Python生成RSS Feed XML 使用feedgen库创建订阅源

月夜之吻

发布时间：2026-03-04 04:31:35

609人浏览过

来源于php中文网

原创

feedgen生成rss不被识别的根本原因是默认缺失rss根节点的version和xmlns属性，需显式调用fg.rss_version('2.0')并添加atom_link；entry.id必须是全局唯一不可变字符串，推荐用url或内容哈希；输出时须统一utf-8编码并设置正确content-type；万级条目性能差，应限制条数、预生成并缓存。

python生成rss feed xml 使用feedgen库创建订阅源

feedgen 生成的 RSS XML 不被浏览器或阅读器识别

根本原因是 feedgen 默认不设置必需的命名空间和根元素属性，很多 RSS 阅读器（比如 Feedly、Inoreader）会直接拒绝解析。浏览器地址栏打开 XML 文件时显示“无法显示此页面”，往往不是格式错，而是 rss 根节点缺 version 和 xmlns。

实操上必须显式调用 rss_str() 前配置好版本与命名空间：

fg = FeedGenerator() 创建后立刻执行 fg.rss_version('2.0')
不要依赖默认行为——fg.rss_str() 内部不会自动补 xmlns:atom，需手动加：fg.atom_link(href='https://example.com/feed.xml', rel='self')
确保 fg.title()、fg.link(href=...)、fg.description() 全部非空，三项缺失任一，部分阅读器会静默丢弃整个 feed

添加条目时 `entry.guid` 被忽略或重复导致聚合器去重失败

RSS 的 guid 是阅读器判断新旧条目的唯一依据，feedgen 中它不叫 guid，而是 id 字段，且必须是字符串类型、全局唯一、不可变。

常见错误是把时间戳或数据库自增 ID 直接塞进 entry.id()：

立即学习“Python免费学习笔记（深入）”；

AI Undetect

让AI无法察觉，让文字更人性化，为文字体验创造无限可能。

下载

用 datetime.now().isoformat() 生成的值每次运行都不同 → 同一篇内容反复出现在订阅源里
用 str(post.id) 但未保证跨环境唯一（比如多实例部署时 ID 冲突）→ 阅读器认为是不同文章，实际却是重复内容
正确做法：对原文 URL 或内容哈希取值，例如 entry.id(hashlib.md5(post.url.encode()).hexdigest())

中文标题/描述乱码或被截断

feedgen 本身支持 UTF-8，但问题出在输出环节：如果用 print(fg.rss_str()) 或写入文件时不指定编码，Python 默认用系统 locale 编码（Windows 上常是 cp936），XML 声明却写着 <?xml version="1.0" encoding="UTF-8"?>，造成解析器按 UTF-8 解、实际内容却是 GBK 编码 → 乱码或解析失败。

务必统一编码出口：

写文件时明确用 open(... , encoding='utf-8')，不能省略 encoding 参数
Web 框架中返回响应时，设好 Content-Type: application/rss+xml; charset=utf-8，Django/Flask 都要额外加 content_type 参数
避免用 fg.rss_str().encode('utf-8') 再 decode 回字符串——多余转换可能引入 BOM 或损坏结构

性能差：万级条目生成耗时几十秒

feedgen 设计目标是灵活性，不是高性能批量生成。它内部对每个 entry 做完整 XML 元素构建 + 属性校验，1000 条目通常 1–2 秒；到 10000 条时可能突破 30 秒，CPU 占满。

真实场景下，RSS 只需要最新 N 条（比如 50 或 100），不需要全量历史：

入库或拉取数据时就按时间倒序取前 N 条，别把全部数据传给 feedgen
完全不用 feedgen？用模板字符串拼接更轻量：f'<item><title>{escape(title)}</title>...</item>'，配合 xml.sax.saxutils.escape() 防 XSS 即可满足基础需求
若必须动态生成且条目数固定，考虑缓存整个 XML 字符串，用文件或 Redis 存，更新频率低时 TTL 设 5 分钟足够

feedgen 的价值在字段丰富性和标准兼容性，不在吞吐量。真要撑住高并发 RSS 请求，得靠预生成 + CDN 缓存，而不是优化单次调用。

Python lxml objectify用法像访问对象属性一样访问XML

如何用Python Pandas处理XML并映射到DataFrame？

XML文件如何批量修改属性值使用Python脚本遍历修改节点

Python lxml etree.fromstring 解析XML字节流

Python xmltodict unparse full_document 是否生成XML声明

相关标签:

python edge django flask xss print 命名空间 xml 字符串字符串类型并发 bom href windows redis 数据库 https atom

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Android shape ring圆环 XML绘制进度条背景下一篇：暂无

作者最新文章

C# IAsyncResult异步模式 C#传统的APM Begin/End方法如何使用

2026-03-03 10:41

C# WebAssembly文件操作 C#在WASM中如何与浏览器文件系统交互

2026-03-03 11:10

XML文件如何设置权限控制谁可以读取或修改XML

2026-03-03 11:16

XSLT中如何调用外部JavaScript函数

2026-03-03 11:19

Clawdbot/Claude免费版和付费版Pro有什么区别？

2026-03-03 11:46

Java XMLOutputFactory createXMLStreamWriter StAX写入XML流

2026-03-03 11:55

考研帮学校库网页版考研帮院校查询入口

2026-03-03 12:52

com.tencent.mm朋友圈视频怎么保存 com.tencent.mm朋友圈缓存提取

2026-03-03 12:56

Windows 11画图3D怎么制作透明背景图片？实用操作步骤详解

2026-03-03 13:20

谷歌浏览器账号头像怎么更换 Chrome个人资料设置【指南】

2026-03-03 14:15

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

Python Web 框架 Django 深度开发

本专题系统讲解 Python Django 框架的核心功能与进阶开发技巧，包括 Django 项目结构、数据库模型与迁移、视图与模板渲染、表单与认证管理、RESTful API 开发、Django 中间件与缓存优化、部署与性能调优。通过实战案例，帮助学习者掌握使用 Django 快速构建功能全面的 Web 应用与全栈开发能力。

154

2026.02.04

Python Flask框架

本专题专注于 Python 轻量级 Web 框架 Flask 的学习与实战，内容涵盖路由与视图、模板渲染、表单处理、数据库集成、用户认证以及RESTful API 开发。通过博客系统、任务管理工具与微服务接口等项目实战，帮助学员掌握 Flask 在快速构建小型到中型 Web 应用中的核心技能。

2025.08.25

Python Flask Web框架与API开发

本专题系统介绍 Python Flask Web框架的基础与进阶应用，包括Flask路由、请求与响应、模板渲染、表单处理、安全性加固、数据库集成（SQLAlchemy）、以及使用Flask构建 RESTful API 服务。通过多个实战项目，帮助学习者掌握使用 Flask 开发高效、可扩展的 Web 应用与 API。

2025.12.15