可采用四种方式导出书香门第书架数据:一、手动复制整理html中书名作者链接;二、用控制台提取window.bookshelf_data等json数据;三、借助web scraper等扩展批量采集分页内容;四、保存网页快照供离线阅读。

如果您希望将书香门第网站中的收藏夹或个人书架内容保存至本地,避免因账号异常或网站变动导致数据丢失,则需借助网页端手动提取或工具辅助抓取的方式完成导出。以下是具体操作步骤:
一、手动复制收藏夹列表
该方法适用于收藏数量较少、需快速生成文本备份的用户。通过浏览器直接查看并复制当前页面显示的书名、作者及链接信息,形成结构化文本记录。
1、登录书香门第官网,进入“我的书架”或“收藏夹”页面。
2、滚动页面确保所有条目完全加载,必要时点击“加载更多”直至全部显示。
3、按 Ctrl+A(Windows)或 Command+A(Mac)全选页面内容,再使用浏览器“查看页面源代码”功能定位到包含书名与链接的HTML区块。
4、在源代码中搜索关键词如 "bookinfo" 或 "href=\"/book/\",筛选出有效图书链接行。
5、将匹配到的书名、作者、URL逐条整理为纯文本或CSV格式,保存为 .txt 或 .csv 文件。
二、使用浏览器控制台提取JSON数据
部分书香门第前端页面会将书架数据以JavaScript变量形式嵌入HTML,可通过开发者工具直接读取原始结构化数据,提高导出准确性与完整性。
1、在“我的书架”页面按 F12 打开开发者工具,切换至 Console 标签页。
2、输入命令 JSON.stringify(window.bookshelf_data || window.favorites, null, 2) 并回车(若报错则尝试 window.data 或检查页面源码中类似 var favorites = [...] 的声明)。
3、若成功输出对象数组,右键结果选择 Store as global variable,再执行 copy(temp1) 将内容复制到剪贴板。
4、新建文本文件,粘贴内容并保存为 shuxiang_bookshelf.json。
三、利用浏览器扩展批量采集链接
对于收藏量大、页面分页加载的用户,可借助支持XPath或CSS选择器的采集类扩展,自动遍历并导出每本书的标题、作者与详情页地址。
1、安装支持自定义脚本的扩展,例如 Web Scraper(Chrome) 或 Data Miner(Edge)。
2、在“我的书架”页面点击扩展图标,新建采集任务,设置选择器为 a[href^="/book/"] 提取链接,div.booktitle 或 span.title 提取书名。
3、添加翻页规则:识别“下一页”按钮的CSS路径(如 a:contains("下一页")),启用自动翻页采集。
4、运行采集后导出为 Excel 或 CSV,保存至本地指定文件夹。
四、保存网页快照作为离线阅读基础
该方式不导出结构化数据,但可完整保留单本书籍页面的图文排版与超链接关系,适合需要长期离线查阅特定书籍内容的场景。
1、打开任意一本收藏书籍的详情页,确保章节列表已加载完毕。
2、按 Ctrl+S(Windows)或 Command+S(Mac),保存类型选择 “网页,完整”(.html + 文件夹)。
3、对每本重点书籍重复上述操作,统一存放于名为 “书香门第_离线书库” 的本地文件夹中。
4、后续可通过双击对应 .html 文件,在无网络状态下浏览封面、简介及目录结构。











