
html 中读取 <p> 标签数据
想要读取 html 中 <p> 标签中的数据,可以使用专业的框架,如 querylist。
querylist 是一个简单易用的 python 库,可以轻松地从 html 文档中提取数据。使用 querylist,你可以:
- 将 html 文档加载到一个 querylist 对象中。
- 使用 css 选择器找到所需的 <p> 标签。
- 获取每个 <p> 标签中包含的内容。
以下示例代码演示了如何使用 querylist 从 html 文档中提取 <p> 标签数据:
立即学习“Python免费学习笔记(深入)”;
from querylist import QueryList
html = """
<p>第四章 医学微生物学(助理不考)</p>
<p>第一节 微生物的基本概念</p>
"""
ql = QueryList(html)
p_tags = ql.find('p')
data = []
for p in p_tags:
data.append(p.text)
print(data)
# 输出:
# ['第四章 医学微生物学(助理不考)', '第一节 微生物的基本概念']通过使用 querylist,你可以轻松地从 html 文档中提取 <p> 标签数据,并根据标签对其进行分组。











