脚本如何获取html_脚本（JavaScript/Python）获取HTML内容方法

爱谁谁

发布时间：2025-11-05 18:03:24

1008人浏览过

来源于php中文网

原创

答案：JavaScript通过DOM操作获取HTML内容，Python则用requests或Selenium等库抓取。具体为：1. JavaScript使用outerHTML、innerHTML等属性获取页面或元素内容；2. Python用requests获取静态页面源码，Selenium或Playwright获取动态渲染内容；3. 配合BeautifulSoup解析提取数据。

脚本如何获取html_脚本（javascript/python）获取html内容方法

脚本获取HTML内容的方法取决于使用的语言和运行环境。以下是JavaScript和Python中常用的方式，适用于不同场景如网页开发、爬虫或自动化操作。

JavaScript 获取 HTML 内容

在浏览器环境中，JavaScript 可直接操作 DOM 来获取页面内容。

1. 获取整个页面的 HTML

使用 document.documentElement.outerHTML 可获取完整的页面结构：

const htmlContent = document.documentElement.outerHTML;

立即学习“Java免费学习笔记（深入）”；

2. 获取某个元素内的 HTML

用 innerHTML 获取指定元素内部的 HTML 字符串：

const divHtml = document.getElementById('myDiv').innerHTML;

3. 获取包含标签本身的 HTML

使用 outerHTML 包括元素自身：

const fullElementHtml = document.getElementById('myDiv').outerHTML;

ChatDOC

ChatDOC是一款基于chatgpt的文件阅读助手，可以快速从pdf中提取、定位和总结信息

下载

4. 动态加载内容（如 AJAX）

通过 fetch 请求获取远程 HTML 片段：

fetch('/page.html')<br>
  .then(response => response.text())<br>
  .then(html => {<br>
    console.log(html);<br>
  });

Python 获取 HTML 内容

Python 通常用于服务器端或爬虫，需借助第三方库发送请求并解析响应。

1. 使用 requests 库获取网页源码

最常见方式是通过 requests.get() 获取目标页面的 HTML 源代码：

import requests<br><br>
url = 'https://example.com'<br>
response = requests.get(url)<br>
html_content = response.text

2. 处理动态渲染页面（含 JavaScript）

若页面内容由 JS 动态生成，requests 无法获取渲染后的内容，应使用 Selenium 或 Playwright。

Selenium 示例：

from selenium import webdriver<br><br>
driver = webdriver.Chrome()<br>
driver.get('https://example.com')<br>
html_content = driver.page_source<br>
driver.quit()

Playwright 示例（推荐，更现代高效）：

from playwright.sync_api import sync_playwright<br><br>
with sync_playwright() as p:<br>
  browser = p.chromium.launch()<br>
  page = browser.new_page()<br>
  page.goto('https://example.com')<br>
  html_content = page.content()<br>
  browser.close()

3. 解析 HTML 结构（可选）

获取 HTML 后，可用 BeautifulSoup 提取特定部分：

from bs4 import BeautifulSoup<br><br>
soup = BeautifulSoup(html_content, 'html.parser')<br>
title = soup.find('title').text

选择合适方法的关键点

根据实际需求决定使用哪种方式：

静态页面 → Python + requests
JS 渲染页面 → Selenium / Playwright
浏览器内脚本 → JavaScript DOM API
需要提取结构化数据 → 配合 BeautifulSoup 或 lxml

基本上就这些。根据运行环境和页面类型选择对应方案即可。

如何使用 JavaScript 实现点击按钮切换内容显示与隐藏

如何实现点击切换样式的 Facebook 风格点赞按钮

如何修复垂直自定义滑块自动跳转到底部的问题

JavaScript 多实例文本轮播动画的正确实现方法

如何用一个按钮同步切换图片与文字说明

HTML速学教程(入门课程)

HTML怎么学习？HTML怎么入门？HTML在哪学？HTML怎么学才快？不用担心，这里为大家提供了HTML速学教程(入门课程)，有需要的小伙伴保存下载就能学习啦！

下载

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：HTML5在线如何添加二维码生成器 HTML5在线工具集成的实现方案下一篇：HTML5代码如何制作3D效果 HTML5代码中WebGL的入门实例

作者最新文章

阿里邮箱自动回复怎么设置_阿里邮箱收信规则自动回复配置【指南】

2026-03-15 18:33

红果短剧怎么缓存全集_红果短剧批量下载方法

2026-03-15 18:35

和平精英国际服倍镜怎么搭配武器_不同枪械瞄准镜选择技巧【技巧】

2026-03-15 18:38

多进程下数据共享怎么做_用Redis或Channel组件通信【方法】

2026-03-15 18:41

塔读文学怎么投稿_塔读小说作者后台投稿签约步骤

2026-03-15 18:46

CopyAI如何生成邮件内容_CopyAI邮件写作方法【说明】

2026-03-15 18:50

QQ邮箱怎么设置自动回复_QQ邮箱自动回复设置步骤【教程】

2026-03-15 18:53

QClaw的Token用完了怎么办_QClaw内测Token额度与续费方法【指南】

2026-03-15 18:54

icity我的日记免费版 icity我的日记免费版获取方法【指南】

2026-03-15 18:55

workbuddy部署常见坑点_workbuddy坑点避免指南【指南】

2026-03-15 18:55

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

ajax教程

php中文网为大家带来ajax教程合集，Ajax是一种用于创建快速动态网页的技术。通过在后台与服务器进行少量数据交换，Ajax可以使网页实现异步更新。这意味着可以在不重新加载整个网页的情况下，对网页的某部分进行更新。php中文网还为大家带来ajax的相关下载资源、相关课程以及相关文章等内容，供大家免费下载使用。

166

2023.06.14

ajax中文乱码解决方法

ajax中文乱码解决方法有设置请求头部的字符编码、在服务器端设置响应头部的字符编码和使用encodeURIComponent对中文进行编码。本专题为大家提供ajax中文乱码相关的文章、下载、课程内容，供大家免费下载体验。

170

2023.08.31

ajax传递中文乱码怎么办

ajax传递中文乱码的解决办法：1、设置统一的编码方式；2、服务器端编码；3、客户端解码；4、设置HTTP响应头；5、使用JSON格式。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

124

2023.11.15

ajax网站有哪些

使用ajax的网站有谷歌、维基百科、脸书、纽约时报、亚马逊、stackoverflow、twitter、hacker news、shopify和basecamp等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

260

2024.09.24

chrome什么意思

chrome是浏览器的意思，由Google开发的网络浏览器，它在2008年首次发布，并迅速成为全球最受欢迎的浏览器之一。本专题为大家提供chrome相关的文章、下载、课程内容，供大家免费下载体验。

1074

2023.08.11

chrome无法加载插件怎么办

chrome无法加载插件可以通过检查插件是否已正确安装、禁用和启用插件、清除插件缓存、更新浏览器和插件、检查网络连接和尝试在隐身模式下加载插件方法解决。更多关于chrome相关问题，详情请看本专题下面的文章。php中文网欢迎大家前来学习。

848

2023.11.06

Python爬虫获取数据的方法

Python爬虫可以通过请求库发送HTTP请求、解析库解析HTML、正则表达式提取数据，或使用数据抓取框架来获取数据。更多关于Python爬虫相关知识。详情阅读本专题下面的文章。php中文网欢迎大家前来学习。

293

2023.11.13

c语言const用法

const是关键字，可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍：1、声明常量，const关键字可用于声明常量，常量的值在程序运行期间不可修改，常量可以是基本数据类型，如整数、浮点数、字符等，也可是自定义的数据类型；2、函数参数中的const修饰符，const关键字可用于函数的参数中，表示该参数在函数内部不可修改等等。

564

2023.09.20