edge浏览器可通过四种方式提取网页文字:一、用“capture region”截图后点击“copy text”调用ocr;二、启用阅读模式后直接复制正文;三、对视频启用“实时字幕”转录语音;四、配合powertoys的text extractor实现高精度本地ocr。

如果您在使用Edge浏览器浏览网页时需要快速截取屏幕内容并提取其中的文字,Edge内置的“截图与文本识别”功能可直接完成这一操作。以下是实现此功能的具体步骤:
一、使用Edge内置的“网页捕获”工具截图并识别文字
Edge浏览器自带的“网页捕获”(Web Capture)支持区域截图,并可在截图后调用OCR引擎自动识别图中文字,识别结果可复制、搜索或翻译。
1、在Edge浏览器中打开目标网页,按 Ctrl + Shift + P 打开命令面板。
2、输入 “Capture region”,选择 “Capture region” 命令并回车。
3、鼠标变为十字光标,拖拽选中需要截图的网页区域。
4、截图完成后,右下角弹出预览缩略图,点击该缩略图进入截图编辑页。
5、在编辑页顶部工具栏中,点击 “Copy text” 图标(图标为两行字母叠加的方块),Edge将立即执行OCR识别并将识别出的纯文本复制到剪贴板。
二、通过“阅读模式”+“选择性复制”辅助提取结构化文字
对于排版清晰、以正文为主的网页(如新闻、文档类页面),启用阅读模式可去除广告与杂乱元素,提升后续OCR识别准确率;部分场景下可跳过截图,直接选取并复制渲染后的文本。
1、在目标网页地址栏右侧,点击 “阅读视图”图标(书本形状),进入纯净阅读界面。
2、用鼠标拖选所需文字段落,右键选择 “复制” 或按 Ctrl + C。
3、若遇到无法直接选中的文字(如图片内嵌文字、PDF渲染页、Canvas绘制文本),返回常规网页视图,改用方法一进行区域截图OCR。
三、启用“实时字幕”作为补充识别手段(限视频/动态内容)
当目标文字存在于网页内嵌视频、直播流或动态字幕中时,“实时字幕”功能可实时捕获并转录语音输出的文字,适用于音频转文字场景,不依赖截图。
1、在Edge浏览器中播放含语音的网页视频(如YouTube、Bilibili嵌入视频)。
2、右键点击视频画面,选择 “显示字幕” 或在地址栏右侧点击 “实时字幕”按钮(对话框图标)。
3、字幕启动后,文字将实时显示在视频上方;点击字幕区域可全选,按 Ctrl + C 复制当前已生成的全部字幕文本。
四、借助“Microsoft PowerToys”扩展OCR能力(本地高精度识别)
当Edge内置OCR对模糊、倾斜、小字号或非拉丁语系文字识别失败时,可配合PowerToys的“Text Extractor”模块实现更高精度的本地截图文字提取,无需上传图像至云端。
1、前往GitHub下载并安装最新版 Microsoft PowerToys(需Windows 10/11系统)。
2、安装后打开PowerToys设置,启用 “Text Extractor” 模块,并确认快捷键(默认为 Win + Shift + T)。
3、在Edge中定位目标区域,按下快捷键触发截图框,拖选目标范围。
4、松开鼠标后,识别结果以半透明窗口悬浮显示,点击 “Copy all” 即可将文字复制至剪贴板。








