0

0

如何抓取电商价格_PHP抓取淘宝商品价格实战【技巧】

看不見的法師

看不見的法師

发布时间:2026-02-09 12:53:16

|

469人浏览过

|

来源于php中文网

原创

淘宝商品价格无法用PHP直接抓取,因其JS动态渲染、加密sign参数、Referer限制、用户行为验证及反爬策略共同防护;可行方案仅剩淘宝联盟API(仅推广价)或PHP调用Puppeteer/Playwright自动化浏览器解析。

如何抓取电商价格_php抓取淘宝商品价格实战【技巧】

淘宝商品价格不能直接通过常规 HTTP 请求抓取,因为其前端数据由 JavaScript 动态渲染,且接口受加密参数、Referer 限制、用户行为验证(如滑块、验证码)和反爬策略多重保护。PHP 原生 cURL 或 file_get_contents 无法直接拿到真实价格。

淘宝价格接口实际调用的是 h5apidetailskip 域名下的加密 API

真实页面中,商品价格来自类似这样的请求:

https://h5api.m.taobao.com/h5/mtop.taobao.detail.getdetail/6.0/?jsv=2.5.1&appKey=12574478&t=1712345678901&sign=xxxxx&api=mtop.taobao.detail.getdetail&v=6.0&ttid=xxx&dataType=json&data=%7B%22itemNumId%22%3A%22692345678901%22%7D

其中 sign 是关键:它由时间戳 tappKey、请求体 data 和一个私有密钥(淘宝未公开)共同计算出的 MD5 或 Hmac-SHA256 值。PHP 无法在无密钥前提下生成合法 sign

  • 淘宝未开放该密钥,所有“PHP 算 sign”的开源方案本质是逆向旧版或模拟无效签名,成功率极低且随时失效
  • 部分工具(如 mitmproxy 抓包后复用 Cookie + t + sign)仅限单机调试,无法部署到服务器长期运行
  • 即使绕过 sign,服务端还会校验 Cookie 中的 _tb_token_cookie2、设备指纹等字段

PHP 直接发起请求大概率返回 {\"code\":\"200\",\"msg\":\"成功\",\"data\":{\"error\":{...}} 或空 data

这不是网络错误,而是淘宝服务端主动拒绝——常见响应特征包括:

立即学习PHP免费学习笔记(深入)”;

Getimg.ai
Getimg.ai

getimg.ai是一套神奇的ai工具。生成大规模的原始图像

下载
  • data.error.code === "403"` 或 `"60011"`:签名无效或过期
  • data.error.msg === "非法请求"`:Referer 缺失或格式不对(必须是 https://item.taobao.com/...)
  • HTTP 状态码 500 / 503 / 403,响应体为空或含 "anti_spider" 字样
  • 返回 HTML 登录页或跳转到 login.taobao.com(说明 Cookie 失效)

你用 curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true) 也救不回来,因为重定向目标仍是风控页。

可行路径只有两种:走官方渠道,或用浏览器自动化代理

如果必须用 PHP 主导流程:

  • 接入淘宝联盟 API(taobao.tbk.item.info.get),但只返回推广价,不含实时成交价、SKU 价格,且需审核通过的 AppKey
  • 用 PHP 调用 Puppeteer(Node.js)或 Playwright(通过 shell_exec),启动无头 Chrome 加载商品页,再用 JS 执行 document.querySelector(".price span").textContent 提取——这是目前最稳定的方式
  • 避免用 simple_html_dom 或 DOMDocument 解析原始 HTML,因为价格标签根本不在初始 HTML 中,是 JS 渲染后插入的

注意:后者需要服务器安装 Chrome + Node.js 环境,且每次请求耗时 3–8 秒,不适合高频调用。

真正难的不是写 PHP 代码,而是绕过淘宝对「非人流量」的识别。哪怕你把 header 模拟得再像,只要没真实鼠标轨迹、Canvas 指纹、WebGL 渲染特征,就大概率被拦截。别在 sign 算法上浪费时间,那是个没有出口的迷宫。

相关文章

淘宝
淘宝

淘宝是一个好逛、丰富、有趣的消费生活社区,每天有亿万消费者来淘宝“逛街”:发现好物、找到乐趣、表达体验……淘宝能满足人们生活中的各种需求,有需要的小伙伴快来保存下载体验吧!

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
chrome什么意思
chrome什么意思

chrome是浏览器的意思,由Google开发的网络浏览器,它在2008年首次发布,并迅速成为全球最受欢迎的浏览器之一。本专题为大家提供chrome相关的文章、下载、课程内容,供大家免费下载体验。

922

2023.08.11

chrome无法加载插件怎么办
chrome无法加载插件怎么办

chrome无法加载插件可以通过检查插件是否已正确安装、禁用和启用插件、清除插件缓存、更新浏览器和插件、检查网络连接和尝试在隐身模式下加载插件方法解决。更多关于chrome相关问题,详情请看本专题下面的文章。php中文网欢迎大家前来学习。

768

2023.11.06

cookie
cookie

Cookie 是一种在用户计算机上存储小型文本文件的技术,用于在用户与网站进行交互时收集和存储有关用户的信息。当用户访问一个网站时,网站会将一个包含特定信息的 Cookie 文件发送到用户的浏览器,浏览器会将该 Cookie 存储在用户的计算机上。之后,当用户再次访问该网站时,浏览器会向服务器发送 Cookie,服务器可以根据 Cookie 中的信息来识别用户、跟踪用户行为等。

6449

2023.06.30

document.cookie获取不到怎么解决
document.cookie获取不到怎么解决

document.cookie获取不到的解决办法:1、浏览器的隐私设置;2、Same-origin policy;3、HTTPOnly Cookie;4、JavaScript代码错误;5、Cookie不存在或过期等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

357

2023.11.23

阻止所有cookie什么意思
阻止所有cookie什么意思

阻止所有cookie意味着在浏览器中禁止接受和存储网站发送的cookie。阻止所有cookie可能会影响许多网站的使用体验,因为许多网站使用cookie来提供个性化服务、存储用户信息或跟踪用户行为。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

420

2024.02.23

cookie与session的区别
cookie与session的区别

本专题整合了cookie与session的区别和使用方法等相关内容,阅读专题下面的文章了解更详细的内容。

95

2025.08.19

curl_exec
curl_exec

curl_exec函数是PHP cURL函数列表中的一种,它的功能是执行一个cURL会话。给大家总结了一下php curl_exec函数的一些用法实例,这个函数应该在初始化一个cURL会话并且全部的选项都被设置后被调用。他的返回值成功时返回TRUE, 或者在失败时返回FALSE。

450

2023.06.14

linux常见下载安装工具
linux常见下载安装工具

linux常见下载安装工具有APT、YUM、DNF、Snapcraft、Flatpak、AppImage、Wget、Curl等。想了解更多linux常见下载安装工具相关内容,可以阅读本专题下面的文章。

179

2023.10.30

Golang处理数据库错误教程合集
Golang处理数据库错误教程合集

本专题整合了Golang数据库错误处理方法、技巧、管理策略相关内容,阅读专题下面的文章了解更多详细内容。

98

2026.02.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 11.3万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.2万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 0.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号