java如何爬取js处理后的代码
为情所困
为情所困 2017-05-17 10:04:18
[Java讨论组]

页面地址:
http://acm.hdu.edu.cn/showpro...

爬取的目标:

想要爬取这些个公式的代码,ChromeF12看到的代码:

但是爬取到的代码如下:

这个代码并不能显示正确的公式,貌似这些代码都是js生成的,该如何爬取到这些代码。

为情所困
为情所困

全部回复(1)
阿神

先抓包,把ajax请求抓出来,关键是看怎么构造该请求,主要是一些参数的确定。套路大概下面几个:1 在上下文搜搜相关参数是否存在,如果是服务器返回的,就直接请求服务器获得该参数;2 如果该参数很明显不变或者变化有规律,可以直接伪造;3 如果参数很复杂且没规律,那么需要搜索参数的key,找到加密的js,然后构造参数的值,得到ajax url;4 实在难度太大那么用selenium等自动化工具驱动浏览器来访问,它会直接给你渲染好所有js

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号