更多>
最新下载
24小时阅读排行榜
- 1 Kotlin Serialization怎么序列化为XML
- 2 怎么比较两个XML文件的差异 在线XML Diff工具
- 3 如何在 Go 中同时监听发送与接收通道而不占用 CPU
- 4 css 想给表单复选框未选状态添加图标怎么办_使用 ::before 伪元素与 :not(:checked)
- 5 ASP.NET Core怎么实现输出缓存 Output Caching配置方法
- 6 Golang网络请求慢怎么优化_连接复用与超时设置说明
- 7 如何使用 Flask + Socket.IO 实时流式传输大型日志文件到前端
- 8 Go 中对链表元素进行字符串类型断言的正确方法
- 9 mysql在mac环境如何搭建_mysql mac安装步骤
- 10 如何在 Beego 中正确返回 JSON 响应供前端 AJAX 调用
- 11 如何将 HTML 输入段落化并实现点击激活交互
- 12 Go基准测试适合测试哪些场景_Go性能评估建议
- 13 mysql安装完成后配置SSL加密连接的方法
- 14 在线XML压缩怎么用 XML代码最小化工具
- 15 如何在 Blogger 中创建一个动态表单并生成可复制的 HTML 代码
更多>
最新教程
-
- Node.js 教程
- 15526 2025-08-28
-
- CSS3 教程
- 1544703 2025-08-27
-
- Rust 教程
- 22807 2025-08-27
-
- Vue 教程
- 25280 2025-08-22
-
- PostgreSQL 教程
- 21858 2025-08-21
-
- Git 教程
- 8870 2025-08-21
下载首页 / 类库下载 / 其它类库
<?php
header("Content-Type: text/html; charset=UTF-8");
require("phpQuery.php");
$hj = QueryList::Query('http://mobile.csdn.net/',array("title"=>array('.unit h1','text')));
//dump($hj->data);
$data = QueryList::Query('http://cms.querylist.cc/bizhi/453.html',array(
'image' => array('img','src')
))->data;
//
$data = QueryList::Query('http://cms.querylist.cc/google/list_1.html',array(
'link' => array('a','href')
))->data;
$page = 'http://cms.querylist.cc/news/566.html';
$reg = array(
'title' => array('h1','text'),
'date' => array('.pt_info','text','-span -a',function($content){
$arr = explode(' ',$content);
return $arr[0];
}),
'content' => array('.post_content','html','a -.content_copyright -script',function($content){
$doc = phpQuery::newDocumentHTML($content);
$imgs = pq($doc)->find('img');
foreach ($imgs as $img) {
$src = 'http://cms.querylist.cc'.pq($img)->attr('src');
$localSrc = 'w/'.md5($src).'.jpg';
$stream = file_get_contents($src);
file_put_contents($localSrc,$stream);
pq($img)->attr('src',$localSrc);
}
return $doc->htmlOuter();
})
);
$rang = '.content';
$ql = QueryList::Query($page,$reg,$rang);
$data = $ql->getData();
dump($data);支持抓取网站,进行爬虫,非常强大,是一个基于PHP的服务端开源项目,它可以让PHP开发人员轻松处理DOM文档内容,比如获取某新闻网站的头条信息。更有意思的是,它采用了jQuery的思想,你可以像使用jQuery一样处理页面内容,获取你想要的页面信息。
本站所有资源都是由网友投搞发布,或转载各大下载站,请自行检测软件的完整性!本站所有资源仅供学习与参考,请勿用于商业用途,否则产生的一切后果将由您自己承担!如有侵权请联系我们删除下架,联系方式:admin@php.cn
