更多>
最新下载
24小时阅读排行榜
- 1 Linux 内存泄漏排查常用方法
- 2 SQL联合索引设计_最左前缀原则详解
- 3 如何在 PHP 中按文件名自然顺序对关联数组键进行排序
- 4 Linux logrotate 日志切割配置教程
- 5 PHP十六进制转整型怎么做 PHP十六进制字符串转十进制【基础】
- 6 Linux SSH登录权限控制_SSH安全配置教程
- 7 Linux Docker 安装与镜像管理
- 8 Linux防火墙配置混乱_防火墙策略梳理方法
- 9 Python切片底层原理_切片性能与复制分析
- 10 php如何实现多重条件判断_php多重条件判断写法【嵌套】
- 11 Go语言中使用mgo库正确映射MongoDB驼峰字段的完整指南
- 12 Linux mpstat 查看多核 CPU 使用情况
- 13 HTML表单如何统计表单完成率_HTML表单统计表单完成率步骤【详解】
- 14 Python 中使用 args 传递字符串分割后的多个参数的正确方法
- 15 Linux load average 含义与分析方法
更多>
最新教程
-
- Node.js 教程
- 17966 2025-08-28
-
- CSS3 教程
- 1552039 2025-08-27
-
- Rust 教程
- 25038 2025-08-27
-
- Vue 教程
- 26921 2025-08-22
-
- PostgreSQL 教程
- 23332 2025-08-21
-
- Git 教程
- 10194 2025-08-21
下载首页 / 类库下载 / 其它类库
<?php
header("Content-Type: text/html; charset=UTF-8");
require("phpQuery.php");
$hj = QueryList::Query('http://mobile.csdn.net/',array("title"=>array('.unit h1','text')));
//dump($hj->data);
$data = QueryList::Query('http://cms.querylist.cc/bizhi/453.html',array(
'image' => array('img','src')
))->data;
//
$data = QueryList::Query('http://cms.querylist.cc/google/list_1.html',array(
'link' => array('a','href')
))->data;
$page = 'http://cms.querylist.cc/news/566.html';
$reg = array(
'title' => array('h1','text'),
'date' => array('.pt_info','text','-span -a',function($content){
$arr = explode(' ',$content);
return $arr[0];
}),
'content' => array('.post_content','html','a -.content_copyright -script',function($content){
$doc = phpQuery::newDocumentHTML($content);
$imgs = pq($doc)->find('img');
foreach ($imgs as $img) {
$src = 'http://cms.querylist.cc'.pq($img)->attr('src');
$localSrc = 'w/'.md5($src).'.jpg';
$stream = file_get_contents($src);
file_put_contents($localSrc,$stream);
pq($img)->attr('src',$localSrc);
}
return $doc->htmlOuter();
})
);
$rang = '.content';
$ql = QueryList::Query($page,$reg,$rang);
$data = $ql->getData();
dump($data);支持抓取网站,进行爬虫,非常强大,是一个基于PHP的服务端开源项目,它可以让PHP开发人员轻松处理DOM文档内容,比如获取某新闻网站的头条信息。更有意思的是,它采用了jQuery的思想,你可以像使用jQuery一样处理页面内容,获取你想要的页面信息。
本站所有资源都是由网友投搞发布,或转载各大下载站,请自行检测软件的完整性!本站所有资源仅供学习与参考,请勿用于商业用途,否则产生的一切后果将由您自己承担!如有侵权请联系我们删除下架,联系方式:admin@php.cn
