1.编写curl类,进行网页内容抓取
复制代码 代码如下:
class curlutil
{
private $curl;
private $timeout = 10;
/**
* 初始化curl对象
*/
public function __construct()
{
$this->curl = curl_init();
curl_setopt($this->curl, curlopt_returntransfer, 1);
curl_setopt($this->curl, curlopt_useragent, "mozilla/4.0 (compatible; msie 6.0; windows nt 5.1; sv1)");
curl_setopt($this->curl, curlopt_header, false); //设定是否显示头信息
curl_setopt($this->curl, curlopt_nobody, false); //设定是否输出页面内容
curl_setopt($this->curl, curlopt_connecttimeout, $this->timeout);
curl_setopt($this->curl, curlopt_followlocation, true);
curl_setopt($this->curl, curlopt_autoreferer, true);
}
/**
* 注销函数 关闭curl对象
*/
public function __destruct()
{
curl_close($this->curl);
}
/**
* 获取网页的内容
*/
public function getwebpagecontent($url)
{
curl_setopt($this->curl, curlopt_url, $url);
return curl_exec($this->curl);
}
}
2.创建curl对象
复制代码 代码如下:
$curlutil = new curlutil();
3.抓取yahoo搜索结果
复制代码 代码如下:
function getyahoosearch(curlutil $curl, $key)
{
$key = urlencode($key);
$searchurl = "http://boss.yahooapis.com/ysearch/web/v1/$key?appid=你的雅虎appid&lang=tzh®ion=hk&abstract=long&count=20&format=json&start=0&count=10";
$josnstr = $curl->getwebpagecontent($searchurl);
$searchdatainfo = json_decode($josnstr, true);
$searchdata = $searchdatainfo['ysearchresponse']['resultset_web'];
$returnarray = array();
if (!empty($searchdata)) {
foreach ($searchdata as $data) {
$returnarray[] = array("url" => $data['url'], "date" => $data['date'], 'title' => strip_tags($data['title']), 'description' => strip_tags($data['abstract']));
}
}
return $returnarray;
}
4.测试结果
var_dump(getyahoosearch($curlutil, "百度"));
0
0
相关文章
如何在表单中根据 MySQL 布尔字段值自动选中单选按钮
生成630个1–20之间的随机数,使其总和严格不超过3000的PHP实现方案
如何在表单中根据 MySQL 布尔字段预选单选按钮
PHP 中读取 PHP 文件顶部注释元数据的最佳实践
如何在 WordPress Astra 主题页眉中动态显示带图标的特色图像标题
相关标签:
本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
热门AI工具
相关专题
本专题汇总了抖音网页版的入口链接、官方登录页面以及视频观看入口,帮助用户快速访问抖音网页版,提供免登录访问方式和直接进入视频播放页面的方法,确保顺利浏览和观看抖音视频。
63
2026.02.04
本专题详细汇总了学习通网页版入口与登录方法,提供学习通官方网页端入口、学生登录平台、网页版使用指南等内容,帮助用户快速稳定地登录学习通官网,顺利进入学习平台,提升学习效率和体验。
9
2026.02.04
本专题系统讲解 Python Django 框架的核心功能与进阶开发技巧,包括 Django 项目结构、数据库模型与迁移、视图与模板渲染、表单与认证管理、RESTful API 开发、Django 中间件与缓存优化、部署与性能调优。通过实战案例,帮助学习者掌握 使用 Django 快速构建功能全面的 Web 应用与全栈开发能力。
9
2026.02.04
本专题专注讲解 Java 在流式数据处理与消息队列系统中的应用,系统讲解 Apache Kafka 的基础概念、生产者与消费者模型、Kafka Streams 与 KSQL 流式处理框架、实时数据分析与监控,结合实际业务场景,帮助开发者构建 高吞吐量、低延迟的实时数据流管道,实现高效的数据流转与处理。
3
2026.02.04
本专题深入讲解 Golang 应用的容器化与 Docker 部署,涵盖 Docker 基础概念、容器构建与镜像管理、Go 应用的 Dockerfile 编写、跨平台容器部署与优化、Docker Compose 和 Kubernetes 部署工具。通过实际案例,帮助学习者掌握 如何将 Golang 应用容器化并实现高效部署与管理,提升系统的可扩展性与运维效率。
3
2026.02.04
热门下载
相关下载
精品课程
最新文章





