0

0

php+R语言分析网站响应时间

巴扎黑

巴扎黑

发布时间:2016-11-12 15:28:23

|

1853人浏览过

|

来源于php中文网

原创

 要做一个网络爬虫,抓取网页上的特定内容。以前有高年级研究生学长写过一个,但是老师嫌弃时间太久,上千个数据而已,竟然要用一夜,这次要我来做,我想先进行一下可行性的研究,要用到r语言进行统计。 

    这次试验的难点有两个,或者说实际上就只有一个,那就是数据的规范化表示。以前没用过php进行文件读写操作,这是头一次。需要考虑的是文件读写的频率,虽然只是一个实验,但是效率还是要考虑的。过于频繁的文件读写,对磁盘过于耗时的操作,是个大问题。所以这个要考虑。其实是数据的格式问题,以什么样的格式存储。要考虑后续r语言处理的问题,r语言可以处理纯文本,数据之间可以使用分隔符,比喻逗号、甚至是制表符。所以文件里面的数据打算用逗号分隔了。 

     首先贴上php代码 
include ("php_lib/lib_http.php"); 
error_reporting(e_all^e_notice); 
$target   ="http://www.*****"; 
$ref = "http://www.*****"; 
$filename = 'sitevisitors.txt'; 


$first=microtime(get_as_float); 
for($n=0;$n    $betime=microtime(get_as_float); 
    $return_arry = http_get_withheader($target,$ref); 
    $finidown = microtime(get_as_float); 
    $resulttime = $finidown - $betime; 
    $count[$n] = $resulttime; 
    //echo $count[$n]."\n"; 
    echo"\n".$n; 

$fp = fopen("data.txt", "a"); 
//fputs ($fp, "$count[0]"); 
for($n=0;$n    fputs($fp, "\r\n".$count[$n]); 

$last=microtime(get_as_float); 
$result=$last-$first; 
fclose ($fp); 
echo"\nend this test"; 
echo"\n the time is:".$result; 
?> 

    由于这个网站不便公布,所以上连接地址和主机地址用*号代替,还请谅解。程序会先设计一个5000个元素的数组,然后发5000次http请求,记录下每次的时间。http报文中好像会有这个时间,但自己记不真切了,所以用的是microtime()函数,注意要加上get_as_float才可以做减法,而且加上include ("php_lib/lib_http.php");屏蔽掉所有的php notice. 
    
    所有的数据全都写进data.txt文件,要注意的是,文件数据格式应该是矩阵,就算只有一个数据源,即只有一列,也要每个数据独占一行,不能连着写,比如不能1,2,3,4……,而应该是: 




…… 
    
    之所以这么做是因为r语言的缘故,r语言是对矩阵进行读写,所以这么写最方便(也有可能有更好的办法,只是我不知道而已)。 

    得到时间后,打开r语言环境,接着做统计: 
    ①读取数据: 
data    ②求平均值: 
mean(data[,1]) 
注意不能是 mean(data),否则会出现如下警告: 
[1] na 
警告信息: 
in mean.default(data) : 参数不是数值也不是逻辑值:回覆na 
data[,1]表示矩阵data的第一列(其实这里也就仅有一列,但也要这么写)。 
    ③想画出散点图,但是坐标精度太小,分辨不出,这还要继续研究: 
cmydatamydatanamse(mydata)with(mydata,plot(x,y,pch=19,main="the result")) 

图倒是画出来了,但是坐标精度只到小数点后2位,如何提高坐标精度,目前正在研究,options(digits)是不行了。接着想吧。 

相关文章

PHP速学教程(入门到精通)
PHP速学教程(入门到精通)

PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!

下载

相关标签:

php

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
C++ 设计模式与软件架构
C++ 设计模式与软件架构

本专题深入讲解 C++ 中的常见设计模式与架构优化,包括单例模式、工厂模式、观察者模式、策略模式、命令模式等,结合实际案例展示如何在 C++ 项目中应用这些模式提升代码可维护性与扩展性。通过案例分析,帮助开发者掌握 如何运用设计模式构建高质量的软件架构,提升系统的灵活性与可扩展性。

14

2026.01.30

c++ 字符串格式化
c++ 字符串格式化

本专题整合了c++字符串格式化用法、输出技巧、实践等等内容,阅读专题下面的文章了解更多详细内容。

9

2026.01.30

java 字符串格式化
java 字符串格式化

本专题整合了java如何进行字符串格式化相关教程、使用解析、方法详解等等内容。阅读专题下面的文章了解更多详细教程。

12

2026.01.30

python 字符串格式化
python 字符串格式化

本专题整合了python字符串格式化教程、实践、方法、进阶等等相关内容,阅读专题下面的文章了解更多详细操作。

4

2026.01.30

java入门学习合集
java入门学习合集

本专题整合了java入门学习指南、初学者项目实战、入门到精通等等内容,阅读专题下面的文章了解更多详细学习方法。

20

2026.01.29

java配置环境变量教程合集
java配置环境变量教程合集

本专题整合了java配置环境变量设置、步骤、安装jdk、避免冲突等等相关内容,阅读专题下面的文章了解更多详细操作。

18

2026.01.29

java成品学习网站推荐大全
java成品学习网站推荐大全

本专题整合了java成品网站、在线成品网站源码、源码入口等等相关内容,阅读专题下面的文章了解更多详细推荐内容。

19

2026.01.29

Java字符串处理使用教程合集
Java字符串处理使用教程合集

本专题整合了Java字符串截取、处理、使用、实战等等教程内容,阅读专题下面的文章了解详细操作教程。

3

2026.01.29

Java空对象相关教程合集
Java空对象相关教程合集

本专题整合了Java空对象相关教程,阅读专题下面的文章了解更多详细内容。

6

2026.01.29

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 10.4万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.2万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 0.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号