Archive

Posts Tagged ‘php’

php采集alexa(包含图片采集下载)程序代码

January 22nd, 2010
No comments 224 views

曾经我有学习过asp版采集程序的编写,见:ASP获取网站alexa排名的源码,asp采集源码主要用到了MSXML2.XMLHTTP获取页面内容,php实现起来更加简单一点,只要用一个php5自带的函数file_get_contents就行。网上有朋友总结了php采集及图片下载的程序,见:php 图文采集的基本原理和代码实例(俗称小偷程序),我这里提取一些要点做下记录。

提取了采集部分的代码:

<?php
< ?
php
 
function str_substr($str ,$statr, $end) { //字符串截取函数
 
$x = strpos($str, $statr);
  
return substr($str$x+strlen($start), strpos($str, $end)-$x+strlen($end))
}
 
$url="http://www.alexa.com/siteinfo/baizoo.cn";//[/url]给据采集内容自己定
$str=file_get_contents($url); //file_get_contents -- 将整个文件读入一个字符串
$start='margin-bottom:-2px;"/>';//截取内容前的html   最后网页中唯一
$end='';//截取内容后的html 最后网页中唯一
$content=str_substr($str , $start, $end);
echo $content; //测试采集到的内容
echo '<hr />';
?>

下载资源部分的代码,因为我暂时用不着,所以也没细看。想要学习的朋友可以看下面完整代码:

Read more…

技术爱好 , ,

Get_headers判断远程文件是否存在-PHP

April 9th, 2009
No comments 564 views

判断网页文件是否存在的方法倒是很多,asp版的可以看我前两篇文章介绍的方法,FSO方法XMLHTTP方法,这里有一个php版的,摘录并了解一下get_headers函数。

<?php
< ?
php
$url = 'http://www.baizoo.cn/index.php';
if (get_headers($url)<>false)
{
  
echo "文件存在";
}
 
else
 
{
  
echo "文件不存在";
 
}
//print_r(get_headers($url, 1));
?>

补充说明:
get_headers函数说明:取得服务器响应一个HTTP 请求所发送的所有标头

array get_headers ( string $url [, int $format ] )

get_headers() 返回一个数组,包含有服务器响应一个 HTTP 请求所发送的标头。如果失败则返回 FALSE 并发出一条 E_WARNING 级别的错误信息。 Read more…

技术爱好 , ,