php采集alexa(包含图片采集下载)程序代码
January 22nd, 2010
No comments
224 views
曾经我有学习过asp版采集程序的编写,见:ASP获取网站alexa排名的源码,asp采集源码主要用到了MSXML2.XMLHTTP获取页面内容,php实现起来更加简单一点,只要用一个php5自带的函数file_get_contents就行。网上有朋友总结了php采集及图片下载的程序,见:php 图文采集的基本原理和代码实例(俗称小偷程序),我这里提取一些要点做下记录。
提取了采集部分的代码:
<?php
< ?php
function str_substr($str ,$statr, $end) { //字符串截取函数
$x = strpos($str, $statr);
return substr($str, $x+strlen($start), strpos($str, $end)-$x+strlen($end));
}
$url="http://www.alexa.com/siteinfo/baizoo.cn";//[/url]给据采集内容自己定
$str=file_get_contents($url); //file_get_contents -- 将整个文件读入一个字符串
$start='margin-bottom:-2px;"/>';//截取内容前的html 最后网页中唯一
$end='';//截取内容后的html 最后网页中唯一
$content=str_substr($str , $start, $end);
echo $content; //测试采集到的内容
echo '<hr />';
?>
< ?php
function str_substr($str ,$statr, $end) { //字符串截取函数
$x = strpos($str, $statr);
return substr($str, $x+strlen($start), strpos($str, $end)-$x+strlen($end));
}
$url="http://www.alexa.com/siteinfo/baizoo.cn";//[/url]给据采集内容自己定
$str=file_get_contents($url); //file_get_contents -- 将整个文件读入一个字符串
$start='margin-bottom:-2px;"/>';//截取内容前的html 最后网页中唯一
$end='';//截取内容后的html 最后网页中唯一
$content=str_substr($str , $start, $end);
echo $content; //测试采集到的内容
echo '<hr />';
?>
下载资源部分的代码,因为我暂时用不着,所以也没细看。想要学习的朋友可以看下面完整代码:

Recent Comments