资讯详情

PHP采集器的简单示例代码

复制代码 代码示例:

#zs#*

* 一例采集器代码

* by www.jbxue.com

#fzs#

$url = "http://book.sina.com.cn/nzt/lit/zhuxian2/index.shtml";// 图书地址

$ver = "old"; //新旧版本

$r = file_get_contents($url); //用file_get_contents打开并读取打开的页面内容

preg_match("//is",$r,$booktitle);////匹配本页标题

$bookname = $booktitle[1]

$preg = '/

/isU';

preg_match_all($preg, $r, $zj); ///匹配页面的章节

$bookzj = count($zj[1] 计算章节标题的数量

if ($ver=="new"){

$content_start = "";

$content_end = "";

}

if ($ver=="old"){

$content_start = "";

$content_end = "";

}

header("Content-Type:text/html;charset=gb2312");

writer($bookname." 共".$bookzj."节rn帅哥刘并于".date("D M j G:i:s T Y")."为毕业设计小说收集rn", "./ailaopo/".$bookname.".txt","w ");

for ($i=0;$i

//echo "http://book.sina.com.cn".$zj[1][$i]".shtml";die();

//用file_get_contents打开章节并读取打开页面的内容

$str = file_get_contents("http://book.sina.com.cn".$zj[1][$i].".shtml");

preg_match("/(

)(.*?)()/is",$str,$title);///匹配连接页面的标题

$title = str_replace("_读书频道_新浪网","",$title(2);//手柄$title[2]里面有_读书频道_新浪网换成空

preg_match("/(".$content_start.")(.*?)(".$content_end.")/is",$str,$content);///匹配连接页面的内容

$content = preg_replace("//s","",str_replace("

","rn",$content(2));/使用str_replace把$content[2]里有 的换成rn

print_r($content);

exit;

//把第".($i 1)."将标题与内容连接在一起,将变量放在一起

$result = " rn第".($i 1)."节--------".$title."_王老师很帅 --------- rn".$content;

writer($result, "./ailaopo/".$bookname.".txt","a ");///调用函数$result

echo "小说".$bookname."共".$bookzj."节,现在整理到第一".$i."节 _".$title."";

}

echo "小说".$bookname."共".$bookzj."节 已完成!";

function writer($content,$url,$mode)//定义函数名 writer 参数$content,$url,$mode

{

$fp = fopen($url, $mode);//打开文件$url

fwrite($fp, $content);//把$content放入到$fp

fclose($fp); //关闭$fp

}

?>

您可能对文章感兴趣:

标签: 1832zj连接器

锐单商城拥有海量元器件数据手册IC替代型号,打造 电子元器件IC百科大全!

锐单商城 - 一站式电子元器件采购平台