以下是编程之家 jb51.cc 代码片段通过网络收集整理。
编程之家小编现在和大家分享,也给大家一个参考。
我自己写的很简单PHP采集器
//****************************************************************
$url = "http://book.sina.com.cn/nzt/lit/zhuxian2/index.shtml";// 图书地址
$ver = "old"; //新旧版本
//****************************************************************
$r = file_get_contents($url); //用file_get_contents打开并读取打开的页面内容
preg_match("//is",$r,$booktitle);////匹配本页标题
$bookname = $booktitle[1]
$preg = '/
/isU';preg_match_all($preg,$zj); ///匹配页面的章节
$bookzj = count($zj[1] 计算章节标题的数量
if ($ver=="new"){
$content_start = "";
$content_end = "";
}
if ($ver=="old"){
$content_start = "";
$content_end = "";
}
header("Content-Type:text/html;charset=gb2312");
writer($bookname." 共".$bookzj."节\r\n帅哥刘并于".date("D M j G:i:s T Y")."为毕业设计小说收集\r\n","./ailaopo/".$bookname.".txt","w ");
for ($i=0;$i
//echo "http://book.sina.com.cn".$zj[1][$i]".shtml";die();
//用file_get_contents将章节连接打开并读取所打开的页面的内容
$str = file_get_contents("http://book.sina.com.cn".$zj[1][$i].".shtml");
preg_match("/(
)(.*?)()/is",$str,$title);///匹配连接页面的标题$title = str_replace("_读书频道_新浪网","",$title(2);//手柄$title[2]里面有_读书频道_新浪网换成空
preg_match("/(".$content_start.")(.*?)(".$content_end.")/is",$content);//匹配此连接页面的内容
$content = preg_replace("//s",str_replace("
","\r\n",$content(2));/使用str_replace把$content[2]里有 的换成\r\nprint_r($content);
exit;
//把第".($i 1)."将标题与内容连接在一起,将变量放在一起
$result = " \r\n第".($i 1)."节--------".$title."_王老师很帅 --------- \r\n".$content;
writer($result,"a ");///调用函数$result
echo "小说".$bookname."共".$bookzj."节,现在整理到第一".$i."节 _".$title."";
}
echo "小说".$bookname."共".$bookzj."节 已全部整理完成!";
function writer($content,$url,$mode)//定义函数名 writer 参数$content,$mode
{
$fp = fopen($url,$mode);//打开文件$url
fwrite($fp,$content);//把$content放入到$fp
fclose($fp); //关闭$fp
}
?>
以上是编程之家(jb51.cc)为您收集整理的所有代码内容,希望文章能帮助您解决程序开发中遇到的问题。
如果您认为编程之家的网站内容很好,请向程序员朋友推荐编程之家的网站。
总结
以上是编程之家为你收集整理的一个简单PHP希望文章能帮你解决收集器的所有内容。PHP程序开发到的程序开发问题。
如果您认为编程之家的网站内容很好,请向程序员朋友推荐编程之家的网站。
本图文内容来源于网友网络收集整理,作为学习参考,版权属于原作者。