基于PHP的简单采集数据入库程序【续篇】
网络编程 2021-07-05 09:50www.168986.cn编程入门
在上篇 基于PHP的简单采集数据入库程序 中提到采集新闻信息页的列表数据,接下来讲讲关于采集新闻具体内容
在上篇文章中,我们已经采集新闻信息页的列表数据,接下来要做的操作就是从数据库中读取所需要采集的URL,进行页面抓取就行
新建一个content表
不过需要注意的一点是,不能再采用采集URL这种id递增的方法去采集,因为数据表中可能出现id断续,比如id=9,id=11,当采集到id=10的时候,URL是空白的,这样可能会导致采集到了空字段。
这里用到的一个技巧是数据库的查询语句,在我们采集完第一条数据的时候,判断数据库里是否还有大于此id的id编号,若有,读取一条,查询信息重复上面的工作。
具体代码如下
<?php include_once("conn.php"); $id=(int)$_GET['id']; $sql="select from list where id=$id"; $result=mysql_query($sql); $row=mysql_fetch_array($result);//取得对应的url地址 $content=file_get_contents($row['url']); $pattern="/<dd class=\"dataWrap\">(.)<\/dd>/iUs"; preg_match($pattern, $content,$info);//获取内容存放info echo $title=$row[1]."<br/>"; echo $content=$info[0]."<hr/>"; //插入数据库 $add="insert into content(title,content) value('$title','$content')"; mysql_query($add); $sql2="select from list where id>$id order by id asc limit 1"; $result2=mysql_query($sql2); $row2=mysql_fetch_array($result2);//取得对应的url地址 if($row2['id']){ echo "<script>window.location='content.php?id=$row2[0]'</script>"; } ?>
这样子我们所要的新闻内容就采集入库了,接下来只需要对数据的一些样式进行整理就行了。
上一篇:YII中assets的使用示例
下一篇:基于PHP的简单采集数据入库程序
编程语言
- 如何快速学会编程 如何快速学会ug编程
- 免费学编程的app 推荐12个免费学编程的好网站
- 电脑怎么编程:电脑怎么编程网咯游戏菜单图标
- 如何写代码新手教学 如何写代码新手教学手机
- 基础编程入门教程视频 基础编程入门教程视频华
- 编程演示:编程演示浦丰投针过程
- 乐高编程加盟 乐高积木编程加盟
- 跟我学plc编程 plc编程自学入门视频教程
- ug编程成航林总 ug编程实战视频
- 孩子学编程的好处和坏处
- 初学者学编程该从哪里开始 新手学编程从哪里入
- 慢走丝编程 慢走丝编程难学吗
- 国内十强少儿编程机构 中国少儿编程机构十强有
- 成人计算机速成培训班 成人计算机速成培训班办
- 孩子学编程网上课程哪家好 儿童学编程比较好的
- 代码编程教学入门软件 代码编程教程