<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE wml PUBLIC "-//WAPFORUM//DTD WML 1.1//EN" "http://www.wapforum.org/DTD/wml_1.1.xml">
<wml>
<head><meta forua="true" http-equiv="Cache-Control" content="max-age=0" /></head>
<card title="PHP（file_get_contents）实现采集中国天气网未来7天天气" id="card1">
<p> 游客</p><p>
标题:PHP（file_get_contents）实现采集中国天气网未来7天天气<br/>
正文:<br/>
下面就介绍一下如何编写一个简单的PHP数据采集程序(PHP爬虫)。原理给定一个网页的URL，使用PHP下载该网页并得到网页内容，然后通过正则表达式将其中我们感兴趣的数据提取出来，然后输出。具体在这个例子中，我们要抓取的网页是 upload/2015/1/201501011530288400.gif 这样的相对路径，我们需要把这些路径补全，在它们前面加上 http://www.weather.com.cn。代码如下:$forecast = str_replace(&amp;quot;&amp;lt;img src=&amp;quot;&amp;quot;,&amp;quot;&amp;lt;img src=&amp;quot;http://www.weather.com.cn&amp;quot;,$res[0]);至此，$forecast 中就是我们需要的天气预报信息了。这个简单的PHP爬虫也就写好了。源代码以下是这个抓取天气预报小程序的完整源代码，其中添加了一些测量各部分程序运行时间的代码，并可以通过设置 $start 和 $end 的值来控制抓取哪几天的信息。代码如下: $url = &amp;quot;http://www.weather.com.cn/weather/101050101.shtml&amp;quot;; $t1 = time();      $page_content = file_get_contents($url); $t2 = time();$start = 1; $end = 3;if ($end &amp;gt; 7){     echo &amp;quot;超出预报能力范围，请重新设置！&amp;quot;; }else {     echo &amp;quot;未来&amp;quot;.($end-$start).&amp;quot;天哈尔滨的天气预报（&amp;quot;               .date('Y-m-j').&amp;quot;发布）&amp;quot;;    eregi(&amp;quot;--day $start--(.*)--day $end--&amp;quot;, $page_content, $res);&amp;nbs<br/><a href="http://camnpr.com/wap.asp?mode=WAP&amp;act=View&amp;id=1873&amp;Page=1">[&lt;&lt;]</a><a href="http://camnpr.com/wap.asp?mode=WAP&amp;act=View&amp;id=1873&amp;Page=1">[[1]]</a><a href="http://camnpr.com/wap.asp?mode=WAP&amp;act=View&amp;id=1873&amp;Page=2">[2]</a><a href="http://camnpr.com/wap.asp?mode=WAP&amp;act=View&amp;id=1873&amp;Page=2">[&gt;&gt;]</a><br/>
<br/>
<a href="wap.asp?act=Com&amp;id=1873">查看评论(0)</a><br/>
<a href="wap.asp?act=AddCom&amp;inpId=1873">发表评论</a><br/><br/>

<br/>

<br/>
<a href="http://camnpr.com/wap.asp">首页</a>
</p>
</card>
</wml>