php采集百度下面的相关搜索关键词

 1 <?php
 2 
 3 $html = getArray(‘狂怒‘);
 4 $res = getHtmlByContent($html);
 5 print_r($res);
 6 
 7 
 8 
 9 /**
10  * getHtmlByContent 
11  * 
12  * @param mixed $html 
13  * @access public
14  * @return void
15  */
16 function getHtmlByContent($html){
17     preg_match_all(‘/<table cellpadding="0">.*<\/table>/‘,$html,$res);
18 //  print_r($res[0][0]);
19     preg_match_all(‘/<th>.*?<\/th>/‘,$res[0][0],$result);
20     $result = $result[0];
21     if(!empty($result) && is_array($result)){
22         foreach($result as $k=>$v){
23             $result[$k] = strip_tags($v);
24         }   
25     }   
26     //print_r($result);
27     return $result;
28 }
29 
30 
31 /**
32  * getArray 
33  * 
34  * @param mixed $kw 
35  * @access public
36  * @return void
37  */
38 function getArray($kw){
39     $url="http://www.baidu.com/s?wd=".$kw;
40     $curl=curl_init();
41     curl_setopt($curl,CURLOPT_URL,$url);
42     curl_setopt($curl,CURLOPT_RETURNTRANSFER,1);
43     //curl_setopt($curl, CURLOPT_POSTFIELDS, $curlPost);
44     $data = curl_exec($curl);
45     $data = preg_replace("/[\r\n\t]+/","",$data);
46     return $data;
47 
48 }

自己网站需要的一个小功能,有需要的可以参考下。

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。