网站首页娱乐新闻焦点新闻历史秘闻社会百态技术文章科技资讯其他资讯女性专栏

首页 > 网络文摘 > 正文

PHP获取指定URL页面中的所有链接

浏览数：20 / 时间：2015年06月09日

form:http://www.uphtm.com/php/253.html

这个东西其实我们开发人员来讲常用了，以前做一个抓取其它网站友情连接时用过，今天看到一朋友整理了一个PHP获取指定URL页面中的所有链接函数，整理过来我们一起来看看吧。

以下代码可以获取到指定URL页面中的所有链接，即所有a标签的href属性：

// 获取链接的HTML代码
$html = file_get_contents(‘http://www.111cn.net‘);
$dom = new DOMDocument();
@$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$hrefs = $xpath->evaluate(‘/html/body//a‘);
for ($i = 0; $i < $hrefs->length; $i++) {
$href = $hrefs->item($i);
$url = $href->getAttribute(‘href‘);
echo $url.‘<br />‘;
}

这段代码会获取到所有a标签的href属性，但是href属性值不一定是链接，我们可以在做个过滤，只保留http开头的链接地址：

// 获取链接的HTML代码
$html = file_get_contents(‘http://www.111cn.net‘);
$dom = new DOMDocument();
@$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$hrefs = $xpath->evaluate(‘/html/body//a‘);
for ($i = 0; $i < $hrefs->length; $i++) {
$href = $hrefs->item($i);
$url = $href->getAttribute(‘href‘);
// 保留以http开头的链接
if(substr($url, 0, 4) == ‘http‘)
echo $url.‘<br />‘;
}

fopen()函数读取指定网页中的所有链接并统计出数量，在一些需要采集网页页容的地方，适合使用本代码，本例以读取百度首页为例，找出百度首页中所有的链接地址，代码经过测试，完全可用：

<?
if(empty($url))$url = "http://www.baidu.com/";//需要采集链接的URL地址
$site=substr($url,0,strpos($url,"/",8));
$base=substr($url,0,strrpos($url,"/")+1);//文件所在目录
$fp = fopen($url, "r" );//打开url地址页面
while(!feof($fp))$contents.=fread($fp,1024);
$pattern="|href=[‘\"]?([^ ‘\"]+)[‘\" ]|U";
preg_match_all($pattern,$contents, $regArr, PREG_SET_ORDER);//使用正则匹配所有href=
for($i=0;$i<count($regArr);$i++){//找出所有匹配的链接
if(!eregi("://",$regArr[$i][1]))//判断是否是相对路径，即是否还有://
if(substr($regArr[$i][1],0,1)=="/")//是否是站点的根目录
echo "link".($i+1).":".$site.$regArr[$i][1]."<br/>";//根目录
else
echo "link".($i+1).":".$base.$regArr[$i][1]."<br/>";//当前目录
else
echo "link".($i+1).":".$regArr[$i][1]."<br/>";//相对路径
}
fclose($fp);
?>

form:http://www.uphtm.com/php/253.html

郑重声明：本站内容如果来自互联网及其他传播媒体，其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。

PHP获取指定URL页面中的所有链接

标签： com 代码使用 http html si 文件 it la com 代码使用 http html si 文件 it la

相关文章

随机文章

您可能还喜欢

您可能还喜欢

最新图文

更多

可爱穿搭很重要

可爱穿搭很重要

工藤美樱写真集

工藤美樱写真集

斯米兰海水是真不错

斯米兰海水是真不错

海边想拍氛围照

海边想拍氛围照

海岛度假

海岛度假

甜妹 ootd 穿搭

甜妹 ootd 穿搭

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

7080后儿时集体回忆插画

7080后儿时集体回忆插画

西安子午峪满山的白杜鹃太美了

西安子午峪满山的白杜鹃太美了

职业模特拍摄省事很多

职业模特拍摄省事很多

您可能还喜欢

更多

英国男子走遍非洲拍摄土著面孔

英国男子走遍非洲拍摄土著面孔

超模刘雯

超模刘雯

浙江苍南城管打人致其吐血引近千群众围观

浙江苍南城管打人致其吐血引近千群众围观

土耳其海滩

土耳其海滩

中国美女城市排行：哈尔滨第一北京未入榜

中国美女城市排行：哈尔滨第一北京未入榜

广西办首届"校花校草大赛" 颜值不忍直视

广西办首届"校花校草大赛" 颜值不忍直视

小众海滩试拍

小众海滩试拍

凯特二胎生公主圆婆婆戴安娜王妃生女遗愿

凯特二胎生公主圆婆婆戴安娜王妃生女遗愿

你见过这种饥荒吗？

你见过这种饥荒吗？

长春刘老根大舞台不雅泥塑被拆

长春刘老根大舞台不雅泥塑被拆

您可能还喜欢

更多

台湾人气双胞胎曝近照 12岁姐妹俩爱跳舞

台湾人气双胞胎曝近照 12岁姐妹俩爱跳舞

任由男子手触侧胸辣妹参加IT公司年会走红

任由男子手触侧胸辣妹参加IT公司年会走红

深圳富豪轰动澳洲买豪宅开派对会巨星

深圳富豪轰动澳洲买豪宅开派对会巨星

李敏镐图片精选

李敏镐图片精选

AI 生成的美女图

AI 生成的美女图

毛泽东和蒋介石的书法，你能区分不？

毛泽东和蒋介石的书法，你能区分不？

美国成人展

美国成人展

揭朱镕基传奇身世之谜：乱世孤儿乃是朱元璋后裔

揭朱镕基传奇身世之谜：乱世孤儿乃是朱元璋后裔

范曾书法部分展览

范曾书法部分展览

本拉登谋划911恐怖袭击前"老巢"曝光

本拉登谋划911恐怖袭击前"老巢"曝光