网站首页娱乐新闻焦点新闻历史秘闻社会百态技术文章科技资讯其他资讯女性专栏

首页 > 网络文摘 > 正文

简述php关于网页元素抓取方面的技术

浏览数：17 / 时间：2015年06月09日

对于php抓取网页的内容，可能比较难的就是dom解析这一部分了，这儿的话有几种技术推荐给大家，具体使用哪种就看自己的喜欢了

1.php自带的xpath解析技术

xpath的话具体可以百度一下他的用法，我只举几个简单的例子，废话不多说，代码如下

<?php

error_reporting(0);
$url=‘http://www.baidu.com‘;//此处写抓取的网页的网址，我随便写的
$html=file_get_contents($url);
$dom=new DOMDocument;
$dom->loadHTML($html);
$xml=simplexml_import_dom($dom);
$nav=$xml->xpath(‘//p[@id="nv"]‘);//这儿简单解释一下，就是调用simplexml的xpath方法，传入符合xpath语法的字符串就行了，我这儿的意思是，获取所有id属性值为nv的p标签元素
print_r($nav);

2.phpquery，

phpquery是基于jQuery选择器的dom解析器，如果经常用jQuery的话会很喜欢这个工具的，下面说说他的用法

<?
include ‘phpQuery.php‘;
phpQuery::newDocumentFile(‘http://job.blueidea.com‘);
$companies = pq(‘#hotcoms .coms‘)->find(‘div‘);
foreach($companies as $company)
{
echo pq($company)->find(‘h3 a‘)->text()."<br>";
}

简单解释一下：

pq()就像jQuery里的$()
基本上jQuery的选择器都可以用在phpQuery上，只要把’.‘变成’->’
phpQuery提供了好几种载入文件的方法，有的使用字符串，有的使用文件(包括url)，选择的时候要注意

3.simplehtmldom

官方手册：http://www.ecartchina.com/php-simple-html-dom/manual.htm

自己看吧，一会就看懂了，我花了半个小时不到的时候就熟练的运用了

对了，这儿还有一个php的抓取系统，phpcrawl，如果想了解php搜索引擎方面的一些知识，可以看看他的源码：

源码下载地址

http://sourceforge.net/projects/phpcrawl/files/PHPCrawl/

简述php关于网页元素抓取方面的技术,古老的榕树,5-wow.com

郑重声明：本站内容如果来自互联网及其他传播媒体，其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。

简述php关于网页元素抓取方面的技术

标签：页面抓取 php 页面抓取 php

相关文章

随机文章

您可能还喜欢

您可能还喜欢

最新图文

更多

可爱穿搭很重要

可爱穿搭很重要

工藤美樱写真集

工藤美樱写真集

斯米兰海水是真不错

斯米兰海水是真不错

海边想拍氛围照

海边想拍氛围照

海岛度假

海岛度假

甜妹 ootd 穿搭

甜妹 ootd 穿搭

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

7080后儿时集体回忆插画

7080后儿时集体回忆插画

西安子午峪满山的白杜鹃太美了

西安子午峪满山的白杜鹃太美了

职业模特拍摄省事很多

职业模特拍摄省事很多

您可能还喜欢

更多

米兰时装周火辣上演美模抱萌娃走秀场面温馨

米兰时装周火辣上演美模抱萌娃走秀场面温馨

刘亦菲神仙姐姐十年颜值一直在线

刘亦菲神仙姐姐十年颜值一直在线

奥马巴儿时旧照

奥马巴儿时旧照

香港生活成本世界最高底层人蜗居“棺材间”

香港生活成本世界最高底层人蜗居“棺材间”

范曾书法部分展览

范曾书法部分展览

专业摄影师视野是与生俱来的

专业摄影师视野是与生俱来的

浙江苍南城管打人致其吐血引近千群众围观

浙江苍南城管打人致其吐血引近千群众围观

凯特二胎生公主圆婆婆戴安娜王妃生女遗愿

凯特二胎生公主圆婆婆戴安娜王妃生女遗愿

三亚商品街打架

三亚商品街打架

亮瞎眼！帅哥美女骑行西藏前后惊悚对比

亮瞎眼！帅哥美女骑行西藏前后惊悚对比

您可能还喜欢

更多

深圳地铁站附近发生恶性砍人事件

深圳地铁站附近发生恶性砍人事件

海边想拍氛围照

海边想拍氛围照

越战结束40年裂痕犹在：越南仍未实现南北和解

越战结束40年裂痕犹在：越南仍未实现南北和解

美国小姐著比基尼参加水上排球大赛

美国小姐著比基尼参加水上排球大赛

女子占座被指责飞踹老人

女子占座被指责飞踹老人

英国黑白双胞胎姐妹走红

英国黑白双胞胎姐妹走红

广州打工妈妈哭诉8岁女儿被强奸4次

广州打工妈妈哭诉8岁女儿被强奸4次

实拍明代干尸开棺全过程(图)

实拍明代干尸开棺全过程(图)

特斯拉入门两厢车新车预览

特斯拉入门两厢车新车预览

海滩试拍

海滩试拍