网站首页娱乐新闻焦点新闻历史秘闻社会百态技术文章科技资讯其他资讯女性专栏

首页 > 网络文摘 > 正文

java爬取百度首页logo

浏览数：19 / 时间：2015年06月08日

两个方法
- 一个获得Url的网页源代码getUrlContentString，另外一个从源代码中得到想要的地址片段，其中需要用到正则表达式去匹配
得到网页源代码的过程：
- 地址为string，将地址转换为java中的url对象
- url的openConnection方法返回urlConnection
- urlConnection的connect方法建立连接
- 新建一个InputStreamReader对象，其中InputStreamReader的构建需要InputStream输入流对象，而URLConnection的getInputStream方法则返回输入流对象，所以可以连接起来
- 然后利用建立好的InputStreamReader对象建立BuffereReader对象
- 从bufferedreader对象中按行读入网页源码，追加到result字符串中，result字符串即为网页源代码字符串
logo地址匹配
- Pattern pattern = Pattern.compile(patternString);
  - java.util.regex：java类库包，用正则表达式所定义的模式对字符串进行匹配
    它包括两个类：Pattern和Matcher 。
    Pattern：创建匹配模式字符串。
    Matcher：将匹配模式字符串与输入字符串。
  - pattern的compile方法：将指定的字符编译到模式中
- Matcher matcher = pattern.matcher(contentString);

郑重声明：本站内容如果来自互联网及其他传播媒体，其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。

java爬取百度首页logo

标签：编程语言 Java C C# Javascript js Python Ruby Spring 程序 VB

相关文章

随机文章

您可能还喜欢

您可能还喜欢

最新图文

更多

可爱穿搭很重要

可爱穿搭很重要

工藤美樱写真集

工藤美樱写真集

斯米兰海水是真不错

斯米兰海水是真不错

海边想拍氛围照

海边想拍氛围照

海岛度假

海岛度假

甜妹 ootd 穿搭

甜妹 ootd 穿搭

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

7080后儿时集体回忆插画

7080后儿时集体回忆插画

西安子午峪满山的白杜鹃太美了

西安子午峪满山的白杜鹃太美了

职业模特拍摄省事很多

职业模特拍摄省事很多

您可能还喜欢

更多

全球15万女性同秀旗袍挑战吉尼斯世界纪录

全球15万女性同秀旗袍挑战吉尼斯世界纪录

国外甜美金发MM

国外甜美金发MM

美国19周的早产儿

美国19周的早产儿

2014年英国潜水小姐冠军出炉

2014年英国潜水小姐冠军出炉

老人被轧躺倒路中间 9中学生合力救人将其送医

老人被轧躺倒路中间 9中学生合力救人将其送医

秦舒培高挑身材

秦舒培高挑身材

英国黑白双胞胎姐妹走红

英国黑白双胞胎姐妹走红

任由男子手触侧胸辣妹参加IT公司年会走红

任由男子手触侧胸辣妹参加IT公司年会走红

东北花袄

东北花袄

北京车展美女礼仪一览

北京车展美女礼仪一览

您可能还喜欢

更多

大学生全裸图书馆前静坐呼吁尊重身体

大学生全裸图书馆前静坐呼吁尊重身体

冯小刚24岁女儿近照曝光叼烟表情逗趣

冯小刚24岁女儿近照曝光叼烟表情逗趣

西安子午峪满山的白杜鹃太美了

西安子午峪满山的白杜鹃太美了

惠州华润小径湾试拍

惠州华润小径湾试拍

长春武僧严寒冬日苦练功夫

长春武僧严寒冬日苦练功夫

揭朱镕基传奇身世之谜：乱世孤儿乃是朱元璋后裔

揭朱镕基传奇身世之谜：乱世孤儿乃是朱元璋后裔

姚奠中书法

姚奠中书法

安倍在寿司店请奥巴马喝酒

安倍在寿司店请奥巴马喝酒

浙江苍南城管打人致其吐血引近千群众围观

浙江苍南城管打人致其吐血引近千群众围观

重庆街拍衣服买大了

重庆街拍衣服买大了