网站首页娱乐新闻焦点新闻历史秘闻社会百态技术文章科技资讯其他资讯女性专栏

首页 > 网络文摘 > 正文

java 抓取网页内容

浏览数：19 / 时间：2015年06月09日

在工作中要通java获取整个网页的html内容，或者某个网络文件的内容。这里我们可以使用java提供的HttpURLConnection类来实现对网页内容的抓取。下面举例说明：

抓取百度首页的内容：

1

2

3

4

5

6

7

8

9

10

11

URL url = new 
URL("http://www.baidu.com");
HttpURLConnection urlCon=(HttpURLConnection)url.openConnection();
urlCon.setConnectTimeout(50000);
urlCon.setReadTimeout(300000);
DataInputStream fIn;
byte[] content = new 
byte[MAX_FILE_SIZE];
fIn = new 
DataInputStream(urlCon.getInputStream());
int size = 0,f_size = 0;
while((size = fIn.read(content,f_size,2048))> 0){
    f_size += size;
}

　在代码中我们将百度首页的内容存储到了一个byte数组中，当然我们有了 IO流以后还可以存储到文件中去了。

java 抓取网页内容,古老的榕树,5-wow.com

郑重声明：本站内容如果来自互联网及其他传播媒体，其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。

java 抓取网页内容

标签： c t http string it html java class a 类 word c t http string it html java class a 类 word

相关文章

随机文章

您可能还喜欢

您可能还喜欢

最新图文

更多

可爱穿搭很重要

可爱穿搭很重要

工藤美樱写真集

工藤美樱写真集

斯米兰海水是真不错

斯米兰海水是真不错

海边想拍氛围照

海边想拍氛围照

海岛度假

海岛度假

甜妹 ootd 穿搭

甜妹 ootd 穿搭

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

7080后儿时集体回忆插画

7080后儿时集体回忆插画

西安子午峪满山的白杜鹃太美了

西安子午峪满山的白杜鹃太美了

职业模特拍摄省事很多

职业模特拍摄省事很多

您可能还喜欢

更多

揭朱镕基传奇身世之谜：乱世孤儿乃是朱元璋后裔

揭朱镕基传奇身世之谜：乱世孤儿乃是朱元璋后裔

栩栩如生的街头三维立体画--绝对逼真

栩栩如生的街头三维立体画--绝对逼真

金曲奖红毯众星云集张学友陈奕迅角逐歌王

金曲奖红毯众星云集张学友陈奕迅角逐歌王

网红赵喵喵

网红赵喵喵

米兰时装周火辣上演美模抱萌娃走秀场面温馨

米兰时装周火辣上演美模抱萌娃走秀场面温馨

安倍在寿司店请奥巴马喝酒

安倍在寿司店请奥巴马喝酒

非礼勿视！日本如此变态的成人文化

非礼勿视！日本如此变态的成人文化

超模刘雯

超模刘雯

乌克兰美女演员伊莉沙

乌克兰美女演员伊莉沙

杭州一企业女员工集体穿肚兜上班

杭州一企业女员工集体穿肚兜上班

您可能还喜欢

更多

美国罕见单羊膜双胞胎女婴牵手出生

美国罕见单羊膜双胞胎女婴牵手出生

凯特二胎生公主圆婆婆戴安娜王妃生女遗愿

凯特二胎生公主圆婆婆戴安娜王妃生女遗愿

韩国票选亚洲最美女神排行榜

韩国票选亚洲最美女神排行榜

北京电影学院表演系毕业照：美女纷纷自拍

北京电影学院表演系毕业照：美女纷纷自拍

货车侧翻市民：不抢是傻子

货车侧翻市民：不抢是傻子

阿富汗发生山体滑坡或造成2700人死亡

阿富汗发生山体滑坡或造成2700人死亡

郭沫若书法

郭沫若书法

小众海滩试拍

小众海滩试拍

北京车展美女礼仪一览

北京车展美女礼仪一览

刘雯秀场新造型太震撼，两条带子做衣服太时髦，肩部“凹凸不平”

刘雯秀场新造型太震撼，两条带子做衣服太时髦，肩部“凹凸不平”