网站首页娱乐新闻焦点新闻历史秘闻社会百态技术文章科技资讯其他资讯女性专栏

首页 > 网络文摘 > 正文

【Python】爬取IMDBTOP250

浏览数：75 / 时间：2015年06月12日

在网上看到有人利用python+beautifulsoup爬取豆瓣Top250

试着自己模仿这个做了个爬取IMDB的，

可惜只能爬取到11个。

后来检查了超久，

才发现，

soup=BeautifulSoup(contents)这里，内容不完整，只能到11个电影为止。

代码如下：

import urllib2
from bs4 import BeautifulSoup
mylist=[]

def crawl(url):
    headers={‘User-Agent‘:‘Mozilla/5.0(Windows;U;Windows NT 6.1;en-US;rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6‘}
    req=urllib2.Request(url,headers=headers)
    page=urllib2.urlopen(req,timeout=200)
    contents=page.read()
    soup=BeautifulSoup(contents)
    for tag in soup.find_all(‘tr‘,class_={‘odd‘,‘even‘}):
            m_order=tag.find(‘td‘,class_=‘titleColumn‘).span.get_text()
            m_name=tag.find(‘td‘,class_=‘titleColumn‘).a.get_text()
            m_rating_score=float(tag.find(‘td‘,class_=‘ratingColumn imdbRating‘).strong.get_text())
            print("%s %s %s" % (m_order,m_name,m_rating_score))
            mylist.append((m_order,m_name,m_rating_score))

crawl(‘http://www.imdb.com/chart/top?ref_=nv_ch_250_4‘)

后来，好像需使用正则表达式，把爬取来的网页进行处理后才好弄。

但是正则表达式未操作过，

如果有人看到，想问下是否可以不通过正则表达式来解决这个问题呢？

郑重声明：本站内容如果来自互联网及其他传播媒体，其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。

【Python】爬取IMDBTOP250

标签： class style 代码 com log 使用 http 问题 it class style 代码 com log 使用 http 问题 it

相关文章

随机文章

您可能还喜欢

您可能还喜欢

最新图文

更多

可爱穿搭很重要

可爱穿搭很重要

工藤美樱写真集

工藤美樱写真集

斯米兰海水是真不错

斯米兰海水是真不错

海边想拍氛围照

海边想拍氛围照

海岛度假

海岛度假

甜妹 ootd 穿搭

甜妹 ootd 穿搭

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

7080后儿时集体回忆插画

7080后儿时集体回忆插画

西安子午峪满山的白杜鹃太美了

西安子午峪满山的白杜鹃太美了

职业模特拍摄省事很多

职业模特拍摄省事很多

您可能还喜欢

更多

斯米兰海水是真不错

斯米兰海水是真不错

乌克兰美女领导克里米亚辛菲罗波尔

乌克兰美女领导克里米亚辛菲罗波尔

东莞孝子举刀弑母后的90个日与夜

东莞孝子举刀弑母后的90个日与夜

沈阳零下16度下模特比基尼走秀

沈阳零下16度下模特比基尼走秀

毛泽东和蒋介石的书法，你能区分不？

毛泽东和蒋介石的书法，你能区分不？

深圳小区现4层楼深大坑保安被吞噬亡

深圳小区现4层楼深大坑保安被吞噬亡

曝快播公司现大量警察员工只进不出

曝快播公司现大量警察员工只进不出

秦舒培高挑身材

秦舒培高挑身材

印尼原始部落生活大揭秘

印尼原始部落生活大揭秘

车臣47岁已婚军阀逼婚17岁少女

车臣47岁已婚军阀逼婚17岁少女

您可能还喜欢

更多

女小偷跪地求被偷者别报警

女小偷跪地求被偷者别报警

潘主兰书法

潘主兰书法

尼泊尔四个月大婴儿震后22小时获救

尼泊尔四个月大婴儿震后22小时获救

北京车展美女礼仪一览

北京车展美女礼仪一览

2014春南宁车展部分模特

2014春南宁车展部分模特

小众海滩试拍

小众海滩试拍

吴莫愁发新片谈李代沫动情落泪：等他回来

吴莫愁发新片谈李代沫动情落泪：等他回来

工藤美樱写真集

工藤美樱写真集

深圳富豪轰动澳洲买豪宅开派对会巨星

深圳富豪轰动澳洲买豪宅开派对会巨星

重庆街拍衣服买大了

重庆街拍衣服买大了