注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

淘尽网 官方博客

淘尽网http://www.tao3w.com做最好的比价网站

 
 
 

日志

 
 
关于我

淘尽网 http://www.tao3w.com 做最好的比价网站,做最好的数据抓取专家。

网易考拉推荐

安装spynner  

2013-05-23 22:16:02|  分类: python |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

sudo apt-get install xorg-dev, libxtst-dev

sudo pip install spynner

这个类库可解析js加载出来的数据!


测试:

复制代码
#!/usr/bin/env python
import spynner
import pyquery

browser = spynner.Browser(debug_level=spynner.DEBUG)
browser.create_webview()
#browser.show()
browser.set_html_parser(pyquery.PyQuery)
browser.load("http://detail.tmall.com/item.htm?spm=a230r.1.10.2.cpNxpf&id=19955188752&ad_id=&am_id=&cm_id=&pm_id=")

browser.wait(2)
print "url:", browser.url

# Soup is a PyQuery object
browser.soup.make_links_absolute(base_url=browser.url)
print "html:", browser.soup("#J_PromoBox").html()#这个id的数据就是js加载出来的

# Demonstrate how to download a resource using PyQuery soup
#imagedata = browser.download(browser.soup("img:first").attr('src'))
#print "image length:", len(imagedata))
browser.close()
  评论这张
 
阅读(792)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017