注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

淘尽网 官方博客

淘尽网http://www.tao3w.com做最好的比价网站

 
 
 

日志

 
 
关于我

淘尽网 http://www.tao3w.com 做最好的比价网站,做最好的数据抓取专家。

网易考拉推荐

用Python模拟浏览器操作  

2012-06-17 12:30:15|  分类: python |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
两种思路三种方法:
  1. 用PAMIE。建议不要使用,因为PAMIE为个人开发,里面的bug比较多,而且是直接使用win32com方式的,如果IE不小心修改了,后果很严重。另外,PAMIE3使用的是Python3,这个在Python世界中支持的不太好。
  2. 用selenium RC。这个东东很好,如果用这个东东完成网页自动测试不错,支持多种浏览器,而且是公司开发的,上手难易程度类似PAMIE。只不过需要打开浏览器,这个就看大家的需要了。
  3. 用Mechanize和Beautiful Soup。这个东东是在urllib2的基础上向上开发的,是个好工具。IBM介绍使用Mechanize的文章
Python中访问网页实际上存在两种思路,一种是利用现成的浏览器访问网页,这种方式的优点是可以利用浏览器处理复杂的javascript的内容,避 免自己受苦受累。经常看到有人问如何点击网页等等的需求,那么利用浏览器来实现就是一个好思路了。1,2均是这种思路,不过使用范围是网站自动测试。当然 自己写一个访问某某网页的东东也不错。
另外的思路就是利用urllib2来访问网页了。说实在话,选择python的理由有两个:google在用,另外它访问网页和正则表达式的方法让我很喜欢。最后的理由就是她是一个高生产力语言,用C写上200行代码可能用python写5行不到。
使用python的另外的好处是资源相对比较多,要解决一个问题,耐心的查找一下,总能发现好的资源。
  评论这张
 
阅读(767)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017