博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python 解析html 时lxml跟beautifulSoup对比
阅读量:4358 次
发布时间:2019-06-07

本文共 707 字,大约阅读时间需要 2 分钟。

根据我使用经验lxml比beautifulSoup速度更快,容错和处理能力更强。

lxml示例如下:

      def getGooglePlayAppInfo(self):                 pageUrl='https://play.google.com/store/apps/details?id=com.taobao.taobao'                 pageUrl_openHandle=self.open_url(pageUrl)                 if pageUrl_openHandle:                         pageUrlHtmlSource=pageUrl_openHandle.read().decode("utf-8")                         #print pageUrlHtmlSource                         doc=etree.HTML(pageUrlHtmlSource)                         hrefs = doc.xpath(u"//a[@class=\"doc-header-link\"]")                         for href in hrefs:                                 print href.text

  

转载于:https://www.cnblogs.com/chaoboma/archive/2013/05/13/3075236.html

你可能感兴趣的文章
PostgreSQL9.1 with PostGIS 2.1.4 for mapping coordinates on linux/ubuntu 已经打包成deb 可下载...
查看>>
[LeetCode] Max Consecutive Ones
查看>>
redis缓存本地安装教程
查看>>
ALTER AVAILABILITY GROUP (Transact-SQL)
查看>>
探究X Window System运行原理与启动过程
查看>>
Arch 安装 gnome桌面
查看>>
SpringCloud学习笔记(9)----Spring Cloud Netflix之声明式 REST客户端 -Feign的使用
查看>>
Python的平凡之路(17)
查看>>
Git for Windows之使用SSH协议开通公钥免密登陆功能
查看>>
Identity Server4学习系列一
查看>>
计算机硬件-基础
查看>>
完成登录功能,用session记住用户名
查看>>
C++ code:剩余串排列
查看>>
网页播放器插件
查看>>
Python第三方库jieba(中文分词)入门与进阶(官方文档)
查看>>
【转】eclipse for java ee的tomcat配置(常见问题解决)
查看>>
QQMacMgr for Mac(腾讯电脑管家)安装
查看>>
特效:ListBox数据加载特效
查看>>
php分页功能limit
查看>>
PHP中开启和关闭错误信息的提示
查看>>