beautifulsoup(用法详解)

导入运用

frombs4importBeautifulSoup

soup=BeautifulSoup(html,’lxml’)

解析器运用方法优势劣势

Python标准库BeautifulSoup(markup,”html.parser”)Python的内置标准库、执行速度适中、文档容错能力强Python2.7.3or3.2.2)前的版本中文容错能力差

lxmlHTML解析器BeautifulSoup(markup,”lxml”)速度快、文档容错能力强需求装置C言语库

lxmlXML解析器BeautifulSoup(markup,”xml”)速度快、唯一支撑XML的解析器需求装置C言语库

html5libBeautifulSoup(markup,”html5lib”)最好的容错性、以浏览器的方法解析文档、生成HTML5格局的文档速度慢、不依赖外部扩展.,beautifulsoup用法详解,

© 版权声明
THE END
喜欢就支持一下吧
点赞37赞赏 分享
评论 抢沙发

请登录后发表评论