导入运用
frombs4importBeautifulSoup
soup=BeautifulSoup(html,’lxml’)
解析器运用方法优势劣势
Python标准库BeautifulSoup(markup,”html.parser”)Python的内置标准库、执行速度适中、文档容错能力强Python2.7.3or3.2.2)前的版本中文容错能力差
lxmlHTML解析器BeautifulSoup(markup,”lxml”)速度快、文档容错能力强需求装置C言语库
lxmlXML解析器BeautifulSoup(markup,”xml”)速度快、唯一支撑XML的解析器需求装置C言语库
html5libBeautifulSoup(markup,”html5lib”)最好的容错性、以浏览器的方法解析文档、生成HTML5格局的文档速度慢、不依赖外部扩展.,beautifulsoup用法详解,
© 版权声明
THE END
请登录后发表评论
注册