写点什么

lxml

0 人感兴趣 · 2 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/15/1538113566776cb104621d459ee1bcee.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

爬虫入门到放弃 02:如何解析网页获取数据

用户头像
叫我阿柒啊
2021-07-16

在原生爬虫中,lxml封装的xpath,相对于bs4封装的css性能要好,所以很多人选择使用xpath。在爬虫框架scrapy中,其底层使用的是parsel封装的选择器,css规则最终也会转换成xpath去选择元素,所以css会比xpath慢,。

lxml_lxml技术文章_InfoQ写作社区