第5章 解析网页
我们已经能够使用requests库从网页把整个源代码爬取下来了,接下来需要从每个网页中提取一些数据。本章主要介绍使用3种方法提取网页中的数据,分别是正则表达式、BeautifulSoup和lxml。
3种方法各有千秋,想要快速学习的读者可以先挑选一种自己喜欢的方法学习,3种方法都能够解析网页。你也可以先阅读本章的最后一节,在了解3种方法各自的优缺点后,再选择一种方法开始学习。
目录
第5章 解析网页
5.1 使用正则表达式解析网页
最后
以上就是会撒娇溪流最近收集整理的关于《Python网络爬虫从入门到实践 第2版》第5章 解析网页第5章 解析网页的全部内容,更多相关《Python网络爬虫从入门到实践内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复