在这一章我们来使用正则表达式来让大家初步了解提取方法
正则对比 bs4,lxml 而言,有好处也有坏处,好处就是可以灵活提取,坏处就是写正则表达式很难写,需要花费一些时间,因为,我们需要构造出能正确匹配我们需要的表达式
大家也不用太担心,因为在爬虫中有一个比较万能的写法 .*? 我们会用得比较多,其他的相对会用得少一些
在此之前了,小编推荐大家可以看一看正则的符号用法:
https://www.imooc.com/article/20354
https://blog.csdn.net/u010760374/article/details/79974586
不同背下来,根据具体实际情况忘了去查就可以了。