当前位置：首页 > Web开发 > 正文

主要分析相关同一级别的源代码的共同点 2

2024-03-31 Web开发

import requests
import re

txt=‘<a href="http://www.mamicode.com/https:/www.vgirls.com/13404.html" target="_blank">想把夏日的阳光寄给冬日的你</a>‘
urla=re.findall(‘<a href="http://www.mamicode.com/(.*?)" target="_blank">.*?</a>‘,txt)
for i in urla:
print(i)
urlb=re.findall(‘<a href="http://www.mamicode.com/.*?" target="_blank">(.*?)</a>‘,txt)
for i in urlb:
print(i)
功效：

https://www.vgirls.com/13404.html
想把夏日的阳光寄给冬日的你

总结：

1。按照网页源代码找到关键位置，主要分析相关同一级另外源代码的配合点

2。找到关键如txt的内容，，复制下来
3。粘贴到空白处：urla=re.findall(‘ ‘,txt)
4.需要选择出来的部分去失改成 (.*?)；不想选择但内容又变革的去失改成 .?*,必然不能加括号

5。所以第一个只提取超级连接的地点；第二个只提取“标签A中的文字"

正则表达式查找网页源代码提取指定内容

温馨提示: 本文由Jm博客推荐，转载请保留链接: https://www.jmwww.net/file/web/30859.html

上一篇： 201 );}#left {width: 200px;margin -left: -100% ;background:
下一篇：调用 unserilize() 方法前则先调用__wakeup方法

主要分析相关同一级别的源代码的共同点 2

推荐文章

热门文章

标签

友情链接

关于本站

联系我们

特别鸣谢