扫码关注官方订阅号
怎么用python正则从这段脚本中提取coggles.co.uk域名呢,望各路高手指点显示下身手...
正则实现的话只要保证你的标定/特征是唯一的就好。但是"url"这个标志又不是唯一的。这个时候@prolifes的方法是很好的。
"url"
如果一定要正则实现呢,要用到零宽断言(zero-width assertions),当然这个词的翻译比较直,带来很多误解。它其实意思是指定位置的匹配,位置的宽度就是0嘛。
这里我们可以看到我们所需的这个"url"在"location"里面,可以以此为位置信息。
"location"
代码如下:
re.search('(?<=location).+?"url": "([^"]+)"', string, re.DOTALL).group(1)
稍微解释一下,(?<=location)这个地方就是指前面得有location。后面有的话这样写:(?=location)re.DOTALL这个是必须的,因为这些字符串已经跨行了。他的作用是将.的字符串匹配范围扩大,包含换行符。"([^"]+)"这个地方是我的习惯,[^"]意指所有非"的字符,这就匹配了双引号中所有的字符串。
(?<=location)
(?=location)
re.DOTALL
.
"([^"]+)"
[^"]
"
微信扫码关注PHP中文网服务号
QQ扫码加入技术交流群
Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号
PHP学习
技术支持
返回顶部
正则实现的话只要保证你的标定/特征是唯一的就好。但是
"url"这个标志又不是唯一的。这个时候@prolifes的方法是很好的。如果一定要正则实现呢,要用到零宽断言(zero-width assertions),当然这个词的翻译比较直,带来很多误解。它其实意思是指定位置的匹配,位置的宽度就是0嘛。
这里我们可以看到我们所需的这个
"url"在"location"里面,可以以此为位置信息。代码如下:
稍微解释一下,
(?<=location)这个地方就是指前面得有location。后面有的话这样写:(?=location)re.DOTALL这个是必须的,因为这些字符串已经跨行了。他的作用是将.的字符串匹配范围扩大,包含换行符。"([^"]+)"这个地方是我的习惯,[^"]意指所有非"的字符,这就匹配了双引号中所有的字符串。