① php 正則匹配A標簽獲得連接和文字
<a\b[^>]*\bhref=([^\s>]+)[^>]*>[\s\S]*?([^<>]*)</a>
解釋:
<a\b #匹配a標簽的開始
[^>]* #匹配a標簽href屬性前的其他屬性
\bhref=([^\s>]+) #匹配href屬性,並將匹配到的內容捕獲到分組1當中
[^>]*> #匹配a標簽的結束
[\s\S]*? #匹配a標簽文本前的img標簽
([^<>]*) #匹配a標簽文本並捕獲到分組2當中
</a> #匹配a標簽的關閉
分組1和分組2即為所需內容
簡化版:
<a\s*href=([^>]+)><img[^>]+>([^>]+)</a>
實際上簡化版可能效率更高……因為嚴格按照原文本格式來匹配。
不過如果標簽形式有一點變化就可能導致匹配失敗,所以這里寫了兩個版本。。
② 如何用php獲取一個網頁iframe中的內容
//1.先獲取到iframe的節點或者src地址,也就是iframe中的url地址,
//2.再次將地址傳入到php,可以通過ajax.
//3.php端可以使用
$url='iframe的src地址';
$html=file_get_contents($url);