PHP通过正则表达式获取网页中的所有图片

来源:博客园 分类: 文章浏览史 发布时间:2020-08-17 12:11:24 最后更新:2020-08-17 浏览:111
转载声明:
本文为摘录自“博客园”,版权归原作者所有。
温馨提示:
为了更好的体验,请点击原文链接进行浏览
摘录时间:
2020-08-17 12:11:24

PHP通过正则表达式获取网页中的所有图片,用到的函数有:file_get_contents() 函数把整个文件读入一个字符串中,preg_match_all函数进行全局正则表达式匹配,array_unique函数去除数组中重复的值

  1. <?php 
  2.     $url="http://sports.qq.com/photo/?pgv_ref=aio"; 
  3.     //file_get_contents() 函数把整个文件读入一个字符串中 
  4.     $string=file_get_contents($url); 
  5.     //preg_match_all函数进行全局正则表达式匹配。 
  6.     preg_match_all("/<img([^>]*)\s*src=('|\")([^'\"]+)('|\")/", 
  7.                     $string,$matches);//带引号 
  8.     //preg_match_all("/<img([^>]*)\ssrc=([^\s>]+)/",$string,$matches);//不带引号 
  9.     $new_arr=array_unique($matches[0]);//去除数组中重复的值 
  10.     foreach($new_arr as $key){ 
  11.         echo $key."</br>"; 
  12.     
  13. ?> 

 代码运行结果将显示所有抓取的图片。

不足之处:如果图片路径不完整,则图片无法显示,所以还需要继续研究下。

php技术微信