php抓取_php抓取div内容

㈠ php抓取div内容

<?php
$text=file_get_contents('http://cn.bing.com/knows/?tid=');
preg_match_all('/<divid="hp_text"class="largeText">([^</div>]+)</div>/',$text,$arr);
var_mp($arr[1]);
?>

输出:

array (size=1)
0 => string '有那么个地方，曾经让你想逃；有那么个地方，生活过才知晓；有那么个地方，听别人讲起你会心怀骄傲；有那么个地方，一直是你心底的宝。' (length=189)

㈡ PHP获取网页内容的几种方法

简单的收集下PHP下获取网页内容的几种方法:
用file_get_contents,以get方式获取内容。
用fopen打开url,以get方式获取内容。
使用curl库，使用curl库之前，可能需要查看一下php.ini是否已经打开了curl扩展。
用file_get_contents函数，以post方式获取url。
用fopen打开url，以post方式获取内容。
用fsockopen函数打开url，获取完整的数据，包括header和body。

㈢ php中想要抓取网页中某一段的数据的代码

<?php
$url='abc.com/';
$data=get_file($url);

$pattern='你的内容正则表达式';
perg_match($pattern,$data,$match);

print_r($match);

function get_file($url)
{
$curl = curl_init($url);
curl_setopt($curl, CURLOPT_HEADER, 0);
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
$data = curl_exec($curl);
return $data;
}
?>

㈣ php抓取网页指定的内容

我给你一个思路, 代码我也不会给的, 会被网络删的.

抓取网上的数据, 一般用正则去匹配. 你可以匹配开头为<div class="so_weather">的, 然后匹配结尾. 结尾尽量是这个开头div的下一个同级div, 如<div id="asda">, 这样. 然后得到的数据用strip_tags函数将html代码都去了, 得到的结果就是你想要的

㈤ php抓取数据

像这样采集的程序一般把循环的速度搞一下，如果太快，一个网速跟不上，一是服务器设置了防采集或是防CC攻击等，如果你每5分钟采集一次，这样，肯定不会受到限制，如果你一分钟采集100或是更多次这服务器会限制你访问，认为你是恶意攻击，明白？就像网络或google 机器人一样，如果不做限制采集过多，会把服务器拉死。

㈥ php如何抓取网页中的数据

<divid="Div3"class="modResumeInfo">
<divclass="title"onclick="clickLabel(rsmEExCt)">
<divclass="dcrLdcrArrowGreen"></div>
<h3>外语能力</h3>
</div>
<divid="Div4"class="content">	

<divclass="workExCom">英语：读写能力精通|听说能力熟练</div>

<divclass="workExCom">韩语：读写能力一般|听说能力良好</div>

<divclass="workExCom">德语：读写能力一般|听说能力一般</div>

</div>	
</div><!--modResumeInfo结束-->

㈦怎样用PHP抓取整个网站的链接

$html = file_get_html('http://www.google.com/');
// Find all links
foreach($html->find('a') as $element)
echo $element->href . '<br>';
不知道你PHP支持不支持 file_get_html这个函数

但是像你说那样的抓肯定会超时的

㈧ PHP怎样抓取网页代码中动态显示的数据

你是想抓别人网页上ajax动态载入的数据吧？

1、要找到它的ajax载入的URL地址

2、利用PHP的file_get_contents($url)函数读取那个url地址。

3、对抓取到的内容进行分析或正则过滤。

㈨ php抓取CMD里面的数据

cmd运行mysql，如果你没有设置过字符集，那mysql默认字符集是latin1（不支持你进入phpmyadmin，把数据表字段的【整理】改成gbk，建表的时候【整理】也,qvGhjY

㈩ PHP抓取网页指定内容

<?php
/*
* 如下：方法有点笨
* 抓取网页内容用 PHP 的正则
* 用JS每隔5分钟刷新当前页面---即重新获取网页内容
*
* 注： $mode中--<title></title>-更改为所需内容（如 $mode = "#<a(.*)</a>#";>获取所有链接）
*
* window.location.href="http://localhost//refesh.php";中的http://localhost//refesh.php
* 更改为自己的URL----作用：即刷新当前页面
*
* setInterval("ref()",300000);是每隔300000毫秒（即 5 * 60 *1000 毫秒即5分钟）执行一次函数 ref()
*
* print_r($arr);输出获得的所有内容 $arr是一个数组可根据所需输出一部分（如 echo $arr[1][0];）
* 若要获得所有内容可去掉
* $mode = "#<title>(.*)</title>#";
if(preg_match_all($mode,$content,$arr)){
print_r($arr);
echo "<br/>";
echo $arr[1][0];
}
再加上 echo $content；
*/
$url = "http://www..com"; //目标站
$fp = @fopen($url, "r") or die("超时");

$content=file_get_contents($url);
$mode = "#<title>(.*)</title>#";
if(preg_match_all($mode,$content,$arr)){
//print_r($arr);
echo "<br/>";
echo $arr[1][0];
}
?>
<script language="javaScript" type="text/javascript">
<--
function ref(){
window.location.href="http://localhost//refesh.php";
}
setInterval("ref()",300000);
//-->
</script>

热点内容

手机app怎么操控电热水器发布：2025-07-12 13:38:30 浏览：839

python爬虫框架推荐发布：2025-07-12 13:26:36 浏览：518

matlab遗传算法适应度函数发布：2025-07-12 12:59:05 浏览：130

制作linux系统镜像发布：2025-07-12 12:52:27 浏览：154

域名解析服务器ip地址不能正常发布：2025-07-12 12:50:06 浏览：845

程序员十万个为什么发布：2025-07-12 12:44:19 浏览：535

维信卡卡贷app怎么下载不了发布：2025-07-12 12:31:23 浏览：919

qdim命令使用发布：2025-07-12 12:15:36 浏览：873

截图R命令发布：2025-07-12 12:07:26 浏览：654

基于单片机的智能台灯设计发布：2025-07-12 12:06:51 浏览：685

多余app是怎么兑换皮肤的发布：2025-07-12 12:00:33 浏览：552

sql数据库查询表命令发布：2025-07-12 11:42:28 浏览：551

简单音乐网站源码发布：2025-07-12 11:38:41 浏览：644

运动健康app华为手表怎么连接发布：2025-07-12 11:33:05 浏览：748

肌肉塑造全书pdf下载发布：2025-07-12 11:02:48 浏览：796

安卓简约拼图用什么软件好发布：2025-07-12 10:51:33 浏览：289

fx1n加密程序发布：2025-07-12 10:50:45 浏览：844

淘客阿里云服务器发布：2025-07-12 10:47:36 浏览：476

100压缩打造发布：2025-07-12 10:30:57 浏览：422

安卓手机怎么和苹果平板传文件发布：2025-07-12 10:30:25 浏览：973

导航:首页 > 编程语言 > php抓取

php抓取

与php抓取相关的资料