今天老大让我抓取某个网页的数据,最开始我就想到了querylist,但是不管怎么获取数据都没有成功,最后在网上了解到queryList无法爬取table
想了很久,最后想到了一个办法,先用file_get_contents获取当前界面的html代码,然后用自己写的去html代码空的函数,trimall
function trimall($str){
$qian=array(" "," ","\t","\n","\r");
return str_replace($qian, '', $str);
}
如果需要处理乱码,用iconv函数
最后用strip_tags去除所有Html代码
根据需求匹配自己需要的数据
主要解决的问题是:php抓取界面显示的内容
网友评论