1.直接从实战开始,抓取新东方在线课程http://www.koolearn.com/
- 找到所有要抓取的分类,组成数组,比如
$cat_url =array (
array (
'cat_id' => '101',
'cat_name' => 'TOEFL',
'url' => 'http://www.koolearn.com/toefl/',
),
array (
'cat_id' => '108',
'cat_name' => 'GMAT',
'url' => 'http://www.koolearn.com/gmat/',
),
);
$base_url = 'http://www.koolearn.com';
cat_id ,cat_name 对应本地数据库里的数据。
-
记录抓取的日志,如在laravel3里可以简单写个函数
function _log($info, $pre='===') {
$info = $pre.$info."\n";
echo $info;
File::append('storage/logs/get.log', $info);
return;
} -
开始抓取
网友评论