对于爬虫的好奇好像由来已久,一直在研究python的爬虫,今天得空研究研究php的爬虫
index.php
1 set('start_page',90000); 7 $img->set('end_page',90010); 8 $img->start_getimg(); 9 }else{10 echo "开始";11 }
getimg.php
1 $key=$val; 20 } 21 22 /*CURL*/ 23 private function curl_get_con($url,$https=true,$method="get",$data=null){ 24 $ch=curl_init(); 25 26 curl_setopt($ch,CURLOPT_URL,$url); 27 28 curl_setopt($ch,CURLOPT_HEADER,false); 29 30 curl_setopt($ch,CURLOPT_RETURNTRANSFER,true); 31 32 if($https){ 33 curl_setopt($ch,CURLOPT_SSL_VERIFYPEER,false); 34 35 curl_setopt($ch,CURLOPT_SSL_VERIFYHOST,false); 36 } 37 38 if($method=="post"){ 39 curl_setopt($ch,CURLOPT_POST,true); 40 41 curl_setopt($ch,CURLOPT_POSTFIELDS,$data); 42 } 43 44 $str=curl_exec($ch); 45 46 curl_close($ch); 47 48 return $str; 49 } 50 51 /*保存图片方法*/ 52 private function save_img($url,$dir,$i){ 53 //创建目录 54 if(!is_dir($dir)){ 55 mkdir($dir,777); 56 } 57 //获取内容 58 $res=file_get_contents($url); 59 //命名文件 60 $file_name=$dir.'/'.$i.'_'.date('Ymd_His').'.jpg'; 61 //重写 62 file_put_contents($file_name,$res); 63 return $file_name; 64 } 65 66 67 68 /*获取方法*/ 69 public function start_getimg(){ 70 71 echo " 72
爬虫已运行:请查看".$this->url."文件夹 | |
正在捕捉".$i."。 | "; 84 85 if(empty($a)){ 86 echo " ----".$i."为空。 |
网址貌似被河蟹了~~