• linkedu视频
  • 平面设计
  • 电脑入门
  • 操作系统
  • 办公应用
  • 电脑硬件
  • 动画设计
  • 3D设计
  • 网页设计
  • CAD设计
  • 影音处理
  • 数据库
  • 程序设计
  • 认证考试
  • 信息管理
  • 信息安全
菜单
linkedu.com
  • 网页制作
  • 数据库
  • 程序设计
  • 操作系统
  • CMS教程
  • 游戏攻略
  • 脚本语言
  • 平面设计
  • 软件教程
  • 网络安全
  • 电脑知识
  • 服务器
  • 视频教程
  • dedecms
  • ecshop
  • z-blog
  • UcHome
  • UCenter
  • drupal
  • WordPress
  • 帝国cms
  • phpcms
  • 动易cms
  • phpwind
  • discuz
  • 科汛cms
  • 风讯cms
  • 建站教程
  • 运营技巧
您的位置:首页 > CMS教程 >建站教程 > 利用curl函数抓取网站数据,仿造IP+伪造来源+防屏蔽

利用curl函数抓取网站数据,仿造IP+伪造来源+防屏蔽

作者:站长图库 字体:[增加 减小] 来源:互联网

站长图库向大家介绍了curl函数,抓取网站数据,仿造IP,伪造来源,防屏蔽等相关知识,希望对您有所帮助

这篇教程带大家学习使用PHP的curl函数抓取网站数据,并且仿造IP、伪造来源、防屏蔽的方法,希望对小伙伴们有所帮助。


1、伪造客户端IP地址,伪造访问referer:(一般情况下这就可以访问到数据了)

curl_setopt($curl, CURLOPT_HTTPHEADER, ['X-FORWARDED-FOR:110.85.108.185', 'CLIENT-IP:110.85.108.185']);curl_setopt($curl, CURLOPT_REFERER, 'http://www.demo.com/test.php');


2、如是上面的还是不行,可能是别人抓到了真实IP,这时候我们就使用代{过}{滤}理访问。

#  详细方式curl_setopt($curl, CURLOPT_PROXY, 'x.x.x.x');    //代{过}{滤}理服务器地址curl_setopt($curl, CURLOPT_PROXYPORT, 80);             //代{过}{滤}理服务器端口//curl_setopt($curl, CURLOPT_PROXYUSERPWD, ':'');      //http代{过}{滤}理认证帐号,username:password的格式curl_setopt($curl, CURLOPT_PROXYTYPE, CURLPROXY_HTTP); //使用http代{过}{滤}理模式#  简写方式curl_setopt($curl, CURLOPT_PROXY, 'http://x.x.x.x:80');


3、还有一种就是用浏览器可以访问,用curl不行。(对方检查了useragent,如果没有就认为是非法来源等验证了)

$useragent = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 ';$useragent.= '(KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36';curl_setopt($curl, CURLOPT_USERAGENT, $useragent);


PHP完整Curl抓取数据函数:

/*** 请求接口* [url=home.php?mod=space&uid=718080]@access[/url] public* [url=home.php?mod=space&uid=952169]@Param[/url] string $url 请求地址* @param array $data 提交参数 没有get 有post* [url=home.php?mod=space&uid=155549]@Return[/url] bean|array*/public function send($url=''){      set_time_limit(0);    $curl = curl_init();    curl_setopt($curl, CURLOPT_URL, $url);    curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);    curl_setopt($curl, CURLOPT_CONNECTTIMEOUT, 10);    curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1);    curl_setopt($curl, CURLOPT_HTTPHEADER, ['X-FORWARDED-FOR:127.0.1.1', 'CLIENT-IP:127.0.1.1']);    curl_setopt($curl, CURLOPT_REFERER, 'http://www.demo.com/demo.php');    curl_setopt($curl, CURLOPT_PROXY, 'http://127.0.0.1:80');    $useragent = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 ';    $useragent.= '(KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36';    curl_setopt($curl, CURLOPT_USERAGENT, $useragent);    if(!empty($data) && is_array($data)){        curl_setopt($curl, CURLOPT_POST, true);        curl_setopt($curl, CURLOPT_POSTFIELDS, $data);    }    $html = curl_exec($curl);    if($error=curl_errno($curl)){        return false;    }    curl_close($curl);    return $html;}

以上就是利用curl函数抓取网站数据,仿造IP+伪造来源+防屏蔽的方法,大家学会了吗?


分享到:QQ空间新浪微博腾讯微博微信百度贴吧QQ好友复制网址打印

您可能想查找下面的文章:

  • 利用curl函数抓取网站数据,仿造IP+伪造来源+防屏蔽

相关文章

  • Photoshop设计碳纤维风格图标教程
  • dedecms文章审核后给会员增加积分或者金币的办法
  • PHP高并发实例详解之商品库存超卖并发测试
  • 以Laravel-admin为例详解Laravel单用户登录
  • 实例详解thinkphp6搭建后端api接口
  • PHPcms v9调用热门文章的两种方法
  • Phootoshop制作金属质感的字体教程
  • WordPress“正在执行例行维护,请一分钟后回来”解决方法
  • Discuz不使用插件实现简单的打赏功能
  • 百度更加重视和同行交换连接,事实证明

文章分类

  • dedecms
  • ecshop
  • z-blog
  • UcHome
  • UCenter
  • drupal
  • WordPress
  • 帝国cms
  • phpcms
  • 动易cms
  • phpwind
  • discuz
  • 科汛cms
  • 风讯cms
  • 建站教程
  • 运营技巧

最近更新的内容

    • Laravel实现谷歌点图验证码【推荐】
    • 解析关于Thinkphp5复合型缓存的使用问题
    • 网站成立初期创造访问量的技巧
    • ThinkPHP5分页paginate代码实例解析
    • 为网站选择一个适当的DMOZ目录
    • 一个标志的制作过程
    • Photoshop绘制立体质感的网页开关按钮
    • Photoshop制作一个古典的小木箱
    • WordPress使用OSS Upload后媒体库无法加载一直转圈解决方法
    • Photoshop制作绚丽的万花筒背景教程

关于我们 - 联系我们 - 免责声明 - 网站地图

©2020-2025 All Rights Reserved. linkedu.com 版权所有