码迷,mamicode.com
首页 > 微信 > 详细

爬虫技术:从sougou网站访问微信公众号的过程

时间:2019-09-28 16:23:32      阅读:139      评论:0      收藏:0      [点我收藏+]

标签:构造   oca   返回   src   meta   color   height   js代码   tle   

一:分析过程:fidder + chrome开发者工具

技术图片

1:输入nba跳转的页面,每页显示10条相关公众号的信息

2:分析网站得到每条标题的详情页链接地址在:

技术图片

3,请求上图中的url,会返回一段js代码,js代码的作用是,构造一个的新的url,并对新的url进行了请求。

技术图片

认真分析一下这段js代码,除了更换请求的url,还做了些什么。

<meta content="always" name="referrer">
<script>
    var url = ‘‘;
    url += http://mp.w;
    url += eixin.qq.co;
    url += m/s?src=11&;
    url += timestamp=1;
    url += 569657625&v;
    url += er=1879&sig;
    url += nature=EtbL;  每一个title的signature都不一样。
    url += qcBn3zLfhrG;
    url += -3E1bon8g8i;
    url += tE*ZzQ-9aDa;
    url += myXb5jH7M2ioQfn7GbekEK2cn2BCeNQZa1Pl70JDLMChQZBD-kJ-jwz-xf0M*VB4Hmak7IYa7qMsYp8wevg4x5VNGLt&new=1;
    url.replace("@", "");
    window.location.replace(url)
</script>

# 人为操作频繁都直接封ip?

爬虫技术:从sougou网站访问微信公众号的过程

标签:构造   oca   返回   src   meta   color   height   js代码   tle   

原文地址:https://www.cnblogs.com/meloncodezhang/p/11603487.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!