正太思路其实很简单,但是实现起来主要在细节部分的完善。
比如前面文章说的:
1、用户行为分析;
2、浏览器的设置
3、User-Agent设置
4、本级Mac地址的修改等。
这都是需要注意的点,其中我认为最重要的而是时间节点和用户行为的控制。
今天主要是说明一下代码部分具体是怎么实现,思路很简单,并没有太复杂的过程。核心已经说过了就是业务模块。
第一讲:User-Agent的设置以及使用。
这一讲主要分为以下几个模块:
总结之前的章节说过的内容最一下细分。
1、搜索类的点击:
所有类的点击常用的搜索就是百度,如何在百度第一个就能很快的找到自己的内容这个我们后面再说,今天主要说一下请求头的问题。
注意一个问题,如果你频繁的去点击百度,次数过多肯定会被百度封锁住IP的,这个毋庸置疑。
那么如何解决。
a、你需要大量的百度cookie,这个可以购买得到。而且很容易买得到。
b、模拟真实的点击时间,不要直接点击目标点位,所以需要做用户行为分析。
2、转连的点击:
点击连接就是我说的直接输入的问题,这个点击属于页面内部的跳转,所以你需要做的就是找论坛类的去发帖,因为据我的实验,论坛类的频繁输入直接访问,不会被封IP,也不会被封号,所以比较好操作,来源也好解决。这时候就很容易实现点击。
最后、ua的设置
这里给出两个方法:
1、购买很多的ua,收集也可以,使用header请求的时候带进去,这个我个人认为比较复杂,我不推荐,下面我推荐使用的。
2、使用fake_useragent:
如果你和我一样都在使用python的话,那么很庆幸的是我们有一个第三方库文件,就是fake_useragent,这个是一个ua类的库文件,你可以从中获得很多的ua。
使用非常简单。
from fake_useragent import UserAgent
def getUa():
ua = UserAgent(verify_ssl=False)
ua = ua.random
print(ua)
if __name__ == '__main__':
getUa()
网友评论