Python 学习笔记 074

作者: 夜羽萧轩 | 来源:发表于2019-10-19 17:53 被阅读0次

    关于爬虫的分类  


    今日编程小插曲:

    怎么解决无法在浏览器中调用输入法的问题?

    百度一下后发现应该是ctfmon.exe停止了运行,发现原因后就应该能解决了。

    那些方法看起来比较复杂,给大家介绍下我刚用的方法吧!

    首先 打开任务管理器,判断(确认)该程序确实已经停止了运行;

    之后打开运行(快捷键Win+R)或者文件-运行新任务

    粘贴文件存放路径让他重新运行就解决了~

    文件存放路径 c:\windows\system32\ctfmon.exe


    OK,搞定电脑issue,然后继续~


    网络爬虫的分类

    1. 通用网络爬虫

    2 .聚焦网络爬虫

    3. 增量式网络爬虫

    4.深层网络爬虫

    怎么说呢?通用网络爬虫就是咱们要学习的爬虫,也是使用的最多的那种爬虫~


    1. 通用网络爬虫

    1.1 概念 

    1.2 用户群体

    1.3 目标

    1.4 抓取流程 

    Pic - 1

    其实关于网页网址解析的那一套我可以重新演示下~

    首先解析本地Host文件对应的域名和IP

    比如这样  host文件中存在这样的两行

    # 127.0.0.1 localhost     

    # ::1 localhost

    127.0.0.1      rywbltest.com

    简单解析如下:

    1.# 为Host文件中自带的或者程序加的,可以认为其不存在

    2.localhost和rywbltest.com都是域名 

    前面的是系统自带的特殊域名 后面的是我自己加的,用于我的个人网站的调试的

    3.输入域名 电脑会在Host文件中查找对应的域名和IP地址

    4.第一个对应为IPV4地址 第二个为V6地址

    (二者具体还是有点差别的,不过现在我们就认为差不多咯)

    就像这样 

    Pic - 2

    两个地址都是非公开的自定义域名,但是通过host文件自定义可以识别到自定义的IP,然后访问到对应的网站。

    这里我吧我的网站解析到了本地环路地址127.0.0.1上。所以本地可以ping通,而且都可以通过地址或者域名来进行访问

    Pic - 3

    嗯,大概就是这样子咯~


    未完待续 2019年10月18日23:11:44

    相关文章

      网友评论

        本文标题:Python 学习笔记 074

        本文链接:https://www.haomeiwen.com/subject/cqepmctx.html