美文网首页代码改变世界
Python爬虫-字体反爬-猫眼国内票房榜

Python爬虫-字体反爬-猫眼国内票房榜

作者: 诸葛青云999 | 来源:发表于2019-05-15 10:39 被阅读0次

    解决:

    出现这种情况的原因是因为网页字体是在 CSS3 @font-face 规则中定义的, 我觉得这种字体就类似描点连线那种方式绘制出来的.

    因为定义规则是动态随机获取的, 不能保证每次都是一个字体文件.

    如下:

    可以看到, 同一数字所对应的字符是不一样的, 所以我们也就动态下载实时字体文件, 具体分析.

    虽然每次对应的字符可能不一样, 但是可以发现同一数字的字形是一样的, 也就是"描点的坐标"应该相同.

    事实证明在这个例子中是确实如此.

    如下:

    同一数字对象里的这些值是一样的.

    如果你在学习Python的过程当中有遇见任何问题,可以加入我的python交流学企鹅群:【611+530+101】,多多交流问题,互帮互助,群里有不错的学习教程和开发工具。学习python有任何问题(学习方法,学习效率,如何就业),可以随时来咨询我



    既然找到问题所在和规律了, 就可以直接开始写代码了.

    代码里loc.woff文件是先下载好的, 通过它找到数字和"描点坐标"之间的对应关系. 这个文件大家可以自己提前下载, 并且手动找到对应关系.

    这里也提供了我下载的loc.woff文件,https://github.com/ysl125963/maoyan, 里面的font.xml文件就是通过saveXML()方法得到的, 可以看到字体文件的具体结构.

    这是第一次写分享博客, 而且github也没怎么用过, 希望以后能坚持吧.

    相关文章

      网友评论

        本文标题:Python爬虫-字体反爬-猫眼国内票房榜

        本文链接:https://www.haomeiwen.com/subject/bbwuaqtx.html