第一次接触字体反爬是在16年12月份的汽车之家论坛页面,当时是一头懵逼的状态,目前有字体反爬的网站有:猫眼,汽车之家,天眼查,大众点评等。
本次的就来分享大众点评的字体破解:
破解的目标网站地址:http://www.dianping.com/shanghai/ch10
首先用鼠标选择页面内容,选择不到的数字或汉字都是通过非文本显示在页面上的,直接爬取下来会出现缺字的现象,碰到这种反爬不要慌,一个字----“盘”
f12检查加密字的网页源代码,你会发现他的源代码都是span class=qhjgfs这种格式,而且并没有文本内容,其实这种反爬效果是通过css样式来实现的,你只需要找到这些字体库的css文件,找到汉字和class标签属性值得对应关系就能解出汉字
查看汉字的Styles,你会发现css文件就藏在里面
css字体文件:
svg字体文件:
打开css文件你会发现一种类型class属性值(例如:gsx)对应一个svg字体文件,那么可以猜测这个属性值和background的两个坐标可以确定svg字体文件内的一个汉字,css文件的backgroup的第二个值(y)近似等于svg的y值(每种svg字体文件y值都有0-24的偏移),确定的y值那么就确定了你要解析的汉字是在svg的第几行,接下来x值肯定是用来确定汉字是在该行的第几列具体算法是:(x/12+1)
到此分享完毕!有其他需要可以加小编微信
网友评论