美文网首页笔戈 Web Team产品设计
工程师揭开知乎匿名背后的秘密

工程师揭开知乎匿名背后的秘密

作者: 流星狂飙 | 来源:发表于2014-11-03 23:53 被阅读4461次
    匿名者

    大家都希望知乎变成一个知识的圣地,一个安定美好的生态圈,但有人的地方就有江湖,这里有的是看不见硝烟的文字的斗争,明争暗斗,箭拨弩张,好不热闹。

    知乎的匿名功能为社区的战斗提供了一个很好的平台:

    优势

    • 有些用户比较含蓄,他们并不喜欢在观点后面署上自己的大名。

    • 让用户自由的表达,网络上因为某些言论而搭上官司的例子素见不鲜,匿名的回答削减了用户的顾虑。给他们一种说出去的话,泼出去的水,与自己无关的错觉。

    • 当我们在表达某个观点时,有没有因为深思熟虑又把这个观点咽下去了?甚至以后回头自己还会对当时自己的想法感到奇怪。匿名的回答,正好把当时没经过深思熟虑的想法记录下来了。
      一言以敝之,知乎接纳每一个用户,任何时刻的表达。

    弊端

    • 透露一些重要的本身应该被保密的信息;

    • 发送不良的信息;

    • 对一些事情进行错误的评价;

    • 对提问者进行人事攻击等等。

    匿名真的为这些不良的行为提供了一个温床了吗?知乎是个平台,自然会出台一些政策来规范这些,知乎的管理员也在一刻不停地瞒着处理知乎各种不和谐的事情。

    官方条例

    1、我匿名问或回答一个问题,这个地球上谁有权限查看我是谁?

    匿名用户信息的查看只有一种方式,就是通过详细分析数据库中的源数据来判定。知乎团队能访问数据库的成员不超过两人。匿名用户的数据分别放置,且数据访问的权限分离,也就是说,两人配合才能分析数据,才能查看匿名用户信息。

    2、 在知乎上用匿名回答或提问时,用户的隐私能否得到保障?

    知乎保护匿名用户的身份不会被公开。
    知乎不赞成以评论或提问等方式去查找匿名用户的真实身份。
    用户要对其发布的内容负责,不允许用匿名的方式攻击他人、泄露他人隐私等行为。

    真的除了知乎管理员,其他人没法获取到这个匿名者是谁了吗?知乎的这种匿名 是真的匿名吗?

    破解匿名的钥匙

    匿名答案的产生

    我是程序员,不太相信别人是怎么样就怎么样,那就实际看看吧!
    勾选匿名以后,再点击提交。知乎会发送这样一个请求

    请求urlhttp://www.zhihu.com/answer/add

    请求参数

    id:2735494
    content:谁会去记忆代码呢?只会学习思路和记住关键API,记不住也可以去查嘛!<div><br></div><blockquote> 但是你得记住去哪查询API</blockquote>
    anon:1
    _xsrf:c54bc4dd7609ba693921ba540b241d87
    
    • ID 为答案的唯一标识
    • content 为答案的内容
    • anon 表示匿名
    • _xsrf 唯一标识,用来防止跨站攻击和请求伪造,该值会写在cookie中

    匿名答案ID

    答案添加后,系统会给该答案生成一个 ID : 32878799

    <a class="answer-date-link meta-item" target="_blank" 
    href="/question/26381561/answer/32878799">发布于 22:36</a>
    

    每个问题都会有一个唯一标识,每个答案也是。答案和答题者的关系呢?自己回答的匿名问题,同样不能给自己点赞,所以说知乎的前端网页还是有机制来判断匿名回答者是谁,但是在前端界面没有保存答题者的信息的情况下,是怎么判断你就是答题者的呢?

    答题者的标识

    查看知乎的代码,有这样一行

    data-isowner="1"
    

    非自己回答的问题,则为

    data-isowner="0"
    

    在每个界面会有这样一段代码来表示用户的信息,

    {
    "user_created": 1383705658000,
    "now": 1415025623000,
    "abtest_mask": "---------1--------------------",
    "user_hash": "cd37719b65d7a40e722e9f5d70e6faa2"
    }
    

    user_hash 就是用来表示当前登录用户的 ID,唯一标识,通过这个ID 就能获取到用户的信息。

    如果能找到匿名答案的userhash,那就大功告成了。
    虽然我已经写好了脚本,能够抓取所有的知乎用户信息和ID,一个答案的所有点赞者等等功能 ,但是没法破解这个user_hash,用hash算法加密了这个数据,需要一个密钥才能解开答案,密钥是什么呢?谁知道呀。

    非自己的匿名答案呢

    比如这个答案
    如何看待王滔不再担任畅游 CEO,陈德文余楚媛接任?

    看完所有前端代码,并没有发现任何泄露答题者的ID 等信息。答题者的信息在后台输出的时候被过滤掉了,如果当前用户浏览的答案为匿名答案则把答案的作者变成了 "匿名答案" 。

    为匿名答案点赞

    url : http://www.zhihu.com/node/AnswerVoteBarV2
    请求发送的数据格式

    {
        method:vote_up
        params:{"answer_id":"8524619"}
    }
    

    如果匿名答案被点赞了,系统同样会通知答题者。奇怪的是,在自己的个人列表并不能看到自己的匿名答案,怎么又能收到知乎匿名答案的通知呢。

    我猜想:

    知乎在设计数 答案据库的时候 增加了一个 anon 字段,1为匿名,0为非匿名,所有只要改变这两个值就能让答案在匿名和非匿名之间切换。

    每个答案绑定一个用户ID,点赞时,传给服务器的数据为答案的ID,系统根据答案ID查找到用户的ID,然后通知用户你的答案被点赞了。匿名用户和非匿名用户在这个功能上面没有任何差别。

    但是如果答案的 anon 为1时,后台自动把用户的信息变成了匿名用户。想通过前端的代码找到匿名答案是谁,真的是没有办法呀,滴水不漏的知乎。
    在输出个人答案列表时,直接选择anon为0的答案,如果把匿名答案也输出了,那其他用户就有办法找到匿名者是谁了。

    改进

    很多人在问,怎么找到我的匿名答案呢?似乎知乎目前没有加入这个功能,也没人知道他们的开发计划。不过确实可以加入这样一个功能——“我的匿名答案”,这个功能只开放给当前登录者,就像只有你自己能修改自己的账号密码一样,这不是很好么!

    结论

    知乎官方的说法:两人配合才能分析数据,才能查看匿名用户信息。对于这个观点,我持怀疑态度,后台没必要把功能做得这复杂,自己建立的系统,当然会给自己绝对的控制权限。

    对于普通用户来说,知乎的匿名为真匿名, 我跪服了。

    相关文章

      网友评论

      • 沙涅:谢谢楼主如此用功。
        我觉得匿名功能真的很好。
      • 阿树:@流星狂飙
        用户会倾向于匿名发布答案,答案就会更倾向于 娱乐 方向发展
      • 流星狂飙:@阿树 你说的泛滥是什么意思, 对于后台来说肯定不是匿名的
      • 阿树:「不过知乎可以加一个功能,“我的匿名答案”,这个按钮只让当前登录者才能看到,这不是很好么!」——加了之后,匿名就更容易泛滥了。

        如果有数据库权限,知乎的匿名还是真匿名吗?

      本文标题:工程师揭开知乎匿名背后的秘密

      本文链接:https://www.haomeiwen.com/subject/yctbtttx.html