为什么基地恐怖分子发动攻击时,每组人数不能超过6人?
为什么网上病毒传播关键零界点是7%,当一条微博渗透率突破它,才能从线性增长变为病毒传播式增长?
为什么Facebook起步时,都先要在一个小范围内吸引社群关注达到6%的饱和度,才考虑从一个Harvard的小社群跃迁到一个像常青藤这样的大社群中去?
Background:开始的这些问题便是引起我阅读的点,这本书讲的就是这些问题背后的科学技术,社会分析网络(Social Network Analysis),开始于20世纪30年代由社会心理学家莫雷创立,也算是一个新兴的,较为独立的学派。感觉还是有一定门槛的,书中内容都基于开源软件NetworkX讲授。
去搜了NetworkX,是一个基于Python的工具包,用于创建,操纵和组织动态和复杂的网络功能研究。
Paul Barry的Python教程《Head First Python》
初翻《社会网络分析》以为这是讲SNS相关科学统计的一本入门读物,但讲者在导论中讲到,Social Network Analysis(之后打卡通称SNA)比Twitter和FB要早至少30年。
大体思路:与一般统计方法类似,最常见到的是将经济学统计学中的回归分析运用于社交媒体,更多的价值便由此延伸。
SNA科学的核心是人与人之前的关系,这些关系定义了我们是谁,以及如何行使。我们的人格、教育、背景、种族、民族等所有的这一切都与我们的关系模式发生互动,并在关系中留下不可磨灭的印记。(作者说的)
什么是关系?
关系可以是二元的,我关注了你的简书,二元关系;还可能是,他转发了你四篇文章,这里是赋值关系。这种关系的量化在社交媒体中很容易实现,但是在现实生活中往往非常困难。老板和我,我和老师这样设置有方向性的关系是不对称的,不对称关系;Twitter和Weibo上的关注尽管有方向,但是还存在一种反向关注,因为可以看做是对称的。最后,还会有一些不同类型的主题如公司雇佣员工、投资者购买公司股票、人们占有资源等等这样双峰关系(Bimodal)或二模关系(2-Mode)(之后讨论)
How to do it?
搜集社会网络数据→寻找定性或定量变量→量化指标(中心性?第3章)→测量指标
作者在此举例最常见的应用方向——同质性(Homophily,希腊文,对相似者的喜爱)研究——通俗讲就是研究“物以类聚,人以群分”。e.g. 为什么年龄相近的人更容易更为朋友?
(略)介绍泊松过程。Ref. 《Probabilistic Graphical Models》、《Bayesian Methods》贝叶斯推理、贝叶斯网络、概率图。
社会网络分析的另一个相似物(作者用表亲)是连接分析。Ref. 《寻人密探组》(Without a Trace)《数字》(Numbers)、《法律与秩序》(Law and Order)
网友评论