来源:三联生活周刊 作者:袁越
【核心提示】 “社交网络不是(革命的)催化剂,它传播的内容才是。”美国亚利桑那州立大学的计算机学专家刘欢(音译)评论道,“社交网络是个超出常规思路的巨大的数据库,社会学家们应该学会如何去驾驭它。”
传统的科学研究基本上可以分成四个步骤,先提出假说,再设计实验,然后做实验并得到数据,最后分析数据得出结论。在计算机出现之前,最重要的是前两步,这也是评价一个科学家水平高低的关键所在。但是随着时间的推移,科学研究的难点已经逐渐向后两个步骤转移,尤其是分析数据的能力正变得格外重要。
这方面的一个经典案例就是四色定理的证明。这个定理最早是在1977年被证明的,证明者将无限种可能出现的情况归纳为1936种状态,但仅靠人脑是无法对这么多状态逐一进行分析的,于是研究者借助计算机来完成这个工作。这是第一个主要借助计算机的超能力而被证明的数学定理,虽然证明过程不够漂亮,没能显示出人类理性的优美,但随着计算机性能的不断提升,借助计算机的力量来完成一些人类完不成的工作已经成为科学研究的常态了。
遗传学就是一个很好的案例。遗传学的开山鼻祖孟德尔仅仅依靠数豆子就总结出了遗传学的基本规律,但当基因组的密码被破解后,遗传学家们所要面对的数据量越来越大,对基因序列的数学分析已经可以自成一派,变成一门单独的学问了。
这股风潮甚至已经蔓延到了社会学领域,尤其是社交网络的兴起,为数学分析师们提供了一展身手的好机会,社会学研究迎来了一个全新的时代。
比如,信息的传播模式历来是社会学研究的热点之一。很多研究者把信息比做病毒,认为信息的传播和病毒的扩散十分相似,两者都遵循同样的原则,即接触病毒的概率越高,受感染的可能性也就越大。这个原则在生物学领域已被证明是对的,但在社会学领域是否同样正确呢?换句话说,一个人相信某条信息的概率,是否和他接触该信息的次数有关?
类似问题在以前只能通过调查问卷的方式进行研究,但社交网络的出现为社会学家们提供了一个特殊的试验场。美国康奈尔大学的社会学家乔恩·克莱恩伯格(Jon Kleinberg)及其同事们与著名的社交网站“脸书”(Facebook)合作,从后者的数据库中调出了5400万封电子邮件加以研究。如此巨大的数据量,以及数据来源的公正性,是传统社会学研究者无法望其项背的。
具体来说,“脸书”网站有个功能,即搜索每一位用户的电子邮箱,然后群发一条邀请信,邀请这位用户的朋友也加入“脸书”。这封邀请函同时还会把受邀对象的朋友当中已经加入“脸书”的人的名字一并附上,以造成一种“大家都在玩脸书”的印象。克莱恩伯格教授设计了一个软件,统计了受邀对象在何种情况下才会真心接受这条新信息,也就是决定加入“脸书”。
分析结果显示,信息传播的效率和接触信息的次数关系不大,一个受邀者接受一个好友邀请后决定加入“脸书”的概率,和他接受了四个好友邀请后决定加入的概率没有差别。但是,邀请者所隶属的社交圈子的数量则对最终结果有着直接的影响,数量越大效果就越好。换句话说,如果四个邀请者分别来自不同的背景(比如同事、朋友和家人),比他们全都来自同一个背景的效果要好很多。
研究者还统计了被邀请者加入“脸书”后的活跃程度,发现结果同样如此,越是被不同的社交圈子吸引进来的用户,活跃程度也就越高。
克莱恩伯格教授将研究结果写成论文,发表在今年4月2日出版的《美国国家科学院院报》(PNAS)上。这个研究为那些网络广告商提供了一个新思路,以前广告商们最看重的是点击量,但这项新研究表明,信息传播的渠道才是最关键的因素,渠道种类越多,广告效果越好。
这种新的研究方法还可以被用在政治学领域。比如一年多前刚刚发生的“阿拉伯之春”,曾经被西方媒体称为“脸书革命”(Facebook Revolution),这场革命的始发地突尼斯首都突尼斯市就有一个革命后刚刚开张的网吧,取名“Facebook”,密码就是“Revolution”(革命)。但是,美国卡内基·梅隆大学的计算机专家凯瑟琳·卡利(Kathleen Carley)设计了一个软件,用关键词分析的方法分析了来自18个相关国家的40万篇传统媒体和网络文章,结果显示,“人权”和“国际关系”才是那场革命的关键词,Facebook、Twitter(推特)和YouTube(全世界最大的视频网站)只是起到了帮助信息传播的次要作用。
“社交网络不是(革命的)催化剂,它传播的内容才是。”美国亚利桑那州立大学的计算机学专家刘欢(音译)评论道,“社交网络是个超出常规思路的巨大的数据库,社会学家们应该学会如何去驾驭它。”