RSS订阅 | 匿名投稿
您的位置:网站首页 > 相关知识 > 正文

一张图话的全球影响力

作者:habao 来源: 日期:2015-7-30 9:20:28 人气: 标签:相关指数 维基

  你找到母语的了吗?

  麻省理工学院、哈佛大学、美国西北大学和艾克斯-马赛大学的研究者分析了多种语言的推特用户、编写者和近30年来的图书翻译数据,绘制了一个网络图,来表示使用不同语言的人之间文化联系的强弱。

  他们用一种语言与其他语言联系的数量和强度来定义语言的“核”,他们指出,与语言的使用广泛程度或者使用这种语言的国家的财富等指标相比,他们提出的语言“核”更能体现使用这种语言的人的“全球声望”。

  “这个语言的网络是全球各种社交网络的总和,”Ashahi公司的Cesar Hidalgo说。“人们使用的语言不同,所以全球社交网络是通过一些迂回的径构建的,在这些径中,使用某些语言的人必然比其他人处于更加核心的。这赋予了他们更大的和责任。一方面,他们更容易他们创造的内容。另一方面,当信息在人群中流动的时候,会染上这些人的思想和。”

  参与这次研究的人包括Hidalgo和他的学生Kevin Hu,哈佛大学的Steven Pinker,艾克斯-马赛大学的Bruno Goncalves,以及西北大学的Alessandro Vespignani。如果某个推特用户曾用非母语写过至少长三句的推文,他们就会把这个用户纳入分析数据库。因此,在大约2.8亿的推特用户中,有1700万被纳入了他们的数据库。他们选择的用户的标准是,曾经用一种以上的语言编辑词条。按照这样的标准,他们选择了2200万名用户加入分析数据库。在这两部分研究对象中,任何两种语言之间的联系强度都是由使用这两种语言的人数来决定的,使用者会选择对和接受信息双方都便利的语言。

  与翻译有关的数据来自于联合国教科文组织的翻译索引,其中编录了1979年到2011年间出版的220万本译著,涉及到了1000多种语言。对于这部分研究对象,两种语言之间的联系强度是由两种语言之间相互翻译的数量决定的。

  研究者使用了两种方式来定义全球声望。一种定义是Hidalgo的团队在以前的万神殿(Pantheon)项目中使用过的,考察的是全球文化产品。万神殿项目识别出了当时每一个至少用26种语言编辑过词条的人一共11340人。

  另一种定义是用《文明的解析:人类艺术与科学成就:公元前500年到公元1950年》(Human Accomplishment: The Pursuit of Excellence in the Arts and Sciences, 800 BC to 1950)一书中提到的4002个人来衡量的。作者列举这些人的依据是这些人在167种参考文献中被提及的频率,这些参考文献包括全世界出版的各种百科全书和历史文献。

  自然,用每个数据库分别绘制的网络不一样,它们与两种声望之间的相关系数也不一样。例如,在用数据绘制的网络中,德语处于比西班牙语更核心的;而在用推特数据绘制的网络中结论则正好相反。

  类似地,用联合国教科文组织的翻译数据绘制的网络,与《文明的解析》中采用的声望指数具有更好的相关性,因为这本书主要关注点在科学和艺术领域。而用和推特数据绘制的网络与万神殿指数的相关性更强,因为万神殿项目中包含的流行文化领域的人物更多。

  但是与使用某种语言的人数或使用某种语言的国家的P这两个指标相比,用本次研究绘制的网络与两种声望定义的相关性肯定要更强。当这些网络与人口和收入等数据联合使用的时候,与两种声望定义的相关性会更强。

  “我们必须非常清楚我们讨论的是什么,”Hidalgo说。“这项研究关注的不是全球语言。这三个网络关注的重点都是精英。但是正是这些精英推动了信息的跨文化。”

  “这个的研究扩大了大数据网络科学与语言学之间的交集,”大学伯克利分校的Kenneth Wachter教授说,“它提出了一种语言能够成为全球核心语言的标准,并有可能激发许多另类的观点。”

  (原文转自newsoffice.mit.edu,原作者:Larry Hardesty,蝌蚪君编译。)

   

读完这篇文章后,您心情如何?
0
0
0
0
0
0
0
0
本文网址:
下一篇:没有资料