当前位置 首页 剧情片 《社交网络》
无需安装任何插件,即可快速播放

广元在线

无需安装任何插件,即可快速播放

红云在线

无需安装任何插件,即可快速播放

极速云1

百度视频

剧情介绍

  点击上面关注,All in AI中国   介绍      友谊对于我们每一个人来说都是非常重要的。小时候,如果有好朋友的话,长大后能增加幸福的机会。但是,在生活中,我们所接受的关于友情的教导并不多,友情是由环境和机会形成的,是直观发展的。那么,我们的朋友是在生活中偶然相遇的吗?显然不是那样。友情的实际形成有很多必须要实行的事情。比如,做同样的运动,有同样喜欢的音乐和音乐家。但是,在这些要素起作用之前,必须满足基本要求。你必须见那个人。我们好像可以通过各种方法认识不同的人。至少在友情的情况下,这些方法有很多和社交网络有关。或者在生日派对上可以见到他们。无论用什么方法,都不能说是真正的偶然。   社交网络分析   社交网络分析是“研究社会结构的战略”(OTT和Rousseau,2002),社交网络分析对很多公司来说有价值。与基于名字假设的情况相反,社交网络分析不仅对Facebook等社交网络,对飞行路线和金融网络等移动网络的分析也有价值。下面介绍具体说明情况的例子。   想象一下小朋友的网络吧。其中也有互相认识的人,但也有其他人不知道。使用Python的话,可以使用NetworkX这个软件包使社交网络可视化。      请想象一下这个网络是你和你的朋友的网络。红色的点被称为节点,中间的线象征着两个人相互了解,这些线被称为边缘。实际的社交网络更大,更复杂,但是为了演示的目的,我们会缩小这个网络。看社交网络的时候,应该看基本的数字。例如,网络由11人和14人连接而成,平均每人连接约2.5人。   现在想想这个网络,可能会形成什么样的新连接呢?更具体地说,记述两个人形成连接概率的措施是什么。让我们来看看回答这些问题的5种可能的方法吧。   对策1:共同邻居   最直观最简单的测量方法是计算个人A和个人B连接的个人数。杰克和利兹有多少邻居?      答案有两个。我是Mike和Cindy。其余的是计算所有连接的共同邻居的数量,并从最高到最低排序。   对策2:Jaccard系数   Jaccard系数与一般邻居的数目非常相似,并且不同之处在于,在量度1中搜索的数目被归一化。为此,必须使用共同邻居的数量,除以邻居的总数。换句话说,将A和B的交点除以其并行集合。      在Liz和Jack的情况下,确认了共同邻居的数量为2个。里兹和杰克一共有多少邻居?      Liz和Jack有5个邻居。结果,他们的Jaccard系数将2除以5或0.4。对于对策1,必须对当前不存在的所有连接计算并比较Jaccard系数。   步骤3:资源配置指标   不要被这个名字所迷惑。由于该措施是使用邻居总数归一化的,所以与Jaccard系数类似。但是,这次我们关注的是我们感兴趣的人的共同邻居。数学表达式,资源分配如下。      这些意味着想计算感兴趣的个体的共同邻居的总数。对此,我们来计算Elle和Ronald的资源分配指数吧。      Elle和Ronald有共同的邻居Steve。史蒂夫本人有三种关系。于是,应用上述公式得了三分之一。因为Elle和Ronald只有一个共同的邻居,所以我们不需要做其他的事情。如果他们有其他邻居的话,我们会为史蒂夫做同样的事情,增加这两个数字。   对策4:Adamic-Adar指数   Adamic-Adar索引实际上与资源分配索引基本相同,除了相邻总数的对数之外,其他相邻总数的对数也基本相同。数学表达式:      对策5:优先连接点数   优先连接模式是许多社交网络的基本结构的蓝图。假设具有许多连接(高度)的个体(节点)获得比具有更少连接的个体更多的新连接(相邻)。换言之,如果你已经有很多朋友,你就可以遇到更多新的朋友。   要计算优先连接得分,可以简单地将感兴趣的个体之间的连接数相乘。这个计算最好用直觉来解释。记住利兹和杰克?简单复习一下吧。      正如您所看到的,Liz和Jack有三个邻居。因此,他们的优先连接得分是3*3=9。   谁有可能成为你的下一个朋友呢?   既然我们已经收集了所有必要的措施,我们才能回答初期的问题。选择一个动作,计算分数,比较结果。但是,我想避免对这个项目引入偏见,所以我决定计算所有的分数,将它们标准化,取得平均分。这样,可以避免它们之间的选择,得到0和1范围的结果分数。   我想知道杰克接下来会联系谁。能推测出是谁吗?在这一点上,Liz是0.96分。再做一次吧。马克有可能和谁联系。答案是Liz。现在让我们来看看我们的社交网络的构造吧。你觉得挑战这个结果的是什么。      看这个社交网络的话,比其他的社区两个社区的内部关系都强。在计算某个人最有可能结合在一起的概率时,如果不注意社区结构的话,肯定会产生偏见。在更加紧密的社区里,人们和来自不同社区的人见面的可能性应该很高。   为了说明社交网络中社区结构的主要原因,介绍Soundarajan和Hopcroft(2012)引入的两种新措施,即扩展上述措施。   适应共同的邻居   要适应共同邻居,不是简单计算两个共同邻居的数量,而是先计算共同邻居的数量,然后计算这些共同邻居中个人A和B在同一个社区里有多少。最后将这两个数字相加。      我们来看看Ronald和Elle吧。      Ronald和Elle有共同的邻居Steve。史蒂夫是Elle和Ronald同一个社区的一员。因此,适应的共同邻居分数是1+1=2。   资源分配的调整   同样,这与上述措施非常相似。唯一的区别是Soundarajan和Hopcroft(2012)提出的资源分配分数只考虑和两个感兴趣的人在同一个网络上的个人。      如上所述,在个体不存在于与X和Y相同的网络中的情况下,f(u)=0,在它们存在于同一网络中的情况下,f(u)=1。根据这个公式,这个措施看起来比实际要复杂。史蒂夫和Pete的资源配置分数是什么?      他们有共同的邻居。Elle。但是,因为它们都在不同的社区,所以f(u)=0。因此,由于其他共同邻居无法考虑,他们所适应的资源分配得分也为零。   再找一次Mark最有可能的下一个连接吧。使用我介绍的措施,发现Mark最有可能的下一个连接实际上是Elle。考虑到我们把两者总结到同一个社区的一部分,这个结果似乎更有意义。   结论   社交网络分析是值得探讨的有魅力的话题。除了仅评估节点之间的边缘之外,还可以提供将这些措施作为特征本身用于监控器学习的一组标签。而且,如果对各节点有兴趣、年龄、性别等更多数据可供使用的话,谁最终成为挚友的建模可能会更准确。   如果您对用于此分析的代码感兴趣,请按以下方式进行戳记。   https://github.com/lksfr/TowardsDataScience   编译产品   来源:   https://towardsdatascience.com/predicting-friendship-a82bc7bbdf11   作者:Lukas Frei

??

Copyright © 2008-2022