旁观者

参与软件开发这些年来,不断地遇到新领域新知识点,屡屡感受到新进入者的迷惑和彷徨,所以对遇到的每一个问题都详细记录问题现象、解决思路以及解决方案,并在blog中留下印迹,以备他日有心人google之而知之。
你们的新手之痛,你们的新业务发展之初的思路混沌,我都感同身受,所以欢迎和我一起探讨这些话题,诸如Semantic/NLP/Mashup/J2ME/IVR/SMS/WAP/Python等,知无不言言无不尽。
posts - 538, comments - 970, trackbacks - 39, articles - 1
   ::  ::  ::  :: 订阅 订阅 :: 管理

郑昀@玩聚RT 20090714

一、对Twitter神经网络的个案分析

    上周从玩聚SR上看到一篇《作为神经网络存在的Twitter(数据篇)》,作者对自己的一个Twitter消息的传播路径做了详尽的分析,并配发了节点图、时间线、延迟时间图、Followings数量图等5张图,罗列出了消息传播过程中涉及的:

  • 用户;
  • 转发时间;
  • 用户的Followings/Followers数字;
  • 谁传递给谁;

的数据。

    数据挖掘功课做得非常足,作者并没有给出明确的结论,但大致可以得知:

  • 某些核心节点虽然可以加快信息传播的速率和广度,但核心节点引发的RT行为数量与核心节点的Followers数量未必成正比;
  • 当后续传播用户的Followers/Followings数值大幅度下降时,传播也就快要结束了。也就是说,当消息传播到圈子的边缘用户时,基本上也就不会再继续传播了。

 

    作者的这张MindMap引起了我的兴趣:

http://woooh.com/wp-content/uploads/Twitter-476x300.png

    它简明扼要地给出了传播的路线。玩聚RT作为中文微博客世界唯一追踪锐推行为的应用,掌握着大量的锐推行为真实数据,完全可以计算出类似的图形。

 

 

二、中文锐推榜上榜消息的传播路线图

    大家都知道,中文锐推榜 是可以追踪微博客中文世界中最流行的锐推、语录和段子,每一条上榜消息都可以查询到对应的所有 Twitter或饭否 用户转发的消息。那么,从每一次转发中提取转发用户名以及转发顺序,加以合并统计,即可得到每一条上榜消息的传播总路线图。

    下面是 @keso  作为核心传播的例子:


    可以看出 @keso 后续的两个节点 @rtmeme(又传播给了5个人) 和 @secretaryzhang(又传播给了4个人) 是又一组核心节点。

    有的时候,一个消息是由两个或多个渠道分别传播出去的。可能是传播中隐去了原作者的ID,比如这条饭否避难手册的广播 。也有可能是某个惊爆新闻由多个敏感人士第一时间各自独立发起,比如这个坐直升飞机上学的新闻


    这种热门新闻,自然会有不同的用户发起传播。我们拥有语义计算能力的做法,可以把某一个消息的大范围内传播进行合并,而不仅仅是追踪某一个人发布的消息如何传播。

 

三、Javascript Mind Map效果

    这种传播路线图,大家应该可以看出来,属于脑图(Mind Map)的画法。

    它是由javascript绘制于一个Canvas(画布)上的,不仅拥有动态自动漂移效果,而且每一个节点都可以自由拖拽。

    这套javascript脚本是 Kenneth 的杰作,名叫“JavaScript MindMap”,你也可以叫它“SpiderMap”。

    代码:
http://code.google.com/p/js-mindmap

    Demo:
http://kenneth.kufluk.com/google/js-mindmap/

 

参考阅读:

1、MMDays:淺談網路世界的Power Law現象〈五〉──Plurk的名人效應與酪梨壽司的一千噗

Feedback

#1楼  回复 引用   

2009-07-15 13:44 by Aether[未注册用户]
我有点沮丧,因为我到RT上去以后找不到和我相关的所有RT页面 - -

另外传播图很酷,稍微有点让人困惑。我建议不显示“传播图”这个节点(因为不明白这个节点在整个图中表示啥意思?),而直接显示始发节点(多个始发节点之间互不影响),然后显示始发节点下一层的节点,最后是转发节点发出的触须(就像现在这样)。
这样应该更加一目了然容易明白些。从那开始,经过谁,到哪去。我现在每次进入至少还需要点击一次才能获取想要的信息(并且这一步毫无创造性),所以有点挫折……

#2楼[楼主]  回复 引用 查看   

2009-07-15 16:44 by 旁观者      
@Aether
之所以显示“传播图”这个总节点,是因为画图的JavaScript要求必须只有一个起始点,不能有多个,否则极大地增大画图的难度,这是被迫的。

#3楼[楼主]  回复 引用 查看   

2009-07-15 16:46 by 旁观者      
@Aether
“找到和我相关的所有RT页面”,这是一个什么需求?没看懂。是希望显示你参与传播过的上榜消息?

#4楼  回复 引用   

2009-07-15 20:24 by Aether[未注册用户]
嗯是这样的,从我的角度来说,其实我并不关心热点,但是我关心我发的推里面有哪些被RT,这些渠道是怎么流动的,进一步还可以有统计信息,比如看看哪些人最经常RT自己的信息,哪些人RT自己的信息以后并发了更多更深层的后续传播,这样。

#5楼[楼主]  回复 引用 查看   

2009-07-15 21:44 by 旁观者      
@Aether
那就很抱歉了,此应用的名字是“中文锐推榜”,我们这个团队也一向是制造meme Tracker,所以我们只关注热点,至于围绕某个个人世界消息如何流动的需求,抱歉,是小众需求,没多少人会这么有闲情雅致地关注的。

#6楼[楼主]  回复 引用 查看   

2009-07-15 21:48 by 旁观者      
@Aether
“我关心我发的推里面有哪些被RT,这些渠道是怎么流动的,进一步还可以有统计信息”,这种统计需求,已经有一个很好的网站做了:
http://www.twitteranalyzer.com/
(介绍:http://sr.ju690.com/meme/item/33506
我相信你应该看过。
很显然,这种个人统计需求不应该由大众热门追踪应用来解决。