﻿<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:trackback="http://madskills.com/public/xml/rss/module/trackback/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:slash="http://purl.org/rss/1.0/modules/slash/"><channel><title>博客园-旁观者</title><link>http://www.cnblogs.com/zhengyun_ustc/</link><description>参与软件开发开发这些年来，不断地遇到新领域新知识点，屡屡感受到新进入者的迷惑和彷徨，所以对遇到的每一个问题都详细记录问题现象、解决思路以及解决方案，并在blog中留下印迹，以备他日有心人google之而知之。你们的新手之痛，你们的新业务发展之初的思路混沌，我都感同身受，所以欢迎和我一起探讨这些话题，诸如，文本挖掘/自然语言处理/Web3.0/J2ME/Web2.0/IVR/SMS/MMS/WAP/SIP/等等，知无不言言无不尽。</description><language>zh-cn</language><lastBuildDate>Mon, 06 Jul 2009 06:05:55 GMT</lastBuildDate><pubDate>Mon, 06 Jul 2009 06:05:55 GMT</pubDate><ttl>60</ttl><item><title>语义分析相关应用的实作要点</title><link>http://www.cnblogs.com/zhengyun_ustc/archive/2009/07/04/1516655.html</link><dc:creator>旁观者</dc:creator><author>旁观者</author><pubDate>Fri, 03 Jul 2009 17:46:00 GMT</pubDate><guid>http://www.cnblogs.com/zhengyun_ustc/archive/2009/07/04/1516655.html</guid><wfw:comment>http://www.cnblogs.com/zhengyun_ustc/comments/1516655.html</wfw:comment><comments>http://www.cnblogs.com/zhengyun_ustc/archive/2009/07/04/1516655.html#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://www.cnblogs.com/zhengyun_ustc/comments/commentRss/1516655.html</wfw:commentRss><trackback:ping>http://www.cnblogs.com/zhengyun_ustc/services/trackbacks/1516655.html</trackback:ping><description><![CDATA[<p><a href="http://blog.csdn.net/zhengyun_ustc/" target="_blank">郑昀</a>@<a href="http://rt.ju690.com/" target="_blank">玩聚RT</a> 20090703</p> <p>舆情监测和口碑监测都属于一个路子。常有人问到自然语言处理技术在其中如何上手实用。下面简单说一下。</p> <p><font size="5"><strong>一、词典和算法</strong></font></p> <p>前期的主要问题是用于分词和分类的词典建立，根据你的应用不同，这一套词典（可能有很多词典，比如人名、地名、组织名、常用英文缩写）的侧重是不同的。还有停用词表，也就是&#8220;的&#8221;&#8220;啊&#8221;&#8220;哦&#8221;之类的词。</p> <p><font color="#000080">举例：</font></p> <p><font color="#000080">对于生活搜索，&#8220;鱼头王&#8221;和&#8220;鱼头&#8221;应不应该都在词典中出现呢？&#8220;大酒店&#8221;和&#8220;酒店&#8221;呢？取舍取决于你的分词算法，甚至取决于你的应用点，如果是正向最大匹配分词算法，如果是搜索应用，那么显然应该移除&#8220;大酒店&#8221;和&#8220;鱼头王&#8221;。</font></p> <p>后期则是自动去重、提取标签和自动聚类的算法以及效率问题，提取实体词和标签也是词典问题。</p> <p>分词算法用谁家的都无所谓，开源的、能拿到手的、靠谱的有不少。主要是一套专用词典。需要（自动地）与时俱进，而不是拿一个许多年前的不更新的旧词典就搞定的。</p> <p>也就是说整个应用的主要问题是词典和算法。</p> <p><font size="5"><strong>二、明确需求</strong></font></p> <p>语义这东西，如果没有明确的需求，很有可能花一番气力做出来的东西，最后不要了。算法一旦去研究，就会耗费很多精力去做对比实验，词典们一旦要自己收集并认真整理，就会耗费很多人工。这些都是成本。</p> <p>所以必须明确需求。 <br />没有明确的需求，很多工作等于是白做。</p> <p><strong><font size="5">三、较高级的挖掘</font></strong></p> <p>深层次文本挖掘，国内外的做法一般有： <br />1：描述性的特征提取，如能够知道人们对某一款汽车具体到操控性、耗油量、舒适性等的评价以及评分；  <br />2：情感分析，即正负面判断，基本上是靠词典和模式匹配； <br />3：自动热点发现，即聚类的变种； <br />4：利用实体词、标签做统计做趋势；  <br />5：传播途径分析； <br />6：特定领域的观点自动提炼，基本上是靠词典和模式匹配；</p> <p>7：自动生成总结(Summary)，注意不是&#8220;摘要&#8221;。&nbsp;<br />剩下的就都是围绕着关键词的简单玩法了。</p> <p><strong>社交玩法</strong></p> <p><a href="http://blog.it.sohu.com/readwriteweb/archives/3391" target="_blank">Read/Write Web的文章也提到了社交的几个点，不妨一看</a>：</p> <ul><li>语义链接分享  </li><li>网络挖掘  </li><li>新闻分享  </li><li>Tweet挖掘 </li></ul> <p>至于它后面说的语义/语境广告投放，那都是巨头的玩法，一般人不要轻易介入。</p> <p><strong>垂直、垂直</strong></p> <p>如果客户追踪的是某一个垂直领域，而不是那种泛泛的内容监控，其实很多事情就有了可做、可控的余地。  <br />口碑监测或舆情监控，最麻烦的就是不知道将要监控的内容是什么，有没有明确的语言特征；这样，词典不好积累，算法不好交叉验证和调整，不容易走捷径。</p> <p><strong><font size="5">四、能做好的</font></strong></p> <p>在垂直领域，即像汽车、旅游、饭馆、酒店和股票等的口碑监控，技术可以有把握做到的： <br />1：准确分词、分类； <br />2：准确提取标签和实体词；  <br />3：描述性的特征提取； <br />4：自动发现热点；</p> <p>不需要垂直领域也可以做到的： <br />1：自动去重； <br />2：通过实体词和标签的关联建立；</p> <p><font size="5"><strong>五、词典</strong></font></p> <p>需要整理专有词典的： <br />1：分词、分类（严重取决于训练机器时的语料是否准确是否具有代表性）； <br />2：实体词、提取标签； <br />3：情感分析；  <br />4：描述性的特征提取；</p> <p>不需要词典就可做的： <br />1：自动去重； <br />2：热点自动发现（说到底还是需要，但不那么严格需要）；  <br />3：高速传播事件监测（其实是自动去重的镜像应用）。</p> <p><strong><font size="5">六、做应用的流程</font></strong></p> <p>1：确定监控的垂直领域；</p> <p>2：收集整理好专有词典； <br />3：为分类准备足够多的语料，每一个分类需要至少三百到五百篇文本，以供训练；  <br />4：做垂直，像CIC或爱搜车的做法，至少要收集足够多的独特性汉语词汇，比如产品昵称，就有黑莓、BB、本本儿、小黑、小捷等；</p> <p>4：为描述性的特征提取，收集语料，建立各种词典。</p> <p>5：为情感分析收集语料，建立词典。</p> <p>6：分别试验各种算法，反复调整以达到商用的准确率。</p> <p>7：将各种语义处理联起来，合成应用。</p> <p>&nbsp;</p> <p>举例：</p> <p>我们做 <a href="http://rt.ju690.com/" target="_blank">玩聚中文锐推榜</a>&nbsp;这个非常简单的语义应用的流程：</p> <p>1：明确需求：近乎实时地获取 <a href="http://twitter.com/" target="_blank">Twitter</a>&nbsp;和 <a href="http://fanfou.com/" target="_blank">饭否</a>&nbsp;的RT(锐推，或称&#8220;转发&#8221;)消息，将内容相似的合并为一条消息；如果该消息被转发次数足够多，就可以登上中文锐推榜，并通过我们的官方微博客帐号和RSS发布出去。</p> <p>2：确定重点功能以及对应的自然语言处理能力：</p> <blockquote> <p>A、合并相似的转发消息：基于分词；</p> <p>B、上榜锐推的标签，标签关联，热门标签趋势：都是基于自动提取标签；</p> <p>C、阻止内容大体相似的锐推重复上榜：基于标签；（</p> <p><font color="#000080">不那么典型的是这两个上榜锐推，应该有一个被阻止上榜的，但实际上很难，因为语言特征上很难做出判断，虽然人一眼就能看出是重复的：</font></p> <p><a href="http://rt.ju690.com/rt/8763"><font color="#000080">RT: @jason5ng32:  这几天我看到的&#8220;门&#8221;：邯郸大学教室做爱门、慈溪职高摸奶门、北京顺义脱裤门、上海地铁洗手门、湖南幼师摸鸟门、图书馆飞机门、湖南某学校秋千门。</font></a></p> <p><font color="#000080">与</font></p> <p><a href="http://rt.ju690.com/rt/8762"><font color="#000080">RT @yeluchow:  今天看了3个门事件 摸&#215;门 电梯门 秋千门 结论是 现在脑残儿童真多。 /// 难不成这也是在给 &#8220;绿&#183;坝&#8221; 造势？？？</font></a></p> <p><font color="#000080">。比较容易阻止的是下面这种：</font></p> <p><font color="#000080">RT @flypig: 贵国的 CCTV 终于在网站上 (页面地址：</font><a href="http://is.gd/16cfg"><font color="#000080">http://is.gd/16cfg</font></a><font color="#000080"> ) 替秦刚老师承认了 GFW 的存在，请看截图：</font><a href="http://twitpic.com/7silp"><font color="#000080">http://twitpic.com/7silp</font></a><font color="#000080">  ，让我们为这种有责任心的媒体喝彩哟！ (CCTV 'admitted) </font> </p><p><font color="#000080">与</font> </p><p><font color="#000080">#RT: @DavidFeng: 贵国的 CCTV 终于在网站上 </font><a href="http://is.gd/16cfg"><font color="#000080">http://is.gd/16cfg</font></a><font color="#000080"> 替秦刚老师承认了 GFW 的存在，截图 </font><a href="http://twitpic.com/7silp"><font color="#000080">http://twitpic.com/7silp</font></a> </p><p>）</p> <p>主要是因为文字长度太短，短的话也就十几个字，所以以往用于长文章的诸多常规手段都用不了，需要调整。</p></blockquote> <p>3：针对锐推的语言行为，整理并持续更新自己专有的停止词词典。</p> <p>4：整理自己的标签专用词典s，这个倒可以用通用的词典s；</p> <p>5：反复调整各项参数，使之达到人可以觉得丰富、最好是有趣的地步；</p> <p>6：将各个计算串联起来，如前面语义算的，如从每一个转发消息中提炼参与转发的用户名，等等，成为 <a href="http://rt.ju690.com/" target="_blank">中文锐推榜</a>&nbsp;的应用，每5分钟刷新一次，7&#215;24地侦测中文微博客世界在流行锐推什么新闻、段子和语录。</p><img src ="http://www.cnblogs.com/zhengyun_ustc/aggbug/1516655.html?type=1" width = "1" height = "1" /><br/><br/>--------------------------<br/>新闻：<a href="http://news.cnblogs.com/n/48002/" target="_blank">竞争日趋激烈 微软欲借 Windows 7 扭转战局</a><br/>网站导航: <a href="http://www.cnblogs.com" target="_blank">博客园首页</a>&nbsp;&nbsp;<a href="http://news.cnblogs.com" target="_blank">新闻</a>&nbsp;&nbsp;<a href="http://dotnet.cnblogs.com" target="_blank">.NET频道</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com" target="_blank">社区</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/q/" target="_blank">博问</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/ing/" target="_blank">闪存</a>&nbsp;&nbsp;<a href="http://zzk.cnblogs.com" target="_blank">找找看</a>]]></description></item><item><title>中文微博客的热门锐推用户榜</title><link>http://www.cnblogs.com/zhengyun_ustc/archive/2009/06/25/rt_lb.html</link><dc:creator>旁观者</dc:creator><author>旁观者</author><pubDate>Thu, 25 Jun 2009 08:03:00 GMT</pubDate><guid>http://www.cnblogs.com/zhengyun_ustc/archive/2009/06/25/rt_lb.html</guid><wfw:comment>http://www.cnblogs.com/zhengyun_ustc/comments/1511047.html</wfw:comment><comments>http://www.cnblogs.com/zhengyun_ustc/archive/2009/06/25/rt_lb.html#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://www.cnblogs.com/zhengyun_ustc/comments/commentRss/1511047.html</wfw:commentRss><trackback:ping>http://www.cnblogs.com/zhengyun_ustc/services/trackbacks/1511047.html</trackback:ping><description><![CDATA[<p><a href="http://blog.csdn.net/zhengyun_ustc/" target="_blank">郑昀</a>@<a href="http://rt.ju690.com/" target="_blank">玩聚锐推榜</a>&nbsp;20090625</p> <p>&nbsp;&nbsp;&nbsp;  twitter、饭否等微博客已经成为信息传播的重要阵地。许多社会事件都是第一时间在微博客上爆发出来，经过大量的微原创&nbsp;、微转发、微传播，将信息在几十分钟内传达给数以十万计的民众。最近最火的就是<a href="http://rt.ju690.com/tags/%E7%9F%B3%E9%A6%96" target="_blank">石首</a>的<a href="http://rt.ju690.com/tags/%E5%B0%B8%E4%BD%93" target="_blank">尸体</a>事件，以及24日<a href="http://rt.ju690.com/tags/GOOGLE" target="_blank">Google DNS劫持</a>事件了。</p> <p>&nbsp;&nbsp;&nbsp;  那么，通过测量微转发（即Twitter术语中的&#8220;retweet(锐推)&#8221;，饭否术语中的&#8220;转发&#8221;）行动中的转发用户名，我们可以很容易获知在微传播过程中最核心节点、最频繁被锐推的关键用户。</p> <p>&nbsp;&nbsp;&nbsp; 于是这就是：<a href="http://rt.ju690.com/lb" target="_blank">热门锐推用户榜</a>，只统计一周内的关键传播节点，一小时更新一次榜单。</p> <p><a title="6月25日下午15点的榜单截屏" href="http://rt.ju690.com/lb" target="_blank"><img title="6月25日下午15点的榜单截屏" alt="6月25日下午15点的榜单截屏" src="http://www.5gme.com/attachment/200906/25/366_1245915111XE6h.png" /></a></p> <p><a href="http://www.5gme.com/attachment/200906/25/366_1245915111XE6h.png" target="_blank">点击此处看大图</a></p> <p>看榜小结：</p> <p>&nbsp;&nbsp;&nbsp; 1、从榜单的 Top Ten 核心节点用户来看，Twitter和饭否各居5席。</p> <p>&nbsp;&nbsp;&nbsp; 2、当然，冉云飞、连岳、艾未未、北风四人两边都有帐号，也都有超高的被转发量。我们没有合并他们的帐号。</p> <p>&nbsp;&nbsp;&nbsp; 3、推特大神@<a href="http://twitter.com/Fenng" target="_blank">Fenng</a>、@<a href="http://twitter.com/virushuo" target="_blank">virushuo</a>和@<a href="http://twitter.com/scavin" target="_blank">scavin</a>，是前二十名中仅有的科技人士。其他上榜人士皆为传媒或人文界的。比如排名19位的@<a href="http://fanfou.com/%E8%83%A1%E6%B7%91%E8%8A%AC" target="_blank">胡淑芬</a>就是电影编剧和导演，排名18位的@<a href="http://rt.ju690.com/lb#" target="_blank">陈丹青</a>是前清华美术学院教授（被证实不是本人），排名15位的@<a href="http://fanfou.com/siyi123123123" target="_blank">宋石男</a>和排名11位的@<a href="http://fanfou.com/%E5%8D%81%E5%B9%B4%E7%A0%8D%E6%9F%B4" target="_blank">十年砍柴</a>都是自由撰稿人，排名16位的@<a href="http://fanfou.com/shuangye" target="_blank">doubleaf</a>是媒体人士。排名13位的@<a href="http://fanfou.com/huajie" target="_blank">华杰</a>比较特殊，他是因石首实时报道而声誉鹊起的新入榜者。那么，这个榜单也许说明，其他媒体（如Blog，如论坛，如纸媒）的关键节点，到了微博客，一样是关键节点，影响力继续延续。</p> <p>&nbsp;&nbsp;&nbsp; 4、上榜的前二十位用户，基本反映了当下传播的热点就是政治，毕竟性和政治是核心话题，你不关心它它还是会来关心你。</p><img src ="http://www.cnblogs.com/zhengyun_ustc/aggbug/1511047.html?type=1" width = "1" height = "1" /><br/><br/>--------------------------<br/>新闻：<a href="http://news.cnblogs.com/n/48001/" target="_blank">上海电信计划2012年80%用户实现100M带宽</a><br/>网站导航: <a href="http://www.cnblogs.com" target="_blank">博客园首页</a>&nbsp;&nbsp;<a href="http://news.cnblogs.com" target="_blank">新闻</a>&nbsp;&nbsp;<a href="http://dotnet.cnblogs.com" target="_blank">.NET频道</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com" target="_blank">社区</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/q/" target="_blank">博问</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/ing/" target="_blank">闪存</a>&nbsp;&nbsp;<a href="http://zzk.cnblogs.com" target="_blank">找找看</a>]]></description></item><item><title>中文锐推榜的一个里程碑</title><link>http://www.cnblogs.com/zhengyun_ustc/archive/2009/06/19/1506378.html</link><dc:creator>旁观者</dc:creator><author>旁观者</author><pubDate>Thu, 18 Jun 2009 16:15:00 GMT</pubDate><guid>http://www.cnblogs.com/zhengyun_ustc/archive/2009/06/19/1506378.html</guid><wfw:comment>http://www.cnblogs.com/zhengyun_ustc/comments/1506378.html</wfw:comment><comments>http://www.cnblogs.com/zhengyun_ustc/archive/2009/06/19/1506378.html#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://www.cnblogs.com/zhengyun_ustc/comments/commentRss/1506378.html</wfw:commentRss><trackback:ping>http://www.cnblogs.com/zhengyun_ustc/services/trackbacks/1506378.html</trackback:ping><description><![CDATA[<p><a href="http://blog.csdn.net/zhengyun_ustc/" target="_blank">郑昀</a>@<a href="http://rt.ju690.com/" target="_blank">玩聚RT</a>&nbsp;20090618</p> <p>今天，<a href="http://twitter.com/terryxxy/" target="_blank">@terryxxy</a>&nbsp;发消息&#8220;恭喜  @<a href="http://twitter.com/rtmeme">rtmeme</a> follower 上2000 (FW @<a href="http://twitter.com/zhengyun">zhengyun</a> )。&#8221;</p> <p>是的，玩聚<a href="http://rt.ju690.com/" target="_blank">中文锐推榜</a>的twitter消息发布机器人  @<a href="http://twitter.com/rtmeme" target="_blank">rtmeme</a> 的订阅人数超过了2000人。</p> <p>我期望 @<a href="http://twitter.com/rtmeme" target="_blank">rtmeme</a>  能成为欲探究微博客有趣之处的新用户必 follow 帐号之一。</p> <p>我期望那些刚来到 <a href="http://twitter.com/" target="_blank">Twitter</a>&nbsp;或 <a href="http://fanfou.com/" target="_blank">饭否</a>&nbsp;且 <a href="http://rt.ju690.com/tags/%E5%BF%83%E7%A5%9E" target="_blank">心神恍惚</a>  不知道自己该做点什么的人都可以关注<a href="http://rt.ju690.com/" target="_blank">锐推榜</a>的消息。（Twitter新用户可以follow <a href="http://twitter.com/rtmeme" target="_blank">@rtmeme</a> ，饭否新用户可以关注 <a href="http://fanfou.com/rtbang" target="_blank">@中文锐推榜</a>&nbsp;）。</p> <p>我期望&nbsp;<a href="http://rt.ju690.com/" target="_blank">锐推榜</a>  能像谷歌资讯、TechMeme、TweetMeme、玩聚SR解决资讯热点一样解决中文微博客世界的热点，过滤噪音，揭示流行趋势。</p> <p>我期望 <a href="http://rt.ju690.com/" target="_blank">锐推榜</a>&nbsp;能成为微博客信息过滤器，它能打通过去和未来的有趣锐推，如：<a href="http://rt.ju690.com/tags/GOOGLE" target="_blank">Google</a>&nbsp;<a href="http://rt.ju690.com/tags/%E5%A4%AE%E8%A7%86" target="_blank">央视</a>&nbsp;<a href="http://rt.ju690.com/tags/%E6%8A%A4%E8%88%AA" target="_blank">护航</a>&nbsp;<a href="http://rt.ju690.com/tags/%E4%BA%92%E8%81%94%E7%BD%91" target="_blank">互联网</a>&nbsp;<a href="http://rt.ju690.com/tags/%E8%89%B2%E6%83%85" target="_blank">色情</a>&nbsp;<a href="http://rt.ju690.com/tags/%E7%BB%BF%E5%9D%9D" target="_blank">绿lvba坝</a> 。</p> <p>我期望继续优化<a href="http://rt.ju690.com/" target="_blank">中文锐推榜</a>，让它成为一个优秀的memeTracker工具。</p> <p><a href="http://www.flickr.com/photos/lucky_money_cat/3508615455/" target="_blank"><img title="" alt="" src="http://farm4.static.flickr.com/3626/3508615455_0c98500f4c.jpg?v=0" /></a></p><img src ="http://www.cnblogs.com/zhengyun_ustc/aggbug/1506378.html?type=1" width = "1" height = "1" /><br/><br/>--------------------------<br/>新闻：<a href="http://news.cnblogs.com/n/48000/" target="_blank">数万名网友签名抗议星际争霸2取消局域网功能</a><br/>网站导航: <a href="http://www.cnblogs.com" target="_blank">博客园首页</a>&nbsp;&nbsp;<a href="http://news.cnblogs.com" target="_blank">新闻</a>&nbsp;&nbsp;<a href="http://dotnet.cnblogs.com" target="_blank">.NET频道</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com" target="_blank">社区</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/q/" target="_blank">博问</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/ing/" target="_blank">闪存</a>&nbsp;&nbsp;<a href="http://zzk.cnblogs.com" target="_blank">找找看</a>]]></description></item><item><title>中文锐推榜的优化</title><link>http://www.cnblogs.com/zhengyun_ustc/archive/2009/06/16/1503967.html</link><dc:creator>旁观者</dc:creator><author>旁观者</author><pubDate>Mon, 15 Jun 2009 17:38:00 GMT</pubDate><guid>http://www.cnblogs.com/zhengyun_ustc/archive/2009/06/16/1503967.html</guid><wfw:comment>http://www.cnblogs.com/zhengyun_ustc/comments/1503967.html</wfw:comment><comments>http://www.cnblogs.com/zhengyun_ustc/archive/2009/06/16/1503967.html#Feedback</comments><slash:comments>4</slash:comments><wfw:commentRss>http://www.cnblogs.com/zhengyun_ustc/comments/commentRss/1503967.html</wfw:commentRss><trackback:ping>http://www.cnblogs.com/zhengyun_ustc/services/trackbacks/1503967.html</trackback:ping><description><![CDATA[<p><a href="http://blog.csdn.net/zhengyun_ustc/" target="_blank">郑昀</a>@<a href="http://rt.ju690.com/" target="_blank">玩聚RT</a>&nbsp;20090615</p> <p>&nbsp;</p> <p><a href="http://rt.ju690.com/" target="_blank">中文锐推榜</a>（原理很简单，就是自动搜集中文世界微博客的锐推(转发)消息，语义计算消息之间的相似性，自动聚合一条消息被  Twitter和饭否用户转发的次数；转发次数高的消息将登上热榜）在<a href="http://blog.csdn.net/zhengyun_ustc/archive/2009/06/09/4254697.aspx" target="_blank">6月9日加入饭否的合并统计</a>之前，存在的老问题：</p> <p>1、<strong>重复</strong>：发源自不同人的锐推，内容大致是一件事情或一个链接，但由于措辞不同（汉语博大精深），甚至只是在最前面加了几个字或者诡异的符号，然后只要转发次数足够多，就可以导致重复上榜；</p> <p>&nbsp;&nbsp;&nbsp;&nbsp;解决办法：针对此问题，我们已经建立了不少规则，尽可能地去除锐推消息中的标点符号英文字母、各种格式各种习惯的转发过程中用户增加的评论。自然语言处理上，则清理消息中无意义的停止词，如&#8220;的&#8221;&#8220;是&#8221;等等。但只能尽可能减少，并未彻底解决。</p> <p>&nbsp;</p> <p>在 @<a href="http://twitter.com/NetPuter" target="_blank">NetPuter</a>  的建议下，最近加入对饭否数据的统计。</p> <p>之后常被投诉的问题：</p> <p>1、<strong>还是重复问题</strong>；</p> <p>2、<strong>部分知名ID过于频繁上榜</strong>：尤其以饭否ID为主；</p> <p>3、<strong>少量上榜消息不具有传播性</strong>：即消息并不像玩聚RT所致力挖掘的那么&#8220;有趣&#8221;；</p> <p>4、<strong>饭否的消息上榜过多</strong>：饭否的站方规范转发行为，增加了转发按钮之后，降低了转发行为的成本。</p> <p>&nbsp;&nbsp;&nbsp; 解决办法：针对2和3，<a href="http://rt.ju690.com/" target="_blank">玩聚RT</a>增加了一个黑名单，专门收纳那些有很多热情粉丝的、消息却不具有传播性的ID。但考虑到无处不在的&#8220;马太效应&#8221;，名人ID的消息上榜多，是显而易见的社会常态，不应该被禁止或限制。只要符合&#8220;有趣&#8221;的特质，那么即使是名人的消息，通过转发次数足够多证明了它的可传播性，那么就应该被传播出去。毕竟，榜单追求的是&#8220;有趣&#8221;。当初<a href="http://www.techmeme.com/" target="_blank">TechMeme</a>的创始人Gabe非常强调的一点就是：&#8220;我希望能让读者感到有趣，同时也为不知名作者提供展示自己的舞台&#8221;。如果榜单上全都是东东枪、连岳或艾未未的名人锐推，人们也会很快厌倦的，所以增加不知名微博客用户的上榜几率，才是我们要认真考虑的。热门榜单相当于给你五分钟登上舞台中央的机会，至于是否抓人，就要看你的自身魅力了。上了锐推榜，第一波可以让至少两、三千人看到，然后也许有近百人再转发，按此估算，上榜的辐射面可能有近万人。这能够给不知名作者带来不少订阅者。</p> <p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 针对4，把来自twitter的消息上榜的阈值，与饭否的分开。饭否的上榜阈值要高得多。</p> <p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 针对1，<a href="&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#49;&#64;&#116;&#101;&#114;&#114;&#121;&#120;&#120;&#121;" target="_blank">@terryxxy</a>  建议，对每一条已达到上榜资格的锐推消息，在准备上榜之前，可以与48小时内的已上榜锐推进行相似性比较；如果此消息发现与之前的消息重复度大于85%，就不再上榜。但考虑到微博客用户对汉语运用的随意性，还是会存在一定判错几率的。</p> <p>&nbsp;</p> <p><strong>其他问题：</strong></p> <p>5、<strong>@</strong><a href="http://twitter.com/easthero"><strong>easthero</strong></a><strong>&nbsp;认为饭否用户和Twitter用户的群体是完全不同的，Twitter上的更具有Geek气质。所以他认为需要把Twitter的锐推榜与饭否的彻底分开，不要混合在一起计算和传播。</strong></p> <p>当然，在@<a href="http://twitter.com/NetPuter" target="_blank">NetPuter</a>&nbsp;建议为饭否单独建一个锐推榜时，我也是这么认为；饭否用户质量不如Twitter质量高，所以它们的消息不能合并计算。</p> <p>但，在做了一段时间的实验后，我发现也不是这么绝对。</p> <p>具有传播特质的锐推，和人性有关，与Geek无关。Geek也是人。</p> <p>饭否和twitter上的能上榜的锐推消息本质都是一样，无非几个命题：</p> <p>&nbsp;&nbsp;&nbsp; 自由主义、科技、情色和爆炸性新闻。</p> <p>你可以回到加入饭否之前（6月9日）的锐推榜，比如 <a title="http://rt.ju690.com/?v=new&amp;d=7&amp;p=page30" href="http://rt.ju690.com/?v=new&amp;d=7&amp;p=page30">http://rt.ju690.com/?v=new&amp;d=7&amp;p=page30</a>&nbsp;，对，修改后面的p参数，翻到40、50页看看，看和现在合并统计的有何区别呢？不还都是那些东西吗？科技、自由、大事件、段子、情色。</p> <p>以后再增加其他微博客服务时，只要调高或调低发源自它们的消息的上榜阈值，调整好黑名单，我认为可以合并统计。</p> <p>&nbsp;</p> <p><a href="http://www.flickr.com/photos/stevedave/3566325269/" target="_blank"><img title="" alt="" src="http://farm4.static.flickr.com/3309/3566325269_c0a2376bc0.jpg?v=0" /></a></p> <p>&nbsp;</p> <p><a href="http://blog.csdn.net/zhengyun_ustc/" target="_blank">郑昀</a>@<a href="http://rt.ju690.com/" target="_blank">玩聚RT</a>&nbsp;20090615</p><img src ="http://www.cnblogs.com/zhengyun_ustc/aggbug/1503967.html?type=1" width = "1" height = "1" /><br/><br/>--------------------------<br/>新闻：<a href="http://news.cnblogs.com/n/47999/" target="_blank">Silverlight打造杰克逊纪念专题</a><br/>网站导航: <a href="http://www.cnblogs.com" target="_blank">博客园首页</a>&nbsp;&nbsp;<a href="http://news.cnblogs.com" target="_blank">新闻</a>&nbsp;&nbsp;<a href="http://dotnet.cnblogs.com" target="_blank">.NET频道</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com" target="_blank">社区</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/q/" target="_blank">博问</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/ing/" target="_blank">闪存</a>&nbsp;&nbsp;<a href="http://zzk.cnblogs.com" target="_blank">找找看</a>]]></description></item><item><title>中国站长站王小东专访郑昀：探索语义聚合为你呈现精彩信息</title><link>http://www.cnblogs.com/zhengyun_ustc/archive/2009/06/10/1500423.html</link><dc:creator>旁观者</dc:creator><author>旁观者</author><pubDate>Wed, 10 Jun 2009 06:18:00 GMT</pubDate><guid>http://www.cnblogs.com/zhengyun_ustc/archive/2009/06/10/1500423.html</guid><wfw:comment>http://www.cnblogs.com/zhengyun_ustc/comments/1500423.html</wfw:comment><comments>http://www.cnblogs.com/zhengyun_ustc/archive/2009/06/10/1500423.html#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://www.cnblogs.com/zhengyun_ustc/comments/commentRss/1500423.html</wfw:commentRss><trackback:ping>http://www.cnblogs.com/zhengyun_ustc/services/trackbacks/1500423.html</trackback:ping><description><![CDATA[<p><a href="http://www.chinaz.com/news/Visit/0610O0112009.html" target="_blank">2009-06-10 12:29:44 来源:中国站长站</a></p> <p>感谢主持人王小东！</p> <p>我摘录了一些问答，全文请到&nbsp;<a href="http://www.chinaz.com/news/Visit/0610O0112009.html" target="_blank">中国站长站</a> 看。</p> <p>&nbsp;</p> <p><strong>中国站长站《站长访谈》主持人王小东：</strong>欢迎郑昀做客中国站长站！首先向郑昀表达一个敬意，在互联网的&#8220;好文章&#8221;后面，常常可以看到你的勤奋身影。 </p><p><strong>郑昀：</strong>我们一直关注如何找到互联网上最优秀的内容和人，基于各种各样的数据和方法，把它们有效整合，并力图完美呈现。 </p><p><strong>王小东：</strong>对，你也曾经说过，玩聚网的内容取舍很大程度上源自你的审美趣味，很多内容特别是早期的玩聚网，多是你平时阅读的RSS订阅列表。那么，呈现玩聚网现在的样子，相信不仅仅是列表的呈现吧。可否详细介绍一下你所说的语义技术作为二层过滤，达到一个有价值主题呈现的这一图景？甄选好文章，主要有哪些途径呢？ </p><p><strong>郑昀：</strong>发现互联网最优秀最新鲜的文章或热点，我们探索的大致有两种测量维度： </p><p>一，找到用户或站方信赖的信源。比如，天涯社区的一些板块，<a href="http://twitter.com/" target="_blank">Twitter</a>，<a href="http://friendfeed.com/" target="_blank">FriendFeed</a>，某些博客，等等，相对值得信赖，它们上面的信息相对好。 </p><p>二，找到用户或站方信赖的人。 </p><p>具体的测量方法，有三种途径： </p><p>一，监测信赖的信源。如果足够多的资讯都在说同一件事，那么这件事可能是值得看的热点；如果足够多的资讯都在重复传播同一篇文章，那么这篇文章可能值得阅读。 </p><p>二，监测信赖的人。如果足够多的人都推荐、分享和转发了同一个资讯，那么这个资讯就可能是优质的、值得被你信赖的。 </p><p>三，把上面两点混合起来用。 </p><p>其中，检测不同文章是讲同一件事，以及检测不同文章其实是一篇文章，这都需要语义计算。 </p><p><strong>王小东：</strong>有另外一个类似的网站&#8212;&#8212;FeedzShare。FeedzShare 是统计Google  Reader和鲜果的读者在RSS阅读器里面分享的内容， 然后把用户分享最多的文章呈现在首页上。玩聚网和FeedzShare有哪些区别吗？我看到内容重合度很高的。 </p><p><strong>郑昀：</strong>我曾经说过，<a href="http://sr.ju690.com/" target="_blank">玩聚SR</a> = （<a href="http://www.rssmeme.com/" target="_blank">RssMeme</a> + <a href="http://www.tweetmeme.com/" target="_blank">TweetMeme</a> + Popacular + &#8230;）+ 语义计算。<a href="http://www.feedzshare.com/" target="_blank">FeedzShare</a> 是 <a href="http://www.rssmeme.com/" target="_blank">RssMeme</a> 的模式在中国的第一个实现者。 </p><p>对互联网科技社群来说，大部分分享和阅读行为都发生在RSS阅读器中，但也有相当比例的推荐行为第一时间发生在 Twitter  为首的微博客中。而且微博客的热点追踪能力更强更快，所以在中国要想做好实时的优质内容发现，必须要加强对微博客领域的监控。 </p><p>微博客的热门链接追踪虽好，但在中国也有缺点，就是容易剑走偏锋，过于新特奇，缺少让人沉稳耐读的资讯。这就需要 <a href="http://www.rssmeme.com/" target="_blank">RssMeme</a> 的模式来补充。 </p><p>另外，站方必须考虑的一点就是，流行的社会化媒体，都往往存在被封锁的风险，所以也必须考虑多种信源聚合，而不是把自己绑在<a href="http://twitter.com/" target="_blank">Twitter</a>或者Google  Reader战车上，避免因信源被封而无米下锅，比如近期我们整合进来饭否的统计数据。 </p><p>至于不同聚合服务内容有一定重合，我认为在现阶段中国这是必然的。因为活跃的中国互联网用户其实就这么多，尤其是社会化媒体，基本都是科技社群这批人作为主力军，每天产生出来的好内容也就那么多，那么作为RSS分享聚合的<a href="http://www.feedzshare.com/" target="_blank">FeedzShare</a>和<a href="http://re.xianguo.com/" target="_blank">鲜果热文</a>，与多种信源聚合的<a href="http://sr.ju690.com/" target="_blank">玩聚SR</a>，内容有一定重合，这是必然的。这就像网易新闻和新浪新闻多数是重合的一样。对于此，我的建议是，保持对一个聚合服务的关注即可。你犯不上新浪新闻和网易新闻全都看。 </p><p><a href="http://www.chinaz.com/news/Visit/0610O0112009_2.html"><img alt="" src="http://www.chinaz.com/upimg/userup/0906/101312594232.jpg" border="0" height="298" width="500" /></a> </p><p>-=-=-=-=-=-=-</p> <p><strong>王小东：</strong>既然一时间难以产生自己的用户，那么如何凝聚一群围绕在玩聚网周围的用户呢？我是说用户关注、平台价值方面，你总得有自己扎扎实实的、很基础的东西吧。按照传统的模式，没有&#8220;自有数据的用户群体&#8221;，这看起来很奇怪。 </p><p><strong>郑昀：</strong>其实没有自己平台产生的内容数据也不算太大问题，至少在网站成长期。主要的问题是，如何让使用玩聚网的用户转为注册用户。我们的考虑是，你如果单纯提供一个注册用户功能，但又无法提供给注册用户更有价值更独特的功能，那么就白花时间开发了，也浪费用户的感情，以后的产品如何让用户产生注册的动力呢。 </p><p>所以，一旦我们推出用户体系，肯定是要做个性化阅读和推送的，不是简单的聚合。然后慢慢地让大部分阅读、分享、评论和传播行为都发生在网站内。听上去有点儿像  FriendFeed 的从外部数据聚合到内部产生数据的道路，但我认为我们要做出自己的特色。 </p><p>&nbsp;</p> <p>-=-=-=-=-=-=-=-</p> <p><strong>王小东：</strong>有了自己的平台，就有了遐想的空间，当前流行的twitter就是如此。玩聚网由于是&#8220;二次推荐&#8221;，是基于twitter、Google  Reader这些已经存在的平台之上的，感觉没有自己底层的东西。玩聚网如何打造自己的平台，拥有自己的用户？持久力在哪里？盈利模式呢，想象力如何转化为创造力？ </p><p><strong>郑昀：</strong>慢慢来吧，先生存下去再说。 </p><p>我们一再试验不同的测量维度，一再 mashup  （糅合）不同的社会化媒体和数据，一再地尝试用各种自然语言处理手段，我相信这些经历会在以后有所体现，会得到回报。 </p><p>我希望能把这些经验灌注到一个新平台中，最好做成一个独特的社区。这个方向的盈利模式在中国只有两条路：个性化推送和口碑营销。现在还很难清晰地描绘出具体的演变路径，只能一步一步走了。 </p><p>&nbsp; </p><p>来源：<a href="http://www.chinaz.com/news/Visit/0610O0112009.html" target="_blank">中国站长站</a></p><img src ="http://www.cnblogs.com/zhengyun_ustc/aggbug/1500423.html?type=1" width = "1" height = "1" /><br/><br/>--------------------------<br/>新闻：<a href="http://news.cnblogs.com/n/47998/" target="_blank">传诺基亚正在开发Android手机</a><br/>网站导航: <a href="http://www.cnblogs.com" target="_blank">博客园首页</a>&nbsp;&nbsp;<a href="http://news.cnblogs.com" target="_blank">新闻</a>&nbsp;&nbsp;<a href="http://dotnet.cnblogs.com" target="_blank">.NET频道</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com" target="_blank">社区</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/q/" target="_blank">博问</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/ing/" target="_blank">闪存</a>&nbsp;&nbsp;<a href="http://zzk.cnblogs.com" target="_blank">找找看</a>]]></description></item><item><title>玩聚RT 加入对饭否的统计</title><link>http://www.cnblogs.com/zhengyun_ustc/archive/2009/06/09/1499644.html</link><dc:creator>旁观者</dc:creator><author>旁观者</author><pubDate>Tue, 09 Jun 2009 06:41:00 GMT</pubDate><guid>http://www.cnblogs.com/zhengyun_ustc/archive/2009/06/09/1499644.html</guid><wfw:comment>http://www.cnblogs.com/zhengyun_ustc/comments/1499644.html</wfw:comment><comments>http://www.cnblogs.com/zhengyun_ustc/archive/2009/06/09/1499644.html#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://www.cnblogs.com/zhengyun_ustc/comments/commentRss/1499644.html</wfw:commentRss><trackback:ping>http://www.cnblogs.com/zhengyun_ustc/services/trackbacks/1499644.html</trackback:ping><description><![CDATA[<p><a href="http://blog.csdn.net/zhengyun_ustc/" target="_blank">郑昀</a>@<a href="http://rt.ju690.com/" target="_blank">玩聚RT</a> 20090609</p> <p><strong>玩聚RT是什么？</strong></p> <p><a href="http://rt.ju690.com/" target="_blank">玩聚RT</a>，即中文锐推榜，实时追踪中文微博客世界的最新鲜、传播最广的锐推。</p> <p>最开始只是自动聚合<a href="http://twitter.com/" target="_blank">Twitter</a>  中文用户的RT(即转发)行为，统计得出最新鲜锐推榜单，并转发到官方帐号：@<a href="http://twitter.com/rtmeme" target="_blank">rtmeme</a> 上。用户 follow @<a href="http://twitter.com/rtmeme" target="_blank">rtmeme</a> 即可收看。或订阅 <a href="http://rt.ju690.com/rt/feed" target="_blank">RSS Feed</a> 。</p> <p><strong>为何加入对饭否RT行为的统计？</strong></p> <p>在饭否站方提供&#8220;转发&#8221;按钮之前，饭否用户也会自发地转发消息，但行为并不规范，多种格式并用，不像 <a href="http://twitter.com/" target="_blank">Twitter</a> 用户有被各种第三方工具认可的 RT 规范。所以，统计会遭遇很大麻烦。</p> <p>但站方提供此按钮，并自动加&#8220;转：&#8221;字样代表转发后，情况就好多了，有利于第三方统计。</p> <p><strong>饭否和Twitter的合并计算</strong></p> <p>饭否消息和Twitter Tweet经过剔除各种符号标点，经过语义处理，得到净化后的传播本体，然后统计出传播最多的锐推消息。</p> <p>此消息同时发送给 Twitter的 @<a href="http://twitter.com/rtmeme" target="_blank">rtmeme</a> 和 饭否的 <a href="http://fanfou.com/rtbang" target="_blank">@中文锐推榜</a> 两个官方帐户，欢迎订阅。</p> <p><strong>提高统计阈值</strong></p> <p>Twitter 被封恢复之后，人民群众的热情高涨，尤其是加入饭否的监测后，显然面对 RT 信息量的增加，我们要提高入榜的门槛。</p> <p>&nbsp;</p> <p><strong>三种收看中文锐推榜的方式：</strong></p> <p>订阅 @<a href="http://twitter.com/rtmeme" target="_blank">rtmeme</a> ；</p> <p>订阅 <a href="http://fanfou.com/rtbang" target="_blank">@中文锐推榜</a>&nbsp;；</p> <p>订阅 <a href="http://rt.ju690.com/rt/feed" target="_blank">RSS Feed</a>&nbsp;。</p><img src ="http://www.cnblogs.com/zhengyun_ustc/aggbug/1499644.html?type=1" width = "1" height = "1" /><br/><br/>--------------------------<br/>新闻：<a href="http://news.cnblogs.com/n/47996/" target="_blank">7月编程语言排行榜</a><br/>网站导航: <a href="http://www.cnblogs.com" target="_blank">博客园首页</a>&nbsp;&nbsp;<a href="http://news.cnblogs.com" target="_blank">新闻</a>&nbsp;&nbsp;<a href="http://dotnet.cnblogs.com" target="_blank">.NET频道</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com" target="_blank">社区</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/q/" target="_blank">博问</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/ing/" target="_blank">闪存</a>&nbsp;&nbsp;<a href="http://zzk.cnblogs.com" target="_blank">找找看</a>]]></description></item><item><title>逆转是怎么发生的？</title><link>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/28/1491205.html</link><dc:creator>旁观者</dc:creator><author>旁观者</author><pubDate>Wed, 27 May 2009 17:42:00 GMT</pubDate><guid>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/28/1491205.html</guid><wfw:comment>http://www.cnblogs.com/zhengyun_ustc/comments/1491205.html</wfw:comment><comments>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/28/1491205.html#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://www.cnblogs.com/zhengyun_ustc/comments/commentRss/1491205.html</wfw:commentRss><trackback:ping>http://www.cnblogs.com/zhengyun_ustc/services/trackbacks/1491205.html</trackback:ping><description><![CDATA[<p><a href="http://blog.csdn.net/zhengyun_ustc/" target="_blank">郑昀</a>@<a href="http://sr.ju690.com/" target="_blank">玩聚SR</a> 20090527</p> <p>&nbsp;&nbsp;&nbsp;  曾几何时，香港警员的<strong>95%</strong>都参与了贪腐。当一个一个警员被迫加入行贿受贿行列中时，当其他公共服务机构也参与进来时，当民众不行贿就难以使用公权资源时，看上去似乎整个体系烂透了，无药可救，就像人们现在看杭州和野三关镇的寒彻心扉默认接受不愿多言一样。</p> <p>&nbsp;&nbsp;&nbsp; 然而正如历史一次又一次地告诉我们的那样，引爆点终于来了。</p> <p>&nbsp;&nbsp;&nbsp; 随着<a href="http://zh.wikipedia.org/w/index.php?title=%E8%91%9B%E6%9F%8F&amp;variant=zh-cn" target="_blank">总警司葛柏</a><strong></strong>因被律政司调查且轻易逃往英国，引爆了民众的反腐大游行，由此廉政公署成立。</p> <p>&nbsp;&nbsp;&nbsp; 几年过去，竟然一个烂透了的公权机器被廉政公署逆转了。接下来，香港变成了地球上最廉洁的城市之一。</p> <p>&nbsp;&nbsp;&nbsp; Why？为何&#8220;<a href="http://www.icac.org.hk/" target="_blank">香港胜在有ICAC</a>&#8221;？</p> <p><strong><font color="#000080" size="4">退二进三？迫不得已的妥协</font></strong></p> <p>&nbsp;&nbsp;&nbsp;  可想而知，当95%的警员都主动或被动参与其中时，每个高级警务人员都有不光彩的过去时，你怎么抓怎么动？这也是四川宣布地震校舍不存在质量问题的原因。</p> <p>&nbsp;&nbsp;&nbsp; 事实证明，廉政公署确实敢迎难而上，不像大陆这么喜欢集体和稀泥。但警察们可不会这么轻易地被收拾。</p> <p>&nbsp;&nbsp;&nbsp; 维基百科：<font color="#800000">1977年10月，廉政公署拘捕140名九龙区警官控以集体贪污罪，后来再拘捕30多名九龙区警官。10月28日，二千多名警务人员在警察总部示威，要求当时警务处处长施礼荣向港府反映，削减廉政公署的权力，一批较激进的警员更冲进位于中环和记大厦的廉政公署执行处，大肆捣乱及伤人。此后几日，继续有警员上街滋事捣乱，形势一度近乎失控。到了11月5日，当时的香港总督麦理浩为了安抚警队，颁布&#8220;局部特赦令&#8221;，决定指令廉政公署特赦在1977年1月1日以前所有曾经贪污而未经检控的公务员。</font></p> <p>&nbsp;&nbsp;&nbsp; 事情并没有就此平息。</p> <p>&nbsp;&nbsp;&nbsp; 警方有人要求全面特赦并解散廉政公署，但港督没有再退让。但毕竟是让了。</p> <p><strong><font color="#000080" size="4">首恶必除 大老虎一定要打死</font></strong></p> <p>&nbsp;&nbsp;&nbsp; 廉政公署立威，必须从抓回潜逃的葛柏开始。</p> <p>&nbsp;&nbsp;&nbsp; 由于英国没有&#8220;财政状况与官职收入不相称&#8221;的控罪，因此港府难以以此控罪引渡他回港。民众不敢相信公署，所以也一直没有人证。</p> <p>&nbsp;&nbsp;&nbsp; 幸运的是，有一名污点证人愿举证，终于一年后将葛柏成功引渡并判处4年监禁。</p> <p>&nbsp;&nbsp;&nbsp; 廉署正是通过一系列大案的侦办，确立了民众对他们的信心。</p> <p>&nbsp;&nbsp;&nbsp; 通过对陈良宇案、王益黄光裕案等大案的观察，胡温似乎都是先按兵不动，然后低调</p> <p>把关键人物调岗，去除障碍，然后通过一年到两年的秘密侦查，最终打下大老虎。所以，四川出来的跟教育体系和建筑相关的这批官员，未见得能活多久。</p> <p>&nbsp;</p> <p>&nbsp;&nbsp;&nbsp;  还会有什么原因导致逆转的胜利呢？持续半年之久的学运吗？港督认识到不制止贪腐，就会危及大英的殖民统治吗？新闻媒体的自由报道吗？是什么让三四年间一切有了大改观？</p> <p>&nbsp;</p> <p><strong>参考文献：</strong></p> <p>1：维基百科：<a href="http://zh.wikipedia.org/wiki/%E5%BB%89%E6%94%BF%E5%85%AC%E7%BD%B2" target="_blank">廉政公署</a>；</p> <p>2：图书《<a href="http://lz.book.sohu.com/serialize-id-4118.html" target="_blank">解密香港廉政公署</a>》；</p> <p>3：《<a href="http://news.sina.com.cn/o/2009-05-27/133715694165s.shtml" target="_blank">廉政公署的神奇是如何缔造的？</a>》；</p> <p>4：《<a href="http://blog.sina.com.cn/s/blog_473d53360100ds64.html" target="_blank">李银河：为什么不学廉政公署？</a>》；</p> <p>5：《<a href="http://www.qzjw.net/index.php?option=com_content&amp;task=view&amp;id=2047&amp;Itemid=191" target="_blank">陈辉：透视香港廉政公署</a>》</p><img src ="http://www.cnblogs.com/zhengyun_ustc/aggbug/1491205.html?type=1" width = "1" height = "1" /><br/><br/>--------------------------<br/>新闻：<a href="http://news.cnblogs.com/n/47995/" target="_blank">Google Voice 上手</a><br/>网站导航: <a href="http://www.cnblogs.com" target="_blank">博客园首页</a>&nbsp;&nbsp;<a href="http://news.cnblogs.com" target="_blank">新闻</a>&nbsp;&nbsp;<a href="http://dotnet.cnblogs.com" target="_blank">.NET频道</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com" target="_blank">社区</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/q/" target="_blank">博问</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/ing/" target="_blank">闪存</a>&nbsp;&nbsp;<a href="http://zzk.cnblogs.com" target="_blank">找找看</a>]]></description></item><item><title>谈谷歌百宝箱的“时空隧道”</title><link>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/22/google_timeline.html</link><dc:creator>旁观者</dc:creator><author>旁观者</author><pubDate>Fri, 22 May 2009 15:09:00 GMT</pubDate><guid>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/22/google_timeline.html</guid><wfw:comment>http://www.cnblogs.com/zhengyun_ustc/comments/1487381.html</wfw:comment><comments>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/22/google_timeline.html#Feedback</comments><slash:comments>3</slash:comments><wfw:commentRss>http://www.cnblogs.com/zhengyun_ustc/comments/commentRss/1487381.html</wfw:commentRss><trackback:ping>http://www.cnblogs.com/zhengyun_ustc/services/trackbacks/1487381.html</trackback:ping><description><![CDATA[<p><a href="http://blog.csdn.net/zhengyun_ustc/" target="_blank">郑昀</a>@<a href="http://rt.ju690.com/" target="_blank">玩聚RT</a> 20090522</p>
<p>&nbsp;&nbsp;&nbsp; 周四下午，应<a href="http://longrujun.name/" target="_blank">龙如俊</a>兄弟和奥美的邀请，去参加了<a href="http://googlechinablog.com/2009/05/blog-post_21.html" target="_blank">谷歌搜索百宝箱的新闻发布会</a>，见着了李开复和洪波的真人。</p>
<p>&nbsp;&nbsp;&nbsp; 发布会<a href="http://v.youku.com/v_show/id_XOTMwMzk5NTY=.html" target="_blank">现场员工扮演机器猫</a>引介的重点是<a href="http://www.google.cn/search?q=%E5%85%A8%E8%81%9A%E5%BE%B7&amp;hl=zh-CN&amp;rlz=1B3GGGL_zh-CN___CN326&amp;sa=N&amp;tbo=1&amp;newwindow=1&amp;tbs=ww:1" target="_blank">神奇罗盘</a>(Wonder wheel)和<a href="http://www.google.cn/search?q=%E5%85%A8%E8%81%9A%E5%BE%B7&amp;hl=zh-CN&amp;rlz=1B3GGGL_zh-CN___CN326&amp;sa=N&amp;newwindow=1&amp;output=search&amp;tbs=tl:1&amp;tbo=1" target="_blank">时空隧道</a>(Timeline)，那么我们姑且分析一下二者的实现。</p>
<p><strong>第一印象</strong></p>
<p>&nbsp;&nbsp;&nbsp; 如果&#8220;<a href="http://www.google.cn/search?q=%E5%85%A8%E8%81%9A%E5%BE%B7&amp;hl=zh-CN&amp;rlz=1B3GGGL_zh-CN___CN326&amp;sa=N&amp;newwindow=1&amp;output=search&amp;tbs=tl:1&amp;tbo=1" target="_blank">时空隧道</a>&#8221;只是简单地判断关键词在文中出现位置的前后是否有明确的年份标记，如果&#8220;神奇罗盘&#8221;只是图形化相关搜索关键词，如果雅虎很早以前就推出过特定时间段的搜索选项，那这次谷歌发布百宝箱，可能主要难点在于海量数据的处理上。</p>
<p><strong>事后分析</strong></p>
<p>&nbsp;&nbsp;&nbsp; 当晚，我并不能立刻在谷歌页面上看到google.com上的开启选项。据龙如俊说，<a href="http://longrujun.name/index.php/2009/05/22/5%E7%9A%84%E4%BB%B7%E5%80%BC/" target="_blank">当前为5%的用户，在搜索时出现百宝箱功能</a>。</p>
<p>&nbsp;&nbsp;&nbsp; 翌日，选项出现，和俊林讨论了一下，对于中文领域的&#8220;时空隧道&#8221;，大致判断如下：</p>
<p>&nbsp;&nbsp;&nbsp; 1：对于某一篇文档分词后出现的词，一般索引中会记录它的出现位置和词频。为了配合Timeline功能，还会附加存储一个位置最近的年份字段。因为&#8220;时空隧道&#8221;的显示速度相当快，所以要在索引上事先做好才行。</p>
<p>&nbsp;&nbsp;&nbsp; 2：对于距离最近的年份日期的识别，并不像最开始我想像的那样，要分析一个句子中谁是主体（比如像雅虎的人际关系图分析一样），那样错误率仍会较高而且增加了计算开销；所以，谷歌应该只是简单地匹配一个文档中出现的各种年份和日期字符串，然后在给所有词（包括停止词）建索引时，直接把位置最近的日期关联存储起来即可。</p>
<p>&nbsp;&nbsp;&nbsp; 3：是否是海量数据呢？俊林提示，&#8220;时空隧道&#8221;搜索<a href="http://www.google.cn/search?q=%E6%88%91&amp;hl=zh-CN&amp;rlz=1B3GGGL_zh-CN___CN326&amp;sa=N&amp;newwindow=1&amp;output=search&amp;tbs=tl:1&amp;tbo=1" target="_blank">&#8220;我&#8221;</a>（找到了2千万记录）和<a href="http://www.google.cn/search?q=%E7%9A%84&amp;hl=zh-CN&amp;rlz=1B3GGGL_zh-CN___CN326&amp;sa=N&amp;newwindow=1&amp;output=search&amp;tbs=tl:1&amp;tbo=1" target="_blank">&#8220;的&#8221;</a>（找到了9千万记录），由此推算，&#8220;时空隧道&#8221;只是索引出现了年份日期的那部分文档，所基于的数据量大致在1亿篇文档以下（是单独搜<a href="http://www.google.cn/search?hl=zh-CN&amp;q=%E7%9A%84&amp;sourceid=navclient-ff&amp;rlz=1B3GGGL_zh-CN___CN326&amp;ie=UTF-8" target="_blank">&#8220;的&#8221;</a>的30分之一）。1亿篇文档上建立起来的数据挖掘，对于谷歌来说，只是小case。所以，才会有如此的搜索速度，丝毫不受特殊功能的影响。</p>
<p>&nbsp;&nbsp;&nbsp; 4：但对于这种
</p>
<p style="margin: 0px; padding: 0px;"><img alt="http://www.google.com/chart?chs=640x100&amp;cht=bvs&amp;chxt=x&amp;chxl=0:|1860%E5%B9%B4%7C1880%E5%B9%B4%7C1900%E5%B9%B4%7C1920%E5%B9%B4%7C1940%E5%B9%B4%7C1960%E5%B9%B4%7C1980%E5%B9%B4%7C2000%E5%B9%B4%7C&amp;chxr=0,0,100&amp;chxs=0,676767,11.5,0,tl,676767&amp;chd=e:AAAACxt7EBAAAAKzDxChAAAACAAAAAAAAAAACxFRAABwJiFRKSAAAAAAAAAAGBAAAAAAGBJSAAAAExf3AwAAAAHiAAAAAAAAAAExJSOzCREhFhKiKiLTUVEBKCMjR0IyS0XmMTPkMTJiTVdH..Z2gYAAAAAAAAAA,AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA&amp;chbh=8,0,0&amp;chg=12.50,0,5,6&amp;chxp=0,0.0,12.5,25.0,37.5,50.0,62.5,75.0,87.5&amp;chco=3366cc,bbcced&amp;chm=R,bbbbbb,0,0.9955,1.0|h,bbbbbb,0,1.0,1.0,1&amp;chxs=0,000000,11,-1" src="http://www.google.com/chart?chs=640x100&amp;cht=bvs&amp;chxt=x&amp;chxl=0%3A%7C1860%E5%B9%B4%7C1880%E5%B9%B4%7C1900%E5%B9%B4%7C1920%E5%B9%B4%7C1940%E5%B9%B4%7C1960%E5%B9%B4%7C1980%E5%B9%B4%7C2000%E5%B9%B4%7C&amp;chxr=0%2C0%2C100&amp;chxs=0%2C676767%2C11.5%2C0%2Ctl%2C676767&amp;chd=e%3AAAAACxt7EBAAAAKzDxChAAAACAAAAAAAAAAACxFRAABwJiFRKSAAAAAAAAAAGBAAAAAAGBJSAAAAExf3AwAAAAHiAAAAAAAAAAExJSOzCREhFhKiKiLTUVEBKCMjR0IyS0XmMTPkMTJiTVdH..Z2gYAAAAAAAAAA%2CAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA&amp;chbh=8%2C0%2C0&amp;chg=12.50%2C0%2C5%2C6&amp;chxp=0%2C0.0%2C12.5%2C25.0%2C37.5%2C50.0%2C62.5%2C75.0%2C87.5&amp;chco=3366cc%2Cbbcced&amp;chm=R%2Cbbbbbb%2C0%2C0.9955%2C1.0%7Ch%2Cbbbbbb%2C0%2C1.0%2C1.0%2C1&amp;chxs=0%2C000000%2C11%2C-1" style="border-style: none; border-width: 0px;" /></p>
&nbsp;&nbsp;&nbsp; 检索时第一时间出现的年份文档数量图，这个数组是如何迅速地给出来的呢？因为即使你搜索随机的字符串，这个图依然能较快地显示。
<p>&nbsp;</p>
<p>&nbsp;&nbsp;&nbsp; 5：分页。&#8220;时空隧道&#8221;它是尽量在一页内的显示结果按照时间排序，即每页返回结果20条，在这20条内做时间排序，这样对搜索速度没影响。</p>
<p>&nbsp;</p>
<p><strong>神奇罗盘</strong></p>
<p>&nbsp;&nbsp;&nbsp; 比较google.com和google.cn的罗盘显示结果，可以得知此功能只是把&#8220;相关搜索&#8221;所列出的搜索词列表图形化而已。</p>
<p>&nbsp;&nbsp;&nbsp; 只不过谷歌的相关搜索词语和google的不一样罢了，<a href="http://blog.csdn.net/malefactor/archive/2005/11/29/539342.aspx" target="_blank">毕竟这个列表是用本土的搜索次数和单词在文档索引中出现次数做出来的</a>，所以，这个一定是本土化的。</p>
<p><strong>小结</strong></p>
<p>&nbsp;&nbsp;&nbsp; 其实现在在技术上，谷歌（不是google）已经不用和百度比，新闻发布会上根本不需要提百度，记者也不需要问与百度的比较，他们早已经不是一个层面上的拳手了。</p>
<p>&nbsp;&nbsp;&nbsp; &#8220;实时搜索&#8221;对Google来说也是弹指之间便可做到，没什么。对比Google搜索结果信息的丰富度以及逼近真理的排序，对比海量数据的快速索引能力，那么索引了算不上海量的短文本的其他实时搜索又能如何呢？他和他都解决不了那个难题：用户为何而来。正是不知道输入一个词是要干什么，所以你才会看到<a href="http://www.google.cn/search?hl=zh-CN&amp;q=%E5%91%A8%E6%9D%B0%E4%BC%A6&amp;sourceid=navclient-ff&amp;rlz=1B3GGGL_zh-CN___CN326&amp;ie=UTF-8" target="_blank">&#8220;周杰伦&#8221;</a>页面上显示了谷歌音乐搜索、新闻搜索、视频搜索的结果，<a href="http://www.google.cn/search?hl=zh-CN&amp;q=%E5%85%A8%E8%81%9A%E5%BE%B7&amp;sourceid=navclient-ff&amp;rlz=1B3GGGL_zh-CN___CN326&amp;ie=UTF-8" target="_blank">&#8220;全聚德&#8221;</a>的结果甚至要显示北京周边所有商户的地图信息。实时搜索能解决这个吗？不能。</p>
<p>&nbsp;&nbsp;&nbsp; &#8220;神奇罗盘&#8221;和&#8220;时空隧道&#8221;是逼近用户意图的一个小技巧，还会有更多这样的努力。</p><img src ="http://www.cnblogs.com/zhengyun_ustc/aggbug/1487381.html?type=1" width = "1" height = "1" /><br/><br/>--------------------------<br/>新闻：<a href="http://news.cnblogs.com/n/47994/" target="_blank">Google号召社区力量为互联网加速</a><br/>网站导航: <a href="http://www.cnblogs.com" target="_blank">博客园首页</a>&nbsp;&nbsp;<a href="http://news.cnblogs.com" target="_blank">新闻</a>&nbsp;&nbsp;<a href="http://dotnet.cnblogs.com" target="_blank">.NET频道</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com" target="_blank">社区</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/q/" target="_blank">博问</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/ing/" target="_blank">闪存</a>&nbsp;&nbsp;<a href="http://zzk.cnblogs.com" target="_blank">找找看</a>]]></description></item><item><title>玩聚RT 受到 Twitter Search 的影响无法自动更新</title><link>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/21/1486088.html</link><dc:creator>旁观者</dc:creator><author>旁观者</author><pubDate>Thu, 21 May 2009 03:23:00 GMT</pubDate><guid>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/21/1486088.html</guid><wfw:comment>http://www.cnblogs.com/zhengyun_ustc/comments/1486088.html</wfw:comment><comments>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/21/1486088.html#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://www.cnblogs.com/zhengyun_ustc/comments/commentRss/1486088.html</wfw:commentRss><trackback:ping>http://www.cnblogs.com/zhengyun_ustc/services/trackbacks/1486088.html</trackback:ping><description><![CDATA[<p><a href="http://blog.csdn.net/zhengyun_ustc/" target="_blank">郑昀</a>@<a href="http://rt.ju690.com/" target="_blank">玩聚RT</a>&nbsp;20090520 </p>
<p><strong>现象</strong> </p>
<p>5月20日，中文 Tweets 被 Twitter Search 划分到了不同语种中；本语种的搜索结果极难得更新一次。</p>
<p>大致问题时间起始自北京时间5月20日6点～7点，至今未解决。<br />
不仅仅是中文，日语和泰语等亚洲语系都受到影响。莫非是Twitter  Search在调整亚洲语系的索引？</p>
<p><strong>举例</strong><br />
譬如，点击不同语种的搜索rt关键词：<br />
<a href="http://search.twitter.com/search?q=rt&amp;lang=is">http://search.twitter.com/search?q=rt&amp;lang=is</a></p>
<blockquote><img alt="http://www.5gme.com/attachment/200905/20/366_1242800170Zyg4.png" src="http://www.5gme.com/attachment/200905/20/366_1242800170Zyg4.png" /></blockquote>
<p><a href="http://search.twitter.com/search?q=rt&amp;lang=it">http://search.twitter.com/search?q=rt&amp;lang=it</a><br />
<a href="http://search.twitter.com/search?q=rt&amp;lang=de">http://search.twitter.com/search?q=rt&amp;lang=de</a><br />
都出现了大量的中文及日文锐推。以前没这么极端，虽然中文和日文容易混在一起，但和其他语系还是容易分开的。<br />
</p>
<p>真正的日文搜索：<br />
<a href="http://search.twitter.com/search?q=rt&amp;lang=ja">http://search.twitter.com/search?q=rt&amp;lang=ja</a><br />
的最后更新时间停留在了北京时间5月20日6点，不再更新。<br />
<img alt="http://www.5gme.com/attachment/200905/20/366_1242800180l2G1.png" src="http://www.5gme.com/attachment/200905/20/366_1242800180l2G1.png" /><br />
中文也是如此，都出现了明显的问题：</p>
<p><a title="http://search.twitter.com/search?q=rt&amp;lang=zh" href="http://search.twitter.com/search?q=rt&amp;lang=zh">http://search.twitter.com/search?q=rt&amp;lang=zh</a><br />
也可以看出大致是北京时间5月20日6点～7点开始的。</p>
<strong>影响</strong><br />
<p>玩聚RT受到Twitter  Search该问题影响，无法自动更新锐推榜了。虽然可以设置在全部语言下搜索，但由于中文和日文难以彻底分开，而且英文retweets特别快特别多，所以，暂时无法抓取到足够全的中文锐推。</p><img src ="http://www.cnblogs.com/zhengyun_ustc/aggbug/1486088.html?type=1" width = "1" height = "1" /><br/><br/>--------------------------<br/>新闻：<a href="http://news.cnblogs.com/n/47989/" target="_blank">Twitter无处不在 魔兽世界Twitter发送器插件发布</a><br/>网站导航: <a href="http://www.cnblogs.com" target="_blank">博客园首页</a>&nbsp;&nbsp;<a href="http://news.cnblogs.com" target="_blank">新闻</a>&nbsp;&nbsp;<a href="http://dotnet.cnblogs.com" target="_blank">.NET频道</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com" target="_blank">社区</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/q/" target="_blank">博问</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/ing/" target="_blank">闪存</a>&nbsp;&nbsp;<a href="http://zzk.cnblogs.com" target="_blank">找找看</a>]]></description></item><item><title>玩聚的Tweet&amp;Blog墙 X</title><link>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/21/1486072.html</link><dc:creator>旁观者</dc:creator><author>旁观者</author><pubDate>Thu, 21 May 2009 03:14:00 GMT</pubDate><guid>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/21/1486072.html</guid><wfw:comment>http://www.cnblogs.com/zhengyun_ustc/comments/1486072.html</wfw:comment><comments>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/21/1486072.html#Feedback</comments><slash:comments>1</slash:comments><wfw:commentRss>http://www.cnblogs.com/zhengyun_ustc/comments/commentRss/1486072.html</wfw:commentRss><trackback:ping>http://www.cnblogs.com/zhengyun_ustc/services/trackbacks/1486072.html</trackback:ping><description><![CDATA[<p>20090519</p>
<p><strong>Blogs:</strong>&nbsp;</p>
<p><img src="http://sr.ju690.com/static/about/comment-open.gif"  alt="" /></p>
<p>脑筋动得快的人，已经想到如何把微网志的内容带进书籤网站的方法了。就是以retweet次数做排名的锐推排行榜，例如美国的Tweetmeme与大陆的玩聚。</p>
<p>以功能来说，我认为玩聚做得十分完整，虽然以alexa流量排行来看，这两个网站还算不上成功，但整体而言，却是其他书籤网站可作为参考的方向。这也证明了，书籤网站只要稍加修改，其运作模式还是可以套用于微网志上。</p>
<p><img src="http://sr.ju690.com/static/about/comment-close.gif" align="center"  alt="" /></p>
<p>--- <a href="http://mmdays.com/" target="_blank">MMDays</a>：<a href="http://mmdays.com/2009/05/20/how_you_read_in_microblogging_era/" target="_blank">在微网志〈Microblogging〉兴起的时代里，你如何阅读？</a></p>
<p>2009年5月20日</p>
<p><img src="http://sr.ju690.com/static/about/comment-open.gif"  alt="" /></p>
<p>鲜果和抓虾的热文早该搞RSS输出了，不过他们同质化很厉害，玩不过玩聚SR。九点相对而言，小资些，有些另类，还可以看到点不同的信息。</p>
<p><img src="http://sr.ju690.com/static/about/comment-close.gif" align="center"  alt="" /></p>
<p>--- <a href="http://xywflife.blogspot.com/2009/05/rssrss.html" target="_blank">XYWF</a> 2009年5月13日</p>
<p><img src="http://sr.ju690.com/static/about/comment-open.gif"  alt="" /></p>
<p>可以适当follow一些诸如 @<a href="http://twitter.com/rtmeme" target="_blank">rtmeme</a>&nbsp;这样的机器人，他会让你看最少的tweets却获得最大的信息量。</p>
<p><img src="http://sr.ju690.com/static/about/comment-close.gif" align="center"  alt="" /></p>
<p>--- <a href="http://zhutou.info/" target="_blank">zhutou</a>：<a href="http://zhutou.info/archives/twitter-info-overload-133.html" target="_blank">Twitter的信息过载问题</a> 2009年5月21日</p>
<p><strong>Tweets:</strong>&nbsp;</p>
<img src="http://sr.ju690.com/static/about/comment-open.gif"  alt="" />
<p>玩聚是目前我看到的最让人欣喜的产品</p>
<p><img src="http://sr.ju690.com/static/about/comment-close.gif" align="center"  alt="" /></p>
<p>--- 姚X旭 <a href="http://fanfou.com/statuses/WqcAgjAPV0w" target="_blank">2009年5月18日</a></p>
<img src="http://sr.ju690.com/static/about/comment-open.gif"  alt="" />
<p>下午RT了一个&#8220;中国逢九必变&#8221;，七七八八又被RT了十四五次；其实 twitter 或者玩聚，可以弄个 RT  的传播路线图，看看这些信息的传播路径有什么规律，感觉这个是 twitter 的差异性所在之一。:D</p>
<p><img src="http://sr.ju690.com/static/about/comment-close.gif" align="center"  alt="" /></p>
<p>--- <a href="http://twitter.com/flierlu" target="_blank">Flier Lu</a>  2009年5月20日</p>
<p><a href="http://sr.ju690.com/" target="_blank"><img alt="http://farm4.static.flickr.com/3373/3534339818_30e0e838b2.jpg?v=0" src="http://farm4.static.flickr.com/3373/3534339818_30e0e838b2.jpg?v=0" /></a></p><img src ="http://www.cnblogs.com/zhengyun_ustc/aggbug/1486072.html?type=1" width = "1" height = "1" /><br/><br/>--------------------------<br/>新闻：<a href="http://news.cnblogs.com/n/47989/" target="_blank">Twitter无处不在 魔兽世界Twitter发送器插件发布</a><br/>网站导航: <a href="http://www.cnblogs.com" target="_blank">博客园首页</a>&nbsp;&nbsp;<a href="http://news.cnblogs.com" target="_blank">新闻</a>&nbsp;&nbsp;<a href="http://dotnet.cnblogs.com" target="_blank">.NET频道</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com" target="_blank">社区</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/q/" target="_blank">博问</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/ing/" target="_blank">闪存</a>&nbsp;&nbsp;<a href="http://zzk.cnblogs.com" target="_blank">找找看</a>]]></description></item><item><title>Python的win32serviceutil之疑似BUG</title><link>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/16/win32serviceutil.html</link><dc:creator>旁观者</dc:creator><author>旁观者</author><pubDate>Fri, 15 May 2009 17:27:00 GMT</pubDate><guid>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/16/win32serviceutil.html</guid><wfw:comment>http://www.cnblogs.com/zhengyun_ustc/comments/1458093.html</wfw:comment><comments>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/16/win32serviceutil.html#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://www.cnblogs.com/zhengyun_ustc/comments/commentRss/1458093.html</wfw:commentRss><trackback:ping>http://www.cnblogs.com/zhengyun_ustc/services/trackbacks/1458093.html</trackback:ping><description><![CDATA[<p><a href="http://blog.csdn.net/zhengyun_ustc/" target="_blank">郑昀</a>@<a href="http://sr.ju690.com/" target="_blank">玩聚SR</a>&nbsp;20090515</p>
<p><strong>1、现象：</strong></p>
<p>用Python的<a href="http://docs.activestate.com/activepython/2.6/pywin32/Windows_NT_Eventlog_and_Threading.html">win32serviceutil控制Windows  Service启动、停止、重启时</a>，如下代码一般是没问题的。</p>
<p><strong>import win32serviceutil</strong></p>
<p><strong>def service_manager(action, machine,  service):<br />
&nbsp;&nbsp;&nbsp; if action == 'stop':<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;  win32serviceutil.StopService(service, machine)<br />
&nbsp;&nbsp;&nbsp; elif action ==  'start':<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; win32serviceutil.StartService(service, machine)<br />
&nbsp;&nbsp;&nbsp; elif  action == 'restart':<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; win32serviceutil.RestartService(service,  machine)<br />
&nbsp;&nbsp;&nbsp; elif action == 'status':<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; if  win32serviceutil.QueryServiceStatus(service, machine)[1] == 4:<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;  print "%s is happy" % service<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; else:<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; print "%s is being  a PITA" % service</strong> </p>
<p>但控制Apache Service时，会出现一个很怪的现象。</p>
<p>譬如运行这么简单的语句：</p>
<p><strong>import win32serviceutil</strong></p>
<p><strong>win32serviceutil.StartService("Apache2.2","localhost")</strong></p>
<p>顺利执行后，停止的Apache服务并没有被启动。<br />
此时，Windows事件日志就会报告这种错误：<br />
<strong>事件类型:&nbsp;&nbsp;&nbsp; 错误<br />
事件来源:&nbsp;&nbsp;&nbsp; Apache Service<br />
事件种类:&nbsp;&nbsp;&nbsp; 无<br />
事件  ID:&nbsp;&nbsp;&nbsp; 3299<br />
The Apache service named&nbsp; reported the following  error:<br />
&gt;&gt;&gt; Usage: C:""Apache2.2""bin""httpd.exe [-D name] [-d  directory] [-f file]</strong></p>
<p><strong></strong>&nbsp;</p>
<p>同样，win32serviceutil.RestartService 函数虽然可以先正常地停止掉Apache服务，但试图启动时仍遇到同样的错误。</p>
<p>在多台服务器(Windows2003+SP2)和我本机(WindowsXP+SP2)都可以重现。</p>
<p><br />
<strong>2、解决：</strong></p>
<p>&nbsp;</p>
<p>把machine参数去掉不传即可，或传空字符串。 <br />
即： <br />
<strong>win32serviceutil.StartService("Apache2.2")</strong>  <br />
或</p>
<p><strong>win32serviceutil.StartService("Apache2.2","")</strong>  </p>
<p>可以正常启动本机的Apache，这样无法遥控域内其他服务器了。</p>
<p>&nbsp;</p>
<p><br />
<strong>3、更多：</strong><br />
1:<strong>win32serviceutil.StartService(service, '-w -n "Apache2.2"  -k start')<br />
</strong>这样不传machine参数，只设定服务启动的传入参数也不行。</p>
<p>2:对于 win32serviceutil.StopService 函数，停止Apache等Windows服务时，不存在此问题。</p><img src ="http://www.cnblogs.com/zhengyun_ustc/aggbug/1458093.html?type=1" width = "1" height = "1" /><br/><br/>--------------------------<br/>新闻：<a href="http://news.cnblogs.com/n/47988/" target="_blank">Firefox 3.5匆忙推出漏洞多 Mozilla本月将更新</a><br/>网站导航: <a href="http://www.cnblogs.com" target="_blank">博客园首页</a>&nbsp;&nbsp;<a href="http://news.cnblogs.com" target="_blank">新闻</a>&nbsp;&nbsp;<a href="http://dotnet.cnblogs.com" target="_blank">.NET频道</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com" target="_blank">社区</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/q/" target="_blank">博问</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/ing/" target="_blank">闪存</a>&nbsp;&nbsp;<a href="http://zzk.cnblogs.com" target="_blank">找找看</a>]]></description></item><item><title>0509·刘未鹏的TL聚会[三]</title><link>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/13/1456146.html</link><dc:creator>旁观者</dc:creator><author>旁观者</author><pubDate>Wed, 13 May 2009 10:31:00 GMT</pubDate><guid>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/13/1456146.html</guid><wfw:comment>http://www.cnblogs.com/zhengyun_ustc/comments/1456146.html</wfw:comment><comments>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/13/1456146.html#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://www.cnblogs.com/zhengyun_ustc/comments/commentRss/1456146.html</wfw:commentRss><trackback:ping>http://www.cnblogs.com/zhengyun_ustc/services/trackbacks/1456146.html</trackback:ping><description><![CDATA[<p><a href="http://blog.csdn.net/zhengyun_ustc/" target="_blank">郑昀</a>@<a href="http://sr.ju690.com/" target="_blank">玩聚SR</a>&nbsp;</p>
<p>北京。五道口。5月9日。</p>
<p>TL聚会话题继续登出。[请阅读<a href="http://blog.csdn.net/zhengyun_ustc/archive/2009/05/11/4168931.aspx">[一]</a>和[二]了解]。</p>
<p><strong>5、科学家主导与工程师主导</strong></p>
<p>一方认为Sun是典型的科学家主导的公司，所以做不好。这个观点，霍炬以前在5G也表达过：<a href="http://home.donews.com/donews/article/9/97011.html" target="_blank">Sun是一个科学家企业，不是一个市场企业。</a></p>
<p>而豆瓣看上去是工程师主导的，但实际上不是，貌似是产品经理主导，甚至只是阿北主导的。</p>
<p>工程师主导的，国内据说是网易有道，国外就是Google。</p>
<p>不过很难说清楚此处的科学家主导和工程师主导区别何在，如果说到不以市场为导向，这二者没什么区别。如果是研究机构，科学家也许更多考虑发表论文，不考虑工程实际细节？但在公司，科学家和工程师身份容易混淆，所以keso<a href="http://home.donews.com/donews/article/9/97011.html" target="_blank">在同一个访谈中说</a>&#8220;我同意Sun是一个工程师主导的技术性公司&#8221;。</p>
<p><strong>6、发散阅读解决方案</strong></p>
<p>大家都知道 <a href="http://mindhacks.cn/" target="_blank">pongba</a>&nbsp;推崇 <a href="http://www.stumbleupon.com/" target="_blank">stumbleupon</a>&nbsp;，它能让你发现你原来对如此多的话题感兴趣，而这些你以前都不知道，甚至你以为你已经知道得够多了。</p>
<p><a href="http://mindhacks.cn/" target="_blank">pongba</a> 问我 <a href="http://sr.ju690.com/" target="_blank">玩聚SR</a> 下一步的计划是什么，个性化阅读有没有提上日程。</p>
<p>我的观点是，Find The Best Content in Web，在国内，需要找到足够多的值得信赖的人。<a href="https://groups.google.com/group/pongba" target="_blank">TopLanguage</a>&nbsp;小组算是有一批可被信赖的人，而且跨界，所以信息质量还算不错且有一定发散性。</p>
<p>如果没有这一大批值得被信赖的人做出的推荐、收藏或分享，个性化之后也不会有好的内容被关联。</p>
<p>国内的网络收藏和书签网站多半被SEOer们滥用，所以已经丧失了挖掘意义。</p>
<p>而没有了数据挖掘的基础数据，光靠Twitter和GReader Shared Items上的那点儿数据，个性化阅读也无从谈起。</p>
<p><a href="http://sr.ju690.com/" target="_blank">玩聚SR</a>  找到了一个次优的解决方案，但由于不敢放开这个&#8220;被信赖的推荐人列表（A-List）&#8221;，所以数据偏少且偏主流化，不足以做个性化推荐。</p>
<p>国内的仿 <a href="http://www.stumbleupon.com/" target="_blank">stumbleupon</a>&nbsp;网站也由于参与用户没有达到量级，所以还没有到达发生质变的阶段。所以，中国当下，只能盯住那些可被信赖的人组成的Network，来注意到你不知道但可能感兴趣的事物，比如<a href="http://songshuhui.net/" target="_blank">科学松鼠会</a>、TL。</p>
<p><img alt="http://farm4.static.flickr.com/3622/3489790678_82b63291bf.jpg?v=0" src="http://farm4.static.flickr.com/3622/3489790678_82b63291bf.jpg?v=0" /></p>
<p><strong>精彩评论聚合</strong></p>
<p>我们继续列出<a href="http://groups.google.com/group/pongba/browse_thread/thread/a64c48b12f4f8281" target="_blank">前两节话题</a>引玉的结果：</p>
<p>1：James：&#8220;</p>
<p>如果TL是一个大脑, 那我们每个人都是一个神经元, 邮件/twitter之类的就是神经信号传递。</p>
<p>&#8221;</p>
<p>2：莫华枫：&#8220;</p>
<p>A。DNA可能并非简单的程序。真正控制行为的是各种化学物质，神经递质、蛋白质、酶等等，以及它们的相互作用，  <br />
这些应该算直接作用于行为的程序。而DNA所做的是&#8220;metaprogramming&#8221;，指导各种物质合成和代谢，是生成程序的程序。</p>
<p>B。<strong>自然的进化不会依赖复杂的规则</strong>（上帝喜欢KISS），进化规则建立在其他自然法则之上，或者根本就是其他法则的体现。机器也依赖于自然法则，剩下的问题就是如何利用基本自然法则指导机器的进化了。当然首先得先摸清自然法则了。</p>
<p>C。大脑功能是网络化的，功能分区存在，但在离开其他分区就无法工作。是介于分区和网络之间的一种形式。上一期环球科学，或者新发现，有相关的一篇文章。单一的认知行为，如听、说、运动，并非只局限于某一个区域。任何单一的认知行为都会调动大脑的几乎所有部分。不过脑功能的转移和重建是有限度的，特别是在脑组织遭到破坏的情况下。大脑更多地是&#8220;扩张&#8221;某一部分脑功能，&#8220;侵占&#8221;另一部分。比如，Discovery的一档节目里就曾经让一个视觉正常的人戴上眼罩，生活了1个星期。发现她的触觉灵敏度提高很多，MRI检测表明，她大脑的一部分视觉皮层&#8220;转行&#8221;做了触觉皮层。这种情况也出现在真正的盲人身上。当她回复视觉一段时间以后，转行的视觉皮层又重新变成视觉皮层。</p>
<p>D。<strong>人的神经系统绝对是&#8220;用简单创造复杂&#8221;。</strong>神经元是简单的，但高度组织关联使其极端复杂。神经系统进化了几亿年，神经细胞基本上没有什么变化，但<strong>规模和组织的变化，产生了天壤之别</strong>。</p>
<p>E。越来越多的证据表明，神经系统的几乎所有构造，都是基因决定的。甚至可能性格和思维方式都取决于基因。十几年前就有试验表明，神经细胞的生长具有高度特异性。有人试验将一种鸟的胚胎的脑顶盖（负责视觉）切下，旋转108度再缝合。结果那些从眼部发射出来向顶盖生长的突触纤维也转了180度。这种特异性甚至可能存在于皮层柱状结构之间。  <br />
神经系统发育的早期已经完成构造，并且由基因驱动，而非环境驱动。神经系统后期生长更多的是裁剪和修饰，而非构造。更像是参数调整。</p>
<p>F。还是基础投入的太少啊，从小学开始，到大学基础科研和人才培养。没有见过枪都端不稳的特种兵的。</p>
<p>&#8221;</p>
<p>3：joyfire：&#8220;</p>
<p>1.大脑各个区域自动修复和重联功能的确很强，但也是有限制的。补偿机制不难理解。 </p>
<p>2.创新不是拍脑袋等苹果落下来，还是需要一些踏实的基础。我们的问题，也许在于，环境导致无法真正"长期潜心研究" 。</p>
<p>&#8221;</p>
<p><img alt="http://farm4.static.flickr.com/3631/3510879688_27cf4601b7.jpg?v=0" src="http://farm4.static.flickr.com/3631/3510879688_27cf4601b7.jpg?v=0" /></p>
<p><a href="http://blog.csdn.net/zhengyun_ustc/" target="_blank">郑昀</a>@<a href="http://sr.ju690.com/" target="_blank">玩聚SR</a> <br />
</p><img src ="http://www.cnblogs.com/zhengyun_ustc/aggbug/1456146.html?type=1" width = "1" height = "1" /><br/><br/>--------------------------<br/>新闻：<a href="http://news.cnblogs.com/n/47987/" target="_blank">预测：Twitter最可能收购的十家公司</a><br/>网站导航: <a href="http://www.cnblogs.com" target="_blank">博客园首页</a>&nbsp;&nbsp;<a href="http://news.cnblogs.com" target="_blank">新闻</a>&nbsp;&nbsp;<a href="http://dotnet.cnblogs.com" target="_blank">.NET频道</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com" target="_blank">社区</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/q/" target="_blank">博问</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/ing/" target="_blank">闪存</a>&nbsp;&nbsp;<a href="http://zzk.cnblogs.com" target="_blank">找找看</a>]]></description></item><item><title>0509·刘未鹏的TL聚会[二]</title><link>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/12/pongba2.html</link><dc:creator>旁观者</dc:creator><author>旁观者</author><pubDate>Mon, 11 May 2009 16:51:00 GMT</pubDate><guid>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/12/pongba2.html</guid><wfw:comment>http://www.cnblogs.com/zhengyun_ustc/comments/1454555.html</wfw:comment><comments>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/12/pongba2.html#Feedback</comments><slash:comments>1</slash:comments><wfw:commentRss>http://www.cnblogs.com/zhengyun_ustc/comments/commentRss/1454555.html</wfw:commentRss><trackback:ping>http://www.cnblogs.com/zhengyun_ustc/services/trackbacks/1454555.html</trackback:ping><description><![CDATA[<p><a href="http://blog.csdn.net/zhengyun_ustc/" target="_blank">郑昀</a>@<a href="http://sr.ju690.com/" target="_blank">玩聚SR</a>&nbsp;</p>
<p>北京。五道口。</p>
<p>TL聚会话题还在延续。[请阅读<a href="http://blog.csdn.net/zhengyun_ustc/archive/2009/05/11/4168931.aspx">[一]</a>了解]。</p>
<p>继<a href="http://blog.csdn.net/zhengyun_ustc/archive/2009/05/11/4168931.aspx">人工智能+进化、破坏性创新</a>两个话题后（tinyfool和joyfire都<a href="http://groups.google.com/group/pongba/browse_thread/thread/b293e84e49e86377">在FL本topic做了补充发言</a>，我更新进去了），我们继续边跑题边激荡。</p>
<p><strong>3、豆瓣的数据</strong></p>
<p>&nbsp;&nbsp;&nbsp; zsp 来自于<a href="http://www.douban.com/" target="_blank">豆瓣</a>。</p>
<p>&nbsp;&nbsp;&nbsp; <a href="http://mindhacks.cn/" target="_blank">pongba</a> 认为<a href="http://it.ju690.com/meme/topic/%E8%B1%86%E7%93%A3" target="_blank">豆瓣</a>需要好的产品经理，充分挖掘<a href="http://it.ju690.com/meme/topic/%E8%B1%86%E7%93%A3" target="_blank">豆瓣</a>的巨大潜力。</p>
<p>&nbsp;&nbsp;&nbsp; 我说我把<a href="http://www.douban.com/group/dbapi/" target="_blank">豆瓣API小组</a>的讨论从头翻到尾，也没看到几个让人眼前一亮的豆瓣第三方应用（他们自己也说&#8220;<a href="http://sakinijino.blogbus.com/logs/33056619.html" target="_blank">API的流行程度还是低于了我的预期</a>&#8221;）。</p>
<p>&nbsp;&nbsp;&nbsp;  究其原因，豆瓣把自己的API限制得太死，给第三方应用很少的腾挪空间，用户隐私保护得太厉害了。默认，用户重要数据是需要相应用户确认才能被应用访问的。</p>
<p>&nbsp;&nbsp;&nbsp; 豆瓣API对访问频次也限制非常严格，每分钟超过40次就会被封。</p>
<p>&nbsp;&nbsp;&nbsp; 当然，豆瓣也常常分析访问日志，如果某些访问不正常，就会封之。这也是被诸多山寨豆瓣、山寨书评影评网逼得。</p>
<p>&nbsp;&nbsp;&nbsp; 这也是阿北的风格。豆瓣的海量高质量数据，原则上是不鼓励被其他人使用或滥用的。</p>
<p>&nbsp;&nbsp;&nbsp; 所以，不像Twitter或facebook，豆瓣没有什么有影响力的第三方应用。</p>
<p><strong>4、互联网繁荣的基础：电子商务</strong></p>
<p>&nbsp;&nbsp;&nbsp; 话说是这么一个逻辑：</p>
<p>&nbsp;&nbsp;&nbsp; 为什么微博客分散了博客的注意力？微博客的发言越频繁，博客写作就越消极？</p>
<p>&nbsp;&nbsp;&nbsp; 因为大陆的博客不像北美，没有那么高的广告收入，或者说即使是热门博主，广告收入也寥寥无几。</p>
<p>&nbsp;&nbsp;&nbsp; 那么为何会出现这种情况呢？</p>
<p>&nbsp;&nbsp;&nbsp;  为何国外会存在这种情况，一个博客提及了镰刀，旁边的AdWord给出了一个镰刀出售的关联广告，那么确实会带去点击和真实收入，虽然那个镰刀定价相当之贵。</p>
<p>&nbsp;&nbsp;&nbsp; 原因可能在于国外便利的信用卡网络交易，人们习惯于随时随地的安全的网络购物（当然人家的购买力也超强）。</p>
<p>&nbsp;&nbsp;&nbsp; 而国内的互联网广告，往往金主是谁呢？</p>
<p>一、淘宝；</p>
<p>二、互联网被风投重金投资的公司之间的买卖流量、投放广告；</p>
<p>三、曾经的移动SP。</p>
<p>&nbsp;&nbsp;&nbsp;  也就是很难让网络用户为看到的AdWord广告发生真实的网上交易。这个限制，一个是没有方便的支付体系（支付宝只是解决了一部分问题），一个是信用问题（淘宝和支付宝也只是解决了一部分，即使如此，也存在刷钻和砸信用的行为）；而这两条，在北美不成问题。</p>
<p>&nbsp;&nbsp;&nbsp; 近几年来，金主纷纷陨落，SP垮台，风投几乎在走下坡路，淘宝也减少了广告投放量。</p>
<p>&nbsp;&nbsp;&nbsp; 所以，没有彻底解决电子商务在中国的信用体系和支付体系之前，没有让电子商务深入海量网络用户之心之前，中国互联网注定要在低水平竞争。</p>
<p>&nbsp;</p>
<p>&nbsp;&nbsp;&nbsp; 此次又放出两个聚会当日讨论话题，抛砖引玉。</p>
<p>&nbsp;&nbsp;&nbsp; 我也列出<a href="http://groups.google.com/group/pongba/browse_thread/thread/b293e84e49e86377" target="_blank">上一篇</a>引玉的结果：</p>
<p>1：wang feng：</p>
<blockquote>
<p>遗传算法？avida?(<a href="http://en.wikipedia.org/wiki/Avida">http://en.wikipedia.org/wiki/Avida</a>)？</p>
</blockquote>
<p>2：图灵刘江：</p>
<blockquote>
<p>我今天想到，在一次聚会甚至大型的活动中，如果计算机系统能记录下与会者的 <br />
所有脑活动，所思所看所听所说，并通过很好的方式展现出来，那该是一幅什么  <br />
场景？ </p>
</blockquote> <blockquote>
<p>推而广之，如果以后地球整个都部署了无线传感器网，能够记录历史的各个细 <br />
节，那又是一幅什么场景啊？ </p>
<p>松鼠会上有篇文章，说治疗癫痫有一种手段，是切断左右脑的联系，减轻患者 <br />
痛苦，但会出现许多奇妙的现象。包括左眼看到的东西可以认出，右眼看到的  <br />
就认不出了，甚至会瞎猜一个答案，很有趣。是姬十三的文章。</p>
</blockquote>
<p>3：James：</p>
<blockquote>
<p>这种影响是通过RNA实现的. 另一种特性也很有意思, DNA -&gt; protein <br />
过程是不可逆的, 并且无法预测,  可以利用此特性来实现一个公钥加密体系, <br />
这个模型已经有人在做了, 不过碰撞率还在讨论中.  </p>
<p>其实RNA的特性更有意思, 更灵活. 有人对 RNA 结构预测/反预测, <br />
RNA 信息表达感兴趣吗, 可以线下聊聊, 呵呵.  </p>
<p>On Mon, 11 May 2009, joyfire wrote: <br />
&gt;  这句话之后，大家议论说，DNA是一种动态语言，可以反过来被它编译出的exe——蛋白质影响。其中的保守部分，比如每个人都只有一个鼻子，两个鼻孔， <br />
&gt;  容错性很高，不会随便就变异掉。但是另外一方面，代码又有很强的灵活性：每个人又有大量的不同点，以利于多样性和进化。</p>
</blockquote>
<p><a href="http://blog.csdn.net/zhengyun_ustc/" target="_blank">郑昀</a>@<a href="http://sr.ju690.com/" target="_blank">玩聚SR</a>&nbsp;20090509</p><img src ="http://www.cnblogs.com/zhengyun_ustc/aggbug/1454555.html?type=1" width = "1" height = "1" /><br/><br/>--------------------------<br/>新闻：<a href="http://news.cnblogs.com/n/47986/" target="_blank">网易澄清:与暴雪合资公司仅提供技术支持</a><br/>网站导航: <a href="http://www.cnblogs.com" target="_blank">博客园首页</a>&nbsp;&nbsp;<a href="http://news.cnblogs.com" target="_blank">新闻</a>&nbsp;&nbsp;<a href="http://dotnet.cnblogs.com" target="_blank">.NET频道</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com" target="_blank">社区</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/q/" target="_blank">博问</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/ing/" target="_blank">闪存</a>&nbsp;&nbsp;<a href="http://zzk.cnblogs.com" target="_blank">找找看</a>]]></description></item><item><title>0509·刘未鹏的TopLanguage聚会[一]</title><link>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/11/pongba.html</link><dc:creator>旁观者</dc:creator><author>旁观者</author><pubDate>Mon, 11 May 2009 12:30:00 GMT</pubDate><guid>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/11/pongba.html</guid><wfw:comment>http://www.cnblogs.com/zhengyun_ustc/comments/1454422.html</wfw:comment><comments>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/11/pongba.html#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://www.cnblogs.com/zhengyun_ustc/comments/commentRss/1454422.html</wfw:commentRss><trackback:ping>http://www.cnblogs.com/zhengyun_ustc/services/trackbacks/1454422.html</trackback:ping><description><![CDATA[<p><a href="http://blog.csdn.net/zhengyun_ustc/" target="_blank">郑昀</a>@<a href="http://sr.ju690.com/" target="_blank">玩聚SR</a>&nbsp;</p>
<p>北京。五道口。</p>
<p>星期六。己丑年四月十五。气温适宜外出活动。</p>
<p><a href="http://twitter.com/pongba" target="_blank">@pongba</a> 前不久<a href="http://groups.google.com/group/pongba/browse_thread/thread/e66bd172df7828b0" target="_blank">离开了南大</a>，受邀微软来到北京。继上月他与<a href="http://www.xiaolai.net/" target="_blank">李笑来</a>会师（江湖曾流传一句话：自从读了李笑来, 我就不写人生感悟了; 自从读了刘未鹏,  我就不写学习方法和思维方法）后，他又召集了<a href="https://groups.google.com/group/pongba" target="_blank">TopLanguage</a>小组聚会。</p>
<p>本次与会技术人7个（按出场顺序排列）：</p>
<ul>
    <li><a href="http://twitter.com/pongba" target="_blank">@pongba</a> Blog：<a href="http://mindhacks.cn/">http://mindhacks.cn</a> 微软亚洲研究院  </li>
    <li>王乐珩 Blog：<a href="http://joyfire.spaces.live.com/">http://joyfire.spaces.live.com</a> 中科院计算所  </li>
    <li><a href="http://fanfou.com/googollee" target="_blank">@googollee</a> Blog：<a title="http://googollee.blog.163.com/" href="http://googollee.blog.163.com/">http://googollee.blog.163.com/</a> Nthcode   </li>
    <li><a href="http://twitter.com/zhengyun" target="_blank">@zhengyun</a> Blog：<a href="http://blog.csdn.net/zhengyun_ustc/">http://blog.csdn.net/zhengyun_ustc/</a>  玩聚网  </li>
    <li><a href="http://twitter.com/tinyfool" target="_blank">@tinyfool</a> Blog: <a href="http://www.tinydust.net/dev">http://www.tinydust.net/dev</a> 银杏泰克  </li>
    <li>张沈鹏 Blog：<a href="http://zsp.javaeye.com/">http://zsp.javaeye.com/</a> 豆瓣  </li>
    <li>孙勇 <a href="http://blogs.sun.com/yongsun/">http://blogs.sun.com/yongsun/</a>  Sun </li>
</ul>
<p>&nbsp;</p>
<p>旁的不叙。咱们表一表与会的闲谈话题。众所周知，人（即节点）一多，每个人的交互（即连接）也多，很难整理出一个可阅读的话题脉络。以下文字基本上来自每个人的口头表达，我尽量加工组合，先优选两个话题抛砖引玉。</p>
<p><strong>1、人工智能和进化</strong></p>
<p>可能是 TL 上 <a href="http://groups.google.com/group/pongba/browse_thread/thread/c422d2d35ad8ae95">Self-replicating_machine</a>  话题的线下延续。</p>
<p>当来自于生物信息课题组的 joyfire 介绍研究方向是&#8220;基因组信息结构的复杂性及遗传语言的根本规律&#8221;时，大家便开始边跑题边激荡脑力。</p>
<p><strong>DNA就是字符串</strong></p>
<p>首先感慨DNA之设计精良，假如上帝是一个程序员的话，视每个DNA为一个四个元素的字符串数组，用区区几十MB的代码量，便控制了人的一切生长和行为，堪称伟大的程序员。</p>
<p>附注：单链DNA可以看作是由符合A、G、C、T组成的字符串。我们简化为就是字符串搜索和匹配，那么可以近似认为基因测序或测定就像搜索引擎一样是对字符串的操作。相应的应用就是SARS基因序列的测定，以及测定三聚氰胺的<strong>质谱仪（这又延伸出另外一个话题：破坏性创新，按下不表）</strong>。</p>
<p>围绕着如此精良的编程功底是如何形成的，于是话题过度到了&#8220;进化&#8221;。</p>
<p><strong>模拟进化</strong></p>
<p>大家执著于讨论：</p>
<p><strong>存不存在可能，模拟一个算法，构建一个环境，把一段代表生命（仅仅是代表草履虫一样的早期生命体）的代码放进去，通过模拟基因变异、适者生存的达尔文法则，通过高速并发计算，最终得到进化到一定程度的高级生命体？</strong></p>
<p>zsp  认为算法有可能跑，但由于模拟的维度是人设计的，必定远远少于真实的世界，由于量变才能引起质变，过少的变异维度和环境维度难以，所以核心问题还在于&#8220;特征&#8221;如何抽取。</p>
<p>一般来说，人类具有抽象能力，能够通过各种方法论找到一个事物或事务的&#8220;特征&#8221;，并把&#8220;特征&#8221;告诉机器，机器计算能力强，执行即可。在这个层面上，自我复制的机器人实际上并不难造，毕竟&#8220;特征&#8221;都是可以固化的。</p>
<p>但如果机器无法具有抽象能力，无法自动找到让进化延续下去的外部或内部&#8220;特征&#8221;，那么&#8220;进化&#8221;又能到什么阶段呢？</p>
<p><strong>进化结果的评价</strong></p>
<p>当然，这里的&#8220;进化&#8221;终极结果并不是出现像人类这样的智能生物，只要是符合逻辑的、可延续下去的生物即可。因为你在某一个时间点并不能用好还是坏来评价某一个演进中的生命体，比如恐龙，某个时间段你可能认为它们是最优秀的生命体，但不久后它们全部被随机产生的外部环境变化毁灭了，那么它是好的还是坏的&#8220;进化&#8221;？比如人类，现在看我们是最优秀的智能生物，但假如不久后我们通过战争自我毁灭，或者被地外生物毁灭，那么我们这个演进路线是对还是错？</p>
<p>所以，这个程序主要考察生命体是否能不断进化，最终产生智能。</p>
<p>当然，大家会谈到《孢子》游戏。它的进化逻辑有点简单，但仍然是一个非常优秀的、融合了即时战略和进化的游戏。</p>
<p><strong>大脑：连接、节点、地址</strong></p>
<p><a href="http://twitter.com/tinyfool" target="_blank">@tinyfool</a>  提到，以前人们都认为大脑是按功能区划分的，彼此不可替代。但后来通过试验发现，大脑的功能区可以转移，可以&#8220;重建&#8221;。用大白话说，<a href="http://www.bioon.com/biology/neuroscience/292060.shtml">就是摧毁了左脑某些组织后，本以为相应所负载的功能（如运动、语言功能）会丧失，但随着时间推移，大脑能迅速在右脑区域重新建造这些功能</a>。</p>
<p><a href="http://twitter.com/tinyfool" target="_blank">@tinyfool</a>  提到，网络最开始也是一个看上去很呆滞的方案，最开始只是每一个主机提供静态网页，后来出现的HTTP协议也是看上去不美，但神奇的事情发生了。由于只定了三个元素：</p>
<ul>
    <li>节点  </li>
    <li>连接  </li>
    <li>地址 </li>
</ul>
<p>最开始也平淡无奇，但随着进化，每个节点自己慢慢地拥有了自己的智能，如动态网页等等，通过地址找到节点，节点互相之间建立了连接，节点有智能，于是互联网便无所不能，本身就是一个拥有海量信息的、具有足够智能的生物体。</p>
<p>这和大脑的机制，似乎有一些有趣的共性。</p>
<p><strong>先验知识或本能</strong></p>
<p>大脑的功能重建，以及程序自进化算法，joyfire 都认为，存在一个大问题，就是&#8220;先验知识&#8221;。</p>
<p>人或动物拥有很多先验知识，这些知识是在一代一代进化中固化在基因中的。比如烫了就缩手，比如本能不喜欢苦的味道。</p>
<p>程序如何模拟这些东西呢？</p>
<p>或者说，大脑重建功能区时，如何恢复这些&#8220;先验知识&#8221;，假如这些东西是存储在某一个固定区域的话。</p>
<p>一方认为，先验知识可以模拟，比如存在多个变异，每个变异者的基因中就携带了该变异，如果进化过程中其他变异者毁灭，那么生存下来的变异者就自然携带这个变异传递下去，这就解释了&#8220;先验知识&#8221;从哪里来的问题。当然，这只是一个理想状态的描述。因为它没有涉及哪些变异会固化到基因中。比如一个天生少了一条腿的小狗，在繁衍时，也不会把这个变异传递下去，也就是某些变异是不会遗传的，那么谁来做出判断要不要遗传？</p>
<p>对于机器来说，&#8220;先验知识&#8221;有点儿像&#8220;特征&#8221;一样难以琢磨，原因如前所述，机器很难判断哪些是应该固化的，用&#8220;进化论&#8221;还是解释不了这个问题。</p>
<p>这样，我们又绕回到&#8220;特征&#8221;抽取问题。</p>
<p><strong>2、破坏性创新</strong></p>
<p>前述 joyfire 的测定三聚氰胺的质谱仪，延伸出另外一个话题：大学教育、破坏性创新和国内环境。</p>
<p>大家应该经常看到这样一种现象，我们的研究机构或者公司，本来凭着中国人的聪明才智，在某一个研究领域几乎已经逼近或超过国际一流水平，此时大家心中暗喜，但随着国外某一个实验组或小公司的一个破坏性创新，导致以前的科研成果又被摧毁被甩出老远，人家继续领跑，当然是换了一帮人领的。</p>
<p>问题就在这里。</p>
<p>照理说，破坏性创新（后简称&#8220;破创&#8221;）基本上是此起彼伏，在全球范围内。</p>
<p>但，事实上中国大陆很难出现破坏性创新。</p>
<p>举个最简单的例子，当我们的门户模式称雄时，SNS横空出世。当我们的名人博客每天吸引了数十亿点击时，Twitter横空出世。</p>
<p>joyfire 说，在生物信息领域，当我们迅速逼近、赶超他们时，突然他们出现跨越式成长，&#8220;跳&#8221;了起来，而我们不会&#8220;跳&#8221;。</p>
<p>一方归结为，中国不是不投钱，但投钱投的区域总是很窄，无法产生链条联动效应，总是受困于上一步或下一步。</p>
<p>假设说，国家重点发展的基因测序需要几微米的试管，我们生产不了，只能买国外的，那么假定这是精密仪器问题。</p>
<p>okay，精密仪器领域，国内也有地方大力鼓励。</p>
<p>但同样的工艺和生产线，就是无法达到国外的水平，比如前面说的试管，要求内径不能忽粗忽细，误差不得大于某某数值，但国内生产就是无法达标。于是，没有下家买单，下家还得去国外订购，订购不到，下家的科研任务就无法做。于是，精密仪器厂家纷纷倒闭。于是，恶性循环。这有点像我们的大飞机这么多年的历史。</p>
<p><strong>修改历史：</strong></p>
<p><strong>0509 23:00</strong></p>
<p><a href="http://twitter.com/tinyfool" target="_blank">@tinyfool</a> 补充道：&#8220;</p>
<p>大概意思是这样的，就是说以前我们认为大脑各个功能区域，功能泾渭分明，但是现在很多实验证明，如果某个功能区域被切割下去，大脑的其他区域就有可能接管这些功能（虽然按照过去的认识，他们是完全没有关系的。另外物理上，也需要一些刺激以及大脑的有足够的活性和细胞再生能力）。这就很让人振奋，就是说大脑的所有功能区域都是相等的，可以动态的部署。  <br />
一般认为智能来自有那些神经元细胞之间的连接，比如听懂语言的能力，就是一系列神经元的连接实现的。如果这些细胞和连接都被切除了，但是如果外界声音对大脑的刺激没有消失，原来跟这个能力完全没有关系的神经元可能会被激发，产生联系，然后对这些刺激进行处理，最终实现听懂语言能力的恢复。&#8221; </p>
<p>&nbsp;</p>
<p><strong>0510 0:04</strong></p>
<p>joyfire 补充道：&#8220;</p>
<p>当时说的时候，大概是这个意思，人体是如此复杂高效的一个复杂系统，然而全部的设计蓝图，或者源代码，其实就全部存储在很少的DNA字符串里。（而且  <br />
DNA里面其实只有5%被翻译，其余的可能都是进化痕迹，都可以看作被注释掉的历史代码）上帝作为程序员，效率真的很高。  </p>
<p>再往前，说这句话的意思，是为了说明，我们现有的软硬件结构，离自然界的上限还很远呢。无论是硬件存储和检索能力，还是软件的编码效率。  </p>
<p>这句话之后，大家议论说，DNA是一种动态语言，可以反过来被它编译出的exe——蛋白质影响。其中的保守部分，比如每个人都只有一个鼻子，两个鼻孔，  <br />
容错性很高，不会随便就变异掉。但是另外一方面，代码又有很强的灵活性：每个人又有大量的不同点，以利于多样性和进化。&#8221;&nbsp; <br />
</p>
<p><br />
</p>
<p><strong>参考资源：</strong></p>
<p><strong>0424 笑来、pongba会师：</strong></p>
<p>1：<a href="http://li-and-jiang.com/blog/2009/04/24/sketch/" target="_blank">素描</a></p>
<p>&#8220;</p>
<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <a href="http://www.luanxiang.org/blog/">余晟</a> <a href="http://mindhacks.cn/">刘未鹏</a></p>
<p><a href="http://blog.devep.net/virushuo/">霍炬</a>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <a href="http://www.xiaolai.net/">李笑来</a></p>
<p><a href="http://blog.xiqiao.info/">西乔</a></p>
<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 我 <a href="http://www.ptzzz.com/">胖兔子粥粥</a></p>
<p>&#8221;</p>
<p><strong>0509 TL聚会：</strong></p>
<p>1：<a href="http://joyfire.spaces.live.com/blog/cns%21502060A314B1A145%212502.entry" target="_blank">TL聚会，遭遇若干大牛</a>：</p>
<p>&#8220;神侃内容：从互联网广告的商业模式开始，到电子商务的信誉体系和物流体系；到语义网络技术、信源挖掘推荐和评价；到人工智能、基因进化和大脑神经机制；到<a href="http://www.douban.com/">豆瓣</a>应完善的若干features需求；到北京美食和若干"驻京办"位置；到房价和经济危机；到国有垄断行业和IT创业；最后到各自工作中正在面对的算法和工程难题。&#8221;</p>
<p>2：<a href="http://joyfire.spaces.live.com/blog/cns%21502060A314B1A145%212506.entry">IP、IC、IQ卡，通通告诉我密码</a>：</p>
<p>&#8220;这就又回到昨天TL聚会讨论的内容，智能的本质，到底是&#8220;超大存储+超快检索&#8221;（换句话说，足够多的先验知识），还是另一种计算模型呢？&#8221;</p><img src ="http://www.cnblogs.com/zhengyun_ustc/aggbug/1454422.html?type=1" width = "1" height = "1" /><br/><br/>--------------------------<br/>新闻：<a href="http://news.cnblogs.com/n/47985/" target="_blank">杰克逊悼念仪式或成史上最大规模Web活动</a><br/>网站导航: <a href="http://www.cnblogs.com" target="_blank">博客园首页</a>&nbsp;&nbsp;<a href="http://news.cnblogs.com" target="_blank">新闻</a>&nbsp;&nbsp;<a href="http://dotnet.cnblogs.com" target="_blank">.NET频道</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com" target="_blank">社区</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/q/" target="_blank">博问</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/ing/" target="_blank">闪存</a>&nbsp;&nbsp;<a href="http://zzk.cnblogs.com" target="_blank">找找看</a>]]></description></item><item><title>引爆点不是坏事</title><link>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/11/1454151.html</link><dc:creator>旁观者</dc:creator><author>旁观者</author><pubDate>Mon, 11 May 2009 06:36:00 GMT</pubDate><guid>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/11/1454151.html</guid><wfw:comment>http://www.cnblogs.com/zhengyun_ustc/comments/1454151.html</wfw:comment><comments>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/11/1454151.html#Feedback</comments><slash:comments>7</slash:comments><wfw:commentRss>http://www.cnblogs.com/zhengyun_ustc/comments/commentRss/1454151.html</wfw:commentRss><trackback:ping>http://www.cnblogs.com/zhengyun_ustc/services/trackbacks/1454151.html</trackback:ping><description><![CDATA[<p><a href="http://blog.csdn.net/zhengyun_ustc/" target="_blank">郑昀</a>@<a href="http://sr.ju690.com/" target="_blank">玩聚SR</a>&nbsp;090511</p>
<p>&nbsp;</p>
<p><strong>引爆点不是坏事，借势不影响程序正义:</strong></p>
<p>&nbsp;&nbsp;&nbsp; 很多人认为谭卓的浙大毕业生身份造成了此案的特殊性，颇有忿忿之意。</p>
<p>&nbsp;&nbsp;&nbsp; 孙志刚当年要不是大学生身份，也不会有那么大的社会影响力，但正是诸多历史诱因加上此引爆点，从而成功导致了恶法被&#8220;废除&#8221;。</p>
<p>&nbsp;&nbsp;&nbsp;  所以，谭卓的浙大毕业生身份只要能够导致飙车等恶意驾驶行为能够以谋杀罪或危害公共安全罪的交通法修正案出台，也算是让这么多年来的成千上万逝者瞑目了。</p>
<p>&nbsp;&nbsp;&nbsp;  如果只是集如此多的公共资源（浙大、大学生群体、网络关注、传统媒体等等的介入），最终<strong>只是达成个案的顺利按程序正义处理</strong>，其实对社会的进步没有多大的帮助。</p>
<p><img alt="http://farm4.static.flickr.com/3345/3246693205_ab8c8a6b06.jpg?v=0" src="http://farm4.static.flickr.com/3345/3246693205_ab8c8a6b06.jpg?v=0" /></p>
<p><strong>加强了善的传播便兹事可为:</strong></p>
<p>&nbsp;&nbsp;&nbsp; 对 @<a href="http://twitter.com/zuola">zuola</a> 动机( <a href="http://is.gd/yKtB">http://blog.youxu.info/2009...</a> )的质疑，对饭否512( <a href="http://fanfou.com/512/">http://fanfou.com/512/</a> )的质疑( <a href="http://is.gd/yKMi">http://rt.ju690.com/rt/4146</a>  )，体现了可贵的怀疑精神和良好的公民意识。</p>
<p>&nbsp;&nbsp;&nbsp; 但只要zuola和饭否们促进了社会的进步，挫了屏蔽封锁方的锐气，传播了善，摒弃了恶，兹事便可为之。</p>
<p>&nbsp;&nbsp;&nbsp;  中国没有那么多赞助各种社会活动的基金会，NGO难以成立而且也缺乏渠道募集赞助资金，那么你不可能要求一个人(或公司)只考虑公共利益而完全忽略个人生存和利益。所以请活在当下，而不是彼岸的理想王国。</p><img src ="http://www.cnblogs.com/zhengyun_ustc/aggbug/1454151.html?type=1" width = "1" height = "1" /><br/><br/>--------------------------<br/>新闻：<a href="http://news.cnblogs.com/n/47985/" target="_blank">杰克逊悼念仪式或成史上最大规模Web活动</a><br/>网站导航: <a href="http://www.cnblogs.com" target="_blank">博客园首页</a>&nbsp;&nbsp;<a href="http://news.cnblogs.com" target="_blank">新闻</a>&nbsp;&nbsp;<a href="http://dotnet.cnblogs.com" target="_blank">.NET频道</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com" target="_blank">社区</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/q/" target="_blank">博问</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/ing/" target="_blank">闪存</a>&nbsp;&nbsp;<a href="http://zzk.cnblogs.com" target="_blank">找找看</a>]]></description></item><item><title>SR方式挖掘豆瓣热点</title><link>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/04/1448597.html</link><dc:creator>旁观者</dc:creator><author>旁观者</author><pubDate>Mon, 04 May 2009 03:49:00 GMT</pubDate><guid>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/04/1448597.html</guid><wfw:comment>http://www.cnblogs.com/zhengyun_ustc/comments/1448597.html</wfw:comment><comments>http://www.cnblogs.com/zhengyun_ustc/archive/2009/05/04/1448597.html#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://www.cnblogs.com/zhengyun_ustc/comments/commentRss/1448597.html</wfw:commentRss><trackback:ping>http://www.cnblogs.com/zhengyun_ustc/services/trackbacks/1448597.html</trackback:ping><description><![CDATA[<p>&nbsp;</p>
<p><a href="http://blog.csdn.net/zhengyun_ustc/" target="_blank"><font color="#669966">郑昀</font></a>@<a href="http://sr.ju690.com/" target="_blank"><font color="#669966">玩聚SR</font></a>&nbsp;20090430</p>
<p>无意中看到M Jia在《<a href="http://www.mijia.org/blog/?p=173" target="_blank"><font color="#669966">豆瓣好友热点 v0.2.3</font></a>》中提及：</p>
<p>&#8220;<font color="#800000">以前很喜欢看Techmeme/Digg这样的聚合/社区工具，现在超级喜欢Hacker News和Reddit Programming，简洁又超级有活力（虽然我不太能参乎进去，呵呵），<strong>如果能够使用</strong></font><a href="http://sr.ju690.com/"><font color="#800000"><strong>玩聚SR</strong></font></a><font color="#800000"><strong>的方式来作豆瓣上的&#8220;物&#8221;并加上豆瓣原来就有的社区，可以非常简洁并有活力，我会非常喜欢</strong>，不过我代表不了广大用户。&#8221;</font></p>
<p>顺着他的这个思路，那么如何一步一步做呢：</p>
<li>case：豆瓣热点
<ul>
    <li>步骤
    <ul>
        <li>找到豆瓣上的核心用户，给予一定权重
        <ul>
            <li>譬如 <a href="http://www.douban.com/group/topic/1727358/" target="_blank"><font color="#669966">豆瓣牛鬼蛇神一览表</font></a>&nbsp; </li>
        </ul>
        </li>
        <li>根据<a href="http://code.google.com/p/douban-python/" target="_blank"><font color="#669966">douban-python-API</font></a>获取这些核心用户的<a href="http://www.douban.com/service/apidoc/reference/user#%E8%8E%B7%E5%8F%96%E7%94%A8%E6%88%B7%E6%9C%8B%E5%8F%8B" target="_blank"><font color="#669966">所有朋友</font></a></li>
        <li>判断这些用户的最新活动时间，如果最近一星期内有更新，则加入到监测</li>
        <li>为之分门别类建立Group，以便按照兴趣打包订阅</li>
        <li>获取<a href="http://www.douban.com/service/apidoc/reference/miniblog#%E8%8E%B7%E5%8F%96%E7%94%A8%E6%88%B7%E5%B9%BF%E6%92%AD" target="_blank"><font color="#669966">所有监测用户的广播</font></a>，这是公开的</li>
        <li>汇总所有监测用户的推荐，一个推荐或提及就代表投了一票
        <ul>
            <li>site</li>
            <li>recommendation
            <ul>
                <li>看过</li>
                <li>想看 </li>
            </ul>
            </li>
        </ul>
        </li>
        <li>设定一个投票上榜的最低阈值</li>
        <li>参考<a href="http://sr.ju690.com/" target="_blank"><font color="#669966">玩聚SR</font></a> 的SRRank公式（<a href="http://blog.csdn.net/zhengyun_ustc/archive/2008/12/21/3575578.aspx" target="_blank"><font color="#669966">SRRank=log10Z+ts/45000</font></a>），设定自己排序规则</li>
        <li>为每一个Group都生成对应的热点榜单</li>
        <li>如果热点是电影或音乐，到VeryCD搜索获取对应的下载项 </li>
    </ul>
    </li>
    <li>mashup
    <ul>
        <li><a href="http://www.douban.com/service/apidoc/" target="_blank"><font color="#669966">豆瓣API</font></a></li>
        <li>VeryCD Search</li>
        <li><a href="http://ginx.com/g/directory" target="_blank"><font color="#669966">ginx的group</font></a>思路 </li>
    </ul>
    </li>
    <li>缺点
    <ul>
        <li>豆瓣的数据很零散，长尾太长，难以发现与时俱进的、有效的What's Hot</li>
        <li>顶多也就是被人回应比较多的Item</li>
        <li>甚至未见得最终挖掘效果比得过<a href="http://www.douban.com/movie/" target="_blank"><font color="#669966">豆瓣电影首页</font></a>的效果</li>
        <li>多数人都是想读想看看过之类的信息，用到&#8220;推荐&#8221;功能的不多</li>
        <li>豆瓣API有访问频次限制，小心别被block</li>
    </ul>
    </li>
</ul>
</li><img src ="http://www.cnblogs.com/zhengyun_ustc/aggbug/1448597.html?type=1" width = "1" height = "1" /><br/><br/>--------------------------<br/>新闻：<a href="http://news.cnblogs.com/n/47984/" target="_blank">《商业周刊》:Mozilla的志愿者开发模式被复制</a><br/>网站导航: <a href="http://www.cnblogs.com" target="_blank">博客园首页</a>&nbsp;&nbsp;<a href="http://news.cnblogs.com" target="_blank">新闻</a>&nbsp;&nbsp;<a href="http://dotnet.cnblogs.com" target="_blank">.NET频道</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com" target="_blank">社区</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/q/" target="_blank">博问</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/ing/" target="_blank">闪存</a>&nbsp;&nbsp;<a href="http://zzk.cnblogs.com" target="_blank">找找看</a>]]></description></item><item><title>玩聚的Tweet&amp;Blog墙 IX</title><link>http://www.cnblogs.com/zhengyun_ustc/archive/2009/04/29/1446128.html</link><dc:creator>旁观者</dc:creator><author>旁观者</author><pubDate>Wed, 29 Apr 2009 04:45:00 GMT</pubDate><guid>http://www.cnblogs.com/zhengyun_ustc/archive/2009/04/29/1446128.html</guid><wfw:comment>http://www.cnblogs.com/zhengyun_ustc/comments/1446128.html</wfw:comment><comments>http://www.cnblogs.com/zhengyun_ustc/archive/2009/04/29/1446128.html#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://www.cnblogs.com/zhengyun_ustc/comments/commentRss/1446128.html</wfw:commentRss><trackback:ping>http://www.cnblogs.com/zhengyun_ustc/services/trackbacks/1446128.html</trackback:ping><description><![CDATA[<p><a href="http://blog.csdn.net/zhengyun_ustc/" target="_blank">郑昀</a>@<a href="http://sr.ju690.com/" target="_blank">玩聚SR</a>&nbsp; 20090423</p>
<p><strong>Tweets:</strong>&nbsp;</p>
<p> </p>
<img src="http://sr.ju690.com/static/about/comment-open.gif" alt="" />
<p><a href="http://digg.com/u11bqA">http://blog.csdn.net/zhengyu...</a> &#8220;玩聚  SR&#8221;的思路很不错。所谓社会化推荐，实际上是以主动聚类分析，和被动反向追踪，来解决的是信息发布平台间，隐性的信息割裂和冗余的问题。而从实时性角度来看，如能跟twitter结合，应该会优于单纯RSS的方式。</p>
<p><img src="http://sr.ju690.com/static/about/comment-close.gif" alt="" align="center" /></p>
<p>--- <a href="http://twitter.com/flierlu" target="_blank">@flier</a> <a href="http://twitter.com/flierlu/status/1592654864" target="_blank">2009年4月23日</a></p>
<p><img src="http://sr.ju690.com/static/about/comment-open.gif" alt="" /></p>
<p>好像从鲜果改版后就很少上了，连热文都不看了，已经被玩聚SR取代</p>
<p><img src="http://sr.ju690.com/static/about/comment-close.gif" alt="" align="center" /></p>
<p>--- <a href="http://twitter.com/zhutouinfo" target="_blank">@zhutouinfo</a> <a href="http://twitter.com/zhutouinfo/status/1549674324" target="_blank">2009年4月18日</a></p>
<p><img src="http://sr.ju690.com/static/about/comment-open.gif" alt="" /></p>
<p>有了&#8220;玩聚SR&#8221;，可以退订所有IT新媒体相关的博客了。挺好。</p>
<p><img src="http://sr.ju690.com/static/about/comment-close.gif" alt="" align="center" /></p>
<p>--- <a href="http://twitter.com/flychina" target="_blank">@flychina</a> <a href="http://twitter.com/FlyChina/status/1603569316" target="_blank">2009年4月24日</a></p>
<p><img src="http://sr.ju690.com/static/about/comment-open.gif" alt="" /></p>
<p>在这种缺乏好观点，好思考的情况下，感谢下SR，时常能发现点不错的新作者。这估计是我一两天去一次的最大动力了！</p>
<p><img src="http://sr.ju690.com/static/about/comment-close.gif" alt="" align="center" /></p>
<p>--- <a href="http://twitter.com/caozenghui" target="_blank">@caozenghui</a> <a href="http://twitter.com/caozenghui/status/1621216734" target="_blank">2009年4月27日</a></p>
<p><img src="http://sr.ju690.com/static/about/comment-open.gif" alt="" /></p>
<p>&#8220;网聚人的力量&#8221;－这句广告词根本不适合网易，百度视频也用了这句话，更是鬼扯，这话更适合玩聚RT。</p>
<p><img src="http://sr.ju690.com/static/about/comment-close.gif" alt="" align="center" /></p>
<p>--- <a href="http://twitter.com/linuxhobby" target="_blank">@linuxhobby</a> <a href="http://twitter.com/FlyChina/status/1603569316" target="_blank">2009年4月27日</a></p>
<p><strong>Blogs:</strong>&nbsp;</p>
<p><img src="http://sr.ju690.com/static/about/comment-open.gif" alt="" /></p>
<p>最近俺在百忙中抽出俺宝贵的时间，重点关注网络新生事物——玩聚SR，经常泡在那看文，还没看完，也没完全整明白，就是觉得挺有意思。文化低，要整明白估计花费二十年上山闭关苦练，先不提它了。</p>
<p><img src="http://sr.ju690.com/static/about/comment-close.gif" alt="" align="center" /></p>
<p>--- <a href="http://hi.baidu.com/fangweng/blog/item/1cd5c9fd1ea8ed8ab801a0d8.html" target="_blank">独钓翁</a> 2009年4月12日</p>
<p><img src="http://sr.ju690.com/static/about/comment-open.gif" alt="" /></p>
<p>以前很喜欢看Techmeme/Digg这样的聚合/社区工具，现在超级喜欢Hacker News和Reddit  Programming，简洁又超级有活力（虽然我不太能参乎进去，呵呵），如果能够使用<a href="http://sr.ju690.com/">玩聚SR</a>的方式来作豆瓣上的&#8220;物&#8221;并加上豆瓣原来就有的社区，可以非常简洁并有活力，我会非常喜欢。</p>
<p><img src="http://sr.ju690.com/static/about/comment-close.gif" alt="" align="center" /></p>
<p>---&nbsp;<a href="http://www.mijia.org/blog/?p=173" target="_blank">M Jia</a>  2009年1月12日</p><img src ="http://www.cnblogs.com/zhengyun_ustc/aggbug/1446128.html?type=1" width = "1" height = "1" /><br/><br/>--------------------------<br/>新闻：<a href="http://news.cnblogs.com/n/47977/" target="_blank">Mono 的Virtual PC 虚拟机</a><br/>网站导航: <a href="http://www.cnblogs.com" target="_blank">博客园首页</a>&nbsp;&nbsp;<a href="http://news.cnblogs.com" target="_blank">新闻</a>&nbsp;&nbsp;<a href="http://dotnet.cnblogs.com" target="_blank">.NET频道</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com" target="_blank">社区</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/q/" target="_blank">博问</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/ing/" target="_blank">闪存</a>&nbsp;&nbsp;<a href="http://zzk.cnblogs.com" target="_blank">找找看</a>]]></description></item><item><title>玩聚的Blog墙 VIII</title><link>http://www.cnblogs.com/zhengyun_ustc/archive/2009/04/23/wall.html</link><dc:creator>旁观者</dc:creator><author>旁观者</author><pubDate>Thu, 23 Apr 2009 04:38:00 GMT</pubDate><guid>http://www.cnblogs.com/zhengyun_ustc/archive/2009/04/23/wall.html</guid><wfw:comment>http://www.cnblogs.com/zhengyun_ustc/comments/1441958.html</wfw:comment><comments>http://www.cnblogs.com/zhengyun_ustc/archive/2009/04/23/wall.html#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://www.cnblogs.com/zhengyun_ustc/comments/commentRss/1441958.html</wfw:commentRss><trackback:ping>http://www.cnblogs.com/zhengyun_ustc/services/trackbacks/1441958.html</trackback:ping><description><![CDATA[<p><a href="http://blog.csdn.net/zhengyun_ustc/" target="_blank">郑昀</a>@<a href="http://sr.ju690.com/" target="_blank">玩聚SR</a>&nbsp;&nbsp;20090423</p> <p><strong>Blogs:</strong>&nbsp;</p> <p><img src="http://sr.ju690.com/static/about/comment-open.gif"  alt="" /></p> <p>当我把这个消息发到Twitter上时，得到了多达18条Retweets，并迅速登上了<a href="http://rt.ju690.com/" target="_blank">玩聚RT</a>热榜，可见此事受到的关注度有多大，而锐推及<a href="http://rt.ju690.com/" target="_blank">玩聚RT</a>热榜带来的辐射面有多广就不那么容易衡量了，500？1000？</p>  <p><img src="http://sr.ju690.com/static/about/comment-close.gif" align="center"  alt="" /></p> <p>---<a href="http://www.21cbh.com/HTML/2009-4-22/HTML_SVIBHAWEL07T.html" target="_blank">黄海均：从开放说到国内微博客的发展</a> 2009年4月22日</p> <p><img src="http://sr.ju690.com/static/about/comment-open.gif"  alt="" /></p> <p>我个人以为类似<a href="http://sr.ju690.com/srcbacks" target="_blank">SRCBacks</a>这样的服务完全可能成为next big thing. 甚至超越目前ju690的系列其他主打服务。&#8230;</p> <p>我以为<a href="http://sr.ju690.com/srcbacks" target="_blank">SRCBacks</a>可以变成单独的非常简单、清晰、用途明确的服务，当然也许应该以英文版本为立足点，完全有机会成为一个亮点。</p>  <p><img src="http://sr.ju690.com/static/about/comment-close.gif" align="center"  alt="" /></p> <p>---<a href="http://robertmao.com/2009/04/21/srback-srcback-next-big-thing/" target="_blank">RobertMao：SRBack / SRCBack 可以是一个 next big thing</a> 2009年4月21日</p>  <p><img src="http://sr.ju690.com/static/about/comment-open.gif"  alt="" /></p> <p>如果说SD是个让人有些烦的服务（search的时候他老在原文的前面或者后面的），<a href="http://robertmao.com/2009/01/11/sr/">SR是个有趣的聪明服务</a>，那么这个SRCBack可以说是个能用Brilliant来形容的服务！</p> <p>可惜的是SD目前提供了非常多的服务，SRCBack有些藏在深闺的味道。  另外SRCBack还可以深入细致地做更多的事情，狠狠地深挖其实还是要花很多心思的。</p>   <p><img src="http://sr.ju690.com/static/about/comment-close.gif" align="center"  alt="" /></p> <p>---<a href="http://robertmao.com/2009/04/21/blogsrcback-itrsquos-awesome/" target="_blank">RobertMao：blog添加了SRCBack, it&#8217;s awesome!!!</a> 2009年4月21日</p> <p><img title="" alt="" src="http://www.5gme.com/attachment/200904/23/366_1240460387cZi3.jpg" width="500" height="416" /></p> <p><img src="http://sr.ju690.com/static/about/comment-open.gif"  alt="" /></p> <p><a href="http://sr.ju690.com/">玩聚SR</a>就是一个很好的利用twitter推荐来<a href="http://www.kenengba.com/post/648.html">聚合热文</a>的例子。&#8230;</p> <p>我认为可能可行的方法是： </p><blockquote> <p>1、将你的followings导入到一个服务 </p><p>2、这个服务能分析这些人的tweets被Retweet（转发）了多少次 </p><p>3、将这些tweets按照转发次数排序，从而得到质量较高的tweets</p></blockquote> <p><a href="http://rt.ju690.com/">玩聚RT</a>似乎正在做类似的服务，但距离我的想法还有距离。 </p> <p><img src="http://sr.ju690.com/static/about/comment-close.gif" align="center"  alt="" /></p> <p>---<a href="http://www.kenengba.com/post/789.html" target="_blank">可能吧：Twitter为什么会流行？</a> 2009年3月31日</p>  <p><img src="http://sr.ju690.com/static/about/comment-open.gif"  alt="" /></p> <p>你可以一天到晚泡在twitter上，看别人的tweet，回复retweet，使用<a href="http://rt.ju690.com/">玩聚RT</a>推荐hot retweet，乐此不彼，但你不可能一天到晚盯着blog看。&#8230;</p> <p>而<a href="http://wangyueblog.com/tag/%E7%8E%A9%E8%81%9Asr/">玩聚SR</a>、玩聚RT等社会化媒体聚合，让twitter的blog推广功能得到进一步升华。</p>  <p><img src="http://sr.ju690.com/static/about/comment-close.gif" align="center"  alt="" /></p> <p>---<a href="http://wangyueblog.com/2009/04/11/is-twitter-blog-killer/" target="_blank">望月：Twitter，博客杀手？</a> 2009年4月11日</p>  <p><img title="" alt="" src="http://www.5gme.com/attachment/200904/23/366_1240460371Ckpn.jpg" width="500" height="500" /></p><img src ="http://www.cnblogs.com/zhengyun_ustc/aggbug/1441958.html?type=1" width = "1" height = "1" /><br/><br/>--------------------------<br/>新闻：<a href="http://news.cnblogs.com/n/47970/" target="_blank">19岁天才黑客发布首个iPhone 3GS破解软件</a><br/>网站导航: <a href="http://www.cnblogs.com" target="_blank">博客园首页</a>&nbsp;&nbsp;<a href="http://news.cnblogs.com" target="_blank">新闻</a>&nbsp;&nbsp;<a href="http://dotnet.cnblogs.com" target="_blank">.NET频道</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com" target="_blank">社区</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/q/" target="_blank">博问</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/ing/" target="_blank">闪存</a>&nbsp;&nbsp;<a href="http://zzk.cnblogs.com" target="_blank">找找看</a>]]></description></item><item><title>玩聚RT之@rtmeme到底是不是机器人？</title><link>http://www.cnblogs.com/zhengyun_ustc/archive/2009/04/20/rtmeme.html</link><dc:creator>旁观者</dc:creator><author>旁观者</author><pubDate>Mon, 20 Apr 2009 04:44:00 GMT</pubDate><guid>http://www.cnblogs.com/zhengyun_ustc/archive/2009/04/20/rtmeme.html</guid><wfw:comment>http://www.cnblogs.com/zhengyun_ustc/comments/1439602.html</wfw:comment><comments>http://www.cnblogs.com/zhengyun_ustc/archive/2009/04/20/rtmeme.html#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://www.cnblogs.com/zhengyun_ustc/comments/commentRss/1439602.html</wfw:commentRss><trackback:ping>http://www.cnblogs.com/zhengyun_ustc/services/trackbacks/1439602.html</trackback:ping><description><![CDATA[<p><a href="http://blog.csdn.net/zhengyun_ustc/" target="_blank">郑昀</a>@<a href="http://rt.ju690.com/" target="_blank">玩聚RT</a>&nbsp;20090420</p> <p>经常会有人问，<a href="http://rt.ju690.com/" target="_blank">玩聚RT</a>(@<a href="http://twitter.com/rtmeme" target="_blank">rtmeme</a>)号称自动转发最新鲜锐推，为何有些锐推后面会加上评论，是不是你手工加的，你@<a href="http://twitter.com/rtmeme" target="_blank">rtmeme</a>到底是不是机器人？</p> <p>原推的作者有时也会找过来，问我原推没有评论，为何你转发时加上评论呢？</p> <p>在这里我统一做一个回答：</p> <p>0：</p> <p>大家可以点击每一个锐推进去看看锐推的历史详情，看看 @<a href="http://twitter.com/rtmeme" target="_blank">rtmeme</a> 是不是自动转发最早的那条锐推。譬如：<a href="http://rt.ju690.com/rt/2560" target="_blank">李鬼比李逵生活得好</a> 、<a href="http://rt.ju690.com/rt/2541" target="_blank">红涨绿跌</a>、<a href="http://rt.ju690.com/rt/2515" target="_blank">一辈子买方便面没有调料包</a>。 </p> <p>如果一个锐推带了评论，它又是被聚合到的最早的锐推，那么 @<a href="http://twitter.com/rtmeme" target="_blank">rtmeme</a> 就全文转发它。所以根本无须人工干预。</p> <p>1：</p> <p><strong>大家看的是有趣的消息，而不是有趣的原始推。</strong>我个人认为没必要那么较真，非要找到原始推。</p> <p>2：</p> <p>评论有时比原推更有意思。抛掉的话，很可惜。</p> <p>3：</p> <p><a href="http://rt.ju690.com/" target="_blank"><strong>玩聚RT</strong></a><strong>的终极目的是有趣，而不是科学和精准。</strong></p> <p>4：</p> <p>由于<a href="http://rt.ju690.com/" target="_blank">玩聚RT</a>是根据自然语言处理技术判断一条锐推和其他锐推的文字大致相似性，所以完全可能存在一个上榜锐推同时存在多个转发源。</p> <p>请看这条最经典的例子：<a href="http://rt.ju690.com/rt/2541" target="_blank">红涨绿跌</a>。其中，存在两个源头：</p> <p>一个是：<a href="http://twitter.com/TimNew/status/1530533142" target="_blank"><strong>RT @hanswhang RT @guxiaoqiang</strong>: 全世界除了中国， 都是绿色涨，  红色跌， 中国真是奇葩的国家 http://tinyurl.com/d5wxzh |||  这个不怪咱们，是当年台湾人搞的，他们就是红色涨，当年钱龙、建功引进到大陆的时候就这样了</a></p> <p>另一个是：<a href="http://twitter.com/faytoday/status/1531264732" target="_blank"><strong>RT @calon: RT @ybbswc</strong>: 全世界除了中国， 都是绿色涨， 红色跌，  中国真是奇葩的国家 [这叫有中国特色的政治正确，演习也是只能红军胜] || 锐推</a></p> <p>这完全是两个转发源，转发路径完全不同。只是由于他们的锐推文字是极其相似的，所以被玩聚RT自动合并为一条上榜锐推。</p> <p>此时，玩聚RT没理由寻找真正的原始推，并按照原始推的内容转发。</p> <p>&nbsp;</p> <p>完毕。</p><img src ="http://www.cnblogs.com/zhengyun_ustc/aggbug/1439602.html?type=1" width = "1" height = "1" /><br/><br/>--------------------------<br/>新闻：<a href="http://news.cnblogs.com/n/47969/" target="_blank">新浪邮箱大本营粉墨登场！Sina.cn开放注册</a><br/>网站导航: <a href="http://www.cnblogs.com" target="_blank">博客园首页</a>&nbsp;&nbsp;<a href="http://news.cnblogs.com" target="_blank">新闻</a>&nbsp;&nbsp;<a href="http://dotnet.cnblogs.com" target="_blank">.NET频道</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com" target="_blank">社区</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/q/" target="_blank">博问</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/ing/" target="_blank">闪存</a>&nbsp;&nbsp;<a href="http://zzk.cnblogs.com" target="_blank">找找看</a>]]></description></item><item><title>本意</title><link>http://www.cnblogs.com/zhengyun_ustc/archive/2009/04/16/benyi.html</link><dc:creator>旁观者</dc:creator><author>旁观者</author><pubDate>Thu, 16 Apr 2009 15:39:00 GMT</pubDate><guid>http://www.cnblogs.com/zhengyun_ustc/archive/2009/04/16/benyi.html</guid><wfw:comment>http://www.cnblogs.com/zhengyun_ustc/comments/1437622.html</wfw:comment><comments>http://www.cnblogs.com/zhengyun_ustc/archive/2009/04/16/benyi.html#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://www.cnblogs.com/zhengyun_ustc/comments/commentRss/1437622.html</wfw:commentRss><trackback:ping>http://www.cnblogs.com/zhengyun_ustc/services/trackbacks/1437622.html</trackback:ping><description><![CDATA[<p><a href="http://blog.csdn.net/zhengyun_ustc/" target="_blank">郑昀</a>@<a href="http://sr.ju690.com/" target="_blank">玩聚SR</a>&nbsp;20090416</p> <p>《疯狂农场》中有一句台词：&#8220;强者为自己出头，强者中的强者为别人出头&#8221;。</p> <p>王安石为大宋和黎民出头，锐意改革，<a href="http://theory.people.com.cn/GB/49157/49163/4658507.html">本意很好</a>。</p> <p>他制定的青苗法应该是最早的扶助弱势群体的小额贷款项目了，只不过是官办的。这正是因为官办，所以也就注定是一个不成功的小额贷款业务。</p> <p>王安石挟天子的威势而来，反对派无一不被彻底清除甚至从肉体上，但，正如魏武挥的《<a href="http://weiwuhui.com/1325.html">民意 vs.  威望</a>》中所说&#8220;和绅的贪污理论某些时候还真是那么回事：你让谁去赈灾？还不是那些大小官员？&#8221;，毕竟还是先前那个官僚体系在执行王安石的变法。</p> <p>所以，这么一个本意很好的制度最终彻底演变为对黎民的无情蹂躏和摧残。贷前，贷款被层层盘剥，层层转贷，要想申请到这笔款需要给官吏好处；收贷时，也赶上变法那几年天灾不断，百姓没有收成自然还不上钱，而官吏则强行收贷，其激烈和暴力程度绝对远高于现在的强制拆迁。</p> <p>王安石不知道这个吏治问题吗？知道，非常清楚，他也有自己的训练和挑选官员的办法。但，一个是来不及，另一个甭管怎么着，毕竟到了基层，你就彻底失控了。</p> <p>如乌有之乡的《<a href="http://www.wyzxsx.com/Article/Class18/200902/70813.html">漫谈：从金融危机联想到王安石青苗法</a>》一文所谈，苏辙和司马光都提前预见了青苗法实施之必然面临的各种问题，也因此坚决反对。其实他们谈到的问题，说到底，就是黎民的人性和官吏的人性。我觉得最经典的一句话就是司马光的&#8220;民间的富人放贷，都有本事把穷人的财产蚕食干净；何况官办贷款&#8221;。</p> <p>王安石不知道这些人性问题吗？</p> <p>知道。</p> <p>我个人认为是王公认为这都是政敌的话，所以敌人的话都是包藏祸心的话，对政敌只有赶尽杀绝，哪有功夫听他们说什么。其实，这就是我们现在仍反复犯的错。不光是政府对艾未未们疑心重重，凡是他们要做的要行为艺术的要谏的，都是国外势力的指使都是在颠覆政权；而且是斗士们也不听中央高层官样讲话背后的良苦用心和潜台词，正如魏武挥指出的&#8220;<a href="http://weiwuhui.com/1325.html">民众是不会分别究竟是奥巴马不干活，还是奥巴马不能让人干活的，总而言之，就是&#8220;我认为你不干活&#8221;。</a>&#8221;</p><img src ="http://www.cnblogs.com/zhengyun_ustc/aggbug/1437622.html?type=1" width = "1" height = "1" /><br/><br/>--------------------------<br/>新闻：<a href="http://news.cnblogs.com/n/47968/" target="_blank">IE市场份额首次跌破60%</a><br/>网站导航: <a href="http://www.cnblogs.com" target="_blank">博客园首页</a>&nbsp;&nbsp;<a href="http://news.cnblogs.com" target="_blank">新闻</a>&nbsp;&nbsp;<a href="http://dotnet.cnblogs.com" target="_blank">.NET频道</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com" target="_blank">社区</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/q/" target="_blank">博问</a>&nbsp;&nbsp;<a href="http://space.cnblogs.com/ing/" target="_blank">闪存</a>&nbsp;&nbsp;<a href="http://zzk.cnblogs.com" target="_blank">找找看</a>]]></description></item></channel></rss>