旁观者

参与软件开发开发这些年来,不断地遇到新领域新知识点,屡屡感受到新进入者的迷惑和彷徨,所以对遇到的每一个问题都详细记录问题现象、解决思路以及解决方案,并在blog中留下印迹,以备他日有心人google之而知之。
你们的新手之痛,你们的新业务发展之初的思路混沌,我都感同身受,所以欢迎和我一起探讨这些话题,诸如,文本挖掘/自然语言处理/Web3.0/J2ME/Web2.0/IVR/SMS/MMS/WAP/SIP/等等,知无不言言无不尽。
posts - 495, comments - 881, trackbacks - 39, articles - 1
   ::  ::  ::  :: 订阅 订阅 :: 管理

2010年1月23日

     摘要: 而从人类的感觉上,至少要能有几个标签,比如名词、动词、形容词等,才能证明一个tweet可能包含有一定信息量,值得被传播。所以强制要求有N个标签被检测到的规则,恰好能逼近这种人类的认知。  阅读全文

posted @ 2010-01-23 23:14 旁观者 阅读(3337) | 评论 (0)编辑

2010年1月18日

     摘要: 大致的框架就是这样。玩聚HOT还在内测中(所以暂不提供RSS和微博帐号),不排除打散逻辑重新组合,但基本哲学应该就是这些了。  阅读全文

posted @ 2010-01-18 03:36 旁观者 阅读(2213) | 评论 (0)编辑

2010年1月7日

     摘要: 现在的重复内容检测逻辑是: 首先对文章内容较长的,是基于Shingle的重复检测办法; 其次对文章很短的,比如cnBeta摘要输出的RSS内容,比如Solidot,比如南方报业旗下的RSS内容,先提取标签,然后计算文章的标签相似度。 这两种办法算起来很快,但未必总能检测出来重复,继续积累吧。   阅读全文

posted @ 2010-01-07 01:00 旁观者 阅读(833) | 评论 (0)编辑

2010年1月6日

     摘要: (多年前就开始流传的一篇文章。作者ID是joeliu,是他年轻时在加拿大写的一篇文章。留作备份。) (大一时本系教改,四大名捕来了三个:倪其道,李百浩,林秀鼎)  阅读全文

posted @ 2010-01-06 00:52 旁观者 阅读(574) | 评论 (0)编辑

2010年1月5日

     摘要: 说先退卡是为了规避忘记取卡的风险,是对的。这属于典型的两害相权取其轻。  阅读全文

posted @ 2010-01-05 22:56 旁观者 阅读(1033) | 评论 (1)编辑

2009年12月23日

     摘要: 所以,不是“已经很少存在理性的声音了”(一点都不少),而是“不迷信权威、不非黑即白、能理性思考的受众人数相对太少”,无法让有理有据的观点第一时间传播。相反,那些乱力怪神、情感激烈、奇技淫巧的论点会快速传播,人的接收信息能力有限时,就会让这些声音充斥大脑,而根本接收不到理性的声音。  阅读全文

posted @ 2009-12-23 20:11 旁观者 阅读(7271) | 评论 (14)编辑

2009年12月15日

     摘要: 所以,综上所述,《降世神通(Avatar)》的转世设定应该是取材于藏传佛教,而不是印度教或佛教。 但goldengrape认为的『为何设定每一个神通是同一个灵魂的不同Copy』,这个说法在剧集中表现得也很模糊。我们可以看这么一个例子:Roku对Aang曾经在Avatar State中警告过:“当你进入Avatar State(神通状态)时,你必须阻止别人杀死你的肉身,一旦你的肉身死了,我们这些过往的转世,都将不复存在,而且将不再有转世。”貌似是只能有一个神通(莫非是指存在于世的肉身只有一个),但转世的每一个神通在Avatar State中却是独立存在的,每一个Copy又依赖于那个肉身存在。反正是很诡异的设计。   阅读全文

posted @ 2009-12-15 06:49 旁观者 阅读(754) | 评论 (0)编辑

     摘要: goldengrape说:『看了降世神通Avatar,才知道原来Avatar转世系统中不遵守灵魂守恒,而是每一次转世,就复制一份。紧急情况下与灵界沟通,进入Avatar state, 前世Avatar可以注入能量。这个转世系统很牛逼,值得修炼。』 北京报道 郑昀  阅读全文

posted @ 2009-12-15 02:19 旁观者 阅读(530) | 评论 (0)编辑

2009年12月13日

     摘要: 简单地说,如何珍惜自己的职业荣誉,就是最开始不以金钱为短期目的,而是以打造自己职场形象为主,以做口碑为主,要保证做一个成一个,至少雁过留声,让别人知道你的idea、技术、运营还可以,千万别做一个得罪一群人,做一个死一个,那就严重影响你以后的IT圈子声誉了。  阅读全文

posted @ 2009-12-13 03:15 旁观者 阅读(6862) | 评论 (0)编辑

2009年12月12日

     摘要: 如果你真的对前面那个People Search感兴趣,不妨看看他们的开源代码: itswhoyouknow[Social Network Browser] 至少你可以观摩一下它的javascript是如何对Google Social Graph API再次封装的,如何调用Google AJAX Search API 的。  阅读全文

posted @ 2009-12-12 03:02 旁观者 阅读(490) | 评论 (0)编辑

2009年12月9日

     摘要: 中国广电工信战争:1、手机电视标准战,广电的DAB和CMMB恶斗工信部的T-MMB。2、视频网站办证第一战,广电发放视听牌照,工信部败。3、互联网电视狙击战,广电一纸通知宣布IPTV相关业务违法。4、手机色情战,工信部惨败。5、视听许可证BT第二战,广电胜。  阅读全文

posted @ 2009-12-09 15:54 旁观者 阅读(6777) | 评论 (7)编辑

2009年12月5日

     摘要: 才知道系列之四。才知道豆瓣有个组叫豆瓣档cos江湖,动辄数千人以回贴加扮演的形式cosplay各种剧集。还演化出更复杂的师徒系统。另一个组里海藻、宋思明和小贝都在cosplay了:http://is.gd/5a6sA  阅读全文

posted @ 2009-12-05 22:09 旁观者 阅读(456) | 评论 (0)编辑

2009年11月27日

     摘要: Parsley是一个挺有意思的小东西,它综合运用了CSS、XPath、正则表达式和JSON,是描述如何从网页里提取结构化数据的简单语言。估计做爬虫(Crawler/Spider)的人都会定义一套类似的模板。只不过Parsley还帮你把具体实现做了,用各种开发语言。   阅读全文

posted @ 2009-11-27 23:57 旁观者 阅读(488) | 评论 (0)编辑

2009年11月25日

     摘要: 我们在中国大陆考虑从social数据挖掘寻找新价值的时候,一般要考虑两个点: 1、是否有足够多的数据; 2、这些数据如何证明是有效/有价值的;或者说你能用什么办法清洗数据。  阅读全文

posted @ 2009-11-25 02:33 旁观者 阅读(550) | 评论 (0)编辑

2009年11月20日

     摘要: 东野圭吾经常把各种各样的知识点揉入他的推理小说中,让你欣赏他严密逻辑推理的同时,还可以被科普一把。前面举过两个例子,比如《嫌疑人X的献身》中的P/NP难题,剧集《神探伽利略》前传中的门罗效应。所以强烈建议理工科生通读东野圭吾的推理小说,点击此从新浪爱问打包下载他的21本小说。下面简单举几个例子。   阅读全文

posted @ 2009-11-20 02:33 旁观者 阅读(1350) | 评论 (1)编辑

     摘要: leondellee抱怨说:“玩聚SR 最近老是有 N 多的Solidot、cnBeta、瘾科技上榜,就不能调整下阈值么... ”   阅读全文

posted @ 2009-11-20 00:22 旁观者 阅读(1437) | 评论 (0)编辑

2009年11月18日

     摘要: 前文《东野圭吾小说中的P/NP问题》说到了东野圭吾的推理小说被拍为日剧《神探伽利略》系列,顺便再八卦一下它的前传,有剧透,没看前传的请暂且打住。  阅读全文

posted @ 2009-11-18 12:14 旁观者 阅读(459) | 评论 (0)编辑

     摘要: 咱表一表推理大师东野圭吾之神作《嫌疑人X的献身》中是怎么用最简单的话定义P不等于NP的: 『对于数学问题,自己想出解答,和判断别人说的解答是否正确,何者比较简单?』   阅读全文

posted @ 2009-11-18 00:55 旁观者 阅读(541) | 评论 (0)编辑

2009年11月17日

     摘要: 奥巴马给胡递了张纸条:save the twitter,save the world. 郑昀@玩聚RT 北京报道 20091117  阅读全文

posted @ 2009-11-17 20:19 旁观者 阅读(433) | 评论 (0)编辑

2009年11月16日

     摘要: 锐推榜上榜阈值是否需要与Followers数目成正比?为何有时锐推榜删除转发第一人的评论呢?   阅读全文

posted @ 2009-11-16 17:39 旁观者 阅读(472) | 评论 (0)编辑