随笔分类 - 新媒体观察

摘要:现在再讲讲个性化阅读的过去、现在和未来,也算是这个话题的延续。 阅读全文
posted @ 2011-04-14 22:53 旁观者 阅读 (9796) | 评论 (2) 编辑
摘要:【注:去年的旧文。上一篇是《02-在 Kuber SocialBadge 基础上再前进一步》和《01-学习 Kuber 的 SocialBadge 好榜样 | 02.技术预研 | Social》,下一篇是《04-WebFinger的利用 | 02.技术预研 | Social》】 阅读全文
posted @ 2011-03-07 22:06 旁观者 阅读 (1892) | 评论 (0) 编辑
摘要:【注:去年的旧文了。上一篇是《01-学习 Kuber 的 SocialBadge 好榜样 | 02.技术预研 | Social》】 阅读全文
posted @ 2011-03-07 21:59 旁观者 阅读 (1622) | 评论 (0) 编辑
摘要:集中回答一下网友对互联网信息监测的提问。 阅读全文
posted @ 2011-03-07 00:31 旁观者 阅读 (1852) | 评论 (0) 编辑
摘要:最近有网友抓了些blog和bbs的文章,所以问了我一些互联网热点发现(俗称就是 meme Tracker 方向)方向的应用问题。也许有其他人也会感兴趣,兹挑选几条列在下面 阅读全文
posted @ 2011-01-06 18:06 旁观者 阅读 (3112) | 评论 (0) 编辑
摘要:Amir Salihefendic(他是Plurk、Todoist的Co-Founder)在今年10月份撰文《How Hacker News ranking algorithm works 》完整地解释了Hacker News的Ranking算法,从中我们才得以知道那个神秘的“1.5”是什么。稍后我们还会拿这个排序规则与Reddit的排序规则做对比。 阅读全文
posted @ 2010-12-15 02:01 旁观者 阅读 (23230) | 评论 (3) 编辑
摘要:假设微博网站允许导出(双向关注的)好友email列表,那么招致非议的MSN式病毒式推广又将卷土重来。我之所以极少确认MSN或Gtalk的好友请求,就是因为,我无法保证对方以及他所使用的第三方服务不滥用这个好友列表 阅读全文
posted @ 2010-11-25 17:08 旁观者 阅读 (7375) | 评论 (1) 编辑
摘要:我平时喜欢玩Mashup,所以对国外各种开放接口都有兴趣看两眼。像Twitter的,Yahoo!的(Yahoo! Pipe、YQL),Google(Buzz、Google Reader、Chart、WebFinger等)的,即使是很不着调的Social Graph API,都能很快测试通过然后嵌到自己的所谓“智能语义聚合框架”里。但对于国内哪怕是所谓“开放平台”提供的API都会比较犯憷。 阅读全文
posted @ 2010-08-19 14:11 旁观者 阅读 (12102) | 评论 (6) 编辑
摘要:Cutt.com在组织资讯时,我把它划分到Topic Engine一类,暂且不谈它的阅读模式和群体智慧。(Updated:我拼写错误,应该是“王靖雯”,这样就可以找到王菲) 阅读全文
posted @ 2010-07-27 00:54 旁观者 阅读 (6425) | 评论 (4) 编辑
摘要:Kuber 的 SocialBadge 还利用了 WebFinger ,从而可以根据用户输入的 Email 地址获取它的关联信息。当然 Kuber 还是走 Social Graph 来得到关联信息,因为 WebFinger 的数据能被 Social Graph 调用。 阅读全文
posted @ 2010-05-26 13:57 旁观者 阅读 (1187) | 评论 (0) 编辑
摘要:最近 Kuber 推出了 SocialBadge ,是利用 google social graph api 做的。 SocialBadge 算是社会化推荐封闭社区的预研 demo 了。有了这个雏形,面向全球 Social 重度用户的个性化推荐计算有了可能。 阅读全文
posted @ 2010-05-25 00:38 旁观者 阅读 (1282) | 评论 (0) 编辑
摘要:可以认为这是一个理想的自动问答机器,利用协同过滤原理和语义技术,同时又有人工编辑审核问题和答案保证机器学习的质量。 阅读全文
posted @ 2010-03-08 16:20 旁观者 阅读 (3357) | 评论 (0) 编辑
摘要:leondellee抱怨说:“玩聚SR 最近老是有 N 多的Solidot、cnBeta、瘾科技上榜,就不能调整下阈值么... ” 阅读全文
posted @ 2009-11-20 00:22 旁观者 阅读 (2135) | 评论 (0) 编辑
摘要:项亮在《关于GRSuggest的一些思考》中说:“去重的问题,这个问题在文章推荐中非常常见,很多文章都被转载N次了,经常发现一个几年前的老贴又被转载,其实我的推荐系统本身也是转载”。 这个延伸出来的是3个常见问题,确实不好解决。 阅读全文
posted @ 2009-10-04 01:50 旁观者 阅读 (8422) | 评论 (3) 编辑
摘要:这样,这个信息过滤器既引入了微博客的实时性,又抑制了它的过度泛滥,还参考了Social Media用户在原体系中的活跃度、受欢迎程度等指标,能有效地摒弃质量不高的社会化媒体用户,算法不复杂,最终达到一个较好的过滤效果和效率。 阅读全文
posted @ 2009-09-19 17:53 旁观者 阅读 (5038) | 评论 (0) 编辑
摘要:这样大致能遍历了Google Reader中文用户,对分享能力低迷的用户识别效果良好。从Rank数值上看,基本能判定: Rank 0 :用户有一定活跃度;Rank越大,用户越活跃,而且分享的文章质量越高。 阅读全文
posted @ 2009-09-19 05:23 旁观者 阅读 (7169) | 评论 (0) 编辑
摘要:在Social Media领域,不管是搜索结果,还是页面展示,只要不是编辑挑选的,只要是机器智能决定的,都需要以某种顺序排列。 那么,除了按时间顺序或按投票数排列外,还会有哪些有效的展示模式呢? 阅读全文
posted @ 2009-09-06 01:11 旁观者 阅读 (8842) | 评论 (2) 编辑
摘要:社会化媒体的可携带可传播数据是海量的,从中打捞珍珠并串成线,还是需要一些手段的。你不能简单地获取那些像水一样流动的数据来展示,无论你的界面多么漂亮,都没有太大价值,你必须增加一些附加价值。 阅读全文
posted @ 2009-08-31 00:26 旁观者 阅读 (7643) | 评论 (0) 编辑
摘要:好了,就是这些了。这就是2009年7月和8月国外情感分析方向的一些进展。 阅读全文
posted @ 2009-08-19 20:21 旁观者 阅读 (5125) | 评论 (2) 编辑
摘要:无意中看到M Jia在《豆瓣好友热点 v0.2.3》中提及: “以前很喜欢看Techmeme/Digg这样的聚合/社区工具,现在超级喜欢Hacker News和Reddit Programming,简洁又超级有活力(虽然我不太能参乎进去,呵呵),如果能够使用玩聚SR的方式来作豆瓣上的“物”并加上豆瓣原来就有的社区,可以非常简洁并有活力,我会非常喜欢,不过我代表不了广大用户。” 顺着他的这个思路,那么如何一步一步做呢 阅读全文
posted @ 2009-05-04 11:49 旁观者 阅读 (853) | 评论 (0) 编辑
摘要:当Social能完整地提供三重元素: 1、 你的身份标识(Indentity):Who you are; 2、 你的联系人或圈子(Contacts):Who you know; 3、 你的网际行为(Activities):What you do 。 时, 阅读全文
posted @ 2009-03-20 00:11 旁观者 阅读 (1388) | 评论 (0) 编辑
摘要:3月17日的SXSW Panel主题是超越聚合,Beyond Aggregation。 会议内容Dawn Foster记录得比较全。FF上的讨论也挺热闹。 阅读全文
posted @ 2009-03-19 01:01 旁观者 阅读 (1949) | 评论 (0) 编辑
摘要:作为一个各种 memeTracker 工具制造者,我(@zhengyun)一直想知道Twitter上什么样的人值得follow、对我的胃口,当然他得是中文用户,说的事儿怎么着也得跟中国有点儿关系。 阅读全文
posted @ 2009-03-18 16:41 旁观者 阅读 (9044) | 评论 (6) 编辑
摘要:其他网站很快就介入,最典型的是一个叫做玩聚SR的网站。该网站自动检测到了Twitter中有此消息正被大量推荐,于是认定这是一个新闻热点,在玩聚SR的首页上,徐来遇刺的消息迅速排到了第一位。关心徐来情况的博客们纷纷发表意见,在Google Reader和其他博客网站中也有大量跟帖,玩聚SR根据每个帖子流传的广度给予了排名。 阅读全文
posted @ 2009-03-07 00:15 旁观者 阅读 (926) | 评论 (0) 编辑
摘要:Kuber 就是我经常说的那种技术 Geeker ,一旦有一个想法,或者看到一个好 Idea ,马上卷起袖子就干,瞬间搞定的人。 阅读全文
posted @ 2009-02-24 19:46 旁观者 阅读 (1046) | 评论 (0) 编辑
摘要:很多人认为 Blog 不再应该是中心,甚至不是个人中心。 Blogger 当然希望大多数动作在自己的 Blog 上展开,起码大多数因 Blog 引发的动作能反映在这个 Blog 上,这个需求即使是 FriendFeed 也解决不了,虽然这是一个“是在当下Twitter、Facebook、Friendfeed、Google reader等信息流服务如此流行的大环境”,虽然 FriendFeed 的数据是可共享和可携带的。 虽然人们认为 LifeStream或SNS也是中心,但 Blogger 也需要 Blog 这个中心,而不只是个被聚合者。 阅读全文
posted @ 2009-02-20 03:35 旁观者 阅读 (1855) | 评论 (3) 编辑
摘要:昨天,Techmeme宣布雇佣编辑了,是个女的。老外主要的担心在于客观不客观偏颇不偏颇上,这一点与我们国内的考虑大相径庭。但Gabe的反驳也很有力:Techmeme从来都不是客观的,因为人生就不公平!Techmeme将总会带有偏颇,因为是人建造了它!(听上去是不是像keso?) 阅读全文
posted @ 2008-12-04 14:00 旁观者 阅读 (1124) | 评论 (0) 编辑
摘要:和有道的推广人员聊,我反映的也是大家做研发最经常遇到的问题。由于新闻聚合的根本涉及自然语言处理的文本相似性计算,所以各种新闻聚合产品也都是一个毛病(跟我们最开始的玩聚热点一样)。 阅读全文
posted @ 2008-09-21 17:18 旁观者 阅读 (4072) | 评论 (2) 编辑
摘要: 这里有三个答案。 一个是,针对微软整个互联网体系的广告主的。简单地说,就是利用Powerset的语义技术加强Contextual Advertising(粗糙的翻译就是:上下文广告),提高微软互联网体系中的广告转化率。众所周知,Google拥有地球上最强的关联广告引擎,非 Yahoo!所能望其项背,并与之合作。不光是微软Live Search需要高转化率的Contextual Advertising,MSN、Live等都需要有这个武器,才能在未来的广告世界中勉强站住脚。想想看,Google最近的Google Trends流量分析、Ad Planner、雅虎谷歌广告合作等一系列大的小的布局,用不了几年工夫,估计就赢者通吃整个生物链了。 另一个是,针对搜索用户的。即Powerset的语义搜索是Google关键词搜索进化的下一步,理应提供给用户更高的用户搜索体验。这里,Powerset往往强调的是,它们能够更精准地体会用户搜索的意图,给出更符合用户需求的搜索结果。 这里容易被质疑的是,统计表明,目前搜 阅读全文
posted @ 2008-07-09 00:37 旁观者 阅读 (804) | 评论 (1) 编辑
摘要: 感谢肚破天惊对玩聚SD的长篇大论,以及精彩的、可操作性很强的建议。 感谢dupola先生的的专业分析之余,我把dupola和曹增辉的几篇SD文章打印出来,仔细地琢磨。 下面这六个问题,估计是国内memeTracker(一、二、三)都需要考虑的问题。 阅读全文
posted @ 2008-06-24 17:57 旁观者 阅读 (690) | 评论 (0) 编辑
摘要:感谢名博风言疯语之IT罗盘对玩聚SD这个非常稚嫩的应用推荐和提出宝贵意见:《玩聚SD:针对博客的创新社会化聚合》。同时对沉默·狼的《玩聚家族:网聚精彩故事》表示感谢! 阅读全文
posted @ 2008-06-19 23:55 旁观者 阅读 (563) | 评论 (1) 编辑
摘要: 首先感谢两个小时前曹增辉发布的对玩聚SD的点评《郑昀的玩聚SD和社会化对话》。阐述得非常漂亮,入木三分。 其次,曹兄指出的围绕“人还是内容”构建关键点,涉及信息架构,是个大问题。我一直在左左右右地徘徊。 阅读全文
posted @ 2008-06-18 02:38 旁观者 阅读 (510) | 评论 (0) 编辑
摘要:首先感谢和菜头提到我们,anyway,和菜头也是博客生态圈中最大的意见领袖之一。不管我们表达的多么哀怨,但看到您的宏篇巨制,都不得不躲边儿上偷笑。对于意见领袖,最狠的莫过于TechCrunch宣布某某进入deadpool,那才是最可怕的,直接踹入历史故纸堆。 阅读全文
posted @ 2008-06-17 00:59 旁观者 阅读 (716) | 评论 (0) 编辑
摘要:首先非常感谢电子商务博客和showeb2.0盗盗两位朋友对玩聚SD的推荐,能够在这两位非常优秀的博客上看到SD的名字,真的很感动。【20080616 18:47 updated: 名站网贝也进行了推荐,感谢blacktulip!】|【20080616 23:50 updated: 名博和菜头也进行了推荐,感谢!】 阅读全文
posted @ 2008-06-16 01:21 旁观者 阅读 (816) | 评论 (0) 编辑
摘要:Tim O'Reilly有句话是: Web 2.0的一个本质是利用集体智慧来将互联网调试为一种所谓的全球的大脑,那么博客圈就是前脑中喋喋不休的呓语。 如果只是一种放大器那么撰写博客将会变得无趣。但是像维基百科全书一样,博客将集体智慧用作一种过滤器。被詹姆士·苏瑞奥维奇称为"大众智慧"的规律起了作用,并且就像PageRank技术所产生的结果胜过分析任何单一文档一样,博客们的集体关注会筛选出有价值的东西。 p.s.: 玩聚SD的用户界面有诸多不合适之处,还望大家指出来,提改进意见,在这里先谢过了。 大家集中指出的问题在:1.看不大懂是对话。对话体征不明显。2.用户参与度少,仅仅是阅读。 阅读全文
posted @ 2008-06-12 16:18 旁观者 阅读 (477) | 评论 (2) 编辑
摘要:为了让Geek's Blog Social Dialogue更加能够反映中国IT江湖的时下热点, 需要尽可能多地收集意见领袖们、IT优秀博客们的RSS地址,来交给这个类似于techmeme般自动实时运行的系统。 阅读全文
posted @ 2008-06-04 14:07 旁观者 阅读 (646) | 评论 (0) 编辑
摘要:奇酷的大致技术思路,如果没猜错的话,会是这样的.... 阅读全文
posted @ 2008-03-16 22:26 旁观者 阅读 (1028) | 评论 (0) 编辑
摘要:我和白鸦晚到了,正赶上腾讯科技频道编辑徐志斌向360圈的重炮轰击,有点像周六下午的帮客会议中和讯社区运营总监陈镇波当仁不让的轮番回答一样扣人心弦。老谭主持下的这种IT圆桌会议,精神通常贯穿地很好,刀出鞘露锋芒,大家都亮出了趁手的兵器,卖弄的是干货,不会温吞水地你好我好他也好。 阅读全文
posted @ 2008-03-06 03:26 旁观者 阅读 (735) | 评论 (2) 编辑
摘要:【命题5:SNS平台商开放之后,有多少“大脑”会跟进贡献?】【命题6:SNS平台商开放之后,会像搜狐一样锣鼓喧天鞭炮齐鸣开新闻发布会吗?】 阅读全文
posted @ 2008-03-04 15:42 旁观者 阅读 (383) | 评论 (0) 编辑
摘要:周六下午,study三角地咖啡吧,帮客群英会,主题:互联网的下一轮竞争——开放平台。 【命题1:中国当下的环境,是否可以鼓励SNS社区开放?】 【命题2:腾讯SNS一枝独秀在前,谁有资格与之用开放策略来竞争?】 【命题3:腾讯SNS一枝独秀在前,如若它开放,甚至不开放,后起之秀如何与之用开放策略来竞争?】 【命题4:有勇气走出开放第一步的SNS平台商,到底能开放到什么程度,是否会和插件商展开正面战?】 阅读全文
posted @ 2008-03-04 01:54 旁观者 阅读 (675) | 评论 (0) 编辑
摘要:比如这次改版后的百度新闻,那就必须揉合多种算法,而且必须从本质做大的提升。姑且不说强度很高的文本相似性算法,就说分类,必须提升现在常见的分类算法。因为它分类分得非常细。 这时候,必须自己研发。 单纯就百度新闻的互联网频道,就好几个子类。十几个大频道,每个都有各种各样很细小的分类,语言特征很模糊。 我问过他们,这都是机器自动的,几乎接近于传统媒体网站一大堆编辑的水平了,语义能到这种可商用的强度就难了。 算法不是一朝一夕能偷师的。 所以,技术门槛还是比较高的。 阅读全文
posted @ 2008-02-29 02:34 旁观者 阅读 (528) | 评论 (1) 编辑
摘要:参考张忠国的意见,我觉得: 第一,以意见领袖的言论为首要聚合点,从而体现价值阅读; 第二,在运营上,如果能及早发现潜在热点,可以联手炒热;热点专题,制作好的话,可以成为病毒式营销,最起码可以SEO; 第三,降低沟通成本,结合newsfeed形式; 第四,新闻和历史热点的自动关联,增加热点的外延。 还需强调的是不必过份依赖技术,难度主要在运营上。 完毕。 阅读全文
posted @ 2008-01-23 00:09 旁观者 阅读 (319) | 评论 (0) 编辑
摘要:总结一下,就是: 第一:对于纯新闻门户来说,那就是足够新的新闻。在新媒体领域,可能的信息采集手段可以有:草根网的站长推荐,cnBeta的网友自荐和站长转贴,百度新闻|玩聚网的自动发现; 第二:阅读者的互动。新媒体可能的组织形式:推荐和收藏行为,评论回复,博客博文,论坛讨论。 第三:新闻与新闻,新闻与专题,新闻与多媒体资源的自动关联,扩大新闻的外延。做法有:人工标签的自动关联;techmeme|玩聚网式的memeTracker;百度新闻式的历史新闻关联;daylife|玩聚网式的实体热点关联; 第四:聊天室、沙龙式的在线访谈。 从操作层面上讲: 1:一个平台; 2:组织与自组织; 3:算法与聚合。 阅读全文
posted @ 2008-01-22 23:48 旁观者 阅读 (363) | 评论 (0) 编辑
摘要:曹增辉的新作《如何扩大在线媒体的新闻受众》为众多在线媒体网站点明了五条操作要点,确实符合曹兄的一贯风格:简明扼要,直击黄龙。以前我在玩聚网团队内部说过,假如把方军、曹增辉和keso这几个认认真真在做reader shared的海量阅读者过滤的优质文章聚合起来,加入digg功能,即可成为一款人人追捧的IT业界信息过滤器。那么,草根网其实就是这么一款工具,鉴于它的互动气氛并不强悍到非提不可的地步,所以我们姑且认为它就是一款阅读工具,只不过张忠国用他的独特个人视角和海量阅读帮助大家过滤信息罢了。 阅读全文
posted @ 2008-01-22 23:08 旁观者 阅读 (402) | 评论 (0) 编辑
摘要:以前给朋友们介绍玩聚网的原理时,总爱说我们和百度新闻机制很相似,只不过他们算的只是新闻,我们算的是博客&论坛&新闻罢了,当时以为区别只是我们的计算量相对来说大得多,毕竟新闻算上重复的每天才多少啊,博客博文加论坛帖子每天多少啊,不是一个数量级的;而且我们计算的文字风格千奇百怪,不像新闻那么简单纯粹好算。 今天,张博士分析了下百度新闻的后台逻辑流程,才感觉可能玩聚网和百度新闻之间技术差异还是比想象的大。 阅读全文
posted @ 2008-01-10 02:18 旁观者 阅读 (795) | 评论 (2) 编辑
摘要:语义这东西,有趣,好玩,起码门槛有点高,没有个三五年的积累,不容易摸着门儿。玩得好,玩到语义搜索的境界,那就玩大了,可以入谷歌百度的法眼了。在IWOM/口碑上玩,也有很多可玩的,据说,“深不可测”。在垂直应用上,也有一定的想象空间。 阅读全文
posted @ 2007-12-13 02:18 旁观者 阅读 (813) | 评论 (0) 编辑
摘要:“我们不是先看见再定义,而是先定义再看见。” ---沃尔特·李普曼 阅读全文
posted @ 2007-12-07 14:24 旁观者 阅读 (422) | 评论 (0) 编辑
摘要:这个现象是值得把玩的。既在于它的流传广泛,还在于它的月经式传播:基本上每一拨新手都会受到这种风险教育,不管有没有人曾经在传播路径上做出过反驳和证伪,总有人把这种“常识”不遗余力地传递下去。与Sologram同事告诫他“本本电源应该先插到墙上插座”如出一辙。 阅读全文
posted @ 2007-12-05 00:21 旁观者 阅读 (2424) | 评论 (4) 编辑
摘要:CSDN主推的软件2.0大会上,来自于谷歌的林斌问会场黑压压上千号开发者,有多少人下载过Android?只有寥寥无几的人举手,绝对不超过10个人。又问有谁真正编译跑起来例子的?只有一个人高高举起了手。 这可是Android啊。尤其是在[谷歌重奖1000万美元推动手机系统Android普及]的刺激下啊。而且这千名开发者可是高手云集啊。 当然,mingjava和我都认为,如果没有实际的商用手机支持Android,过早研究Android雏形不一定好,毕竟Android实际上就是JavaME的另一个变身罢了,虽然Google不愿意承认。参看[Google又能怎样 手机大佬评判Android]。 阅读全文
posted @ 2007-12-01 18:00 旁观者 阅读 (2233) | 评论 (5) 编辑
摘要:别看那些做了若干年网站的,如果不是象白鸦、谢文、思践、麦田那样掌握了方法论的,基本上都是一半是盲人摸象一半是迷信。不过这也是大多数行业的通病,多数人真的是要么十几年如一日从不反省,要么就一思考上帝就发笑。 我最佩服方军和Mr.6,基本能做到持之以恒地每日给自己留一段时间思考和进化(“想到和得到,中间还有两个字,那就是要做到”)。 阅读全文
posted @ 2007-11-01 16:10 旁观者 阅读 (562) | 评论 (4) 编辑
摘要:“移动很可能自己在弄一个围墙,最后把自己圈了进去”。经典话语。 最后移动可能发现,大家都在绕着他走,他所树立的那些屏障,只是自拉自弹。 阅读全文
posted @ 2007-10-29 15:56 旁观者 阅读 (4140) | 评论 (2) 编辑
摘要:创业者不单单要考虑某一个Web2.0网站站内的微内容组织,还需要考虑众多Web2.0站点的内容整合,而且不单单是把信息聚合到一起,最重要的也是最难的,是如何把信息、人之间的关系挖掘出来。由于多数Web2.0创业者都不能很好地掌握语义计算能力,甚至完全不了解文本挖掘的概念,所以通常只在常见的互动手段、对其他开放平台的API进行Mashup等大做文章,所以很容易导致两个问题,一是技术门槛过低容易被复制,二是过分依赖用户UGC、用户主动行为。后面我们会谈谈语义计算能如何帮助Web2.0创业者。 阅读全文
posted @ 2007-10-16 14:36 旁观者 阅读 (548) | 评论 (0) 编辑
摘要:9月30号,TechCrunch率先报道Techmeme Leaderboard即将上线,不知道是不是为了哗众取宠,居然说Techmeme Leaderboard在进攻Technorati的“list of top blogs”,完全不是一种榜单嘛。 阅读全文
posted @ 2007-10-02 14:19 旁观者 阅读 (286) | 评论 (0) 编辑
摘要:其实,Pandora、Last.fm之前并不是没有音乐紧密或松散相关的推荐,无非就是榜单和归类嘛,但如此便捷自如地专注演绎,凸显了专注的威力。 音乐可以如此无止境地欣赏。文章呢? 现阶段的文章阅读,IT互联网里大家要么是通过RSS阅读器,比如抓虾鲜果GR,要么是通过人工编辑挑选组合的文章,比如donews新浪科技cnBeta,要么根据好友主动分享,比如GoogleReaderSharedItems鲜果分享del.ici.ous抓虾收藏。 阅读全文
posted @ 2007-09-30 14:03 旁观者 阅读 (3702) | 评论 (0) 编辑
摘要:昨天和思践聊天,论及上面这些FriendStreams服务,还都是主动通知你好友的所作所为,它们都需要你特别抽出精力去处理这些信息。有时候,这是一种无声的轰炸。 这只适合那些有很多时间关心好友行为的“闲人”,==|||。 我所喜欢的是,在你不去注意你的好友干什么的情况下,也就是不分散你的注意力,你还是有你自己的生活的,在你浏览的时候,机器人主动告诉你,你的好友对于这个主题曾经什么时候关注过,是在哪个网站。 也就是,好友行为在该出现的时候出现。 阅读全文
posted @ 2007-09-08 13:49 旁观者 阅读 (404) | 评论 (0) 编辑
摘要:请给出您的建议,有什么方法使得RSS阅读器更高效? 注:这篇文章并不是提示用户如何运用上面提到的方法获取高效的阅读体验,而是讲述了当下国内外RSS阅读器正在拥有的智能特性。 阅读全文
posted @ 2007-08-30 03:42 旁观者 阅读 (713) | 评论 (0) 编辑
摘要:新浪科技主编曹增辉的《新闻聚合的门槛》论及了玩聚所处的一些大环境之先天不足,主要是环境门槛、细分市场的门槛,以及入口问题。 我的理解呢: 阅读全文
posted @ 2007-08-24 01:34 旁观者 阅读 (418) | 评论 (0) 编辑
摘要:微内容如何定义?又为什么要说“你”的微内容呢?。。那么到了郑治的前瞻定义中,Eric Schmidt的这个solution就变成了这样: 重新打包你和你的好友散落在各处的这些碎片,按照你的阅读、你关注的新闻、你关注的人类文化,输出一个有序的“整片”。 这是不是算“你”的微内容呢?有人说,玩聚差不多是中国第一个memeTracker了,玩得就是语义,也就是把全网中博客、论坛中原本无序的碎片经过底层大平台的处理,吐出来的就是有序的整片;但是这样的微内容聚合,仅仅和techmeme一样是群体热点,是观点聚合(移步观看《围绕新闻的观点聚合是有价值的【新媒体】》),但那都是和我八杆子打不着的别人的观点聚合,那不是“我”的微内容聚合。是的,郑治和Eric Schmidt提出一个有趣的方向,以玩聚的后台技术应该可以做到。 阅读全文
posted @ 2007-08-15 17:24 旁观者 阅读 (568) | 评论 (0) 编辑
摘要:1:我个人认为,非第一手的新闻本身没有太高价值,尤其当我们接收新闻的途经如此之多的情况下。 2:单纯的新闻聚合没有太大意义,但百度新闻并不是简单的新闻聚合,所以还是有点儿意义,你可以认为它把过往的历史和当下发生的新闻自动联系起来了,从这一点来说就有用。 3:围绕新闻的观点聚合,尤其是专家的观点聚合,包括博客、论坛、评论,并以有趣的形式展现出来,这基本上属于传统媒体比如杂志所擅长的领域,互联网嘛,还需要多向传统媒体学习。 阅读全文
posted @ 2007-08-14 00:15 旁观者 阅读 (327) | 评论 (0) 编辑
摘要:百度向左,走向广告媒体;谷歌向右,走向内容协同过滤的新媒体。我们曾经为了做Presentation,而重新定义了“聚合”和“内容(协同)过滤”的概念,“聚合”就是按照某种主题把信息聚合到一个页面而其他用户很难改变这个聚合结果,举例说明:百度新闻的新闻聚合、博啦的博客聚合、奇虎聚客的主题聚合、抓虾的RSS聚合。“协同过滤”则是用户可以通过某种行为改变聚合结果,举例:豆瓣九点的博客聚合;Digg、Reddit;Spotback。那么,Google这次的尝试正是从“聚合”走向了“内容(协同)过滤”的新媒体。 阅读全文
posted @ 2007-08-10 00:24 旁观者 阅读 (460) | 评论 (1) 编辑
摘要:曹增辉在《RSS阅读器:工具化还是媒介化》提出了对抓虾新动作的定义:“对于抓虾这次调整的思路,不少人将之归结为“社区化”,其实,我觉得说是“媒介化”更准确一点”。 那么媒介化是不是可以理解为“从订阅走向发现之旅”呢? 如果是这样,那么这个概念和“从搜索到发现之旅”是一样,都是着眼于从用户主动行为(搜索关键词、订阅RSS)到系统帮助用户找到潜在资源。 林嘉澍在《从搜索到发现》文中有一段非常精彩的话,是这么定义这个发现之旅的“搜索是你明确地知道自己要找什么东西时所做的事情,而发现是你并不明确地知道一些好东西存于世上的时候,这些东西主动找到了你。” 阅读全文
posted @ 2007-08-05 19:58 旁观者 阅读 (481) | 评论 (3) 编辑
摘要:仿照Technorati的 Popular频道,电影、音乐、书籍的博客影响力榜单终于在玩聚新页面上体现了出来,以后每天都可以看到最新的榜单自动计算并展现了。 Technorati的做法是,计算过去24小时内,计算链接指向IMDB某部作品的数量,从而获知电影、音乐、博客、视频、新闻的流行程度。 而我们在中国嘛,所以没有什么人会在博文中说自己看了某部电影,竟然会贴出指向豆瓣或者VeryCD的链接,所以只能通过语义计算啦。 有人问了,那整理一个电影、音乐名列表不就完了,然后自己去做博客搜索,这需要什么语义技术啊?要是这么easy,我们还玩什么文本挖掘啊?就是要一切无风自动,文本挖掘引擎自己从每天抓取到的数以万计篇文章中自动识别出潜在的电影、音乐/歌曲、书籍,而不需要人工告诉机器哪些词语是电影,并自动统计出博客引用次数。 阅读全文
posted @ 2007-07-26 20:44 旁观者 阅读 (377) | 评论 (0) 编辑
摘要:China Web2.0 Review7月22日讲到了我们玩聚(Onejoo: Memetracker in China),从叙事逻辑上看,算是很懂memeTracker的了,我于是在下面留言说了我们的在第一阶段的第一回合构建的最新进展。我和张俊林张博士从去年9月到现在已经努力了11个月了,时间很长了,左冲右突之下,也算是积累了坚实的文本挖掘技术基础和较高的壁垒。《中国的克隆公司能够引领创新吗?》论述了善于克隆的中国公司应该如何处理用户量与技术支持比例的问题,我们过去也一直在致力于解决这些问题,当然我们考虑的还不是访问网站的用户量问题,而是如何针对数以百万计的博客甚至是数以万计的论坛、数以万计的新闻源进行实时的大规模文本挖掘计算,并且以某种方式找到万事万物之间的关系。 阅读全文
posted @ 2007-07-24 00:43 旁观者 阅读 (394) | 评论 (0) 编辑
摘要:这些日子,不单单注意到那些新锐网站,比如MyLifeBrand 、Throof、很像大众点评网的Yelp,还看到那些人们曾经认为不够酷的旧势力们卷土重来,比如AOL的一系列动作,CNN的redesigned version,USA today的三月份重构,News.com.com的Big Picture,都大量地吸收了流行的、酷的元素。 “STILL around after all these years and STILL thriving”,这句话准确描述了人们看到这些重构动作的感受。他们终于都回来了! 阅读全文
posted @ 2007-07-11 22:59 旁观者 阅读 (374) | 评论 (0) 编辑
摘要:ZapTxt的提醒姗姗来迟,都已经设定了半个月了,才终于给我送过来一篇Alert。 我在上一篇《个性化阅读的过去和未来【一】》中提到:“Zaptxt,也是同样的思路,搜索范围也是非常广,从你指定的RSS Feed、新闻站点到招聘贴士,只要符合你的关键词,就可以筛选出来以某种方式投递给你。既可监视你的Feed列表,也可以专门监视特定网站。” 阅读全文
posted @ 2007-07-10 00:45 旁观者 阅读 (408) | 评论 (0) 编辑
摘要:Connections Engine,是大势所趋,无论你是用人工做,还是机器做,都必须能够揭示出不同事物之间的关系。雷鸣的酷我早已经在这方面迈出一大步了,揭示了不同明星之间的关系甚至是远近程度,是国内Topic的先行者。 我们的尝试是基于过去大半年累计下来的数以万计的热点(不是文章,而是每天各个领域的主题自动聚合,社会的、娱乐的、财经的、电影的等等),经过自动分析而展现出来的这两种关系: 热点故事与人、组织之间的关系,具体的例子:刘德华被封杀,红楼选秀法律问题; 人、组织之间的关系,具体的例子:刘德华,陈晓旭,雅虎。 我们称之为“关联点”,一个技术性很强的术语。你可以在不同关联点、热点故事之间导航,看到他们为何有关系。每一个关联点就是一个Topic,这样把历史上所有的热点做了一个自动整合,形成了Topic Engine。这种Topic Engine就有点类似于搜索引擎的整合搜索,把某一个人物的搜索结果条理化、主题聚合化,使得人们阅读的时候直接看到事件、看到热点,而不是一篇一篇一页一页的孤零零需要人脑处理的资讯文章。 阅读全文
posted @ 2007-07-08 15:41 旁观者 阅读 (445) | 评论 (2) 编辑
摘要:那么是否可以存在一个服务,象watchmojo所说的那样(News is Still a Wide Open Game),兼容并蓄,囊括编辑模式、机器智能模式、群众智慧模式,杀入新闻聚合服务领域呢? 对此,Google黑板报有一个注脚“Larry Page说,搜索就是发现内容…,而维基百科发现了一个更好的方法来组织信息。他似乎很喜欢这种同时使用人力、流程和机器的模型。所以这是另一项证据,表明谷歌正敞开胸怀,寻求可扩展的方法来利用人的力量。” watchmojo给出的答案是“Topix + TechMeme + Digg”。 你的呢? 阅读全文
posted @ 2007-07-03 00:36 旁观者 阅读 (3630) | 评论 (2) 编辑
摘要:你是否每天经常访问许多站点,来跟踪你感兴趣的新闻或博客? 你订阅的Feed是否每天都有太多太多的文章,根本读不过来? 你需要保持敏锐的触觉,但它是不是花费了你太多时间? 阅读全文
posted @ 2007-06-29 10:32 旁观者 阅读 (2883) | 评论 (3) 编辑