随笔分类 -  语义应用

上一页 1 ··· 3 4 5 6 7 8 下一页
摘要:语义这东西,有趣,好玩,起码门槛有点高,没有个三五年的积累,不容易摸着门儿。玩得好,玩到语义搜索的境界,那就玩大了,可以入谷歌百度的法眼了。在IWOM/口碑上玩,也有很多可玩的,据说,“深不可测”。在垂直应用上,也有一定的想象空间。 阅读全文
posted @ 2007-12-13 02:18 老兵笔记 阅读(1145) 评论(0) 推荐(0)
摘要:智能语义聚合框架,是什么,第一步,选择好垂直方向;第二步,把知识碎片together起来,碎片包括blog、news、forum、microblog、live room等等;第三步,文本挖掘和统计;第四步,展现价值。 阅读全文
posted @ 2007-11-30 01:03 老兵笔记 阅读(939) 评论(0) 推荐(1)
摘要:创业者不单单要考虑某一个Web2.0网站站内的微内容组织,还需要考虑众多Web2.0站点的内容整合,而且不单单是把信息聚合到一起,最重要的也是最难的,是如何把信息、人之间的关系挖掘出来。由于多数Web2.0创业者都不能很好地掌握语义计算能力,甚至完全不了解文本挖掘的概念,所以通常只在常见的互动手段、对其他开放平台的API进行Mashup等大做文章,所以很容易导致两个问题,一是技术门槛过低容易被复制,二是过分依赖用户UGC、用户主动行为。后面我们会谈谈语义计算能如何帮助Web2.0创业者。 阅读全文
posted @ 2007-10-16 14:36 老兵笔记 阅读(772) 评论(0) 推荐(0)
摘要:其实,Pandora、Last.fm之前并不是没有音乐紧密或松散相关的推荐,无非就是榜单和归类嘛,但如此便捷自如地专注演绎,凸显了专注的威力。 音乐可以如此无止境地欣赏。文章呢? 现阶段的文章阅读,IT互联网里大家要么是通过RSS阅读器,比如抓虾鲜果GR,要么是通过人工编辑挑选组合的文章,比如donews新浪科技cnBeta,要么根据好友主动分享,比如GoogleReaderSharedItems鲜果分享del.ici.ous抓虾收藏。 阅读全文
posted @ 2007-09-30 14:03 老兵笔记 阅读(3868) 评论(0) 推荐(0)
摘要:玩聚热点故事(譬如对《赢在中国》的四个失望)不含任何人工编辑成分,真实地反映网民的关注热点,突出新闻背后的观点价值。 9月24日,郭惠礼提供了玩聚热点故事分享的Widget(博客小部件): 获取小部件请浏览 http://www.onejoo.com/service/getwidget/ ,帮助请看 http://www.onejoo.com/service/explain/ 。 小部件可以嵌入到我们的博客中,显示玩聚热点故事前若干个热点。 阅读全文
posted @ 2007-09-28 00:08 老兵笔记 阅读(559) 评论(0) 推荐(0)
摘要:2007.9.24 玩聚(http://www.onejoo.com/)支持国内主流科技新闻媒体。 李璞为玩聚加入以下科技新闻媒体支持,从而让玩聚网全面支持中国主流的新闻、博客、论坛等信息源。 CNBeta ccidnet赛迪网新闻 Sohu新闻 Sina新闻 QQ新闻 ENet 泡泡网新闻 等等 加入之后,IT、科技、互联网的热点效果不错,参见 玩聚科技 。 阅读全文
posted @ 2007-09-28 00:04 老兵笔记 阅读(415) 评论(0) 推荐(0)
摘要:如果你订阅了一个博客,这个博客的一篇文章中提及某些链接,那么,SharpReader会自动在你目前的订阅列表的所有文章中寻找共同指向这个链接的所有文章并以非常方便阅读的Threaded方式列出来,并且可以迭代查找而不仅仅只是列出一层关系。不得不承认这个功能很贴心,虽然从技术上来说无非就是反向链接计算很简单的。 希望能够在Web RSS Reader上能够看到这一特性。 阅读全文
posted @ 2007-09-08 16:11 老兵笔记 阅读(506) 评论(0) 推荐(0)
摘要:昨天和思践聊天,论及上面这些FriendStreams服务,还都是主动通知你好友的所作所为,它们都需要你特别抽出精力去处理这些信息。有时候,这是一种无声的轰炸。 这只适合那些有很多时间关心好友行为的“闲人”,==|||。 我所喜欢的是,在你不去注意你的好友干什么的情况下,也就是不分散你的注意力,你还是有你自己的生活的,在你浏览的时候,机器人主动告诉你,你的好友对于这个主题曾经什么时候关注过,是在哪个网站。 也就是,好友行为在该出现的时候出现。 阅读全文
posted @ 2007-09-08 13:49 老兵笔记 阅读(679) 评论(0) 推荐(0)
摘要:如果你阅读新闻有这样的烦恼,不同网站甚至不同媒体对于同一事件的新闻报道内容大多是一模一样的, 没有观点只罗列事实,甚至即使有观点也都是口径一致的,那你一定要来看玩聚热点故事中各路草根英雄的多角度点评和爆料。 玩聚热点故事不含任何人工编辑成分,真实地反映网民的关注热点,突出新闻背后的观点价值。 阅读全文
posted @ 2007-09-02 04:03 老兵笔记 阅读(718) 评论(0) 推荐(0)
摘要:请给出您的建议,有什么方法使得RSS阅读器更高效? 注:这篇文章并不是提示用户如何运用上面提到的方法获取高效的阅读体验,而是讲述了当下国内外RSS阅读器正在拥有的智能特性。 阅读全文
posted @ 2007-08-30 03:42 老兵笔记 阅读(1052) 评论(0) 推荐(0)
摘要:新浪科技主编曹增辉的《新闻聚合的门槛》论及了玩聚所处的一些大环境之先天不足,主要是环境门槛、细分市场的门槛,以及入口问题。 我的理解呢: 阅读全文
posted @ 2007-08-24 01:34 老兵笔记 阅读(644) 评论(0) 推荐(0)
摘要:微内容如何定义?又为什么要说“你”的微内容呢?。。那么到了郑治的前瞻定义中,Eric Schmidt的这个solution就变成了这样: 重新打包你和你的好友散落在各处的这些碎片,按照你的阅读、你关注的新闻、你关注的人类文化,输出一个有序的“整片”。 这是不是算“你”的微内容呢?有人说,玩聚差不多是中国第一个memeTracker了,玩得就是语义,也就是把全网中博客、论坛中原本无序的碎片经过底层大平台的处理,吐出来的就是有序的整片;但是这样的微内容聚合,仅仅和techmeme一样是群体热点,是观点聚合(移步观看《围绕新闻的观点聚合是有价值的【新媒体】》),但那都是和我八杆子打不着的别人的观点聚合,那不是“我”的微内容聚合。是的,郑治和Eric Schmidt提出一个有趣的方向,以玩聚的后台技术应该可以做到。 阅读全文
posted @ 2007-08-15 17:24 老兵笔记 阅读(836) 评论(0) 推荐(0)
摘要:1:我个人认为,非第一手的新闻本身没有太高价值,尤其当我们接收新闻的途经如此之多的情况下。 2:单纯的新闻聚合没有太大意义,但百度新闻并不是简单的新闻聚合,所以还是有点儿意义,你可以认为它把过往的历史和当下发生的新闻自动联系起来了,从这一点来说就有用。 3:围绕新闻的观点聚合,尤其是专家的观点聚合,包括博客、论坛、评论,并以有趣的形式展现出来,这基本上属于传统媒体比如杂志所擅长的领域,互联网嘛,还需要多向传统媒体学习。 阅读全文
posted @ 2007-08-14 00:15 老兵笔记 阅读(512) 评论(0) 推荐(0)
摘要:论坛和博客如何联合起来?可能还有更多更巨大的力量没有被发掘出来。他们只需要一个线索,一个主题,寻找新闻或主题背后的观点。请看我的《围绕新闻的观点聚合是有价值的【新媒体】》 于是,玩聚来了。 阅读全文
posted @ 2007-08-14 00:15 老兵笔记 阅读(540) 评论(0) 推荐(0)
摘要:百度向左,走向广告媒体;谷歌向右,走向内容协同过滤的新媒体。我们曾经为了做Presentation,而重新定义了“聚合”和“内容(协同)过滤”的概念,“聚合”就是按照某种主题把信息聚合到一个页面而其他用户很难改变这个聚合结果,举例说明:百度新闻的新闻聚合、博啦的博客聚合、奇虎聚客的主题聚合、抓虾的RSS聚合。“协同过滤”则是用户可以通过某种行为改变聚合结果,举例:豆瓣九点的博客聚合;Digg、Reddit;Spotback。那么,Google这次的尝试正是从“聚合”走向了“内容(协同)过滤”的新媒体。 阅读全文
posted @ 2007-08-10 00:24 老兵笔记 阅读(736) 评论(1) 推荐(0)
摘要:曹增辉在《RSS阅读器:工具化还是媒介化》提出了对抓虾新动作的定义:“对于抓虾这次调整的思路,不少人将之归结为“社区化”,其实,我觉得说是“媒介化”更准确一点”。 那么媒介化是不是可以理解为“从订阅走向发现之旅”呢? 如果是这样,那么这个概念和“从搜索到发现之旅”是一样,都是着眼于从用户主动行为(搜索关键词、订阅RSS)到系统帮助用户找到潜在资源。 林嘉澍在《从搜索到发现》文中有一段非常精彩的话,是这么定义这个发现之旅的“搜索是你明确地知道自己要找什么东西时所做的事情,而发现是你并不明确地知道一些好东西存于世上的时候,这些东西主动找到了你。” 阅读全文
posted @ 2007-08-05 19:58 老兵笔记 阅读(627) 评论(3) 推荐(0)
摘要:你说当大家都是爬行动物的时候,怎么突然出来鸟这种飞行的创意了呢?怎么想出来的?真是匪夷所思,那些蠢大之物都是越发展越蠢大,怎么就开始突然其中一部分兄弟发展装饰性的羽毛了呢?而且怎么冒出一个分支向着脱离地心引力凭借不可思议的空气动力学运动呢?嗯?!怎么评价Google/Blog/Youtube横空出世?Twitter呢都只是顺势而为罢了。一句话,它最开始没这目的真的要飞起来,它们只是装饰性渐进,因为还没有生物见识过飞行,又怎么会预测自己要飞行而长出翅膀呢,可你总见识过滑翔吧,至少见过高空抛物吧?见识过techmeme、tailrank、megite这些滑翔的兄弟们后,玩聚网就是打算结结实实地玩把语义。 阅读全文
posted @ 2007-08-02 22:35 老兵笔记 阅读(582) 评论(1) 推荐(0)
摘要: 老熊写了《python的1234》,恰好昨天我和军刀聊天的时候也说过,现在youtube大部分是python;pownce也是python的django。这种比较便于快速开发。豆瓣虽然不是基于django,但也是python。Gmail也是python。 现在玩聚的微内容聚合版本就是基于Python的Django框架开发的,确实能够做到快速Web开发,非常方便,而且嵌入memcached也很容易。Django的问题就是版本还只是0.95、0.96啦之类的,一直没有到1.0。从它对newform的处理来看,版本兼容问题还是有的。 阅读全文
posted @ 2007-07-27 13:44 老兵笔记 阅读(1652) 评论(1) 推荐(0)
摘要:仿照Technorati的 Popular频道,电影、音乐、书籍的博客影响力榜单终于在玩聚新页面上体现了出来,以后每天都可以看到最新的榜单自动计算并展现了。 Technorati的做法是,计算过去24小时内,计算链接指向IMDB某部作品的数量,从而获知电影、音乐、博客、视频、新闻的流行程度。 而我们在中国嘛,所以没有什么人会在博文中说自己看了某部电影,竟然会贴出指向豆瓣或者VeryCD的链接,所以只能通过语义计算啦。 有人问了,那整理一个电影、音乐名列表不就完了,然后自己去做博客搜索,这需要什么语义技术啊?要是这么easy,我们还玩什么文本挖掘啊?就是要一切无风自动,文本挖掘引擎自己从每天抓取到的数以万计篇文章中自动识别出潜在的电影、音乐/歌曲、书籍,而不需要人工告诉机器哪些词语是电影,并自动统计出博客引用次数。 阅读全文
posted @ 2007-07-26 20:44 老兵笔记 阅读(520) 评论(0) 推荐(0)
摘要:China Web2.0 Review7月22日讲到了我们玩聚(Onejoo: Memetracker in China),从叙事逻辑上看,算是很懂memeTracker的了,我于是在下面留言说了我们的在第一阶段的第一回合构建的最新进展。我和张俊林张博士从去年9月到现在已经努力了11个月了,时间很长了,左冲右突之下,也算是积累了坚实的文本挖掘技术基础和较高的壁垒。《中国的克隆公司能够引领创新吗?》论述了善于克隆的中国公司应该如何处理用户量与技术支持比例的问题,我们过去也一直在致力于解决这些问题,当然我们考虑的还不是访问网站的用户量问题,而是如何针对数以百万计的博客甚至是数以万计的论坛、数以万计的新闻源进行实时的大规模文本挖掘计算,并且以某种方式找到万事万物之间的关系。 阅读全文
posted @ 2007-07-24 00:43 老兵笔记 阅读(586) 评论(0) 推荐(0)

上一页 1 ··· 3 4 5 6 7 8 下一页