旁观者

参与软件开发开发这些年来,不断地遇到新领域新知识点,屡屡感受到新进入者的迷惑和彷徨,所以对遇到的每一个问题都详细记录问题现象、解决思路以及解决方案,并在blog中留下印迹,以备他日有心人google之而知之。
你们的新手之痛,你们的新业务发展之初的思路混沌,我都感同身受,所以欢迎和我一起探讨这些话题,诸如,文本挖掘/自然语言处理/Web3.0/J2ME/Web2.0/IVR/SMS/MMS/WAP/SIP/等等,知无不言言无不尽。
posts - 361, comments - 668, trackbacks - 36, articles - 0
   ::  ::  ::  :: 订阅 订阅 :: 管理

Search Engine

     摘要: 这里有三个答案。

一个是,针对微软整个互联网体系的广告主的。简单地说,就是利用Powerset的语义技术加强Contextual Advertising(粗糙的翻译就是:上下文广告),提高微软互联网体系中的广告转化率。众所周知,Google拥有地球上最强的关联广告引擎,非 Yahoo!所能望其项背,并与之合作。不光是微软Live Search需要高转化率的Contextual Advertising,MSN、Live等都需要有这个武器,才能在未来的广告世界中勉强站住脚。想想看,Google最近的Google Trends流量分析、Ad Planner、雅虎谷歌广告合作等一系列大的小的布局,用不了几年工夫,估计就赢者通吃整个生物链了。

另一个是,针对搜索用户的。即Powerset的语义搜索是Google关键词搜索进化的下一步,理应提供给用户更高的用户搜索体验。这里,Powerset往往强调的是,它们能够更精准地体会用户搜索的意图,给出更符合用户需求的搜索结果。

这里容易被质疑的是,统计表明,目前搜  阅读全文

posted @ 2008-07-09 00:37 旁观者 阅读(333) | 评论 (1)  编辑 |

     摘要: 书接上回《自然语言处理能够把全网内容组织到什么程度?》。
百度新闻和google新闻都是不错的新闻聚合,内容组织得不错。
他们的区别有几点:
1:是否提供新闻摘要?
2:是否可定制?
3:是否可根据用户习惯推荐资讯?
通过以上比较,我们可以看到:
1:论技术,google胜过百度;
2:论产品整合程度,google胜过百度;
3:论个性化定制和“更了解人”,google胜过百度;
4:论“更了解中国人想看什么”,百度胜过google。

那么我们的自然语言处理如何帮助人们阅读资讯呢?
显然,新闻聚合模式,暂时无人能出google新闻之右。
那我们只能攻击他们的弱点,也就是在资讯中搜索的结果了。  阅读全文

posted @ 2007-03-31 12:34 旁观者 阅读(347) | 评论 (0)  编辑 |

     摘要: 发现数位之墙竟然在半年前曾经这么说过,呵呵,很像我们最开始谈起的概念,只不过不再是搜索引擎人员来做“搜罗”,而是机器自动生成的,从而发现所有热点,并进一步精耕细作为一个一个有趣的话题,继而串连起来形成专题。百度新闻、Google新闻的原理也就是这样。只不过,新闻的自然语言处理还是相对简单的,毕竟文字规整,内容聚焦性强,发散性弱。网民零散的语言则更发散,更无厘头,文字风格更迥异,所以对自然语言处理提出了更高的要求。  阅读全文

posted @ 2007-03-16 12:08 旁观者 阅读(217) | 评论 (0)  编辑 |

     摘要: 现在脱胎换骨的Jookster,主要是从主流的web2.0站点,如myspace、Youtube等站点抓取UGC内容,定位到人/ID,而不仅仅像以前的Jookster一样做内容搜索或者bookmark搜索。  阅读全文

posted @ 2006-11-21 15:34 旁观者 阅读(326) | 评论 (0)  编辑 |