浙江省高等学校教师教育理论培训

微信搜索“毛凌志岗前心得”小程序

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2012年9月22日

摘要: Cloudera's Hadoop Demo VM for CDH4 - Cloudera SupportRunning the VMOnce you launch the VM, you are automatically logged in as the cloudera user. The account details are:username: clouderapassword: cl... 阅读全文
posted @ 2012-09-22 17:25 lexus 阅读(288) 评论(0) 推荐(0)

摘要: Leoncom » 利用Simrank算法进行Query Rewriting利用Simrank算法进行Query Rewritingleoncom 搜索技术 2011-05-19搜索引擎的检索结果页下方一般会提示多个相似的搜索关键词,这些词可以被看作查询关键词query的rewriting。在计算广告中,当某一个query没有对应的bid phase出价广告,或者该query对应的bid phas... 阅读全文
posted @ 2012-09-22 14:39 lexus 阅读(1296) 评论(0) 推荐(0)

摘要: resemblance with the jaccard coefficient<< back to other nerdy projectspart 1: resemblance with the jaccard coefficientpart 2: fastmap projection using jaccard distancespart 3: the simhash algorithmpa... 阅读全文
posted @ 2012-09-22 14:33 lexus 阅读(373) 评论(0) 推荐(0)

摘要: 2012 Beijing Google Dev FastDay(11/03/2012) - 移动新观察亲爱的北京谷歌技术用户组GDG成员们及Google技术爱好者们,今年的Google FastDay又要和大家见面了,如果你关注移动开发、跨平台开发、Web 前端开发以及Google技术创业领域,那么本次活动对你会很有帮助,我们北京GDG也希望借此机会和各位开发者、开发商们一起展望最新的Google... 阅读全文
posted @ 2012-09-22 14:26 lexus 阅读(338) 评论(0) 推荐(0)

摘要: 海量文档查同或聚类问题 -- Locality Sensitive Hash 算法 - fxjtoday的专栏 - 博客频道 - CSDN.NET海量文档查同或聚类问题 -- Locality Sensitive Hash 算法 分类: Web Data Mining Algorithm 2011-02-22 15:56 737人阅读 评论(0) 收藏 举报 Normal 0 ... 阅读全文
posted @ 2012-09-22 14:21 lexus 阅读(383) 评论(0) 推荐(0)

摘要: Min-Hash和推荐系统 | IT瘾Min-Hash和推荐系统标签: 未分类 | 发表时间:2012-06-22 12:56 | 作者:xlvector分享到:出处:http://xlvector.net/blog前几年看Google News Recommendation的那篇Paper,对里面提到的MinHash的算法基本没有注意,因为之前的习惯都是只注意论文的模型那块,至于怎么优化模型... 阅读全文
posted @ 2012-09-22 14:11 lexus 阅读(579) 评论(0) 推荐(0)

摘要: 张栋_机器学习的照片 - 微相册微相册小图中图大图特大图上传照片 相册首页 阅读全文
posted @ 2012-09-22 14:10 lexus 阅读(273) 评论(0) 推荐(0)

摘要: 基于Simhash的应用模板识别Perl_信息安全自留地_百度空间|文章出处:http://hi.baidu.com/_wang8基于Simhash的应用模板识别Perl demo对于同一应用模板生成不同的url,url可能的pathdir、filename、arguments的一项或者几项可能不同。同时web页面的展示一眼看过去也差别较大。在url聚类的需求场合,需要能自动识别web/url的相... 阅读全文
posted @ 2012-09-22 13:43 lexus 阅读(273) 评论(0) 推荐(0)

摘要: cascading-simhash a library to cluster by minhashes in Hadoop« Why is XOR the default way to combine hasheshector.rb: the pleasant JRuby Cassandra client (wraps Hector) »cascading-simhash a library to... 阅读全文
posted @ 2012-09-22 13:34 lexus 阅读(349) 评论(0) 推荐(0)

摘要: Leoncom » simhashsimhash与Google的网页去重leoncom 搜索技术 4 comments前几天去吃葫芦头的路上,大飞哥给详细的讲解了他在比较文本相似度实验时对Google的simhash方法高效的惊叹,回来特意去找了原文去拜读。Simhash传统IR领域内文本相似度比较所采用的经典方法是文本相似度的向量夹角余弦,其主要思想是根据一个文章中出现词的词频构成一个向量,然后... 阅读全文
posted @ 2012-09-22 13:03 lexus 阅读(349) 评论(0) 推荐(0)

摘要: Download RubyAs of this writing, as long as you have git installed, you can install RVM with:$ curl -L get.rvm.io | bash -s stable 阅读全文
posted @ 2012-09-22 12:56 lexus 阅读(200) 评论(0) 推荐(0)

摘要: ubuntu - Installed Ruby 1.9.3 with RVM but command line doesn't show ruby -v - Stack Overflowou have broken version of RVM - Ubuntu does something to RVM that produces lots of errors, the only safe wa... 阅读全文
posted @ 2012-09-22 12:50 lexus 阅读(166) 评论(0) 推荐(0)

摘要: 计算机科学中最重要的32个算法zzhttp://www.infoq.com/cn/news/2012/08/32-most-important-algorithms 奥地利符号计算研究所(Research Institute for Symbolic Computation,简称RISC)的Christoph Koutschan博士在自己的页面上发布了一篇文章,提到他做了一个调查,参与者大多数是... 阅读全文
posted @ 2012-09-22 12:03 lexus 阅读(335) 评论(0) 推荐(0)

摘要: 《周末休闲吧》:教你如何玩车震——车震全程攻略!_周末休闲吧_百度空间《周末休闲吧》:教你如何玩车震——车震全程攻略! 阅读全文
posted @ 2012-09-22 11:56 lexus 阅读(1555) 评论(0) 推荐(0)

摘要: SQOOP的安装配置_Linux伊甸园开源社区-24小时滚动更新开源资讯,全年无休!SQOOP是一款开源的工具,主要用于在HADOOP与传统的数据库间进行数据的传递,下面从SQOOP用户手册上摘录一段描述Sqoop is a tool designed to transfer data between Hadoop andrelational databases. You can use Sqoo... 阅读全文
posted @ 2012-09-22 11:51 lexus 阅读(451) 评论(0) 推荐(0)

摘要: Hive官方手册翻译(Getting Started) - 实践检验真理 - 51CTO技术博客Hive官方手册翻译(Getting Started)2012-07-23 16:18:12标签:手册 hadoop hive版权声明:原创作品,如需转载,请与作者联系。否则将追究法律责任。翻译Hive官方文档系列,文中括号中包含 注: 字样的,为我自行标注的,水平有限,翻译不是完美无缺的。如有疑问,请... 阅读全文
posted @ 2012-09-22 10:46 lexus 阅读(392) 评论(0) 推荐(0)

摘要: 百度技术沙龙宗旨“畅想•交流•争鸣•聚会”是百度技术沙龙的宗旨。 百度技术沙龙是由百度与InfoQ中文站定期组织的线下技术交流活动。目的是让中高端技术人员有一个相对自由的思想交流和交友沟通的平台。主要分讲师分享和OpenSpace两个关键环节,每期只关注一个焦点话题。讲师分享和现场Q&A让大家了解百度和其他知名网站技术支持的先进实践经验,OpenSpace环节是百度技术沙龙主题的升华和展开,提供一... 阅读全文
posted @ 2012-09-22 10:34 lexus 阅读(332) 评论(0) 推荐(0)

摘要: thrift安装 - xiaoshe的专栏 - 博客频道 - CSDN.NET thrift安装 分类: thrift 2011-06-21 09:05 876人阅读 评论(1) 收藏 举报 Thrift是Facebook开发出的一个软件库和一组代码生成工具,以加快高效率、可扩展的后端服务的开发与实现的速度。它通过对各语言最常用的部分加以抽象,把它们放进一个通用库里,再用各个语言实现,来实现跨... 阅读全文
posted @ 2012-09-22 10:32 lexus 阅读(314) 评论(0) 推荐(0)

摘要: 相似数据检测算法szzhao的日记szzhao的主页广播相册喜欢二手活动发豆邮相似数据检测算法2011-10-26 14:47:46相似数据检测算法对给定的一对数据序列计算两者之间的相似度([0,1], 1表示完全相同)或距离([0, ), 0表示完全相同),从而度量数据之间的相似程度。相似数据检测在信息科学领域具有非常重要的应用价值,比如搜索引擎检索结果的聚类与排序、数据聚类与分类、Spam检测... 阅读全文
posted @ 2012-09-22 09:56 lexus 阅读(479) 评论(0) 推荐(0)