浙江省高等学校教师教育理论培训

微信搜索“毛凌志岗前心得”小程序

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2012年9月23日

摘要: Installing NLTK — NLTK 2.0 documentationMac/Unix¶Open Finder>Applications>Utilities>Terminal and type python -V to find out what version of Python is installedInstall Setuptools: Download the correspo... 阅读全文
posted @ 2012-09-23 13:43 lexus 阅读(324) 评论(0) 推荐(0)

摘要: 相似度计算的若干函数 - 小小的世界相似度计算的若干函数from math import sqrtdef sim_distance(p1,p2): c=set(p1.keys())&set(p2.keys()) if not c:return 0 sum_of_squares=sum([pow(p1.get(sk)-p2.get(sk),2) for sk in c]) p=1/(1+sq... 阅读全文
posted @ 2012-09-23 10:15 lexus 阅读(357) 评论(0) 推荐(0)

摘要: Excel SUMPRODUCT formula - Syntax, Usage, Examples and Tutorial | Chandoo.org - Learn Microsoft Excel OnlineToday we will learn a new and exciting excel formula – the all powerful SUMPRODUCT.At the ou... 阅读全文
posted @ 2012-09-23 09:36 lexus 阅读(433) 评论(0) 推荐(0)

摘要: Cosine Similarity and Term Weight Tutorialosine Similarity and Term Weight TutorialAn Information Retrieval Tutorial on Cosine Similarity Measures, Dot Products and Term Weight Calculations.Dr. E. Gar... 阅读全文
posted @ 2012-09-23 09:02 lexus 阅读(698) 评论(0) 推荐(0)

摘要: RunningMapReduceExampleTFIDF - hadoop-clusternet - This document describes how to run the TF-IDF MapReduce example against ascii books. - This project is for those who wants to experiment hadoop as a ... 阅读全文
posted @ 2012-09-23 08:59 lexus 阅读(334) 评论(0) 推荐(0)

摘要: RunningMapReduceExampleTFIDF - hadoop-clusternet - This document describes how to run the TF-IDF MapReduce example against ascii books. - This project is for those who wants to experiment hadoop as a ... 阅读全文
posted @ 2012-09-23 08:58 lexus 阅读(182) 评论(0) 推荐(0)

摘要: 向量空间模型 - 维基百科,自由的百科全书向量空间模型 维基百科,自由的百科全书 跳转到: 导航, 搜索 向量空间模型 (或者 词组向量模型) 作为向量的标识符(比如索引),是一个用来表示文本文件的代数模型。它应用于信息过滤、信息检索、索引以及关联规则。SMART是第一个使用这个模型的信息检索系统。目录[隐藏]1 定义2 应用3 范例: tf-idf 权重4 优点5 局限6 基于模型的以及扩展的... 阅读全文
posted @ 2012-09-23 08:54 lexus 阅读(1594) 评论(0) 推荐(0)

摘要: MS Excel: COUNTIF Function (WS)MS Excel: COUNTIF Function (WS)In Excel, the COUNTIF function counts the number of cells in a range, that meets a given criteria.The syntax for the COUNTIF function is:C... 阅读全文
posted @ 2012-09-23 08:46 lexus 阅读(496) 评论(0) 推荐(0)

摘要: PhD Students of Karl Aberer Research Research topics Current Projects Past Projects Partners Awards Events Teaching Current Courses Student Project Offers Ongoing Student Projects Past Courses Complet... 阅读全文
posted @ 2012-09-23 08:24 lexus 阅读(427) 评论(0) 推荐(0)

摘要: Distributed Information SystemsLSIR course, winter semester 2005/2006 (last year's web page)Distributed Information SystemsDescriptionThis course introduces in detail several key technologies underlyi... 阅读全文
posted @ 2012-09-23 08:18 lexus 阅读(217) 评论(0) 推荐(0)

摘要: Exercise 8 - TF/IDF rankingDIS 2006/2007Exercise 8: TF/IDF rankingIn this exercise we'll have a look at how the TF/IDF ranking works.There are 5 different documents in the collection: D1 = "If it wa... 阅读全文
posted @ 2012-09-23 08:12 lexus 阅读(693) 评论(0) 推荐(0)

摘要: 关于python一些常用的语法 - 游空 - 博客园 保留浮点数的小数点。 如保留小数点后两位。 num = 9.2174 new_num = round( num , 2 ) 则new_num = 9.22 (四舍五入)晕。。。。看来常用的东西也不少啊,看来不能堆在一起说了。。。 阅读全文
posted @ 2012-09-23 08:01 lexus 阅读(16412) 评论(0) 推荐(1)

摘要: 详细的tfidf构建过程实例(转) - ancruna的专栏 - 博客频道 - CSDN.NET 详细的tfidf构建过程实例(转) 分类: 算法 2011-04-21 17:31 162人阅读 评论(0) 收藏 举报文本相似计算是进行文本聚类的基础,和传统结构化数值数据的聚类方法类似,文本聚类是通过计算文本之间"距离"来表示文本之间的相似度并产生聚类。文本相似度的常用计算方法有余弦定理和Ja... 阅读全文
posted @ 2012-09-23 07:49 lexus 阅读(796) 评论(0) 推荐(0)

摘要: TF_IDF模型和文本相似度的计算 - icelovely的专栏 - 博客频道 - CSDN.NETTF_IDF模型和文本相似度的计算 分类: 文本检索 2012-04-08 15:47 91人阅读 评论(0) 收藏 举报TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与文本挖掘的常用加权技术。TF-IDF是一种统计方法,用以... 阅读全文
posted @ 2012-09-23 01:41 lexus 阅读(651) 评论(0) 推荐(0)