摘要: IDE:Intellij idea 1. 参考了stackoverflow上诸多答案,一般是修改VM,设置_JAVA_OPTIONS,使用idea64.exe等,但仍然报错。 2. 参考此博客后,柳暗花明http://blog.csdn.net/u014749291/article/details/ 阅读全文
posted @ 2017-02-08 15:53 温暖的挪挪 阅读(749) 评论(0) 推荐(0) 编辑
摘要: 引言最近在面试中,除了基础 & 算法 & 项目之外,经常被问到或被要求介绍和描述下自己所知道的几种分类或聚类算法(当然,这完全不代表你将来的面试中会遇到此类问题,只是因为我的简历上写了句:熟悉常见的聚类 & 分类算法而已),而我向来恨对一个东西只知其皮毛而不得深入,故写一个有关数据挖掘十大算法的系列... 阅读全文
posted @ 2015-08-20 15:42 温暖的挪挪 阅读(738) 评论(0) 推荐(0) 编辑
摘要: Matplotlib是一个Python工具箱,用于科学计算的数据可视化。借助它,Python可以绘制如Matlab和Octave多种多样的数据图形。安装Matplotlib并不是Python的默认组件,需要额外安装。官方下载地址http://matplotlib.org/downloads.html... 阅读全文
posted @ 2015-07-02 14:14 温暖的挪挪 阅读(9785) 评论(0) 推荐(0) 编辑
摘要: 一.分词软件简介分词算法在20世纪80年代就有研究,不过基于当时的技术条件所限,大多数就是原始的机械分词算法。比如,最大匹配算法,mmseg等。关于原始的机械分词算法http://www.cnblogs.com/alic/articles/1215001.html这篇blog有很详细的介绍。之后随着... 阅读全文
posted @ 2015-07-01 16:01 温暖的挪挪 阅读(902) 评论(0) 推荐(0) 编辑
摘要: 3.加工原料文本3.1 字符串:最底层的文本处理我们侧重于将文本作为一个词链表。通过使用NLTK 中的语料库接口,我们可以忽略这些文本所在的文件。一个词的内容,一个文件的内容在编程语言中是由一个叫做字符串的基本数据类型来表示的。3.2使用Unicode进行文字处理Unicode 支持超过一百万种字符... 阅读全文
posted @ 2015-07-01 15:25 温暖的挪挪 阅读(2088) 评论(0) 推荐(0) 编辑
摘要: 1.自然语言工具包(NLTK)NLTK 创建于2001 年,最初是宾州大学计算机与信息科学系计算语言学课程的一部分。从那以后,在数十名贡献者的帮助下不断发展壮大。如今,它已被几十所大学的课程所采纳,并作为许多研究项目的基础。表P -2 列出了NLTK 的一些最重要的模块。这本书提供自然语言处理领域非... 阅读全文
posted @ 2015-07-01 11:36 温暖的挪挪 阅读(859) 评论(0) 推荐(0) 编辑
摘要: 自己最近学习了正则表达式,整理了一些关于Python的优秀博文,大家可以拿来参考学习:1. google 搜索引擎排名第一的 ”Python正则表达式“http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html但作为初学者来说,此文比较硬骨... 阅读全文
posted @ 2015-06-29 17:11 温暖的挪挪 阅读(182) 评论(0) 推荐(0) 编辑
摘要: 原文为发表于Communications of the ACM 2012年第10期的“A Few Useful Things to Know About Machine Learning”,虽然发表于2012年,但是作者提出的观点对于今天仍有很多借鉴意义。作者:佩德罗·多明戈斯(Pedro Domi... 阅读全文
posted @ 2015-06-29 17:02 温暖的挪挪 阅读(562) 评论(0) 推荐(0) 编辑
摘要: Google 开源项目风格指南Python风格规范分号Tip不要在行尾加分号, 也不要用分号将两条命令放在同一行.行长度Tip每行不超过80个字符例外:长的导入模块语句注释里的URL不要使用反斜杠连接行.Python会将圆括号, 中括号和花括号中的行隐式的连接起来, 你可以利用这个特点. 如果需要,... 阅读全文
posted @ 2015-06-23 10:04 温暖的挪挪 阅读(235) 评论(0) 推荐(1) 编辑
摘要: 一段逻辑既可以做一个module,也可以做一个class老早之前就在纠结这个问题,实在找不出个界限最近和同事讨论了一下,有了新的认识,和大家讨论一下1.module比较关注的是功能方面,它把方法收集在一起,组成一个特殊的上下文,通常表示一种能力,比如Enumerable。2.class就是我们所理解... 阅读全文
posted @ 2015-06-05 16:35 温暖的挪挪 阅读(1443) 评论(0) 推荐(0) 编辑