摘要: 1、修改mysql的my.ini文件: 在 [client] 下面增加 default-character-set=utf8 在 [mysqld] 下面增加: character_set_server=utf8 2、创建数据库: 示例创建数据库代码: 注意:在这之后的数据库才没有中文乱码的问题 阅读全文
posted @ 2017-04-17 21:53 赵半仙并不会算命 阅读(860) 评论(0) 推荐(0) 编辑
摘要: 使用javamail发送包含八位验证码的邮件(完美解决中文乱码问题) 阅读全文
posted @ 2017-03-28 12:05 赵半仙并不会算命 阅读(1026) 评论(0) 推荐(0) 编辑
摘要: kNN算法原理 k最近邻(k-Nearest Neighbor)算法是比较简单的机器学习算法。它采用测量不同特征值之间的距离方法进行分类,思想很简单:如果一个样本在特征空间中的k个最近邻(最相似)的样本中大多数属于某一个类别,则该样本也属于这个类别。 kNN算法的步骤 第一阶段:确定k值(指最近的邻 阅读全文
posted @ 2017-03-27 12:34 赵半仙并不会算命 阅读(2275) 评论(0) 推荐(0) 编辑
摘要: 前言 朴素贝叶斯是一种十分简单的分类算法,称其朴素是因为其思想基础的简单性,就文本分类而言,他认为词袋中的两两词之间的关系是相互独立的,即一个对象的特征向量中的每个维度都是互相独立的。这是朴素贝叶斯理论的思想基础。 贝叶斯公式推导 朴素贝叶斯分类的正式定义: 那么关键就是如何计算第三步中的各个条件概 阅读全文
posted @ 2017-03-27 11:34 赵半仙并不会算命 阅读(4741) 评论(0) 推荐(1) 编辑
摘要: 背景 文本挖掘是指从大量文本数据中抽取实现未知的、可理解的、最终可用的知识的过程,同时运用这些知识更好地组织信息以便将来参考。即从非结构化的文本中寻找知识的过程。 目前文本挖掘主要有7个主要领域: · 搜索和信息检索IR · 文本聚类:使用聚类方法对词汇、片段、段落或文件进行分组和归类 · 文本分类 阅读全文
posted @ 2017-03-27 09:08 赵半仙并不会算命 阅读(22851) 评论(5) 推荐(2) 编辑
摘要: 第一次安装双系统的时候由于不怎么会弄,设置了ubuntu引导windows,这种方法是非常不推荐的,因为当ubuntu出现问题或者是当你不再使用ubuntu的时候,删除ubuntu就会成为一个很麻烦的问题,本人也遇到了这样的问题,然后直接删除了安装有ubuntu的磁盘(愚蠢),结果再次开机,就直接进 阅读全文
posted @ 2017-03-17 09:32 赵半仙并不会算命 阅读(5587) 评论(0) 推荐(1) 编辑