/*自定义导航栏*/
摘要: 伏草惟存,五年博客精选系列文章 作者:白宁超 2017年8月28日10:18:28 摘要:在技术学习的过程中,坚持记录是一个不错的习惯,笔者坚持五年来收益颇丰。不久前,反观之前之前的文章,层次不齐,质量不一,篇间散乱。于是着手对170余篇文章反复整理完善得到如下入口,主要是分类形式展示,多为笔者学习阅读全文
posted @ 2017-08-28 10:19 伏草惟存 阅读(1294) 评论(9) 编辑
摘要: 摘要:近来自然语言处理行业发展朝气蓬勃,市场应用广泛。笔者学习以来写了不少文章,文章深度层次不一,今天因为某种需要,将文章全部看了一遍做个整理,也可以称之为概述。关于这些问题,博客里面都有详细的文章去介绍,本文只是对其各个部分高度概括梳理。(本文原创,转载注明出处:自然语言处理学习中需要了解的几个问题 )阅读全文
posted @ 2016-09-23 00:51 伏草惟存 阅读(39348) 评论(5) 编辑
摘要: 导读:k-均值算法(英文:k-means clustering),属于比较常用的算法之一,文本首先介绍聚类的理论知识包括什么是聚类、聚类的应用、聚类思想、聚类优缺点等等;然后通过k-均值聚类案例实现及其可视化有一个直观的感受,针对算法模型进行分析和结果优化提出了二分k-means算法。最后我们调用机器学习库函数,很短的代码完成聚类算法。(本文原创,转载必须注明出处: 决策树模型算法研究与案例分析)阅读全文
posted @ 2018-09-13 09:13 伏草惟存 阅读(222) 评论(0) 编辑
摘要: 导读:逻辑回归(Logistic regression)即逻辑模型,属于常见的一种分类算法。本文将从理论介绍开始,搞清楚什么是逻辑回归、回归系数、算法思想、工作原理及其优缺点等。进一步通过两个实际案例深化理解逻辑回归,以及在工程应用进行实现。(本文原创,转载必须注明出处: 决策树模型算法研究与案例分析)阅读全文
posted @ 2018-09-06 16:32 伏草惟存 阅读(148) 评论(0) 编辑
摘要: 朴素贝叶斯模型是机器学习常用的模型算法之一,其在文本分类方面简单易行,且取得不错的分类效果。所以很受欢迎,对于朴素贝叶斯的学习,本文首先介绍理论知识即朴素贝叶斯相关概念和公式推导,为了加深理解,采用一个维基百科上面性别分类例子进行形式化描述。然后通过编程实现朴素贝叶斯分类算法,并在屏蔽社区言论、垃圾邮件、个人广告中获取区域倾向等几个方面进行应用。由于篇幅较长,采用理论理解、案例实现、sklearn优化三个部分进行学习。(本文原创,转载必须注明出处: 朴素贝叶斯模型算法研究与实例分析)阅读全文
posted @ 2018-09-04 15:47 伏草惟存 阅读(175) 评论(0) 编辑
摘要: 朴素贝叶斯模型是机器学习常用的模型算法之一,其在文本分类方面简单易行,且取得不错的分类效果。所以很受欢迎,对于朴素贝叶斯的学习,本文首先介绍理论知识即朴素贝叶斯相关概念和公式推导,为了加深理解,采用一个维基百科上面性别分类例子进行形式化描述。然后通过编程实现朴素贝叶斯分类算法,并在屏蔽社区言论、垃圾邮件、个人广告中获取区域倾向等几个方面进行应用,由于篇幅较长,采用理论理解、案例实现、sklearn优化三个部分进行学习。(本文原创,转载必须注明出处:朴素贝叶斯模型算法研究与实例分析)阅读全文
posted @ 2018-09-04 09:05 伏草惟存 阅读(199) 评论(0) 编辑
摘要: 朴素贝叶斯模型是机器学习常用的模型算法之一,其在文本分类方面简单易行,且取得不错的分类效果。所以很受欢迎,对于朴素贝叶斯的学习,本文首先介绍理论知识即朴素贝叶斯相关概念和公式推导,为了加深理解,采用一个维基百科上面性别分类例子进行形式化描述。然后通过编程实现朴素贝叶斯分类算法,并在屏蔽社区言论、垃圾邮件、个人广告中获取区域倾向等几个方面进行应用,包括创建数据集、数据预处理、词集模型和词袋模型、朴素贝叶斯模型训练和优化等。然后结合复旦大学新闻语料进行朴素贝叶斯的应用。最后,大家熟悉其原理和实现之后,采用机器学习sklearn包进行实现和优化。由于篇幅较长,采用理论理解、案例实现、sklearn优化三个部分进行学习。(本文原创,转载必须注明出处:朴素贝叶斯模型算法研究与实例分析)阅读全文
posted @ 2018-09-03 17:54 伏草惟存 阅读(235) 评论(0) 编辑
摘要: 决策树算法是一种基本的分类与回归方法,是最经常使用的算法之一。决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是基于规则的集合。本文首先介绍决策树定义、工作原理、算法流程、优缺点等,然后结合案例进行分析。(本文原创,转载必须注明出处: 决策树模型算法研究与案例分析)阅读全文
posted @ 2018-08-27 16:34 伏草惟存 阅读(206) 评论(1) 编辑
摘要: 随着人工智能的快速发展,自然语言处理和机器学习应用愈加广泛。但是对于初学者入门还是有一定难度,对于该领域整体概况不能明晰。本章主要从发展历程、研究现状、应用前景等角度整体介绍自然语言处理和机器学习,让读者对该技术领域有个系统而全面的认识。阅读全文
posted @ 2018-08-23 10:53 伏草惟存 阅读(155) 评论(0) 编辑
摘要: 表格语法 无序列表 有序列表 分割线 MarkdownPad 2 常用快捷键 代码高亮 在线公式编辑 点击在线LaTeX编辑方式:http://www.codecogs.com/latex/eqneditor.php 在对话框中输入数学公式(使用TeX语法),比如输入 x=\frac{-b\pm\s阅读全文
posted @ 2018-08-15 10:23 伏草惟存 阅读(30) 评论(0) 编辑
摘要: 导读:机器学习算法中KNN属于比较简单的典型算法,既可以做聚类又可以做分类使用。本文通过一个模拟的实际案例进行讲解。整个流程包括:采集数据、数据格式化处理、数据分析、数据归一化处理、构造算法模型、评估算法模型和算法模型的应用。(本文原创,转载必须注明出处: 基于KNN分类算法模型为案例进行机器学习研究)阅读全文
posted @ 2018-07-24 08:52 伏草惟存 阅读(256) 评论(0) 编辑
摘要: 导读:随着大数据的快速发展,自然语言处理、数据挖掘、机器学习技术应用愈加广泛。针对大数据的预处理工作是一项庞杂、棘手的工作。首先数据采集和存储,尤其高质量数据采集往往不是那么简单。采集后的信息文件格式不一,诸如pdf,doc,docx,Excel,ppt等多种形式。然而最常见便是txt、pdf和word类型的文档。本文主要对pdf和word文档进行文本格式转换成txt。格式一致化以后再进行后续预处理工作。笔者采用一些工具转换效果都不理想,于是才出现本系统的研究与实现。(本文原创,转载必须注明出处: 数据分析:基于Python的自定义文件格式转换系统 )阅读全文
posted @ 2018-07-18 17:29 伏草惟存 阅读(339) 评论(2) 编辑
摘要: 本书分四个部分,第一部分主要介绍基础知识,包括认识机器学习和自然语言处理、快速上手Python、线性代数、概率论和统计学;第二部分主要介绍自然语言处理技术,包括自然语言处理介绍、语料库技术、中文分词、数据预处理、马尔科夫模型、条件随机场、模型评估、剖析自然处理工具背后的原理;第三部分主要介绍机器学习技术,包括认识机器学习、常见机器学习算法、机器学习算法案例源码实现。第四部分主要介绍工程项目实践,包括Python项目实战、自然语言处理项目实战、机器学习结合自然语言处理综合项目实战。阅读全文
posted @ 2018-07-13 16:38 伏草惟存 阅读(414) 评论(0) 编辑
摘要: 在阅读python相关书籍中,对其进行简单的笔记纪要。旨在注意一些细节问题,在今后项目中灵活运用,并对部分小notes进行代码标注。阅读全文
posted @ 2018-07-09 11:08 伏草惟存 阅读(616) 评论(2) 编辑
摘要: 手记实用系列文章: 1 结巴分词和自然语言处理HanLP处理手记 2 Python中文语料批量预处理手记 3 自然语言处理手记 4 Python中调用自然语言处理工具HanLP手记 5 Python中结巴分词使用手记 代码封装类: 运行效果:阅读全文
posted @ 2017-10-16 11:41 伏草惟存 阅读(2437) 评论(0) 编辑
摘要: 手记实用系列文章: 1 结巴分词和自然语言处理HanLP处理手记 2 Python中文语料批量预处理手记 3 自然语言处理手记 4 Python中调用自然语言处理工具HanLP手记 5 Python中结巴分词使用手记 语料预处理封装类: 执行结果:阅读全文
posted @ 2017-10-16 11:39 伏草惟存 阅读(1835) 评论(0) 编辑
摘要: 手记实用系列文章: 1 结巴分词和自然语言处理HanLP处理手记 2 Python中文语料批量预处理手记 3 自然语言处理手记 4 Python中调用自然语言处理工具HanLP手记 5 Python中结巴分词使用手记 HanLP方法封装类: HanLP运行结果: python调用HanLP的jar包阅读全文
posted @ 2017-10-16 11:37 伏草惟存 阅读(2414) 评论(0) 编辑
摘要: 手记实用系列文章: 1 结巴分词和自然语言处理HanLP处理手记 2 Python中文语料批量预处理手记 3 自然语言处理手记 4 Python中调用自然语言处理工具HanLP手记 5 Python中结巴分词使用手记 结巴分词方法封装类 结巴分词的运行结果阅读全文
posted @ 2017-10-16 11:34 伏草惟存 阅读(2193) 评论(0) 编辑
摘要: 手记实用系列文章: 1 结巴分词和自然语言处理HanLP处理手记 2 Python中文语料批量预处理手记 3 自然语言处理手记 4 Python中调用自然语言处理工具HanLP手记 5 Python中结巴分词使用手记 1 中文自然语言预处理 实验数据预处理(本文采用python版结巴分词) 1.对于阅读全文
posted @ 2017-10-16 11:27 伏草惟存 阅读(331) 评论(0) 编辑
摘要: 伏草惟存,五年博客精选系列文章 作者:白宁超 2017年8月28日10:18:28 摘要:在技术学习的过程中,坚持记录是一个不错的习惯,笔者坚持五年来收益颇丰。不久前,反观之前之前的文章,层次不齐,质量不一,篇间散乱。于是着手对170余篇文章反复整理完善得到如下入口,主要是分类形式展示,多为笔者学习阅读全文
posted @ 2017-08-28 10:19 伏草惟存 阅读(1294) 评论(9) 编辑
摘要: 摘要:上文号称【最为简明实用的Django上手教程】介绍了django基本概念、配置和相关操作。相信通过上文的阅读,基本明白django运行机制和操作。假设你现在通过dome和相关书籍已经基本理解django这台机器的运行。下一步如何像asp.net、Jsp,PHP等常规网站开发,进行前后台交互呢?又如何采用较为简洁美观的前端框架进行设计呢?假设你需要配置多个数据库怎么办?静态文件单独存放需要哪些配置?针对这些配置有哪些便利?最后,假设你又是一名对数据开发很感兴趣的,且学过一些机器学习,数据挖掘,自然语言处理,云计算等技术之一,想挖掘分析数据并进行可视化,怎么办?本文就是针对这些问题开始的。(本文原创编著,转载注明出处:号称最为简明实用的Django上手教程(下))阅读全文
posted @ 2017-08-25 08:52 伏草惟存 阅读(978) 评论(0) 编辑
摘要: 摘要:Django的学习教程也是分门别类,形式不一。或是较为体系的官方文档,或者风格自由的博客文档,或者偏向实例的解析文档。即使官方文档,章节较多,文字阐述累赘,有时候我们只是关注某个功能用法而已,而自由博文最大的问题是互相抄袭,结构混乱,涵盖面小且错误较为明显。由此,本文结合学习期间资料梳理和项目开发经验,整理出一套较为常用实用的文章。适用于(1)新手入门,无论C#,C,java,Python,R等具有任何编程语言基础均可;(2)想快速了解Django并可以快速开发上手者。(3)适用于作为资料查询,技术点参考。(本文原创编著,转载注明出处:号称最为简明实用的Django上手教程)阅读全文
posted @ 2017-08-24 13:38 伏草惟存 阅读(2494) 评论(1) 编辑