Fork me on GitHub
摘要: 一、前述 关联规则的目的在于在一个数据集中找出项之间的关系,也称之为购物蓝分析 (market basket analysis)。例如,购买鞋的顾客,有10%的可能也会买袜子,60%的买面包的顾客,也会买牛奶。这其中最有名的例子就是"尿布和啤酒"的故事了。 二、相关概念 交易集:包含所有数据的一个数 阅读全文
posted @ 2018-04-07 18:41 L先生AI课堂 阅读(1875) 评论(0) 推荐(0)
摘要: 一、前述 Sed是一种流编辑器,它是文本处理中非常中的工具,能够完美的配合正则表达式使用,功能不同凡响。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到 阅读全文
posted @ 2018-04-07 17:19 L先生AI课堂 阅读(882) 评论(0) 推荐(0)
摘要: 一、前述 awk是一个强大的文本分析工具。相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入,(空格,制表符)为默认分隔符将每行切片,切开的部分再进行各种分析处理。 二、具体 1、基础知识点 awk -F '{pattern + a 阅读全文
posted @ 2018-04-07 17:06 L先生AI课堂 阅读(294) 评论(0) 推荐(0)
摘要: 一、前述 机器学习算法中,有种依据概率原则进行分类的朴素贝叶斯算法,正如气象学家预测天气一样,朴素贝叶斯算法就是应用先前事件的有关数据来估计未来事件发生的概率。 二、具体 1、背景--贝叶斯定理引入对于两个关联事件(非独立事件)A和B,同时发生的概率为:P(AB)=P(A|B)P(B)=P(B|A) 阅读全文
posted @ 2018-04-07 15:28 L先生AI课堂 阅读(423) 评论(0) 推荐(0)