随笔分类 -  数据挖掘(Python)

摘要:频繁项集 >产生强关联规则的过程 1.由Apriori算法(当然别的也可以)产生频繁项集 2.根据选定的频繁项集,找到它所有的非空子集 3.强关联规则需要满足最小支持度和最小置性度 (假设关联规则是:A=>B , support(A=>B)= { P(AUB) } confidence(A=>B)= 阅读全文
posted @ 2018-01-05 10:48 soyosuyang 阅读(7905) 评论(1) 推荐(1)
摘要:版权声明:本文为博主原创文章,未经博主允许不得转载。 Apriori算法: 使用一种称为逐层搜索的迭代方法,其中K项集用于搜索(K+1)项集。 首先,通过扫描数据库,统计每个项的计数,并收集满足最小支持度的项,找出频繁1项集的集合。该集合记为L1。然后,使用L1找出频繁2项集的集合L2,使用L2找出 阅读全文
posted @ 2018-01-04 11:21 soyosuyang 阅读(959) 评论(0) 推荐(0)
摘要:结果: **********文件操作***********['soyo8,35\n', '\xe5\xb0\x8f\xe5\x91\xa8,30\n', '\xe5\xb0\x8f\xe5\x8d\x8e,19\n', 'soyo,88\n']soyo8,35小周,30小华,19soyo,88['s 阅读全文
posted @ 2018-01-02 19:57 soyosuyang 阅读(188) 评论(0) 推荐(0)
摘要:结果: ***********集合操作************set([8, 9, 10])set([8, 65, 78, 9])集合的差-->属于set2而不属于set3set([10])集合的并set([65, 8, 9, 10, 78])集合的交set([8, 9])集合的异或-->(并集-交 阅读全文
posted @ 2018-01-02 17:42 soyosuyang 阅读(129) 评论(0) 推荐(0)
摘要:结果: ************字典的遍历*************['hadoops', 'soyo1', 'kafka']['hadoops', 'soyo1', 'kafka']['kafka', 'soyo1', 'hadoops']['hadoops', 'kafka', 'soyo1'] 阅读全文
posted @ 2018-01-02 17:02 soyosuyang 阅读(163) 评论(0) 推荐(0)
摘要:结果: i learn python and learn Spark i ki leari like 'Spark' Python 具有丰富的库,\ 使用用途很广。常见的就是对机器学习的使用。但是,'Spark' 也很强哦 E:ote\Python.docE:\note\Python.doc 字符串 阅读全文
posted @ 2017-12-31 13:38 soyosuyang 阅读(166) 评论(0) 推荐(0)
摘要:结果: 7 ['\xe4\xb8\xad\xe5\x9b\xbd', '\xe5\x92\x8c', '\xe9\x9f\xa9\xe5\x9b\xbd', '\xe7\x9a\x84\xe5\x8c\xba\xe5\x88\xab']中国和韩国的区别 <type 'str'><type 'unic 阅读全文
posted @ 2017-12-31 13:06 soyosuyang 阅读(7396) 评论(0) 推荐(0)
摘要:结果:201005.0efgsoyo12soyosoyo89012345678910soyo88111213141516171819345672581114*************234[1, 2, 3]******************234soyosoyo[2, 3, 4]3******** 阅读全文
posted @ 2017-12-27 15:48 soyosuyang 阅读(184) 评论(0) 推荐(0)
摘要:问题: ubuntu16.04 Anaconda 安装成功 Eclispe 写Python代码 无法使用 (pandas库等) 原因: Eclispe 此时的python解释器==>用的并不是Anaconda 解决办法: eclipse 使用Anaconda python 解释器 (就是使eclip 阅读全文
posted @ 2017-12-27 15:32 soyosuyang 阅读(1508) 评论(0) 推荐(0)
摘要:Python Anaconda 不同版本在官网上的位置:https://www.anaconda.com/download/#linux进入官网=》Changelog=》Product specifications=》 Old package lists=》Anaconda installer ar 阅读全文
posted @ 2017-12-27 15:26 soyosuyang 阅读(1706) 评论(0) 推荐(0)
摘要:鼠标移动到新建项目处 ,右键->run as-> run configuration->选择Enable auto build 即可。 阅读全文
posted @ 2017-12-27 15:17 soyosuyang 阅读(258) 评论(0) 推荐(0)
摘要:这个问题挺好解决: sudo gedit /usr/share/applications/eclipse.desktop在这个文件中将Icon=/home/soyo/eclipse/icon.xpm,Exec=/home/soyo/eclipse/eclipse,的路径更改成本机eclipse的安装 阅读全文
posted @ 2017-12-27 15:16 soyosuyang 阅读(818) 评论(0) 推荐(0)
摘要:1.将下载好的Pydev4.5.2(http://sourceforge.net/projects/pydev/files/pydev/ 里面有很多版本) 文件夹里的两个文件夹(features+plugins)复制到安装eclipse目录下的dropins文件夹内,命令就是上面的(直接鼠标复制就可 阅读全文
posted @ 2017-12-27 15:13 soyosuyang 阅读(173) 评论(0) 推荐(0)