时间又不会为我赖着不走, 干嘛停下来为了选择头疼

编程匠心者

厚德 求真 励学 笃行
诚朴 雄伟 励学 敦行

随笔分类 -  spark

摘要:代码放在github上: "click me" 一、数据说明 数据集为英文语料集,一共包含20种类别的邮件,除了类别soc.religion.christian的邮件数为997以外每个类别的邮件数都是1000。每份邮件内部包含发送者,接受者,正文等信息。 二、实验方法 2.1 数据预处理 数据预处理 阅读全文
posted @ 2019-09-02 16:52 编程匠心者 阅读(1062) 评论(0) 推荐(0)
摘要:详细代码我已上传到github: "click me" 一、 实验要求         在 Spark2.3 平台上实现 Apriori 频繁项集挖掘的并行化算法。要求程序利用 Spark 进行并行计算。 二、算法设计 阅读全文
posted @ 2018-12-21 02:24 编程匠心者 阅读(4866) 评论(9) 推荐(1)