06 2022 档案

摘要:一、安装Spark 1.检查基础环境hadoop,jdk 2.下载spark 3.解压,文件夹重命名、权限 4.配置文件 5.环境变量 6.试运行Python代码 二、Python编程练习:英文文本的词频统计 1.准备文本文件 2.读文件,预处理:大小写,标点符号,停用词,分词,统计每个单词出现的次 阅读全文
posted @ 2022-06-05 21:31 塞纳河没有冰期 阅读(73) 评论(0) 推荐(0) 编辑