会员
周边
新闻
博问
AI培训
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
rrromi
博客园
首页
新随笔
联系
订阅
管理
2.安装Spark与Python练习
一、安装Spark
检查基础环境hadoop,jdk
下载spark
解压,文件夹重命名、权限
配置文件
环境变量
试运行Python代码
二、Python编程练习:英文文本的词频统计
准备文本文件
读文件
预处理:大小写,标点符号,停用词
分词
统计每个单词出现的次数
按词频大小排序
结果写文件
读文件:
预处理:大小写,标点符号,停用词、分词
统计每个单词出现的次数,按词频大小排序
结果写文件
输出
posted @
2022-03-05 14:22
rrromi
阅读(
24
) 评论(
0
)
编辑
收藏
举报
会员力量,点亮园子希望
刷新页面
返回顶部
公告