柯灵鑫---第六次作业

这个作业属于哪个课程 https://edu.cnblogs.com/campus/fzzcxy/BD-HairlineMaintenanceAssociation
这个作业要求在哪里https://edu.cnblogs.com/campus/fzzcxy/BD-HairlineMaintenanceAssociation/homework/12550
这个作业的目标 <实战运用词向量模型,结巴分词,聚类,对职业描述的软实力类词语进行提取>
学号 <212106420>
成果图

有的空行是因为没有软实力词语。

jupyter notebook 代码
1.进行库的导入以及模型装载

2.设置停用词以及相关标点符号

3.结巴分词

4.创建词向量模型

5.聚类并合并dataframe

6.提取软实力词语并生成新的一列soft存放

7.绘制词云图

posted @ 2022-05-22 01:02  Macipc  阅读(5)  评论(0编辑  收藏  举报