摘要: 前段时间,我们爬取了几部热门的电影,分别是《三生三世》,《战狼》,《二十二》,我们今天 就以这几部为例,进行一个简单的词云的制作。 我们主要以《二十二》为例,来制作一个评论的词云。 首先需要安装几个必要的工具库: Pandas 用来实现文件读取和存储,以及必要的数据转换。 jieba 一个强大的分词 阅读全文
posted @ 2017-11-08 21:52 cnkai 阅读(702) 评论(0) 推荐(0) 编辑
摘要: 针对抓取到的南京市链家网的房源数据进行一次简单的数据可视化 首先导入必要的库。 读取链家网房源数据的csv文件。 原文件中有每一个房源的链接信息,在这里我们不需要,所以就可以直接删除。 上面表格中的列分别是南京市的行政区划,房源名称,房屋设置,面积,朝向,装修情况的描述,电梯与否,楼层高度,建造时间 阅读全文
posted @ 2017-11-08 15:14 cnkai 阅读(1404) 评论(0) 推荐(2) 编辑