摘要:
1、数据导入: 要求将样表文件中的(sales_sample_20170310)数据导入 HIVE 数据仓库中。 先创建一个表 Create table test2(day_id varchar(30), sale_nbr varchar(30), buy_nbr varchar(30), cnt 阅读全文
摘要:
1、 文章分词:使用中文分词算法解析所有新闻正文,并统计每个词语出现的数量,并以词云图的方式展示,点击词云图中该词语,显示其数量。 先使用python将总表的数据用jieba分词将分出的词和词的次数存储到数据库 在用代码连接数据库输出词云 阅读全文