摘要: 本文主要承接上文,以tsne的方式,侧面验证聚类的效果。流程大致为:1.用sklearn对数据进行tsne降维; 2.用Matplotlib进行数据可视化和数据探索。 1、故事的起源 上次写到航空公司客户的RFM价值分析,即抽取航空公司2012年4月1日至2014年3月31日的数据,构建出客户关系长 阅读全文
posted @ 2020-11-16 00:33 旋律,散不去 阅读(608) 评论(1) 推荐(0)
摘要: 本文主要讨论的是以航空公司的会员数据,用RFM的思想结合聚类分析,挖掘不同客户群的价值并制定不同的营销策略。流程大致为:1.用Pandas对数据进行预处理; 2.用Matplotlib进行数据可视化和数据探索;3.用Sklearn来对客户聚类 1、故事的起源 2020年的新年假期对于大部分小伙伴来说 阅读全文
posted @ 2020-03-09 01:43 旋律,散不去 阅读(1548) 评论(0) 推荐(0)
摘要: 本文主要讨论的是尝试使用NetworkX,构建复杂网络(CNA),初步探究Panama Papers中的隐含信息。流程大致为:1.用NetworkX构建Panama Papers的网络模型;2.用常见的网络评估指标来评估主网络和子网络;3.可视化网络的信息。 1.故事的起源 最近J看到一本叫做Com 阅读全文
posted @ 2019-10-28 00:43 旋律,散不去 阅读(862) 评论(0) 推荐(0)
摘要: 本文主要讨论的是通过爬取天猫的销售数据和评论数据后,对数据进行清洗,并进行分析。流程大致为:1.通过selenium爬取商品销售数据; 2.通过selenium和re正则表达式爬取和解析评论数据;3.通过pandas对数据进行清洗和分析;4.运用matplotlib和wordcloud来进行可视化 阅读全文
posted @ 2019-09-10 22:40 旋律,散不去 阅读(359) 评论(1) 推荐(0)