2020年4月6日
摘要: 文本挖掘之词云及个性化词云 一:词云-WordCloud 词云:对文本中出现的关键词按照出现频率通过改变字体字号颜色样式等方式集中显示 个人看法,wordcloud是一款将词语(支持英文、中文等各种语言词汇)作为基本元素,对图像文件进行十分高效填充的文字展示工具。同时,还可使用masks(掩膜)功能 阅读全文
posted @ 2020-04-06 23:58 一只阿木木 阅读(1311) 评论(0) 推荐(1) 编辑
  2020年4月5日
摘要: 数据分析:某地医院药品销售业务数据分析 本篇文章以朝阳医院2018年销售数据为例,目的是了解朝阳医院在2018年里的销售情况几个业务指标 月均消费次数 月均消费金额 客单价 消费趋势 数据分析的步骤:提出问题→理解数据→数据清洗→构建模型→数据可视化 一.确定业务问题 我们知道,数据分析是指用适当的 阅读全文
posted @ 2020-04-05 22:16 一只阿木木 阅读(1556) 评论(0) 推荐(1) 编辑
  2020年3月4日
摘要: 示例统计销售榜品牌及销售额 import pandas as pd import numpy as np import os os.chdir('F:\\50mat\源数据1000张表格') name = '户外服装&滑雪衣.xlsx' df = pd.read_excel(name) df.hea 阅读全文
posted @ 2020-03-04 16:34 一只阿木木 阅读(2777) 评论(1) 推荐(0) 编辑
  2020年3月3日
摘要: 目标用户偏好指数Target Group Index分析 TGI指数,全称Target Group Index,可以反映目标群体在特定研究范围内强势或者弱势。 TGI指数计算公式 = 目标群体中具有某一特征的群体所占比例 / 总体中具有相同特征的群体所占比例 * 标准数100 TGI指数大于100, 阅读全文
posted @ 2020-03-03 18:00 一只阿木木 阅读(2914) 评论(0) 推荐(0) 编辑
  2020年2月19日
摘要: linux 下部署web 程序 1. 创建ucenter用户 一般情况下,发布应用程序都不是使用root用户的,需要创建一个普通用户来发布程序; 创建ucenter用户: useradd -d /ucenter ucenter 设置密码: passwd ucenter (密码 ucenter) 切换 阅读全文
posted @ 2020-02-19 17:30 一只阿木木 阅读(626) 评论(0) 推荐(0) 编辑
摘要: linux 下安装mysql 1. 下载 http://dev.mysql.com/downloads/mysql/ 或者使用wget下载: wget http://dev.mysql.com/get/Downloads/MySQL-5.6/MySQL-5.6.22-1.el6.i686.rpm-b 阅读全文
posted @ 2020-02-19 17:28 一只阿木木 阅读(169) 评论(0) 推荐(0) 编辑
摘要: linux 下安装jdk1.7 先卸载open-jdk java –version rpm -qa | grep java rpm -e --nodeps java-1.7.0-openjdk-1.7.0.45-2.4.3.3.el6.x86_64 rpm -e --nodeps java-1.6. 阅读全文
posted @ 2020-02-19 17:20 一只阿木木 阅读(884) 评论(0) 推荐(0) 编辑
  2020年2月15日
摘要: RFM,是一种经典的用户分类、价值分析模型: R,Rencency,即每个客户有多少天没回购了,可以理解为最近一次购买到现在隔了多少天。 F,Frequency,是每个客户购买了多少次。 M,Monetary,代表每个客户平均购买金额,也可以是累计购买金额。 这三个维度,是RFM模型的精髓所在,帮助 阅读全文
posted @ 2020-02-15 14:21 一只阿木木 阅读(2204) 评论(1) 推荐(0) 编辑
  2019年11月14日
摘要: 天猫官方公布了今年的双11成交额为2684亿元,成功刷新了自己创下的商业纪录。 代码:利用多项式拟合淘宝双11 数据。 环境:python 3.6 , jupyter Notebook 利用三次多项式预测的数据与公布的结果确实很相近。 我们继续搞事情。 将今年2019年的2684亿导入,预测一下后面 阅读全文
posted @ 2019-11-14 11:06 一只阿木木 阅读(527) 评论(0) 推荐(0) 编辑
  2019年11月13日
摘要: 国外大神制作的一个很棒的matplotlib 可视化教程 参考:https://www.machinelearningplus.com/plots/top-50-matplotlib-visualizations-the-master-plots-python/ ♔一:关联 散点图 带边界的气泡图 阅读全文
posted @ 2019-11-13 15:44 一只阿木木 阅读(1176) 评论(0) 推荐(0) 编辑
  2019年5月9日
摘要: 通过 EXPLAIN 浅析数据库查询优化方法 EXPLAIN 思维导图 知识点 explain 或者 desc 命令 获取Myswl如何执行SELECT语句的信息,包括在SELECT语句执行过程中表如何连接和连接的顺序。 index: 这种类型表示是mysql会对整个该索引进行扫描。 要想用到这种类 阅读全文
posted @ 2019-05-09 11:28 一只阿木木 阅读(1417) 评论(1) 推荐(1) 编辑
  2019年1月17日
摘要: tuple 元素真的不可变吗 有一种有序列表叫元组:tuple。 tuple和list非常类似,但是tuple一旦初始化就不能修改,比如同样是列出单位或同学的名字: 现在,classmates这个tuple不能变了,它也没有append(),insert()这样的方法。其他获取元素的方法和list是 阅读全文
posted @ 2019-01-17 14:17 一只阿木木 阅读(860) 评论(0) 推荐(1) 编辑
  2019年1月15日
摘要: 爬虫系列4:Requests+Xpath 爬取动态数据 【抓取】:参考前文 爬虫系列1:https://www.cnblogs.com/yizhiamumu/p/9451093.html 【分页】:参考前文 爬虫系列2:https://www.cnblogs.com/yizhiamumu/p/102 阅读全文
posted @ 2019-01-15 17:05 一只阿木木 阅读(3503) 评论(0) 推荐(0) 编辑
摘要: 数据保存本地 【抓取】:参考前文 爬虫系列1:https://www.cnblogs.com/yizhiamumu/p/9451093.html 【分页】:参考前文 爬虫系列2:https://www.cnblogs.com/yizhiamumu/p/10267721.html 【保存】:参考前文 阅读全文
posted @ 2019-01-15 11:23 一只阿木木 阅读(1054) 评论(0) 推荐(0) 编辑
  2019年1月14日
摘要: Requests+Xpath 爬取租房网站信息 【抓取】:参考前文 爬虫系列1:https://www.cnblogs.com/yizhiamumu/p/9451093.html 【分页】:参考前文 爬虫系列2:https://www.cnblogs.com/yizhiamumu/p/1026772 阅读全文
posted @ 2019-01-14 16:47 一只阿木木 阅读(1363) 评论(0) 推荐(0) 编辑
  2018年10月24日
摘要: 我们之前讨论过时间,在Java 中有一些方法会出现横线?比如Date 过期方法。 参考文章:知识点:java一些方法会有横线?以Date 过期方法为例 Java中的日期和时间处理方法 Date类(官方不再推荐使用,官方解释Date类不利于国际化,推荐使用Calendar类) Calendar类 Da 阅读全文
posted @ 2018-10-24 22:21 一只阿木木 阅读(1195) 评论(0) 推荐(0) 编辑
  2018年10月11日
摘要: 容器是整个Spring 框架的核心思想,用来管理Bean的整个生命周期。 一个项目中引入Spring和SpringMVC这两个框架,Spring是父容器,SpringMVC是其子容器,子容器可以看见父容器中的注册的Bean,反之就不行。请记住这个特性。 spring 容器基础释义 1 我们可以使用统 阅读全文
posted @ 2018-10-11 18:55 一只阿木木 阅读(886) 评论(1) 推荐(0) 编辑
  2018年8月16日
摘要: 本文spring libs 地址:https://github.com/yizhiamumu/springlibs Spring 能帮我们做什么 ①.Spring 能帮我们根据配置文件创建及组装对象之间的依赖关系。 ②.Spring 面向切面编程能帮助我们无耦合的实现日志记录,性能统计,安全控制。 阅读全文
posted @ 2018-08-16 15:04 一只阿木木 阅读(570) 评论(0) 推荐(0) 编辑
  2018年8月9日
摘要: 爬虫1:Requests+Xpath 爬取豆瓣电影TOP 【抓取】:参考前文 爬虫系列1:https://www.cnblogs.com/yizhiamumu/p/9451093.html 【分页】:参考前文 爬虫系列2:https://www.cnblogs.com/yizhiamumu/p/10 阅读全文
posted @ 2018-08-09 19:00 一只阿木木 阅读(1867) 评论(0) 推荐(0) 编辑
  2018年8月1日
摘要: 多线程即在同一时间,可以做多件事情。 创建多线程有3种方式,分别是继承线程类,实现Runnable接口,匿名类 一:线程概念 首先要理解进程(Processor)和线程(Thread)的区别 进程:启动一个LOL.exe就叫一个进程。 接着又启动一个DOTA.exe,这叫两个进程。 线程:线程是在进 阅读全文
posted @ 2018-08-01 15:56 一只阿木木 阅读(1162) 评论(0) 推荐(2) 编辑