会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
foremost
苦要自己扛,路要自己走。你的痛苦只有自己才能理解,成长本来就是渐渐沉默的过程。
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
8
9
···
34
下一页
2019年12月16日
R的环境系统
摘要: r环境概念 环境:用来具体存储对象的地方。 规则1:每一个对象都存储在一个环境当中。 规则2:每一个环境都与一个父环境相连接,构成一个分层的环境系统。 规则3:子环境与父环境的连接是单向的。 parenvs()查看当前R的环境; parenvs(all=TRUE)会返回当前会话包含的环境列表。 as
阅读全文
posted @ 2019-12-16 20:23 foremost
阅读(853)
评论(1)
推荐(0)
2019年12月12日
机器学习入门-逻辑回归
摘要: 一、知识结构 分类问题和逻辑回归? 1)输出数据的类型分类输出的数据类型是离散数据,也就是分类的标签。 回归输出的是连续数据类型。 2)第2个区别是我们想要通过机器学习算法得到什么? 分类算法得到是一个决策面,用于对数据集中的数据进行分类。 回归算法得到是一个最优拟合线,这个线条可以最好的接近数据集
阅读全文
posted @ 2019-12-12 22:07 foremost
阅读(474)
评论(0)
推荐(0)
机器学习入门-相关性分析
摘要: 1.什么是机器学习? 像豆瓣、淘宝、QQ音乐这些推荐系统,背后的秘密武器正是机器学习 机器学习是:用机器学习算法来建立模型,并利用规律和模型对未知数据进行预测。 监督学习 supervised learning; 非监督学习 unsupervised learning; 半监督学习 semi-sup
阅读全文
posted @ 2019-12-12 10:53 foremost
阅读(7609)
评论(0)
推荐(0)
2019年12月10日
R语言-记号体系
摘要: 安装xlsx包 #装之前先装jdk,配置环境变量 install.packages("xlsx") 代表安装成功 必须先加载包然后再使用包library() $提取符号 当一个函数里需要返回多个值(比如有变量,有向量,有矩阵)时,我们要用list,而不是return,这时如果想提取某个变量的结果,就
阅读全文
posted @ 2019-12-10 20:30 foremost
阅读(991)
评论(0)
推荐(0)
2019年12月6日
R语言基础
摘要: 1、R语言介绍 R和RStudio 是与计算机进行对话的两个工具 RStudio 是话筒 R是沟通所用的语言 R的由来:基于S语言,由新西兰奥克兰大学的Robert Gentleman和Ross Ihaka开发,因两位开发者名字首字母都是R,所以该语言命名为R。 怎样理解R 一种计算机语言 一种用于
阅读全文
posted @ 2019-12-06 23:12 foremost
阅读(1814)
评论(0)
推荐(0)
2019年11月28日
职位画像分析(pandas/ matplotlib)
摘要: 一、数据分析的步骤 二、提出问题 (1) 分析数据分析师主要的技能排名? (2) 分析数据分析师薪资和岗位地点、学历、工作年限的关系? (3) 数据分析师的学历需求? (4) 不同城市数据分析师的需求?(地图展示) 三、获取数据源 选择前程无忧官网 关键词:数据分析师 范围:全国 总记152页信息,
阅读全文
posted @ 2019-11-28 21:38 foremost
阅读(2467)
评论(1)
推荐(0)
2019年11月25日
python 可视化工具-matplotlib
摘要: 一、matplotlib介绍 python优秀的数据可视化第三方库 matplotlib库的效果 官网:https://matplotlib.org/ 当我们想画一个图但不知道怎么画出来的时候,就可以去这个网站上去找了,网站上罗列出来了各式各样的绘图形式 配置参数: axex: 设置坐标轴边界和表面
阅读全文
posted @ 2019-11-25 19:18 foremost
阅读(827)
评论(0)
推荐(0)
2019年11月24日
pandas-缺失值处理
摘要: import pandas as pd import numpy as np Step 1.加载数据集 # header=0以第一行作为列名 tip = pd.read_csv("lianx.csv",sep=',',header=0) tip.head() Step 2.删除第 1,4,7,9,1
阅读全文
posted @ 2019-11-24 21:06 foremost
阅读(468)
评论(0)
推荐(0)
k-means实战-RFM客户价值分群
摘要: 数据挖掘的十大算法 基本概念 1、数据预处理:处理成 用户ID,R ,F,M四个字段 2、调用KMeans算法 进行聚类 ,设定为8类 3、对数据进行拟合,训练模型 ,每个ID对应一个类别(0-7) 4、如何将分类好的数字标签,和RFM 模型中的客户类别匹配起来? 查看每个类别的中心点,用其构造Da
阅读全文
posted @ 2019-11-24 19:33 foremost
阅读(2678)
评论(1)
推荐(0)
2019年11月23日
药店商品销量分析(python)
摘要: 一、数据分析的步骤 二、提出问题 分析药店商品销售情况 1)月均消费次数 2)月均消费金额 3)客单价 4)消费趋势 5)热销商品、滞销商品 三、理解数据 销售数据源为excel文件 字段的含义: 共有6579条销售数据 共有7个字段分别为:购买时间、社保卡号、商品编码、商品名称、销售数量、应收金额
阅读全文
posted @ 2019-11-23 21:28 foremost
阅读(1435)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
9
···
34
下一页