会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
做梦当财神
首页
管理
上一页
1
···
32
33
34
35
36
37
38
39
40
···
52
下一页
2020年7月21日
pandas.MultiIndex
摘要: 分层/多级索引能在较低纬度的数据结构(如Series和DataFrame)中存储和操作任意维度的数据, 1. 创建MultiIndex MultiIndex对象是标准索引Index对象的扩展,可以将MultiIndex看作一个元组数组,其中每个元组都是唯一的。可以从数组列表(MultiIndex.f
阅读全文
posted @ 2020-07-21 16:21 做梦当财神
阅读(1578)
评论(0)
推荐(0)
2020年7月2日
提升树
摘要: 集成学习 随机森林 AdaBoost 算法 提升树 梯度提升树(GBDT) XGBoost 一、提升树 提升树是以 $CART$ 回归树为基本分类器的提升方法。 提升方法采用加法模型(即基函数的线性组合)与前向分步算法。 1. 提升树模型 提升树模型可以表示为决策树的加法模型: $$ \tag{13
阅读全文
posted @ 2020-07-02 18:51 做梦当财神
阅读(790)
评论(0)
推荐(0)
字符串的合并(str.cat())
摘要: 字符串的合并,主要有4种方法: 1. 使用“+”组合字符串 例如:输入x='a'+'b'得到x的值是‘ab’。 2. 使用%占位符组合字符串 例如:输入x='I am %s'%'Tony',得到x的值是‘I am Tony’。 3. 使用.join方法将多个可迭代对象合并 例如:输入x=' '.jo
阅读全文
posted @ 2020-07-02 18:49 做梦当财神
阅读(1619)
评论(0)
推荐(0)
2020年7月1日
pandas.cut
摘要: 用途 pandas.cut用来把一组数据分割成离散的区间。比如一组年龄数据,pandas.cut将年龄分割成不同的年龄段并打上标签。 原型 pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3,include_
阅读全文
posted @ 2020-07-01 12:58 做梦当财神
阅读(418)
评论(0)
推荐(0)
2020年6月30日
Python 中字典的键映射多个值
摘要: 问题 怎么实现一个键对应多个值的字典(也叫 multidict )? 解决方案 字典中一个键对应一个单值的映射。如果想一个键映射多个值,就需要将多个值放到另外的容器中。比如列表、集合等。 d = { 'a' : [1, 2, 3], 'b' : [4, 5] } e = { 'a' : {1, 2,
阅读全文
posted @ 2020-06-30 22:51 做梦当财神
阅读(3867)
评论(0)
推荐(0)
Python groupby()
摘要: 用法一: groupby()函数扫描整个序列并且查找连续相同值(或根据指定 key 函数返回值相同)的元素序列。 每次迭代,返回一个值和一个迭代器对象。 from operator import itemgetter from itertools import groupby rows = [ {'
阅读全文
posted @ 2020-06-30 15:37 做梦当财神
阅读(1063)
评论(0)
推荐(0)
基于RFM的用户价值度分析
摘要: 案例完整代码、数据见Github 1. 案例背景 用户价值细分是了解用户价值度的重要途径,常用的细分模型包括:基于属性的方法、ABC分类法、聚类法等。 1. 基于属性的方法 常用的细分属性包括:地域、产品类别、用户类别(大客户、普通客户、VIP客户等)、性别、消费等级等。这种细分方法可根据数据库中数
阅读全文
posted @ 2020-06-30 01:11 做梦当财神
阅读(1625)
评论(0)
推荐(0)
2020年6月9日
基于AdaBoost的营销响应预测
摘要: 完整代码、数据见Github 1. 案例背景 会员部门在做会员营销时,希望通过数据预测下一次营销活动时,响应活动的会员名单和具体概率。 数据: order.xlsx表: sheet1为训练集,sheet2为预测集 特征变量数:13 数据条数:训练集39999条,预测集8843条 NA值:有 异常值:
阅读全文
posted @ 2020-06-09 18:39 做梦当财神
阅读(610)
评论(0)
推荐(0)
2020年6月8日
数据分析中样本类别分布不均衡问题
摘要: 所谓不均衡指的是不同类别的样本量差异非常大。从数据规模上分为大数据分布不均衡和小数据分布不均衡两种。 大数据分布不均衡:数据规模大,其中的小样本类的占比较少。但从每个特征的分布来看,小样本也覆盖了大部分或全部特征。 例如:1000万条数据,其中占比50万条的少数分类样本属于这种情况。 小数据分布不均
阅读全文
posted @ 2020-06-08 21:58 做梦当财神
阅读(2528)
评论(0)
推荐(0)
XGBoost
摘要: 集成学习 Bagging 与随机森林 Boosting 与 AdaBoost 算法 提升树 梯度提升树(GBDT) XGBoost 目录一、XGBoost 简介二、XGBoost 原理1. 从目标函数开始,生成一棵树1.1 学习第 t 颗树1.2 XGBoost 的目标函数1.3 泰勒公式展开1.4
阅读全文
posted @ 2020-06-08 00:33 做梦当财神
阅读(537)
评论(0)
推荐(0)
上一页
1
···
32
33
34
35
36
37
38
39
40
···
52
下一页
公告