会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
我们都是大好青年
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
9
10
11
12
13
14
15
16
17
···
25
下一页
2018年9月4日
python上数据存储 .h5格式或者h5py
摘要: 最近在做城市计算的项目,数据文件是以.h5的格式存储的,总结下其用法和特点 来自百度百科的简介: HDF(Hierarchical Data Format),可以存储不同类型的图像和数码数据的文件格式,并且可以在不同类型的机器上传输,同时还有统一处理这种文件格式的函数库。大多数计算机都支持这种文件格
阅读全文
posted @ 2018-09-04 15:01 我们都是大好青年
阅读(15876)
评论(0)
推荐(0)
2018年9月3日
数据预处理之独热编码(One-Hot Encoding)
摘要: 问题的由来 在很多机器学习任务中,特征并不总是连续值,而有可能是分类值。 例如,考虑以下三个特征: 如果将上述特征用数字表示,效率会高很多。例如: 但是,即使转化为数字表示之后,上述数据也不能直接用在我们的分类器中。因为,分类器往往默认数据是连续的,并且是有序的。但是,按照我们上述的表示,数组并不是
阅读全文
posted @ 2018-09-03 14:16 我们都是大好青年
阅读(1017)
评论(0)
推荐(0)
2018年8月31日
残差网络
摘要: 恢复内容开始 景 (1)为什么残差学习的效果会如此好?与其他论文相比,深度残差学习具有更深的网络结构,此外,残差学习也是网络变深的原因,为什么网络深度如此重要? 解答:一般认为神经网络的每一层分别对应于提取不同层次的特征信息,有低层,中层和高层,而网络越深的时候,提取到的不同层次的信息会越多,而不同
阅读全文
posted @ 2018-08-31 11:13 我们都是大好青年
阅读(2695)
评论(0)
推荐(0)
2018年8月27日
GBDT为什么不能并行,XGBoost却可以
摘要: 传统的GBDT是以CART作为基分类器,xgboost还支持线性分类器,这个时候XGBOOST相当于带L1和L2正则化的逻辑斯蒂回归(分类问题)或者线性回归(回归问题)。传统的GBDT在优化的hih只用到一阶导数信息,xgboost则对代价函数进行了二阶泰勒展开,同时用到了一阶和二阶导数。顺便提一下
阅读全文
posted @ 2018-08-27 10:42 我们都是大好青年
阅读(8593)
评论(1)
推荐(0)
百融金服、趣店、中航信面试总结
摘要: 百融金服: 总体面试官很好,一共三个人面我,一个leader,两个员工,一起面: 自我介绍基本必不可少 1、逻辑回归的推导 2、参加竞赛的讲述(要细致,我每次面试都会带上纸和笔方便讲述) 3、项目的评判标准 4、GBDT为什么不能并行 5、XGBoost的用途,怎么用? 基本就问这三大类,但是很注重
阅读全文
posted @ 2018-08-27 09:52 我们都是大好青年
阅读(1449)
评论(0)
推荐(0)
机器学习常见的优化算法
摘要: 1、梯度下降法 梯度下降法是最早最简单的,也是最为常用的最优化算法。梯度下降法实现简单,当目标函数是凸函数时,梯度下降法的解是全局解。一般情况下,其解不保证是全局最优解,梯度下降法的速度未必是最快的。梯度下降法的优化思想是用当前位置负梯度方向作为搜索方向,因为该方向为当前位置的最快下降方向,所以也被
阅读全文
posted @ 2018-08-27 09:24 我们都是大好青年
阅读(3030)
评论(0)
推荐(1)
2018年8月26日
排序算法的python实现
摘要: 本文用python实现了插入排序、希尔排序、冒泡排序、快速排序、直接选择排序、堆排序、归并排序、基数排序。 1、插入排序 插入排序的基本操作就是将一个数据插入到已经排好序的有序数据中,从而的到一个新的、个数加一的有序数据,算法适用于少量的数据的排序,时间复杂度为O(n^2),是稳定的排序方法。插入算
阅读全文
posted @ 2018-08-26 21:43 我们都是大好青年
阅读(232)
评论(0)
推荐(0)
2018年8月8日
优信数据挖掘实习生面试经验
只有注册用户登录后才能阅读该文。
阅读全文
posted @ 2018-08-08 15:02 我们都是大好青年
阅读(11)
评论(0)
推荐(0)
2018年8月7日
数据挖掘十大经典算法
摘要: 1、c4.5 c4.5算法是机器学习算法中的一种分类决策树算法,其核心是ID3算法,c4.5算法继承了ID3算法的优点,并在一下几个放米娜对ID3算法进行了改进: 1)用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足。 2)在树构造过程中进行剪枝。 3)能够完成对不连续属
阅读全文
posted @ 2018-08-07 22:09 我们都是大好青年
阅读(455)
评论(0)
推荐(0)
2018年8月5日
GBDT算法简述
摘要: 提升决策树GBDT 梯度提升决策树算法是近年来被提及较多的一个算法,这主要得益于其算法的性能,以及该算法在各类数据挖掘以及机器学习比赛中的卓越表现,有很多人对GBDT算法进行了开源代码的开发,比较火的是陈天奇的XGBoost和微软的LightGBM 一、监督学习 1、 监督学习的主要任务 监督学习是
阅读全文
posted @ 2018-08-05 12:57 我们都是大好青年
阅读(2597)
评论(0)
推荐(0)
上一页
1
···
9
10
11
12
13
14
15
16
17
···
25
下一页
公告