随笔分类 -  Python之机器学习

摘要:Docker 简介 什么是docker?A container is a standard unit of software that packages up code and all its dependencies so the application runs quickly and reli 阅读全文
posted @ 2020-01-31 16:04 布尔先生 阅读(326) 评论(0) 推荐(0)
摘要:常见的多模型融合算法 多模型融合算法可以比单一模型算法有极为明显的效果提升。但是怎样进行有效的融合,充分发挥各个算法的长处?这里总结一些常见的融合方法: 1. 线性加权融合法 线性加权是最简单易用的融合算法,工程实现非常方便,只需要汇总单一模型的结果,然后按不同算法赋予不同的权重,将多个推荐算法的结 阅读全文
posted @ 2018-05-01 08:34 布尔先生 阅读(11634) 评论(0) 推荐(0)
摘要:简介 如果你的预测模型表现得有些不尽如人意,那就用XGBoost吧。XGBoost算法现在已经成为很多数据工程师的重要武器。它是一种十分精致的算法,可以处理各种不规则的数据。构造一个使用XGBoost的模型十分简单。但是,提高这个模型的表现就有些困难(至少我觉得十分纠结)。这个算法使用了好几个参数。 阅读全文
posted @ 2018-04-13 17:53 布尔先生 阅读(17361) 评论(0) 推荐(1)
摘要:XGBoost参数 在运行XGboost之前,必须设置三种类型成熟:general parameters,booster parameters和task parameters: General parameters:参数控制在提升(boosting)过程中使用哪种booster,常用的booster 阅读全文
posted @ 2018-04-13 17:52 布尔先生 阅读(351) 评论(0) 推荐(0)
摘要:xgboost是基于GBDT原理进行改进的算法,效率高,并且可以进行并行化运算,而且可以在训练的过程中给出各个特征的评分,从而表明每个特征对模型训练的重要性, 调用的源码就不准备详述,本文主要侧重的是计算的原理,函数get_fscore源码如下,源码来自安装包:xgboost/python-pack 阅读全文
posted @ 2018-04-13 17:51 布尔先生 阅读(4601) 评论(0) 推荐(0)
摘要:1.LaTeX软件的安装和使用方法A(自助):在MikTeX的官网下载免费的MikTeX编译包并安装。下载WinEdt(收费)或TexMaker(免费)等编辑界面软件并安装。方法B(打包):在ctex.org下载ctex套装(含MikTeX及WinEdt)哈哈这一部分当然不包含在标题的30分钟里。2 阅读全文
posted @ 2018-04-03 17:26 布尔先生 阅读(373) 评论(0) 推荐(0)
摘要:什么是TensorFlow? TensorFlow 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。它灵活的架构让你可以在多种平台上展开计算,例 阅读全文
posted @ 2018-04-03 14:54 布尔先生 阅读(661) 评论(0) 推荐(0)
摘要:关于O2O比赛的相关资料 https://jiayi797.github.io/2017/03/03/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E5%AE%9E%E8%B7%B5-O2O%E4%BC%98%E6%83%A0%E5%88%B8%E9%A2%84%E6%B 阅读全文
posted @ 2018-03-23 17:25 布尔先生 阅读(149) 评论(0) 推荐(0)
摘要:计算时间差,时间加减运算代码 最近在学习数据预处理,碰到日期型数据不会处理,上网查了下: Q:如何方便的计算两个时间的差,如两个时间相差几天,几小时等A:使用datetime模块可以很方便的解决这个问题,举例如下: import datetime d1 = datetime.datetime(200 阅读全文
posted @ 2018-03-23 09:21 布尔先生 阅读(2021) 评论(0) 推荐(0)