11 2019 档案

macbook安装LightGBM
摘要:一开始直接用pip install lightgbm 报错: OSError: dlopen(/opt/anaconda3/lib/python3.7/site-packages/lightgbm/lib_lightgbm.so, 6): Library not loaded: /usr/local 阅读全文

posted @ 2019-11-29 15:09 静静的白桦林_andy 阅读(3116) 评论(0) 推荐(0)

LightGBM和XGBoost的区别?
摘要:首先声明,LightGBM是针对大规模数据(样本量多,特征多)时,对XGBoost算法进行了一些优化,使得速度有大幅度提高,但由于优化方法得当,而精度没有减少很多或者变化不大,理论上还是一个以精度换速度的目的。如果数据量不大,那就对XGBoost没有什么优势了。 我认为有这几点: 1.GOSS(Gr 阅读全文

posted @ 2019-11-28 16:03 静静的白桦林_andy 阅读(2877) 评论(0) 推荐(0)

mac用python读取文件常见问题(未完成)
摘要:python读取文件常见问题(mac版) 让python的默认编码,和文件的编码保持一致 阅读全文

posted @ 2019-11-26 09:43 静静的白桦林_andy 阅读(1748) 评论(0) 推荐(0)

python编程常用功能(随时添加)
摘要:1 pandas查看DataFrame列或具体值数据类型 2 left join/right join/inner join的区别 3 df_series.value_counts() 4 删除dataframe中的某几行或者某几列 删除的drop函数使用 5 dataframe显示所有列 pd.s 阅读全文

posted @ 2019-11-15 09:28 静静的白桦林_andy 阅读(210) 评论(0) 推荐(0)

sklearn包源码分析(二)——ensemble(未完成)
摘要:网络资源 sklearn包tree模型importance解析 阅读全文

posted @ 2019-11-13 13:59 静静的白桦林_andy 阅读(186) 评论(0) 推荐(0)

数学中的距离distance(未完成)
摘要:manhattan distance(曼哈顿距离) euclidean distance(欧几里得距离) cosine distance(cosine距离) 闵式距离 切比雪夫距离 阅读全文

posted @ 2019-11-11 16:52 静静的白桦林_andy 阅读(445) 评论(0) 推荐(0)

数据结构与算法 python课后题(未完成)
摘要:挖一个坑,先立个flag,后面慢慢填坑。 先放个其它人写的链接 阅读全文

posted @ 2019-11-11 11:23 静静的白桦林_andy 阅读(272) 评论(0) 推荐(0)

某分行联合贷产品建模结果(未完成)
摘要:某分模型评估 1.iv值大于2直接作为规则。其中看一下覆盖率、坏客户率。坏客户率达到60%以上就作为直拒规则。看一下每个区间中,累计的样本占比,累计的坏账率。如果满足低命中率(样本占比),高准确率(一般坏样本率60%)就把它作为规则放到风控中。 2.等频分箱,计算woe值,iv值,iv值大于2小于0 阅读全文

posted @ 2019-11-09 17:06 静静的白桦林_andy 阅读(350) 评论(0) 推荐(0)

icloud/onenote/onedrive/microoutlook/百度云账号都是怎么回事(未完成)
摘要:在用一些跨机器跨平台软件的时候,一旦换了电脑或者手机,我经常出现蒙的状态,不知道怎么同步或者使用了,在这里总结一下。 一、icloud账号 当我们买iphone或者macbook的时候,一开机它会让你先注册个appleID,或者用之前已有的appleID来作为唯一标识码。会让你填三项: 姓名 英文的 阅读全文

posted @ 2019-11-09 16:35 静静的白桦林_andy 阅读(1765) 评论(0) 推荐(0)

sklearn包源码分析(一)--neighbors
摘要:python如何查看内置函数的用法及其源码? 在anaconda的安装目录下,有一块会放着我们安装的所有包,在里面可以找到所有的包 找到scikit learn包,进入 这里面又有了多个子包,每个子包就是一个主要的算法或功能块。我们经常使用的一些算法或功能,比如线性模型、集成算法、神经网络、邻近ne 阅读全文

posted @ 2019-11-08 15:42 静静的白桦林_andy 阅读(3582) 评论(0) 推荐(1)

python--包package、模块module、类Class、Mixin类(未完成)
摘要:包package>模块module>类Class(包含了属性、方法、实例等概念) 模式一:一个包下面有多个py文件,即多个模块module 模式二:一个包下面包含多个子包packages 包package,就是一个带__init__.py的文件夹,一般里面会有packages(子包)或modules 阅读全文

posted @ 2019-11-08 11:23 静静的白桦林_andy 阅读(548) 评论(0) 推荐(0)

调参、最优化、ml算法(未完成)
摘要:最优化方法 调参方法 ml算法 梯度下降gd grid search lr 梯度上升 随机梯度下降 pca 随机梯度下降sgd 贝叶斯调参 lda 牛顿算法 knn 拟牛顿算法 kmeans 遗传算法 tree 蚁群算法 gbdt 模拟退火 xgboost 反向传播算法 lightgbm 坐标上升? 阅读全文

posted @ 2019-11-08 10:20 静静的白桦林_andy 阅读(289) 评论(0) 推荐(0)

python编程——Class(未完成)
摘要:__new__ __init__ __call__ __del__ if __name__=='__main__' __main__ 阅读全文

posted @ 2019-11-06 19:45 静静的白桦林_andy 阅读(147) 评论(0) 推荐(0)

特征选择的方法(未完成)
摘要:使用sklearn做单机特征工程 特征选择方法 阅读全文

posted @ 2019-11-06 16:10 静静的白桦林_andy 阅读(114) 评论(0) 推荐(0)

XGBoost使用篇(未完成)
摘要:1.截止到本文(20191104)sklearn没有集成xgboost算法,需要单独安装xgboost库,然后导入使用 xgboost官网安装说明 Pre-built binary wheel for Python 在源码git页面下载包,然后手动安装。 如何安装包 2.xgboost读取文件的格式 阅读全文

posted @ 2019-11-04 20:36 静静的白桦林_andy 阅读(2832) 评论(0) 推荐(0)

python库之——sklearn
摘要:机器学习库sklearn 官方documentation(资料)中分为不同的部分: 其中我们主要讲User Guide(机器学习算法理论介绍)、API(程序实现方法): 一、User Guide https://scikit-learn.org/stable/user_guide.html 二、ap 阅读全文

posted @ 2019-11-03 13:25 静静的白桦林_andy 阅读(1458) 评论(0) 推荐(0)

导航