随笔分类 -  数据挖掘

数据挖掘与分析相关的思路与实现
摘要:原文:http://www.iterate.site/2019/04/13/07-%E4%B8%8D%E5%9D%87%E8%A1%A1%E6%A0%B7%E6%9C%AC%E9%9B%86%E7%9A%84%E9%87%8D%E9%87%87%E6%A0%B7/ 在训练二分类模型时,例如医疗诊断、 阅读全文
posted @ 2019-06-20 11:47 ottll 阅读(1147) 评论(0) 推荐(0)
摘要:原文:https://blog.csdn.net/qq_28031525/article/details/70207918 RF、GBDT和XGBoost都属于集成学习(Ensemble Learning),集成学习的目的是通过结合多个基学习器的预测结果来改善单个学习器的泛化能力和鲁棒性。 根据个体 阅读全文
posted @ 2018-07-06 18:18 ottll 阅读(754) 评论(0) 推荐(0)
摘要:原文:https://blog.csdn.net/zcc_0015/article/details/76595447 已知三个feature,三个feature分别取值如下:feature1=[“male”, “female”]feature2=[“from Europe”, “from US”, 阅读全文
posted @ 2018-07-06 18:07 ottll 阅读(2292) 评论(0) 推荐(0)
摘要:http://blog.sina.com.cn/s/blog_605f5b4f010109z3.html 首先,CRF,HMM(隐马模型),MEMM(最大熵隐马模型)都常用来做序列标注的建模,像词性标注,True casing。但隐马模型一个最大的缺点就是由于其输出独立性假设,导致其不能考虑上下文的 阅读全文
posted @ 2018-06-29 18:42 ottll 阅读(446) 评论(0) 推荐(0)