06 2020 档案
摘要:需改进:1. 增加实验结果 (7个SOTA) 2. 加速计算的逻辑 及 实验过程 3. WMD计算过程(尤其是代码部分cvxopt) 可以适当增加 零、背景简介 Word Embedding可有效表示不同词间的语义相似度(通常用欧式或余弦距离计算),词袋模型BOW(Bag of words)或TF-
阅读全文
摘要:【零、背景简介】 XGBoost 于2016年由陈天奇提出,一种用于可扩展的分布式的大规模机器学习算法,在Kaggle多项比赛中高频获奖。 核心思想是基于残差的树Boosting,它在建树计算split点、泰勒2阶展开计算损失、正则处理、特殊值处理(如空值处理)、列采样、系统并行化等方面做足了功夫,
阅读全文
浙公网安备 33010602011771号