摘要:
1 案例背景 泰坦尼克号沉没是历史上最臭名昭着的沉船之一。1912年4月15日,在她的处女航中,泰坦尼克号在与冰山相撞后沉没,在2224名乘客和机组人员中造成1502人死亡。这场耸人听闻的悲剧震惊了国际社会,并为船舶制定了更好的安全规定。 造成海难失事的原因之一是乘客和机组人员没有足够的救生艇。尽管 阅读全文
posted @ 2021-09-23 21:29
Trouvaille_fighting
阅读(1179)
评论(0)
推荐(0)
摘要:
决策树算法api class sklearn.tree.DecisionTreeClassifier(criterion='gini', max_depth=None,random_state=None) criterion 特征选择标准 "gini"或者"entropy",前者代表基尼系数,后者代 阅读全文
posted @ 2021-09-23 20:46
Trouvaille_fighting
阅读(117)
评论(0)
推荐(0)
摘要:
特征提取【了解】 将任意数据(如文本或图像)转换为可用于机器学习的数字特征 特征提取分类:【了解】 字典特征提取(特征离散化) 文本特征提取 图像特征提取 字典特征提取【知道】 字典特征提取就是对类别型数据进行转换 api:sklearn.feature_extraction.DictVectori 阅读全文
posted @ 2021-09-23 20:37
Trouvaille_fighting
阅读(189)
评论(0)
推荐(0)
摘要:
1 文本特征提取 作用:对文本数据进行特征值化 1、sklearn.feature_extraction.text.CountVectorizer(stop_words=[]) 返回词频矩阵 CountVectorizer.fit_transform(X) X:文本或者包含文本字符串的可迭代对象 返 阅读全文
posted @ 2021-09-23 20:31
Trouvaille_fighting
阅读(448)
评论(0)
推荐(0)
摘要:
1 特征提取 1.1 定义 将任意数据(如文本或图像)转换为可用于机器学习的数字特征 注:特征值化是为了计算机更好的去理解数据 特征提取分类 字典特征提取(特征离散化) 文本特征提取 图像特征提取 1.2 特征提取API sklearn.feature_extraction 2 字典特征提取 作用: 阅读全文
posted @ 2021-09-23 19:33
Trouvaille_fighting
阅读(386)
评论(0)
推荐(0)
摘要:
1 为什么要剪枝 1.1 图形描述 横轴表示在决策树创建过程中树的结点总数 纵轴表示决策树的预测精度 实线显示的是决策树在训练集上的精度 虚线显示的则是在一个独立的测试集上测量出来的精度 随着树的增长,在训练样集上的精度是单调上升的, 然而在独立的测试样例上测出的精度先上升后下降。 1.2 出现这种 阅读全文
posted @ 2021-09-23 19:08
Trouvaille_fighting
阅读(156)
评论(0)
推荐(0)

浙公网安备 33010602011771号