上一页 1 ··· 669 670 671 672 673 674 675 676 677 ··· 743 下一页
摘要: 三、随机变量 原文:prob140/textbook/notebooks/ch03 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 许多数据科学涉及数值变量,它的观察值取决于几率。其他值提供的变量的预测值,随机样本中观察到的不同类别个体的数量,以及自举样本的中值,仅仅是几个例子 阅读全文
posted @ 2018-06-24 00:10 绝不原创的飞龙 阅读(93) 评论(0) 推荐(0)
摘要: 二、计算几率 原文:prob140/textbook/notebooks/ch02 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 一旦你开始处理概率问题,你很快就会意识到所有可能结果是等可能的假设并不总是合理的。例如,如果你认为硬币有偏差,那么你就不会认为它的正反面具有相同的 阅读全文
posted @ 2018-06-21 23:12 绝不原创的飞龙 阅读(62) 评论(0) 推荐(0)
摘要: 来源:ApacheCN《面向机器学习的特征工程》翻译项目 译者:@cn-Wziv 校对:@HeYun 通过自动数据收集和特征生成技术,可以快速获得大量特征,但并非所有这些都有用。在第 3 章和 在第 4 章中,我们讨论了基于频率的滤波和特征缩放修剪无信息的特征。现在我们来仔细讨论一下使用主成分分析( 阅读全文
posted @ 2018-06-21 13:40 绝不原创的飞龙 阅读(10) 评论(0) 推荐(0)
摘要: 来源:ApacheCN《面向机器学习的特征工程》翻译项目 译者:@kkejili 校对:@HeYun 如果让你来设计一个算法来分析以下段落,你会怎么做? Emma knocked on the door. No answer. She knocked again and waited. There 阅读全文
posted @ 2018-06-21 13:37 绝不原创的飞龙 阅读(19) 评论(0) 推荐(0)
摘要: 来源:ApacheCN《面向机器学习的特征工程》翻译项目 译者:@ZhipengYe 校对:(虚位以待) 机器学习将数据拟合到数学模型中来获得结论或者做出预测。这些模型吸纳特征作为输入。特征就是原始数据某方面的数学表现。在机器学习流水线中特征位于数据和模型之间。特征工程是一项从数据中提取特征,然后转 阅读全文
posted @ 2018-06-21 13:35 绝不原创的飞龙 阅读(31) 评论(0) 推荐(0)
摘要: 一、基础 原文:prob140/textbook/notebooks/ch01 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 究竟是什么概率,一直是有争议的辩论主题。有些人认为概率是长期的频率,只适用于在相同条件下可能反复发生的事件。其他人则认为概率量化了个体对任何事件的不确 阅读全文
posted @ 2018-06-19 17:37 绝不原创的飞龙 阅读(41) 评论(0) 推荐(0)
摘要: 来源:ApacheCN《Sklearn 与 TensorFlow 机器学习实用指南》翻译项目 译者:@Lisanaaa @y3534365 校对:@飞龙 和支持向量机一样, 决策树是一种多功能机器学习算法, 即可以执行分类任务也可以执行回归任务, 甚至包括多输出(multioutput)任务. 它是 阅读全文
posted @ 2018-06-12 09:56 绝不原创的飞龙 阅读(18) 评论(0) 推荐(0)
摘要: 五、探索性数据分析 原文:DS-100/textbook/notebooks/ch05 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 探索性数据分析是一种态度,一种灵活的状态,一种寻找那些我们认为不存在和存在的东西的心愿。 John Tukey 在探索性数据分析(EDA),也 阅读全文
posted @ 2018-06-07 22:39 绝不原创的飞龙 阅读(50) 评论(0) 推荐(0)
摘要: 四、数据清理 原文:DS-100/textbook/notebooks/ch04 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 数据以多种格式出现,并且在分析的实用性方面差别很大。尽管我们希望,我们所有的数据都以表格的形式出现,并且每个数值的记录都一致和准确,但实际上,我们必 阅读全文
posted @ 2018-06-06 22:52 绝不原创的飞龙 阅读(59) 评论(0) 推荐(0)
摘要: 三、处理表格数据 原文:DS-100/textbook/notebooks/ch03 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 索引、切片和排序 起步 在本章的每一节中,我们将使用第一章中的婴儿名称数据集。我们将提出一个问题,将问题分解为大体步骤,然后使用pandas D 阅读全文
posted @ 2018-06-05 17:33 绝不原创的飞龙 阅读(43) 评论(0) 推荐(0)
上一页 1 ··· 669 670 671 672 673 674 675 676 677 ··· 743 下一页