上一页 1 ··· 101 102 103 104 105 106 107 108 109 ··· 139 下一页
摘要: pandas是数据科学家必备的数据处理库,我们今天总结了10个在实际应用中肯定会用到的技巧 1、Select from table where f1=’a’ and f2=’b’ 使用AND或OR选择子集 dfb = df.loc[(df.Week == week) & (df.Day == day 阅读全文
posted @ 2022-10-19 13:44 deephub 阅读(31) 评论(0) 推荐(0)
摘要: 持续学习是指在不忘记从前面的任务中获得的知识的情况下,按顺序学习大量任务的模型。这是一个重要的概念,因为在监督学习的前提下,机器学习模型被训练为针对给定数据集或数据分布的最佳函数。而在现实环境中,数据很少是静态的,可能会发生变化。当面对不可见的数据时,典型的ML模型可能会性能下降。这种现象被称为灾难 阅读全文
posted @ 2022-10-18 11:46 deephub 阅读(561) 评论(0) 推荐(0)
摘要: 神经网络在训练时的优化首先是对模型的当前状态进行误差估计,然后为了减少下一次评估的误差,需要使用一个能够表示错误函数对权重进行更新,这个函数被称为损失函数。 损失函数的选择与神经网络模型从示例中学习的特定预测建模问题(例如分类或回归)有关。在本文中我们将介绍常用的一些损失函数,包括: 回归模型的均方 阅读全文
posted @ 2022-10-17 12:22 deephub 阅读(56) 评论(0) 推荐(0)
摘要: 什么是图像描述 图像描述是生成图像文本描述的过程。它使用自然语言处理和计算机视觉来为图像生成描述的文本字幕。一幅图像可以有很多个不同的描述,但是只要它正确地描述了图像,并且描述涵盖了图像中的大部分信息就可以说是没问题的。下面是示例图片和生成的描述文字。 放射学中的图像描述 放射学也称为诊断成像,是一 阅读全文
posted @ 2022-10-16 12:49 deephub 阅读(150) 评论(0) 推荐(0)
摘要: 假设我们从未知分布 q 中观察到 N 个独立且同分布的 (iid) 样本 X = (x1, ... , xN)。统计学中的一个典型问题是“样本集 X 能告诉我们关于分布 q 的什么信息?”。 参数统计方法假设 q 属于一个参数分布族,并且存在一个参数 θ,其中 q(x) 等于所有 x 的参数分布 p 阅读全文
posted @ 2022-10-15 12:09 deephub 阅读(75) 评论(0) 推荐(0)
摘要: 标签传播算法是一种半监督机器学习算法,它将标签分配给以前未标记的数据点。要在机器学习中使用这种算法,只有一小部分示例具有标签或分类。在算法的建模、拟合和预测过程中,这些标签被传播到未标记的数据点。 完整文章: https://avoid.overfit.cn/post/928d67bc5c9146e 阅读全文
posted @ 2022-10-14 11:10 deephub 阅读(69) 评论(0) 推荐(0)
摘要: 通过应用软件工程最佳实践,可以交付质量更好数据科学的项目。更好的质量可能是更少的错误、可靠的结果和更高的编码效率。 最佳实践都是从错误中总结出来的,所以这里我们总结了一些遇到的最常见的错误,并提供了如何最好地解决这些错误的方法、想法和资源。 完整文章: https://avoid.overfit.c 阅读全文
posted @ 2022-10-13 11:00 deephub 阅读(25) 评论(0) 推荐(0)
摘要: 在研究自注意力时,有很多的名词需要我们着重的关注,比如填充掩码,前瞻掩码等等,但网上没有太多注意力掩码的教程和它是如何工作的信息,另外还有以下的细节需要详细的解释: 为什么要对多个层应用注意力掩码?、 为什么不沿键和查询应用注意力掩码? 键、查询和值权重是否混淆了原始矩阵的序列顺序? 所以本篇文章将 阅读全文
posted @ 2022-10-12 13:01 deephub 阅读(86) 评论(0) 推荐(0)
摘要: 金融市场的时间序列数据是出了名的杂乱,并且很难处理。这也是为什么人们都对金融数学领域如此有趣的部分原因! 我们可以用来更好地理解趋势(或帮助模式识别/预测算法)的一种方法是时间序列平滑。以下传统的方法: 移动平均线——简单、容易、有效(但会给时间序列数据一个“滞后”的观测),Savitzky-Gol 阅读全文
posted @ 2022-10-11 13:29 deephub 阅读(124) 评论(0) 推荐(0)
摘要: 时间序列是数据点的序列,通常由在一段时间间隔内进行的连续测量组成。时间序列分析是使用统计技术对时间序列数据进行建模和分析,以便从中提取有意义的信息并做出预测的过程。 时间序列分析是一个强大的工具,可以用来从数据中提取有价值的信息,并对未来的事件做出预测。它可以用来识别趋势、季节模式和变量之间的其他关 阅读全文
posted @ 2022-10-10 10:29 deephub 阅读(155) 评论(0) 推荐(0)
上一页 1 ··· 101 102 103 104 105 106 107 108 109 ··· 139 下一页