deephub

2022年8月24日

摘要：这些方法都是专为RNN设计，它们都经过了广泛的学术评估，而且十分的简单大量医疗数据例如心电图、体温监测、血压监测、定期护士检查等等本质上都是时间序列数据。在这些医学图表的趋势、模式、高峰和低谷中嵌入了大量有价值的信息。医疗行业要求对医疗时间序列数据进行有效分析，这被认为是提高医疗质量、优化资源利用阅读全文

posted @ 2022-08-24 10:32 deephub 阅读(263) 评论(0) 推荐(0)

2022年8月22日

使用Pytorch手写ViT — VisionTransformer

摘要：《The Attention is all you need》的论文彻底改变了自然语言处理的世界，基于Transformer的架构成为自然语言处理任务的的标准。尽管基于卷积的架构在图像分类任务中仍然是最先进的技术，但论文《An image is worth 16x16 words: transfo 阅读全文

posted @ 2022-08-22 10:24 deephub 阅读(266) 评论(0) 推荐(0)

2022年8月21日

25个例子学会Pandas Groupby 操作

摘要： groupby是Pandas在数据分析中最常用的函数之一。它用于根据给定列中的不同值对数据点(即行)进行分组，分组后的数据可以计算生成组的聚合值。如果我们有一个包含汽车品牌和价格信息的数据集，那么可以使用groupby功能来计算每个品牌的平均价格。在本文中，我们将使用25个示例来详细介绍grou 阅读全文

posted @ 2022-08-21 10:30 deephub 阅读(149) 评论(0) 推荐(0)

2022年8月20日

广义线性模型（GLM）及其应用

摘要：广义线性模型[generalize linear model(GLM)]是线性模型的扩展，通过联系函数建立响应变量的数学期望值与线性组合的预测变量之间的关系。它的特点是不强行改变数据的自然度量，数据可以具有非线性和非恒定方差结构。是线性模型在研究响应值的非正态分布以及非线性模型简洁直接的线性转化时的阅读全文

posted @ 2022-08-20 10:17 deephub 阅读(831) 评论(0) 推荐(0)

2022年8月19日

10个常用的损失函数解释以及Python代码实现

摘要：什么是损失函数？损失函数是一种衡量模型与数据吻合程度的算法。损失函数测量实际测量值和预测值之间差距的一种方式。损失函数的值越高预测就越错误，损失函数值越低则预测越接近真实值。对每个单独的观测(数据点)计算损失函数。将所有损失函数（loss function）的值取平均值的函数称为代价函数（cost 阅读全文

posted @ 2022-08-19 11:24 deephub 阅读(202) 评论(0) 推荐(0)

2022年8月18日

使用PyTorch和Keras实现 pix2pix GAN

摘要：对比两个框架实现同一个模型到底有什么区别？第一步，我们对数据集进行图像预处理。我们在这里选择 Facades 数据集，我们将 2 张图像合并为一张，以便在训练过程中进行一些增强。 Pytorch： def __getitem__(self, index):img = Image.open(self 阅读全文

posted @ 2022-08-18 09:32 deephub 阅读(107) 评论(0) 推荐(0)

2022年8月17日

超参数黑盒（Black-box）优化的Python代码示例

摘要：在机器学习中，超参数是用于控制机器学习模型的学习过程的参数。为了与从数据中学到的机器学习模型参数区分开，所以称其为超参数。超参数的配置决定了机器学习模型的性能，每组独特的超参数集可以对应一个学习后的机器学习模型。对于大多数最先进的机器学习模型，所有可能的超参数组合的集合可能会很大。大多数机器学习模型阅读全文

posted @ 2022-08-17 11:19 deephub 阅读(198) 评论(0) 推荐(0)

2022年8月16日

贝叶斯自举法Bayesian Bootstrap

摘要： “自举”（翻译自bootstrap）这个词汇在多个领域可能见到，它字面意思是提着靴子上的带子把自己提起来，这当然是不可能的，在机器学习领域可以理解为原样本自身的数据再抽样得出新的样本及统计量，也有被翻译为自助法的。 Bayesian Bootstrap是一个强大的方法，它比其他的自举法更快，并且可以阅读全文

posted @ 2022-08-16 11:35 deephub 阅读(232) 评论(0) 推荐(0)

2022年8月15日

使用Dask，SBERT SPECTRE和Milvus构建自己的ARXIV论文相似性搜索引擎

摘要：通过矢量相似性搜索，可以在〜50ms内响应〜640K论文上的语义搜索查询 Arxiv.org大家一定都不陌生，学习数据科学的最佳方法之一是阅读Arxiv.org上的开源研究论文。但是即使对于经验丰富的研究人员来说，从大量的研究论文中找出想读的内容也是非常不容易的。Connected等论文之类的工具可阅读全文

posted @ 2022-08-15 11:34 deephub 阅读(244) 评论(0) 推荐(0)

2022年8月14日

几行 Python 代码就可以提取数百个时间序列特征

摘要：时间序列数据是随着时间的推移反复捕获的变量值，随着时间的推移可以产生一系列的按时间顺序索引的数据点。在时间序列中，数据具有自然的时间顺序，即一个变量在特定时间的值依赖于过去的值。传统的机器学习算法不能捕捉时间序列数据的时间顺序。数据科学家需要执行相关的特征工程，将数据的重要特征捕获到几个指标中。生阅读全文

posted @ 2022-08-14 08:50 deephub 阅读(339) 评论(0) 推荐(0)

overfit深度学习

公告