会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
126
127
128
129
130
131
132
133
134
···
138
下一页
2022年2月9日
为什么交叉熵和KL散度在作为损失函数时是近似相等的
摘要: 在本文中,我们将介绍熵、交叉熵和 Kullback-Leibler Divergence [2] 的概念,并了解如何将它们近似为相等。 尽管最初的建议使用 KL 散度,但在构建生成对抗网络 [1] 时,在损失函数中使用交叉熵是一种常见的做法。这常常给该领域的新手造成混乱。当我们有多个概率分布并且我们
阅读全文
posted @ 2022-02-09 10:58 deephub
阅读(141)
评论(0)
推荐(0)
2022年2月8日
使用DistilBERT 蒸馏类 BERT 模型的代码实现
摘要: 机器学习模型已经变得越来越大,即使使用经过训练的模型当硬件不符合模型对它应该运行的期望时,推理的时间和内存成本也会飙升。为了缓解这个问题是使用蒸馏可以将网络缩小到合理的大小,同时最大限度地减少性能损失。 我们在以前的文章中介绍过 DistilBERT [1] 如何引入一种简单而有效的蒸馏技术,该技术
阅读全文
posted @ 2022-02-08 10:46 deephub
阅读(192)
评论(0)
推荐(0)
2022年2月7日
DeepFaceDrawing: 使用草图生成人脸图像
摘要: 在本文中,介绍了使用人脸设计或草图来制作人脸照片的想法。该技术的应用包括角色设计、教育培训、面部变形和嫌疑人画像等。 有兴趣的可以先看看视频介绍: 要解决的问题 这篇文章的想法是设计一个应用程序来使用该面部草图来绘制一张真实的面部图像,该应用程序在警察、电影拍摄和面部彩绘中具有各种应用。这个想法的主
阅读全文
posted @ 2022-02-07 10:23 deephub
阅读(485)
评论(0)
推荐(0)
2022年1月31日
卷积自编码器中注意机制和使用线性模型进行超参数分析
摘要: 新神经网络架构设计的最新进展之一是注意力模块的引入。首次出现在在NLP 上的注意力背后的主要思想是为数据的重要部分添加权重。在卷积神经网络的情况下,第一个注意机制是在卷积块注意模型中提出的。其中注意机制分为两个部分:通道注意模块和空间注意模块。 空间注意模块通过将图像分解为两个通道,即最大池化和跨通
阅读全文
posted @ 2022-01-31 10:35 deephub
阅读(89)
评论(0)
推荐(0)
2022年1月30日
论文推荐-使用 Noisy Student 进行自训练可以提高 ImageNet 分类的表现
摘要: 教师学生模型、伪标签、半监督学习和图像分类 使用 Noisy Student 进行自训练改进 ImageNet 分类是一篇由 Google Research、Brain Team 和Carnegie Mellon大学发表在2020 CVPR的论文 Noisy Student在训练时使用相等或更大的学
阅读全文
posted @ 2022-01-30 10:18 deephub
阅读(100)
评论(0)
推荐(0)
2022年1月29日
5分钟NLP - SpaCy速查表
摘要: SpaCy 是一个免费的开源库,用于 Python 中的高级自然语言处理包括但不限于词性标注、dependency parsing、NER和相似度计算。它可帮助构建处理和理解大量文本的应用程序可用于多种方向,例如信息提取、自然语言理解或为深度学习提供文本预处理。 SpaCy 诞生于2014年年中(并
阅读全文
posted @ 2022-01-29 10:19 deephub
阅读(141)
评论(0)
推荐(0)
2022年1月28日
图卷积和消息传递理论的可视化详解
摘要: 本文中将研究如何基于消息传递机制构建图卷积神经网络,并创建一个模型来对具有嵌入可视化的分子进行分类。 假设现在需要设计治疗某些疾病的药物。有一个其中包含成功治疗疾病的药物和不起作用的药物数据集,现在需要设计一种新药,并且想知道它是否可以治疗这种疾病。如果可以创建一个有意义的药物表示,就可以训练一个分
阅读全文
posted @ 2022-01-28 10:26 deephub
阅读(193)
评论(0)
推荐(0)
2022年1月27日
伪标签:用于深度神经网络的简单高效的半监督学习方法
摘要: 未标记的数据由监督学习网络标记,即所谓的伪标记。然后使用标记数据和伪标记数据训练网络。 伪标签 (Pseudo-Labels) 伪标签是对未标记数据的进行分类后的目标类,在训练的时候可以像真正的标签一样使用它们,在选取伪标签的时使用的模型为每个未标记样本预测的最大预测概率的类: 伪标签可以用于带有
阅读全文
posted @ 2022-01-27 10:25 deephub
阅读(273)
评论(0)
推荐(0)
2022年1月26日
2022年必须要了解的20个开源NLP 库
摘要: 在本文中,我列出了当今最常用的 NLP 库,并对其进行简要说明。它们在不同的用例中都有特定的优势和劣势,因此它们都可以作为专门从事 NLP 的优秀数据科学家备选方案。每个库的描述都是从它们的 GitHub 中提取的。 NLP库 以下是顶级库的列表,排序方式是在GitHub上的星数倒序。 1、Hugg
阅读全文
posted @ 2022-01-26 09:56 deephub
阅读(420)
评论(0)
推荐(0)
2022年1月25日
高斯函数、高斯积分和正态分布
摘要: 正态分布是高斯概率分布。高斯概率分布是反映中心极限定理原理的函数,该定理指出当随机样本足够大时,总体样本将趋向于期望值并且远离期望值的值将不太频繁地出现。高斯积分是高斯函数在整条实数线上的定积分。这三个主题,高斯函数、高斯积分和高斯概率分布是这样交织在一起的,所以我认为最好尝试一次性解决这三个主题(
阅读全文
posted @ 2022-01-25 10:53 deephub
阅读(604)
评论(0)
推荐(0)
上一页
1
···
126
127
128
129
130
131
132
133
134
···
138
下一页
公告