会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
129
130
131
132
133
134
135
136
137
···
155
下一页
2022年6月25日
使用“BERT”作为编码器和解码器(BERT2BERT)来改进Seq2Seq文本摘要模型
摘要: BERT是一个著名的、强大的预先训练的“编码器”模型。让我们看看如何使用它作为“解码器”来形成编码器-解码器架构。 Transformer 架构由两个主要构建块组成——编码器和解码器——我们将它们堆叠在一起形成一个 seq2seq 模型。从头开始训练基于Transformer 的模型通常很困难,因为
阅读全文
posted @ 2022-06-25 10:38 deephub
阅读(451)
评论(0)
推荐(0)
2022年6月24日
如何比较两个或多个分布:从可视化到统计检验的方法总结
摘要: 比较一个变量在不同组中的分布是数据科学中的一个常见问题。当我们想要评估一项策略(用户体验功能、广告活动、药物等)的因果效应时,因果推断的黄金标准便是随机对照试验,也就是所谓的A /B测试。在实践中,我们为研究选择一个样本,并将其随机分为对照组(control group)和实验组(treatment
阅读全文
posted @ 2022-06-24 12:05 deephub
阅读(413)
评论(0)
推荐(0)
2022年6月23日
评估和选择最佳学习模型的一些指标总结
摘要: 在评估模型时,虽然准确性是训练阶段模型评估和应用模型调整的重要指标,但它并不是模型评估的最佳指标,我们可以使用几个评估指标来评估我们的模型。 因为我们用于构建大多数模型的数据是不平衡的,并且在对数据进行训练时模型可能会过拟合。在本文中,我将讨论和解释其中的一些方法,并给出使用 Python 代码的示
阅读全文
posted @ 2022-06-23 11:58 deephub
阅读(46)
评论(0)
推荐(0)
2022年6月22日
位置编码(PE)是如何在Transformers中发挥作用的
摘要: 在人类的语言中,单词的顺序和它们在句子中的位置是非常重要的。如果单词被重新排序后整个句子的意思就会改变,甚至可能变得毫无意义。 Transformers不像LSTM具有处理序列排序的内置机制,它将序列中的每个单词视为彼此独立。所以使用位置编码来保留有关句子中单词顺序的信息。 什么是位置编码? 位置编
阅读全文
posted @ 2022-06-22 11:44 deephub
阅读(171)
评论(0)
推荐(0)
2022年6月21日
主动学习(Active Learning) 概述、策略和不确定性度量
摘要: 主动学习是指对需要标记的数据进行优先排序的过程,这样可以确定哪些数据对训练监督模型产生最大的影响。 主动学习是一种学习算法可以交互式查询用户(teacher 或 oracle),用真实标签标注新数据点的策略。主动学习的过程也被称为优化实验设计。 主动学习的动机在于认识到并非所有标有标签的样本都同等重
阅读全文
posted @ 2022-06-21 11:51 deephub
阅读(392)
评论(0)
推荐(0)
2022年6月20日
模型的度量指标和损失函数有什么区别?为什么在项目中两者都很重要?
摘要: 你是否一直在使用你的损失函数来评估你的机器学习系统的性能?我相信有很多人也是这样做的,这是一个普遍存在的误解,因为人工智能中的程序默认设置、课程中介绍都是这样说的。 在本文中,我将解释为什么需要两个独立的模型评分函数来进行评估和优化……甚至还可能需要第三个模型评分函数来进行统计测试。 在整个数据科学
阅读全文
posted @ 2022-06-20 11:41 deephub
阅读(152)
评论(0)
推荐(0)
2022年6月19日
Curriculum Labeling:重新审视半监督学习的伪标签
摘要: Curriculum Labeling (CL),在每个自训练周期之前重新启动模型参数,优于伪标签 (PL) Pseudo-Labeling (PL) 通过将伪标签应用于未标记集中的样本以在自训练周期中进行模型训练。Curriculum Labeling (CL)中,应用类似课程学习的原则,通过在每
阅读全文
posted @ 2022-06-19 13:10 deephub
阅读(161)
评论(0)
推荐(0)
2022年6月18日
如何正确拆分数据集?常见的三种方法总结
摘要: 将数据集分解为训练集,可以帮助我们了解模型,这对于模型如何推广到新的看不见数据非常重要。如果模型过度拟合可能无法很好地概括新的看不见的数据。因此也无法做出良好的预测。 拥有适当的验证策略是成功创建良好预测,使用AI模型的业务价值的第一步,本文中就整理出一些常见的数据拆分策略。 简单的训练、测试拆分
阅读全文
posted @ 2022-06-18 11:36 deephub
阅读(441)
评论(0)
推荐(0)
2022年6月17日
联合概率和条件概率的区别和联系
摘要: 联合概率P(A∩B) 两个事件一起(或依次)发生的概率。 例如:掷硬币的概率是 ¹⁄₂ = 50%,翻转 2 个公平硬币的概率是 ¹⁄₂ × ¹⁄₂ = ¹⁄₄ = 25%(这也可以理解为 50% 的 50%) P(A ∩ B) = P(A) ⋅ P(B) 对于 2 个硬币,样本空间将是 4 {HH
阅读全文
posted @ 2022-06-17 12:36 deephub
阅读(443)
评论(0)
推荐(0)
2022年6月16日
使用神经网络模型创建一个龙与地下城怪物生成器
摘要: 龙与地下城(DND)于1974年发行第一版,现在所有RPG游戏都有它的影子,可以说它影响了全世界的RPG,对于RPG来说,最主要的一个特点就是有着不同类型的怪物,而我们可以通过《dungeon master guide》中提供的Challenge Rating(CR)公式来创建我们自己的怪物,因为我
阅读全文
posted @ 2022-06-16 11:53 deephub
阅读(293)
评论(0)
推荐(0)
上一页
1
···
129
130
131
132
133
134
135
136
137
···
155
下一页
公告