摘要:
License: CC BY-NC-SA 4.0 之前都是输入一个固定长度的东西,但是如果每次输入的东西长度不一样呢? 例如输入一个句子。当然可以用 one-hot encoding 来编码单词,但这样就看不到某些单词之间的相关性。一个更好的方法是 word embedding。 对于音频输入的情况 阅读全文
posted @ 2025-02-03 11:44
383494
阅读(16)
评论(0)
推荐(0)
摘要:
License: CC BY-NC-SA 4.0 有时候,对特定任务调整神经网络的架构会使它做得更好。例如,CNN 用于图像识别。 一张彩色图片是 3 个矩阵(RGB),当然可以把它拉直成向量然后直接硬上全连接层,但是这样会带来非常多的参数,增加了 overfitting 的风险。 下面我们要基于一 阅读全文
posted @ 2025-02-03 11:44
383494
阅读(30)
评论(0)
推荐(0)
摘要:
License: CC BY-NC-SA 4.0 为什么我用 gradient descent 训了半天 loss 还是不降? local minima & saddle point 有可能是你卡在 local minima(极小值)了,但大部分情况下这只是个 saddle point(某一维是极小 阅读全文
posted @ 2025-02-03 11:43
383494
阅读(35)
评论(0)
推荐(0)
摘要:
License: CC BY-NC-SA 4.0 loss (test) large loss (test) small loss (train) large 可能是 optimization 不够或模型不够复杂 运气好 loss (train) small overfitting 或 mismat 阅读全文
posted @ 2025-02-03 11:43
383494
阅读(13)
评论(0)
推荐(0)
摘要:
License: CC BY-NC-SA 4.0 机器学习的任务是什么?考虑几个常见的任务:输入一段语音,输出语音中的文字;输入一张图片,输出图片中的内容;输入棋局局面,输出下一步怎么走。总结一下就是找到一个函数。 几个常见的任务: Regression 输出一个标量。 Classification 阅读全文
posted @ 2025-02-03 11:41
383494
阅读(10)
评论(0)
推荐(0)

浙公网安备 33010602011771号