摘要:
首先来看看二元交叉熵的损失公式 然后再来看看nn.functional.binary_cross_entropy_with_logits的用法 然后来讲一下\(0.9352\)是怎么得出的(\(1.8462\)同理) 每个样本没有归一化的输出为[1.1, -2.2, 3.3, -4.4],标签分别为 阅读全文
posted @ 2025-03-01 20:41
最爱丁珰
阅读(5)
评论(0)
推荐(0)
摘要:
一些本人的理解如下: 事件\(D|w_c,w_o\)的意思是以\(w_c\)作为中心词,\(w_o\)是否来自其上下文,若\(D=1\)则表示来自,否则表示不来自 式\((14.17)\)也比较好理解,两个词向量的内积可以衡量两个的相似程度(长度以及夹角) 文中“正样本的事件”指的是\(D=1\); 阅读全文
posted @ 2025-03-01 09:16
最爱丁珰
阅读(19)
评论(0)
推荐(0)

浙公网安备 33010602011771号