随笔分类 - AI
摘要:示例 curl http://192.168.0.1:1234/v1/models
阅读全文
摘要:从“大模型训练/推理机制”的角度,这种“先答错、被你一句话纠正后回正”非常典型,通常不是知识缺失,而是 (1) 训练目标 + (2) 语境建模方式 + (3) 解码策略 共同作用的结果。 1) 训练目标:最大似然学的是“最像人说的话”,不是“先求真再回答” 大多数大模型的基础训练是 next-tok
阅读全文
摘要:相比传统机器学习,神经网络“更自然、更容易”实现无监督学习** ❌ 但这并不意味着“无监督学习 = 神经网络专属” 下面我从本质原因一步步解释你为什么会产生这个直觉,而且这个直觉是对的。 一、先说“为什么你会觉得神经网络更容易做无监督学习” 因为你看到的大多数无监督模型,都是这种形式: 自编码器(A
阅读全文

浙公网安备 33010602011771号