01 2025 档案
摘要:一、基本概念 1. Prompt Prompt 最初是 NLP(自然语言处理)研究者为下游任务设计出来的一种任务专属的输入模板,类似于一种任务(例如:分类,聚类等)会对应一种 Prompt。在 ChatGPT 推出并获得大量应用之后,Prompt 开始被推广为给大模型的所有输入。即,我们每一次访问大
阅读全文
摘要:一. 什么是LLM(大语言模型)? 1. 发展历程 语言建模的研究始于20世纪90年代,最初采用了统计学习方法,通过前面的词汇来预测下一个词汇。然而,这种方法在理解复杂语言规则方面存在一定局限性。 随后,研究人员不断尝试改进,其中在2003年,深度学习先驱Bengio在他的经典论文《A Neural
阅读全文
摘要:写在前面 最近,DeepSeek 发布的推理大模型 DeepSeek - R1 ,可以说是AI大模型领域杀出的一匹黑马。它在国外大模型排名 Arena 上成绩惊人,基准测试位列全类别大模型第三,在风格控制类模型中更是与 OpenAI o1 并列第一。不仅如此,1 月 27 日,其应用登顶中美应用商店
阅读全文

浙公网安备 33010602011771号