会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
TheArtofLLMs
博客园
首页
新随笔
联系
订阅
管理
2024年3月
大模型如何能够更好的辅助小模型的训练数据生成?
摘要: ## 摘要数据合成是训练一个只有极少标注数据的小型模型的一种有前景的方法。数据合成的一种方法是利用大型语言模型的丰富知识,为小型模型合成伪训练样本,从而同时实现数据和计算的效率。然而,数据合成面临的一个关键挑战是,合成的数据集通常与真实任务数据分布存在较大的差异。因此,在本文中,我们提出了“逐步合成
阅读全文
posted @ 2024-03-03 11:03 大模型的艺术
阅读(381)
评论(0)
推荐(0)
2023年12月
从文本使用大模型自a动生成代码:Codex
摘要: OpenAI Codex是由OpenAI开发的人工智能模型。它能解析自然语言并生成相应的代码。该模型驱动了GitHub Copilot,一个为选定的IDE(如Visual Studio Code和Neovim)提供的编程自动补全工具。Codex是OpenAI的GPT-3模型的后代,经过微调以用于编程
阅读全文
posted @ 2023-12-09 12:20 大模型的艺术
阅读(800)
评论(0)
推荐(0)
2023年11月
最新!大模型真的存在涌现能力吗?
摘要: 摘要 近期的研究表明,大型语言模型展现出了一种涌现能力,这种能力在小规模模型中不存在,但在大规模模型中显现出来。这种涌现能力吸引人的地方有两个:其一是它们的突然性,似乎是瞬间从不存在转变为存在;其二是它们的不可预测性,在看似难以预见的模型规模上出现。在这里,我们提出了一种关于涌现能力的替代解释:对于
阅读全文
posted @ 2023-11-19 12:31 大模型的艺术
阅读(244)
评论(0)
推荐(0)
【世界经济论坛】明日职业走向:大语言模型/AIGC引领的工作变革
摘要: 摘要 随着生成人工智能(AI)的不断进展以前所未有的速度,大型语言模型(LLMs)正在崭露头角,具有重新定义工作格局的潜力。这些工具的最新进展,如GitHub的Copilot、Midjourney和ChatGPT,预计将引起全球经济和劳动力市场的重大变化。这些特定的技术进步与来自经济、地缘政治、绿色
阅读全文
posted @ 2023-11-12 11:57 大模型的艺术
阅读(163)
评论(0)
推荐(0)
【RAG问答相关】复杂知识库问答综述(下)
摘要: 前言 大模型落地应用过程中,一般形式还是问答形式,无论是人机对话还是机机对话,都是靠问答来解决一系列问题。无论是要求大模型给出具体的专业化知识,还是要求大模型进行某项作业的开展,都是以问题(指令其实也是一种特殊的问题)的形式进行。所以在RAG中,如何将问题转化为大模型能够理解的问题,转化为各种知识库
阅读全文
posted @ 2023-11-12 11:54 大模型的艺术
阅读(604)
评论(0)
推荐(0)
【RAG问答相关】复杂知识库问答综述(中)
摘要: 前言 大模型落地应用过程中,一般形式还是问答形式,无论是人机对话还是机机对话,都是靠问答来解决一系列问题。无论是要求大模型给出具体的专业化知识,还是要求大模型进行某项作业的开展,都是以问题(指令其实也是一种特殊的问题)的形式进行。所以在RAG中,如何将问题转化为大模型能够理解的问题,转化为各种知识库
阅读全文
posted @ 2023-11-12 11:44 大模型的艺术
阅读(324)
评论(0)
推荐(0)
【RAG问答相关】复杂知识库问答综述(上)
摘要: 前言 大模型落地应用过程中,一般形式还是问答形式,无论是人机对话还是机机对话,都是靠问答来解决一系列问题。无论是要求大模型给出具体的专业化知识,还是要求大模型进行某项作业的开展,都是以问题(指令其实也是一种特殊的问题)的形式进行。所以在RAG中,如何将问题转化为大模型能够理解的问题,转化为各种知识库
阅读全文
posted @ 2023-11-04 14:40 大模型的艺术
阅读(753)
评论(0)
推荐(0)
公告