从数据层面,训练数据的规模、质量和多样性不同,如GPT系列基于海量互联网文本,使其知识覆盖面广
而一些垂直领域大模型数据聚焦特定行业,专业性强
在模型架构上,Transformer架构虽为基础,但不同模型在结构细节和参数规模有别,参数多的模型理论上学习能力更强
功能应用方面,通用大模型如文心一言可处理多种任务,语言生成、问答皆能
而医学大模型Med-PaLM则专注医学领域诊断、医学文献解读,解决专业问题

posted on 2025-03-09 20:22  汤圆233  阅读(23)  评论(0)    收藏  举报