从数据层面,训练数据的规模、质量和多样性不同,如GPT系列基于海量互联网文本,使其知识覆盖面广 而一些垂直领域大模型数据聚焦特定行业,专业性强 在模型架构上,Transformer架构虽为基础,但不同模型在结构细节和参数规模有别,参数多的模型理论上学习能力更强 功能应用方面,通用大模型如文心一言可处理多种任务,语言生成、问答皆能 而医学大模型Med-PaLM则专注医学领域诊断、医学文献解读,解决专业问题