摘要: 大语言模型(Large Language Models,LLM)是一种由包含数百亿以上权重的深度神经网络构建的语言模型,使用自监督学习方法通过大量无标记文本进行训练。自2018年以来,包含Google、OpenAI、Meta、百度、华为等公司和研究机构都纷纷发布了包括BERT、GPT等在内多种模型, 阅读全文
posted @ 2024-12-27 12:15 Xu_Lin 阅读(430) 评论(0) 推荐(0)