摘要:
大语言模型大语言模型(LLM)是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义。大语言模型可以处理多种自然语言任务,如文本分类、问答、对话等,是通向人工智能的一条重要途径。来自百度百科 发展历史 2020年9月,OpenAI授权微软使用GPT-3模型,微软成为全球首个 阅读全文
posted @ 2023-07-06 17:55
mingruqi
阅读(775)
评论(0)
推荐(1)
摘要:
背景 SambaNova和Together这2家公司于2023.05.19开源了可商用的支持多语言的微调模型BLOOMChat。 SambaNova这家公司专注于为企业和政府提供生成式AI平台,Together专注于用开源的方式打造一站式的foundation model,赋能各个行业。 OpenA 阅读全文
posted @ 2023-07-06 17:52
mingruqi
阅读(150)
评论(0)
推荐(0)
摘要:
今天,Stability宣布开源StableLM计划,这是一个正在开发过程的大语言模型,但是它是开源可商用的模型。本文将对该模型做简单的介绍!本文来自DataLearner官方博客:开源可商用大模型再添重磅玩家——StabilityAI发布开源大语言模型StableLM | 数据学习者官方网站(Da 阅读全文
posted @ 2023-07-06 17:51
mingruqi
阅读(146)
评论(0)
推荐(0)
摘要:
最近, 清华大学 NLP实验室、面壁智能、知乎联合在 OpenBMB 开源多模态大模型系列VisCPM,评测显示,VisCPM 在中文多模态开源模型中达到最佳水平。 VisCPM 是一个开源的多模态大模型系列,支持中英双语的多模态对话能力(VisCPM-Chat模型)和文到图生成能力(VisCPM- 阅读全文
posted @ 2023-07-06 17:50
mingruqi
阅读(119)
评论(0)
推荐(0)
摘要:
开源中英文大语言模型汇总 Large Language Model (LLM) 即大规模语言模型,是一种基于深度学习的自然语言处理模型,它能够学习到自然语言的语法和语义,从而可以生成人类可读的文本。 所谓"语言模型",就是只用来处理语言文字(或者符号体系)的 AI 模型,发现其中的规律,可以根据提示 阅读全文
posted @ 2023-07-06 17:47
mingruqi
阅读(672)
评论(0)
推荐(0)
摘要:
随时更新!汇总2023年开源的大型中文大规模语言模型,入选标准: 对中文支持能力强 模型规模 ≥ 1B 公布模型权重、推理代码 公布模型训练细节 Chinese-Vicuna 项目地址:https://github.com/Facico/Chinese-Vicuna 基座模型:LLaMA 7B 特点 阅读全文
posted @ 2023-07-06 17:44
mingruqi
阅读(389)
评论(0)
推荐(0)
摘要:
号称“史上最强的开源大语言模型”出现了。 它叫Falcon(猎鹰),参数400亿,在1万亿高质量token上进行了训练。 最终性能超越650亿的LLaMA,以及MPT、Redpajama等现有所有开源模型。 一举登顶HuggingFace OpenLLM全球榜单: 除了以上成绩,Falcon还可以只 阅读全文
posted @ 2023-07-06 17:42
mingruqi
阅读(106)
评论(0)
推荐(0)
摘要:
原文有模型链接与更新信息。 目前,业界开源的大语言模型越来越多,性能也越来越强大。然而,这些开源模型大多数由国外的机构贡献,对于英文的支持没有任何问题。但是,对于中文的支持则是有好有坏。本文将基于主流的开源大模型进行分析,介绍当前支持中文的开源大模型,并对其使用方式和主要能力进行总结。 上图是Dat 阅读全文
posted @ 2023-07-06 17:40
mingruqi
阅读(670)
评论(0)
推荐(0)
摘要:
开源大语言模型是否可以商用的调查报告 0. 背景 1. 调查结果 1.1 基础大模型(LLM) 1.2 对话大模型(ChatLLM) 1.3 多模态对话大模型(MultiModal-ChatLLM) 2. 可商用开源模型总结 2.1 基础大模型(LLM) 2.2 对话大模型(ChatLLM) 0. 阅读全文
posted @ 2023-07-06 15:32
mingruqi
阅读(1183)
评论(1)
推荐(0)

浙公网安备 33010602011771号