摘要: 大语言模型大语言模型(LLM)是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义。大语言模型可以处理多种自然语言任务,如文本分类、问答、对话等,是通向人工智能的一条重要途径。来自百度百科 发展历史 2020年9月,OpenAI授权微软使用GPT-3模型,微软成为全球首个 阅读全文
posted @ 2023-07-06 17:55 mingruqi 阅读(775) 评论(0) 推荐(1)
摘要: 背景 SambaNova和Together这2家公司于2023.05.19开源了可商用的支持多语言的微调模型BLOOMChat。 SambaNova这家公司专注于为企业和政府提供生成式AI平台,Together专注于用开源的方式打造一站式的foundation model,赋能各个行业。 OpenA 阅读全文
posted @ 2023-07-06 17:52 mingruqi 阅读(150) 评论(0) 推荐(0)
摘要: 今天,Stability宣布开源StableLM计划,这是一个正在开发过程的大语言模型,但是它是开源可商用的模型。本文将对该模型做简单的介绍!本文来自DataLearner官方博客:开源可商用大模型再添重磅玩家——StabilityAI发布开源大语言模型StableLM | 数据学习者官方网站(Da 阅读全文
posted @ 2023-07-06 17:51 mingruqi 阅读(146) 评论(0) 推荐(0)
摘要: 最近, 清华大学 NLP实验室、面壁智能、知乎联合在 OpenBMB 开源多模态大模型系列VisCPM,评测显示,VisCPM 在中文多模态开源模型中达到最佳水平。 VisCPM 是一个开源的多模态大模型系列,支持中英双语的多模态对话能力(VisCPM-Chat模型)和文到图生成能力(VisCPM- 阅读全文
posted @ 2023-07-06 17:50 mingruqi 阅读(119) 评论(0) 推荐(0)
摘要: 开源中英文大语言模型汇总 Large Language Model (LLM) 即大规模语言模型,是一种基于深度学习的自然语言处理模型,它能够学习到自然语言的语法和语义,从而可以生成人类可读的文本。 所谓"语言模型",就是只用来处理语言文字(或者符号体系)的 AI 模型,发现其中的规律,可以根据提示 阅读全文
posted @ 2023-07-06 17:47 mingruqi 阅读(672) 评论(0) 推荐(0)
摘要: 随时更新!汇总2023年开源的大型中文大规模语言模型,入选标准: 对中文支持能力强 模型规模 ≥ 1B 公布模型权重、推理代码 公布模型训练细节 Chinese-Vicuna 项目地址:https://github.com/Facico/Chinese-Vicuna 基座模型:LLaMA 7B 特点 阅读全文
posted @ 2023-07-06 17:44 mingruqi 阅读(389) 评论(0) 推荐(0)
摘要: 号称“史上最强的开源大语言模型”出现了。 它叫Falcon(猎鹰),参数400亿,在1万亿高质量token上进行了训练。 最终性能超越650亿的LLaMA,以及MPT、Redpajama等现有所有开源模型。 一举登顶HuggingFace OpenLLM全球榜单: 除了以上成绩,Falcon还可以只 阅读全文
posted @ 2023-07-06 17:42 mingruqi 阅读(106) 评论(0) 推荐(0)
摘要: 原文有模型链接与更新信息。 目前,业界开源的大语言模型越来越多,性能也越来越强大。然而,这些开源模型大多数由国外的机构贡献,对于英文的支持没有任何问题。但是,对于中文的支持则是有好有坏。本文将基于主流的开源大模型进行分析,介绍当前支持中文的开源大模型,并对其使用方式和主要能力进行总结。 上图是Dat 阅读全文
posted @ 2023-07-06 17:40 mingruqi 阅读(670) 评论(0) 推荐(0)
摘要: 开源大语言模型是否可以商用的调查报告 0. 背景 1. 调查结果 1.1 基础大模型(LLM) 1.2 对话大模型(ChatLLM) 1.3 多模态对话大模型(MultiModal-ChatLLM) 2. 可商用开源模型总结 2.1 基础大模型(LLM) 2.2 对话大模型(ChatLLM) 0. 阅读全文
posted @ 2023-07-06 15:32 mingruqi 阅读(1183) 评论(1) 推荐(0)