2023 年 7月 6 日随笔档案 - mingruqi

2023年7月6日

摘要：大语言模型大语言模型（LLM）是指使用大量文本数据训练的深度学习模型，可以生成自然语言文本或理解语言文本的含义。大语言模型可以处理多种自然语言任务，如文本分类、问答、对话等，是通向人工智能的一条重要途径。来自百度百科发展历史 2020年9月，OpenAI授权微软使用GPT-3模型，微软成为全球首个阅读全文

posted @ 2023-07-06 17:55 mingruqi 阅读(803) 评论(0) 推荐(1)

逼近GPT-4！BLOOMChat: 开源可商用支持多语言的大语言模型

摘要：背景 SambaNova和Together这2家公司于2023.05.19开源了可商用的支持多语言的微调模型BLOOMChat。 SambaNova这家公司专注于为企业和政府提供生成式AI平台，Together专注于用开源的方式打造一站式的foundation model，赋能各个行业。 OpenA 阅读全文

posted @ 2023-07-06 17:52 mingruqi 阅读(163) 评论(0) 推荐(0)

开源可商用大模型再添重磅玩家——StabilityAI发布开源大语言模型StableLM

摘要：今天，Stability宣布开源StableLM计划，这是一个正在开发过程的大语言模型，但是它是开源可商用的模型。本文将对该模型做简单的介绍！本文来自DataLearner官方博客：开源可商用大模型再添重磅玩家——StabilityAI发布开源大语言模型StableLM | 数据学习者官方网站(Da 阅读全文

posted @ 2023-07-06 17:51 mingruqi 阅读(155) 评论(0) 推荐(0)

能「说」会「画」， VisCPM：SOTA 开源中文多模态大模型

摘要：最近，清华大学 NLP实验室、面壁智能、知乎联合在 OpenBMB 开源多模态大模型系列VisCPM，评测显示，VisCPM 在中文多模态开源模型中达到最佳水平。 VisCPM 是一个开源的多模态大模型系列，支持中英双语的多模态对话能力（VisCPM-Chat模型）和文到图生成能力（VisCPM- 阅读全文

posted @ 2023-07-06 17:50 mingruqi 阅读(127) 评论(0) 推荐(0)

开源中英文大语言模型汇总

摘要：开源中英文大语言模型汇总 Large Language Model (LLM) 即大规模语言模型，是一种基于深度学习的自然语言处理模型，它能够学习到自然语言的语法和语义，从而可以生成人类可读的文本。所谓"语言模型"，就是只用来处理语言文字（或者符号体系）的 AI 模型，发现其中的规律，可以根据提示阅读全文

posted @ 2023-07-06 17:47 mingruqi 阅读(695) 评论(0) 推荐(0)

开源中文大型语言模型（资源汇总

摘要：随时更新！汇总2023年开源的大型中文大规模语言模型，入选标准：对中文支持能力强模型规模 ≥ 1B 公布模型权重、推理代码公布模型训练细节 Chinese-Vicuna 项目地址：https://github.com/Facico/Chinese-Vicuna 基座模型：LLaMA 7B 特点阅读全文

posted @ 2023-07-06 17:44 mingruqi 阅读(409) 评论(0) 推荐(0)

开源大模型新SOTA，支持免费商用，比LLaMA65B小但更强

摘要：号称“史上最强的开源大语言模型”出现了。它叫Falcon（猎鹰），参数400亿，在1万亿高质量token上进行了训练。最终性能超越650亿的LLaMA，以及MPT、Redpajama等现有所有开源模型。一举登顶HuggingFace OpenLLM全球榜单：除了以上成绩，Falcon还可以只阅读全文

posted @ 2023-07-06 17:42 mingruqi 阅读(113) 评论(0) 推荐(0)

截至2023年5月份目前业界支持中文大语言模型开源和商用许可协议总结

摘要：原文有模型链接与更新信息。目前，业界开源的大语言模型越来越多，性能也越来越强大。然而，这些开源模型大多数由国外的机构贡献，对于英文的支持没有任何问题。但是，对于中文的支持则是有好有坏。本文将基于主流的开源大模型进行分析，介绍当前支持中文的开源大模型，并对其使用方式和主要能力进行总结。上图是Dat 阅读全文

posted @ 2023-07-06 17:40 mingruqi 阅读(693) 评论(0) 推荐(0)

开源大语言模型是否可以商用的调查报告

摘要：开源大语言模型是否可以商用的调查报告 0. 背景 1. 调查结果 1.1 基础大模型(LLM) 1.2 对话大模型(ChatLLM) 1.3 多模态对话大模型(MultiModal-ChatLLM) 2. 可商用开源模型总结 2.1 基础大模型(LLM) 2.2 对话大模型(ChatLLM) 0. 阅读全文

posted @ 2023-07-06 15:32 mingruqi 阅读(1203) 评论(1) 推荐(0)

ming

公告