瑞士开源大语言模型今夏发布
开源瑞士大语言模型今夏发布
由瑞士联邦理工学院与苏黎世联邦理工学院联合开发的大语言模型(LLM)即将在今夏公开发布。该模型在瑞士国家超算中心的"阿尔卑斯"超级计算机上完成训练,标志着开源AI与多语言处理技术的重大进展。
开放生态建设
近期在日内瓦举办的国际开源LLM构建者峰会上,50余家全球领先机构共同探讨了开源基础模型的协作生态。该模型作为峰会焦点,由瑞士多所高校与超算中心工程师联合开发,具有以下核心特性:
- 完全开源:模型源代码、权重及训练数据全部公开
- 多语言支持:覆盖1500多种语言(60%英语+40%非英语)
- 合规设计:严格遵循瑞士数据保护法及欧盟AI法案
技术架构
模型提供两个版本:
- 80亿参数版:满足常规需求
- 700亿参数版:全球性能最强的完全开源模型之一
训练使用超过15万亿高质量token,采用100%碳中和电力在配备10,000块NVIDIA Grace Hopper超级芯片的"阿尔卑斯"超算上完成。
社会影响
项目负责人表示:"完全开放的模型不仅能推动AI风险研究,更有利于监管合规。"该模型采用Apache 2.0许可证发布,配套文档将详细说明架构、训练方法及应用指南,支持全球科研机构二次开发。
背景延伸
瑞士AI计划由10余所学术机构参与,每年可使用超2000万GPU小时,是目前全球最大的AI基础模型开源科学计划。超算中心作为LUMI联盟成员,通过跨国合作确保基础设施的持续领先。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)
公众号二维码


浙公网安备 33010602011771号