微软Phi-3，3.8亿参数能与Mixtral 8x7B和GPT-3.5相媲美，量化后还可直接在IPhone中运行

Phi-3系列

Phi-3是一系列先进的语言模型，专注于在保持足够紧凑以便在移动设备上部署的同时，实现高性能。Phi-3系列包括不同大小的模型：

Phi-3-mini（38亿参数） - 该模型在3.3万亿个令牌上进行训练，设计得足够小，可以在现代智能手机上运行。尽管体积紧凑，它的性能却可与更大的模型如Mixtral 8x7B和GPT-3.5相媲美，例如在MMLU基准测试中达到69%，在MT-bench上得分为8.38。
Phi-3-small（70亿参数）和Phi-3-medium（140亿参数） - 这些是Phi-3系列中较大的版本，在相同类型的数据上训练，但令牌数更多（4.8万亿），表现更佳。例如，Phi-3-small和Phi-3-medium在相同基准测试中的得分高于Phi-3-mini。

Phi-3模型的开发涉及使用经过严格过滤的网络数据和合成数据训练模型，使它们能够执行通常预期的大型模型任务。这种策略使Phi-3系列能够利用更小、更高效的模型，而不牺牲功能，使其能够直接在智能手机上运行。

Phi-3模型的重要性在于它们能够将强大的AI能力带到移动设备上，允许运行完全本地的强大AI应用，无需持续的互联网连接。这种进步可能导致广泛的设备上应用，增强用户隐私并减少AI驱动任务的延迟。

posted @ 2024-04-24 12:13 deephub 阅读(130) 评论(0) 收藏举报

刷新页面返回顶部