会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
博客园
首页
新随笔
联系
订阅
管理
2023年3月31日
为什么中文语言模型这么难
摘要: 1.数据量级 gpt-4 1750亿参数 2、不同自然语言训练表现不同 中文较差 3、数据来源问题 (1)中文网站优质内容少,且需要付费,优质平台消亡 (2)很多现存平台内容质量差,如csdn (3)水军、自媒体、营销号和饭圈太多,豆瓣,贴吧,微博小红书 (4)互联网大厂行业竞争与垄断,用户数据生态
阅读全文
posted @ 2023-03-31 23:03 万里同风
阅读(73)
评论(0)
推荐(0)
公告