摘要: 1.数据量级 gpt-4 1750亿参数 2、不同自然语言训练表现不同 中文较差 3、数据来源问题 (1)中文网站优质内容少,且需要付费,优质平台消亡 (2)很多现存平台内容质量差,如csdn (3)水军、自媒体、营销号和饭圈太多,豆瓣,贴吧,微博小红书 (4)互联网大厂行业竞争与垄断,用户数据生态 阅读全文
posted @ 2023-03-31 23:03 万里同风 阅读(73) 评论(0) 推荐(0)