机器学习 —— 大语言模型背景下的“泛化”概念的逐渐模糊化 —— 任务间泛化概念已经模糊
在机器学习领域,泛化是一个很重要的概念,但是在大语言模型背景该概念却变得界限模糊起来了。
特别要说明,本文说的“泛化”概念的模糊化是特指大语言模型的背景下的情况。
在大语言模型之前,在机器学习中是需要根据数据集来区分任务的,也就是说都是图像识别任务或对话系统任务的话也是需要区分出有的视觉任务是区分猫和狗的,有的视觉任务是区分牛和羊的,有的对话系统是回答售后服务的,有的对话系统是回答售前咨询的,但是大语言模型的出现就在一定程度上改变了这个情况。
大语言模型通过“大模型”和“大数据集”以及特定的算法模型结构所构造出的大语言模型,如ChatGPT、DeepSeeK等模型,已经可以对普遍的任务均可以有很好的适用性,针对不同的对话任务类型只需要给出一定的背景语料和适当的prompt提示就可以得到高performance的AI对话系统,因此,大语言模型在一定程度上就在机器学习的泛化能力上使任务间泛化概念或者说是使任务间的泛化的界限模糊化了,毕竟在大语言模型的背景下对于对话任务已经可以不区分具体任务了,而是对所有任务均可以适用了(当然对于某些特定任务的表现还是有不足和问题)。
虽然大语言模型实现了像人一样可以很好的进行几乎所有类型的任务的对话,但是这也只是局限于语言类型的对话任务,比如在视觉任务中还没有出现像大语言模型那样可以具有普遍适用性的模型。
首先,要知道语言本身就是人类所创造的,人类文明有文字记载的可以最远追溯到几千年前,而这最早的就是中国的文明历史了,因此人类迄今为止所创造出来的纸质记录的和电子记录的文字内容都是在一定程度上被认为是有限的,这也是为啥现在一直有说法说大语言模型已经没有可以学习的数据了,因为人类的已有的文字记录已经几乎都被大语言模型(chatGPT、DeepSeek等)给学过一遍了,已经米有更多的数据来学了,这时候只能等着人类创造新的文字内容了(比如有作家新写的书、网友新写的blog、记者新发表的新闻,等等),但是视觉任务却不是这样。视觉任务不可能像语言任务那边学完所有的数据,因为事物的图像数据可以被认为是无限大的,毕竟时间万物本身就是存在的,而不是人类所后天创造出来的,世间万物,比如:花鸟鱼虫,等等,可以说视觉的数据是无穷无尽的,因此也就不存在大语言模型那样可以把所有数据全学一遍的说法了。
虽然,李飞飞,吴恩达,等人,多年前就尝试过使用较大数据集来训练视觉任务,但是这样的数据集在今天的大语言模型背景下也算不上怎么大的数据量了,再加上图像数据本身就存在无上限数据量的这个特点,因此视觉任务很难像语言任务那样使用大模型、大算力、大数据量来训练出一个通用模型,也就是说在目前的AI技术下是不太有视觉任务的foundation model。目前的视觉任务的foundation model是做不到像大语言模型(chatGPT,等等)的那种通用能力的。
PS:
如果对于某一类任务,比如对话任务,图片识别任务,如果存在一个模型可以具有通用性,那么在这类任务上也就不存在任务间泛化的概念了,因为已经可以对这类任务都有很好的适用性了,可以说在一类任务上具有通用性的模型出现后那么在这类任务上也就没有了任务间泛化的概念了。
posted on 2025-03-19 13:59 Angry_Panda 阅读(70) 评论(0) 收藏 举报
 
                    
                     
                    
                 
                    
                 
                
            
         
         
 浙公网安备 33010602011771号
浙公网安备 33010602011771号