一些想法
最近去快手实习,用VLM做多模态内容理解。上一段是一个小厂的CV视觉算法,与智驾目标检测相关,上上段实习是小米的决策规划,主要洗数据和自己学习逆强化学习。
看过很多人的bg,在三个厂也实习过,最近也有Meta收购Manus的信息,不禁有些感触,
最近最火热的是大模型相关,大模型分为应用和基模研究,前者偏向业务和落地服务,后者偏向基础模型构建,但是在我看来,LLM、VLM、MLLM等,实际上真正落地收益很大的方向,实际上并不广泛,例如用VLM大模型来做目标识别,你用非语言模型来做,当然也可以甚至做的比它还好,大模型最核心的其实是生成,它是一个概率生成模型,最显著的方向我认为是教培,AI辅助教育行业,比如猿辅导作业帮等,似乎是大模型最收益的落地,其余的问答系统,或者是其他应用,想要真正落地应用并收益(指的是广泛性的应用,比如推荐算法会推荐商品,让东西更好地卖出去,这叫真真实实的收益,如果大模型仅仅靠贩卖API来想收益,是否不太理想?),还是有比较大的距离,也就是说其实大模型还有发展的空间,但是具体往哪方面发展,还是看基础模型的性能。
Meta收购Manus更进一步证实,构建基础模型很重要,但是如果将模型切身实地使用在日常生活中,应用在各个方面,并且能够获得收益,才是大模型这个泡沫持续壮大的最关键因素。众所周知,推广搜和距离钱最近的业务,因为他的推荐和广告效果,对于收益有最直接的影响,这就是一个很好的算法应用例子。
我有个很大胆的猜测,未来的趋势一定是基础模型的研究变成几家独大,然后应用算法岗位,才是最需要的。
我没有论文,没有顶会,实验室资源应该也很难有,发现很多人的bg就是手握几篇a会顶会,然后去闯人才计划,我不禁在想,真的需要这么多基础模型的研究人员吗?应用型的岗位是否是更看重具体的应用措施和经验,实习三段,我觉得对于大厂来说,如果使用的模型跟最好的模型相差不超过10个点或者5个点,都完全可以用调参来进行逼近,a会很多都是策略和模型部分创新,但是这些在应用岗上真的需要吗?应用岗实际上并不一味追求模型的架构带来的性能影响,可能数据更重要,和如何应用得效果更好更重要,追求模型的架构带来的性能提升,可能对于应用岗来说,如果你需要大量时间实践的话,其实是时间不允许的,那是基础模型研究才能容忍的,应用岗似乎更追求周期短,效果快,所以其实a会最好是去做基础模型的研究?所以实际上,对于我这种只能实习,无法产生顶会的人员来说,最好的就是去接触最有质量最涉及应用核心的实习位置,让我对业务有更深刻的理解,而不是去追求基模的研究。未来的职业规划应该也是,尽可能去拿算法应用业务岗位的好offer。
下一段实习我应该会去LLM结合推广搜的核心业务岗试试看,或者去基础模型研究岗位看看,不一样的风景,可能会让我又有不一样的领悟。
不知道未来的路如何去走,但就是需要慢慢前进慢慢探。

浙公网安备 33010602011771号