2024-07-24 闲话
人们总说,学校是给你试错的地方。诚然。之前闹得沸沸扬扬的“ GPT4o token 列表中出现了意义不明内容”的事情的zhihu帖子里面给出了一些原因的猜测,有一个是洗数据顺序错了,然后带着嘲讽意味说,在国内大模型公司,实习生犯这种错误得被骂一顿,正式员工肯定得扣绩效。
其实当时甚至到了现在对绩效一点概念也没有,逛zhihu的其它帖子里面写着什么“华子公司里面经常有上级对下级说,你是 B 里面靠前的了”,但是这种体验不亲身经历一下,都是浮云。Being rejected is tough.
因为之前没有把模型挂到端口上进行 inference 的经历,于是昨天说自己跑跑这个代码,然后发现:
-
服务器上得找一个现成 llama3-8b,要不然就得下载一个。我似乎懒得不 load from pretrained 了……
找靠谱模型参数花了点时间,然后 load from pretrained 发现没有 tokenizer -
sb 服务器 transformers 版本太 jb 低了,不只是 transformers ,整个py 版本低得要命,极其之恶心。
然后自闭了。

浙公网安备 33010602011771号