2024-07-24 闲话

人们总说,学校是给你试错的地方。诚然。之前闹得沸沸扬扬的“ GPT4o token 列表中出现了意义不明内容”的事情的zhihu帖子里面给出了一些原因的猜测,有一个是洗数据顺序错了,然后带着嘲讽意味说,在国内大模型公司,实习生犯这种错误得被骂一顿,正式员工肯定得扣绩效。

其实当时甚至到了现在对绩效一点概念也没有,逛zhihu的其它帖子里面写着什么“华子公司里面经常有上级对下级说,你是 B 里面靠前的了”,但是这种体验不亲身经历一下,都是浮云。Being rejected is tough.

因为之前没有把模型挂到端口上进行 inference 的经历,于是昨天说自己跑跑这个代码,然后发现:

  1. 服务器上得找一个现成 llama3-8b,要不然就得下载一个。我似乎懒得不 load from pretrained 了……
    找靠谱模型参数花了点时间,然后 load from pretrained 发现没有 tokenizer

  2. sb 服务器 transformers 版本太 jb 低了,不只是 transformers ,整个py 版本低得要命,极其之恶心。

然后自闭了。

posted @ 2024-07-24 22:44  没学完四大礼包不改名  阅读(374)  评论(1)    收藏  举报