摘要:
一、数据: word2vec训练数据格式说明:对于文本文件,基本格式是一行一句话,需要分好词。 (1)如果按字级别训练,将汉字分隔开就行。按字分割: line_str = line.replace(" ", "") cn = " ".join(line_str) (2)按词分割 方法有很多,jieb 阅读全文
posted @ 2021-05-24 10:17
jasonzhangxianrong
阅读(348)
评论(0)
推荐(0)
浙公网安备 33010602011771号