摘要: 基于Character-Based Language Model在制作之前需要对语料库中的词汇进行分割,将每个字母单拎出来存在另一个文件里使用; 下方是干分割工序的Python脚本: # -*- coding: UTF-8 -*- import string import sys def Split 阅读全文
posted @ 2022-09-26 15:16 艾孜尔江 阅读(533) 评论(0) 推荐(0)