摘要:
1. 词条化是将给定的字符序列拆分成一系列子序列的过程,其中每个子序列称为一个词条(token)。在这个过程中,可能会同时去掉一些特殊字符,如标点符号等。 输入:Friends, Romans, Countrymen, lend me your ears; 输出:Friends Romans Cou 阅读全文
posted @ 2016-02-22 20:09
summerkiki
阅读(548)
评论(0)
推荐(0)
浙公网安备 33010602011771号