2019 年 2月 11 日随笔档案 - JieLongZ

2019年2月11日

摘要：分词（Tokenization） - NLP学习（1） N-grams模型、停顿词（stopwords）和标准化处理 - NLP学习（2）之前我们都了解了如何对文本进行处理：（1）如用NLTK文本处理库将文本的句子成分分成了N-Gram模型，与此同时引入了正则表达式去除一些多余的句子成分；（2）将阅读全文

posted @ 2019-02-11 15:57 JieLongZ 阅读(2940) 评论(1) 推荐(1) 编辑

持续学习的JielongZ

不积跬步无以至千里

公告