摘要: 但是如果修改为['驴 福 记 ( 阜通 店 )','...',...]执行vectorizer.fit_transform就正常。原因是,创建CountVectorizer实例时,有一个默认参数analyzer='word',在该参数作用下,词频矩阵构建过程会默认过滤所有的单字token,所以上面的 阅读全文
posted @ 2019-02-26 15:03 yjy888 阅读(1375) 评论(0) 推荐(0)