摘要: 数据来源:http://ai.stanford.edu/~amaas/data/sentiment/ 1、处理数据集 1 import torch 2 import os 3 import re 4 from torch.utils.data import Dataset, DataLoader 5 阅读全文
posted @ 2021-10-25 17:53 luyizhou 阅读(822) 评论(0) 推荐(1)
摘要: 利用 Word2Vec 实现文本分词后转换成词向量 步骤: 1、对语料库进行分词,中文分词借助jieba分词。需要对标点符号进行处理 2、处理后的词语文本利用word2vec模块进行模型训练,并保存 词向量维度可以设置高一点,300 3、保存模型,并测试,查找相似词,相似词topN 1 import 阅读全文
posted @ 2021-10-25 10:45 luyizhou 阅读(1766) 评论(0) 推荐(0)