会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
jie_74
博客园
首页
新随笔
联系
订阅
管理
2022年4月1日
处理MR数据集为{'token''label'}
摘要: 从text_gcn中拿数据集 标签单独放开一个文件,每行有一个数字标签,0和1 原文说因为文本实在是太短了,所以没有去停用词 注意:MR使用Latin1编码!!! 查看编码格式 vim text_train.txt 命令框中输入 :set fileencoding #!/usr/bin/env py
阅读全文
posted @ 2022-04-01 20:42 jie_74
阅读(95)
评论(0)
推荐(0)
公告