会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
西西嘛呦
从自己能做到的开始,一件件来,缓慢而坚定地前进,尽力而为
博客园
首页
新随笔
联系
管理
2021年4月21日
【自然语言处理】对句子进行预处理
摘要: 主要是去除掉换行符、空格、制表符以及无效的字符: import collections import re import unicodedata import six def clean_br(text): br_pattern = ('<br\s*?/?>') text = re.sub(br_p
阅读全文
posted @ 2021-04-21 17:01 西西嘛呦
阅读(262)
评论(0)
推荐(0)
公告