如果是常见文件的话grep -o '[^ -~]' file 就大概是中文汉字和中文标点了。如果想精确点的话grep -o '[一-龥]' file应该可以一就是\u4e00龥就是\u9FA5也就是传说中unicode编码中的第一个汉字和最后一个汉字
posted on 2018-05-08 10:55 likeatree 阅读(464) 评论(0) 收藏 举报