grep 汉字

如果是常见文件的话

grep -o '[^ -~]' file 

就大概是中文汉字和中文标点了。

如果想精确点的话

grep -o '[一-龥]' file

应该可以

一就是\u4e00
龥就是\u9FA5
也就是传说中unicode编码中的第一个汉字和最后一个汉字

posted on 2018-05-08 10:55  likeatree  阅读(464)  评论(0)    收藏  举报

导航