关于Hive正则匹配中文字符串的问题

首先,中文字符集为 '^[\\4e00-\\u9fa5]$'

1.如果直接在Hive命令行中使用, 则直接使用 ‘^[\\u4e00-\\u9fa5]$’ 进行匹配

 

2.如果在终端调用,则需叫上转义符,如

hive -e "select '中国'  rlike ‘^[\\\u4e00-\\\u9fa5]$’"

 

3.在scala和java中使用 同1;

val regex = new Regex("[\\u4e00-\\u9fa5]")
val a = regex.findFirstMatchIn("中国")
println(a)

 

posted @ 2018-09-28 15:20  洛杉矶骑士总冠军  阅读(7873)  评论(0编辑  收藏  举报