hive 正则 同时保留中文英文数字符号 去除非中文
select regexp_replace('50.8九 ,c...o【.。。。】。。。$##mmmmQWER@@*&^ 112 历史088天空','([^\\u4E00-\\u9FA5a-zA-Z0-9.]+)','') as name
select regexp_replace('50.8九 ,c...o【.。。。】。。。$##mmmmQWER@@*&^ 112 历史088天空','([^\\u4E00-\\u9FA5a-zA-Z0-9.]+)','') as name