• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录

kaikai向前走

转职任务完成。崭新fn诞生
  • 博客园
  • 联系
  • 订阅
  • 管理

公告

View Post

用Regular expression寻找源代码中的汉字字符串

在平台改为支持多语言时,原来源代码中可能存在大量直接引用的字符串,需要改为由多语言模块翻译。
如果不能准确的搜索源代码,那么工作量将非常庞大。

在vc中使用Regular expression编写:
^[^#].*".*[\x4080-\xfffe]+.*"
匹配所有非预编译中的包含汉字的字符串。
\x4080-0xfffe其实超过了汉字集合,不过源代码里用到这些'特别'的字符的可能性并不大。

面对类似的恐怖的工作量,基本上都别靠蛮力。

btw,前几天学到一个awk工具。它也非常有用。它是一个数据驱动的文本处理工具。

posted on 2006-03-08 18:00  kaikai  阅读(787)  评论(2)    收藏  举报

刷新页面返回顶部
 
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3