八进制

少年壮志无烟抽

  博客园 :: 首页 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::
  244 随笔 :: 0 文章 :: 3241 评论 :: 14 引用

已经是第二次遇到同样的问题了,要匹配的字符串里含有中文,例如“<你好><Edward>”,我希望取出Edward的名字,所以正则表达式为“<[^>]*><([^>]*)>”,匹配后只要取group(1)即可。在一台装有jdk1.4.2_06国际版的机器上,运行正常,但在装jdk1.4.2_01的机器上,则完全不能匹配。卸载原来的jdk,换成1.4.2_06版就没有问题了。

为什么会有这个区别呢,我试了增加各种参数例如-Duser.language=zh -Duser.region=cn -Dfile.encoding=GBK都没有用,难道我的程序要求用户机器上必须装最新的jdk1.4?但据我所知,还有很多机器上装的是jdk1.4.0呢,更别说jdk5.0了。

时间关系,这个问题暂时放在这里,欢迎提供解决方法。

posted on 2005-01-07 20:41 八进制 阅读(4077) 评论(7)  编辑 收藏 网摘 所属分类: Java

评论

我知道,我知道,解决方法就是:在每台机器上都装最新的jdk1.4。可以通过编写一小段提示程序来告诉用户这样做。
  回复  引用    

#2楼 2005-05-30 17:01 oonoon
第一次光临你的blog,有些问题想请教一下:
最近有种想法,想将xml文件里面的一些东西根据ontology的定义映射成它的实例,然后再利用jena将这些实例抽取出来,把它们存入关系数据库。比如xml里面有<element1>JSP高级编程<elment1/>,ontolgy“book”里面有书名这个概念。所以JSP高级编程就被映射成书名的一个实例。然后将它利用jena取出,存入数据库。
在映射到ontoloy之前要做什么事情我还没有想清楚。还有就是我用protege生成的book这个ontology里面的中文字符在export成.owl文件之后,owl文件中见所有的中文字符都是乱码。是不是因为owl不支持中文字符呢?

  回复  引用    

#3楼[楼主] 2005-05-30 22:12 八进制      
如果目的就是为了把xml里的对象导入到数据库,我觉得没有必要用ontology,利用digester这样的xml->object转换工具,再加上hibernate就可以很方便的完成。
owl没有支持不支持中文的问题,我想你是指protege,它处理中文是没有问题的。

  回复  引用  查看    

#4楼 2005-08-04 13:50 iq50628[未注册用户]
什么样的政则表达式才能做到,只能输入中文和标点符号呢?
  回复  引用    

#5楼 2006-09-18 20:11 deadcode[未注册用户]
<([\\u4e00-\\u9fa5]|[^>])*>
中文匹配的问题

  回复  引用    

JAVA的没碰到过
  回复  引用    

你好,我刚刚开始看正规表达式方面的东西,有关正规表达式、字符串匹配、perl 它们三者之间到底是什么关系?看的我晕晕的。
由于刚刚开始,问题有些白,请详细解答一下好吗?谢谢!

  回复  引用    

发表评论

昵称: [登录] [注册]

主页:

邮箱:(仅博主可见)

评论内容:

  登录  注册

[使用Ctrl+Enter键快速提交评论]

0 88414


相关文章:

相关链接: