随笔分类 -  text

下载生物信息
摘要:http://www.catalogueoflife.org/col/browse/classification这是一个国外的生物信息网站今天的代码可以抓取指定分类的信息(id,学名)没有把多线程写进去,略失败...运用:webclient,regex,io项目在>>>开源中国 1 using Sy... 阅读全文
posted @ 2014-05-19 16:13 13m0n 阅读(255) 评论(0) 推荐(0)
正则表达式 汉字部分
摘要:匹配中文标点符号:String str="[\u3002\uff1b\uff0c\uff1a\u201c\u201d\uff08\uff09\u3001\uff1f\u300a\u300b]" 该表达式可以识别出: 。 ; ,: “ ”( ) 、 ? 《 》 这些标点符号。匹配中文汉字 String str="[\u4e00-\u9fa5]";该表达式可以识别出汉字。 阅读全文
posted @ 2014-04-08 15:01 13m0n 阅读(232) 评论(0) 推荐(0)
初始正则表达式
摘要:1 using System.Text.RegularExpressions;2 3 4 string regext = ".*\\s+.{41}\\s+href=\"http:\\/\\/([\\w\\-\\.,@?^=%&amp;:/~\\+#]*[\\w\\-\\@?^=%&amp;/~\\+#])?\">[0-9a-zA-Z\\u0391-\\uFFE5]+(.*\\s+){5}(<.*\\s+){1,3}"; //正则表达式内容regext5 6 foreach (Match mi in Regex.Matches( 阅读全文
posted @ 2014-03-24 19:24 13m0n 阅读(190) 评论(0) 推荐(0)