|
公告
日历
| | 日 | 一 | 二 | 三 | 四 | 五 | 六 |
|---|
| 27 | 28 | 29 | 30 | 31 | 1 | 2 | | 3 | 4 | 5 | 6 | 7 | 8 | 9 | | 10 | 11 | 12 | 13 | 14 | 15 | 16 | | 17 | 18 | 19 | 20 | 21 | 22 | 23 | | 24 | 25 | 26 | 27 | 28 | 29 | 30 | | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
|
统计
- 随笔 - 482
- 文章 - 4
- 评论 - 593
- 引用 - 114
导航
常用链接
我参与的团队
我的标签
随笔分类(476)
我的空间
友情链接
积分与排名
最新评论

60天内阅读排行
|
评论:
-
#1楼
Posted @ 2006-09-12 16:08
兄弟,脏子字典文件给个下载吧,我知道贴出来是不可能的呵呵
免得兄弟们到处找了
可以的话封装成一个dll,方便调用
回复 引用 查看
-
#2楼
Posted @ 2006-09-12 16:18
不错
回复 引用 查看
-
#3楼[ 楼主]
Posted @ 2006-09-12 16:19
to : aspnetx
已经贴上了 !
回复 引用 查看
-
#4楼
Posted @ 2006-09-12 16:43
既然是字典,当然字典的查找效率更高了,为什么不把数据以字典形式存放查找?
回复 引用
-
#5楼[ 楼主]
Posted @ 2006-09-12 16:48
to :michael
这里只是做一个测试,看看哪中算法效率高,就采取哪种算法
式了一下普通算法 竟然比正则效率要高,为什么呢?还是我统计的方法有误?
回复 引用 查看
-
#6楼
Posted @ 2006-09-12 16:50
@PointNet
我觉得用LookUpTable方式,也是最直观地
回复 引用 查看
-
#7楼
Posted @ 2006-09-12 17:02
@PointNet
谢啦
早先我们老师收集这东西的时候深有感触
呵呵
收集完后自己都学会不少种说脏话的方法了
回复 引用 查看
-
#8楼
Posted @ 2006-09-12 17:08
可口可乐
这个也被包含到字典里了哈
看看博客园能否将其过滤掉
回复 引用 查看
-
#9楼[ 楼主]
Posted @ 2006-09-12 17:14
好象 一般的论坛都没有这个功能吧,因为有版主,博客园好像也没有过滤
回复 引用 查看
-
#10楼
Posted @ 2006-09-12 17:22
@PointNet
哈哈
要不然你试试?
回复 引用 查看
-
#11楼[ 楼主]
Posted @ 2006-09-12 17:30
to :aspnetx
我式过了 ,而且你刚才不是也发了吗? 我在论坛上做过测试!
回复 引用 查看
-
#12楼
Posted @ 2006-09-12 18:42
@PointNet
哈哈,我只是好奇那个词怎么也会有
而你如果真试了的话,我指特别敏感的那个词的话
那么,即使dudu不来找你,也会有人来找你的
听说有的公司就是给电信做那种抓包业务的哦
回复 引用 查看
-
#13楼
Posted @ 2006-09-12 20:22
不能说是"脏"字
可以说是避讳字吧
回复 引用 查看
-
#14楼
Posted @ 2006-09-13 10:27
粗看下,应该是正则效率高吧,你的测试之所以普通的要高些,是因为你只做了存在测试,并没有有替换的步骤,应加上这步的比较
另外你的使用正则的方法有必要改进一下
Regex reg=(Regex)HttpRuntime.Cache["Regex"];
这会比较费时,1,会在Cache字典中查找"Regex",当Cache很多对象时,很费时;2,使用显示转换;
用静态类的静态方法做正则的提供者是比较好的做法.
还有正则表达式
"^((?!"+dirtyStr+").(?<!"+dirtyStr+"))*$"
没看懂意思,为什么要加上!和<,而且dirtyStr重复是两次之多,这与普通测试好象差别很大啊
这也可能是测试结果不对的原因.
回复 引用
-
#15楼[ 楼主]
Posted @ 2006-09-13 10:44
是啊! 是一些敏感话题中的词语!
回复 引用 查看
-
#16楼[ 楼主]
Posted @ 2006-09-13 11:34
@Edwin Liu
谢谢指点,几个问题:
1.使用显示转换如何做
2.静态类的静态方法,静态类什么意思
3. ?! 代表右边必须不存在 脏字1|脏字3|脏字2
这样的东西
4.能提供更好的正则表达式吗?
回复 引用 查看
-
#17楼
Posted @ 2007-09-26 03:55
http://www.ceisoft.net/?q=node/1" target="_new">http://www.ceisoft.net/?q=node/1
自己实现的算法,速度比文本查找提高10倍.
回复 引用 查看
-
#18楼
Posted @ 2007-09-28 08:36
特色
回复 引用 查看
-
#19楼
Posted @ 2008-01-23 20:40
妈妈的
回复 引用
-
#20楼
Posted @ 2008-01-23 23:20
测试的写的有问题。
t2-t1这样的测试不精确,用 Stopwatch 对象测试时间间隔,测试间隔的时候只要测试匹配函数运行时间就可以了。
str+这样的写法效率很低,使用stringbuilder对象效率会高很多。
我估计你现在的测试的时间相当一部分都消耗在str+上了。
回复 引用
-
#21楼
Posted @ 2008-07-22 16:38
速度很慢啊。
回复 引用 查看
-
#22楼
Posted @ 2008-07-22 16:38
@icyfire 同意,我也是这个看法。
回复 引用 查看
-
#23楼
Posted @ 2008-08-21 08:59
楼主你好,能发给我一个脏字字典吗?很感激,我在做毕业设计,急需啊!邮箱iloveecho83@yahoo.com.cn
回复 引用
-
#24楼[ 楼主]
Posted @ 2008-08-22 09:40
已经发了
回复 引用 查看
-
#25楼
Posted @ 2008-12-09 14:58
看了你的脏字字典,好多啊。。你的这个算法行吗?
回复 引用 查看
-
#26楼
Posted @ 2008-12-09 15:04
我来测试一下脏字:
“他妈的”这算是脏字
回复 引用 查看
-
#27楼
Posted @ 2008-12-09 15:04
这里好像没有过滤。。。。
回复 引用 查看
-
#28楼[ 楼主]
Posted @ 2008-12-12 14:37
当然可以了@极品菜鸟
回复 引用 查看
|