toolgood

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

2021年9月1日

摘要: 普通公司的敏感词审核制度,从三个方面来划分:敏感词的程度、审查策略、人工审查策略。大公司还会将用户类别、所在地区进行划分。 一、依据敏感词程度分成违禁词、高危敏感词、中低危敏感词。 违禁词依据限制还可划细分为“禁止发布”和“禁止搜索”,或二者皆有。 文章或留言踩中一些高危敏感词,如涉政涉爆信息,直接 阅读全文
posted @ 2021-09-01 10:30 ToolGood 阅读(3568) 评论(0) 推荐(0) 编辑

2021年8月31日

摘要: 2月底,我辞了公司工作,开始为自己奋斗,立志在敏感词过滤方面走出一条路来。原以为凭借ToolGood.Words开源项目所领悟的算法及多年优化经验,我可以在3个月内快速完成,然而我用了6个月,在6个月内,我换了三套核心算法,每次重写都让人心身疲惫,甚至有点自我怀疑,一个人单干真得太难了。 敏感词过滤 阅读全文
posted @ 2021-08-31 08:50 ToolGood 阅读(5202) 评论(4) 推荐(2) 编辑

2021年7月22日

摘要: 最近,骗子盯上了网站备案。。。 今天莫名奇妙地收到一个顺丰快递通知,是到付的,代收金额23元。 在微信点开通知一看,显示从北京市寄过来的,进入 【运单详情】,始发地却是宿迁市。 内容却是网站备案相关文字描述,显示网站域名是我第一个网站,(其实最近我已申请第二个网站备案,而且备案成功通知早就发到我的邮 阅读全文
posted @ 2021-07-22 16:59 ToolGood 阅读(443) 评论(1) 推荐(0) 编辑

2020年10月11日

摘要: 目录: 一、新人小白过滤敏感词 1.1)小谈过滤算法 1.2)使用List<string>遍历所有敏感词 1.3)使用正则方式查寻敏感词 1.4)敏感词过滤算法比较 二、网络常用敏感词过滤方法 2.1)基础概念介绍 2.2)Trie tree算法 2.3)AC自动机算法 2.4)AC自动机的几种改良 阅读全文
posted @ 2020-10-11 14:31 ToolGood 阅读(640) 评论(0) 推荐(0) 编辑

2020年10月3日

摘要: 7月到10月,我考虑太多事情了,从7月的焦虑,89月的迷茫,到最近几天的清醒与自信。焦虑,那就是有心人故意告诉我“同样的工作,别人比我工资高,可能年纪还比我小”,让我产生焦虑,然后他告诉我,他有课程能让我提高自己,能涨工资,解除焦虑。焦虑,其实来源我们内心深处,不然就不会被人几句话轻易的勾起焦虑。来 阅读全文
posted @ 2020-10-03 10:46 ToolGood 阅读(142) 评论(0) 推荐(0) 编辑

2020年8月16日

摘要: 最近,我写公司项目word导出功能,应该只有2小时的工作量,却被硬生生的拉长2天,项目上线到业务正常运行也被拉长到2个星期。 为什么如此浪费时间呢? 1)公司的项目比较老,采用硬编码模式,意味着word改一个字就要发布一次代码。发布检验就浪时间了。 2)由于硬编码,采用的是<html>这种格式,手写 阅读全文
posted @ 2020-08-16 12:22 ToolGood 阅读(1901) 评论(3) 推荐(2) 编辑

2020年5月23日

摘要: 最近一个Asp.net core项目需要静态化页面,百度查找了一下,没有发现合适的。原因如下 配置麻烦。 类库引用了第三方类,修改起来麻烦。 有只支持MVC,不支持PageModel。 继承ActionFilterAttribute类,只重写了OnActionExecutionAsync,看似静态化 阅读全文
posted @ 2020-05-23 10:42 ToolGood 阅读(1694) 评论(1) 推荐(6) 编辑

2019年4月13日

摘要: 前几天,公司数据库出现了两条相同的数据,而且时间相同(毫秒也相同)。排查原因,发现是网络波动造成了重复提交。 由于网络波动而重复提交的例子也比较多: 网络上,防重复提交的方法也很多,使用redis锁,代码层面使用lock。 但是,我没有发现一个符合我心意的解决方案。因为网上的解决方案,第一次提交返回 阅读全文
posted @ 2019-04-13 13:32 ToolGood 阅读(2513) 评论(3) 推荐(4) 编辑

2018年1月10日

摘要: 最近研究JWT算法, JWT由header、payload、signature三个部分组成,payload是非加密的,一些敏感信息能被别人非法获得,必要时候要加密。 加密算法中,RC4算法的速度可以达到DES加密的10倍左右,且具有很高级别的非线性。由于RC4算法加密是采用的xor,所以,一旦子密钥 阅读全文
posted @ 2018-01-10 20:15 ToolGood 阅读(614) 评论(1) 推荐(0) 编辑

2017年2月7日

摘要: 最近研究汉字转拼音,想到了拼音模糊搜索,每个网站都有关键字提示系统,自己粗略的写了一个,速度还不错,但一看内存,吓了一大跳,200多个关键字4G多内存,于是研究了一下关键字提示的算法,也就有了本文。 由于这个算法的细节过多,只放片段代码有可能误导读者,所以本篇文章不放代码,有兴趣的同学可以下载源码研 阅读全文
posted @ 2017-02-07 21:09 ToolGood 阅读(829) 评论(0) 推荐(1) 编辑