摘要:前言 由于需要做一个快速匹配敏感关键词的服务,为了提供一个高效,准确,低能耗的关键词匹配服务,我进行了漫长的探索。这里把过程记录成系列博客,供大家参考。 在一开始,接收到快速敏感词匹配时,我就想到了 KMP 翻译过来叫“看毛片“的算法,因为大学的时候就学过它。听说到它的效率非常高。把原本字符串匹配效 阅读全文
posted @ 2019-08-05 14:36 Shendu.CC 阅读 (3882) 评论 (1) 编辑
摘要:.net core 于 10月17日发布了 "ASP.NET Core 2.2.0 preview3" ,在这个版本中,我看到了一个很让我惊喜的新特性: HTTP Client Performance Improvements ,而且在Linux上性能提升了60% ! 之前就一直苦于 HttpCli 阅读全文
posted @ 2018-11-02 09:13 Shendu.CC 阅读 (4145) 评论 (16) 编辑
摘要:前言: 上一篇提到了特征提取,或者叫做降维。在文本分类中,特征提取算法的优劣对于文本分类的结果具有非常大的影响。 所以选择效果好的特征提取算法是文本分类前中很重要的步骤。于是这篇就对卡方检验做一个介绍。这是一个效果很好的特征提取方法。 之前对卡方检验做过介绍:卡方检验是通过对特征进行打分然后排序,选 阅读全文
posted @ 2018-04-09 17:55 Shendu.CC 阅读 (9271) 评论 (4) 编辑
摘要:前言:目前自己在做使用Lucene.net和PanGu分词实现全文检索的工作,不过自己是把别人做好的项目进行迁移。因为项目整体要迁移到ASP.NET Core 2.0版本,而Lucene使用的版本是3.6.0 ,PanGu分词也是对应Lucene3.6.0版本的。不过好在Lucene.net 已经有 阅读全文
posted @ 2018-02-08 14:26 Shendu.CC 阅读 (3243) 评论 (54) 编辑
摘要:"题目" 阅读全文
posted @ 2020-04-03 12:31 Shendu.CC 阅读 (5) 评论 (0) 编辑
摘要:"题目" 递归,分治,暴力跑就可以了 阅读全文
posted @ 2020-04-03 12:30 Shendu.CC 阅读 (3) 评论 (0) 编辑
摘要:"题目" O(m+n) 阅读全文
posted @ 2020-04-03 12:28 Shendu.CC 阅读 (5) 评论 (0) 编辑
摘要:"第一题" "第四题" 数位DP,之前没有接触过,这次学了一下数位DP 阅读全文
posted @ 2020-03-31 17:34 Shendu.CC 阅读 (7) 评论 (0) 编辑
摘要:40分钟刷完4题,打破自己的最高纪录 "第一题" "第二题" 遍历除数的时候从1到sqrt(nums[i]) 10000 sqrt(100000) 是不会超时的 "第四题" KMP 的求最长公共前后缀的部分,就是Next的部分 阅读全文
posted @ 2020-03-22 15:50 Shendu.CC 阅读 (10) 评论 (0) 编辑
摘要:"题目" 题解: 现场想到了从结果的二进制的每一位考虑,每一位都是由比它低的低位决定的,但是规律没找好。 举个例子,结果的二进制的第3位(从0位开始)上是否为1,是由0 到 2^4 1 之间的数决定,就是 0000 1111 之间所有数两两相加决定的,所以数组要先对2^4取余。 而相加的结果,只有在 阅读全文
posted @ 2020-03-21 19:57 Shendu.CC 阅读 (8) 评论 (0) 编辑
摘要:前言 因为想做一下文本自动摘要,文本自动摘要是NLP的重要应用,搜了一下,有一种TextRank的算法,可以做文本自动摘要。其算法思想来源于Google的PageRank,所以先把PageRank给了解一下。 马尔科夫链 我感觉说到PageRank,应该要提起马尔科夫链,因为PageRank在计算的 阅读全文
posted @ 2020-03-16 13:34 Shendu.CC 阅读 (92) 评论 (0) 编辑
摘要:"题目" 题解:DFS,同时记住已经DFS的结果,防止重复搜索 阅读全文
posted @ 2020-03-15 14:33 Shendu.CC 阅读 (11) 评论 (0) 编辑
摘要:"题目" 题解:区间DP dp[i][j] 表示i j的所有灯泡都熄灭了之后,能获得最大价值 阅读全文
posted @ 2020-03-15 14:32 Shendu.CC 阅读 (5) 评论 (0) 编辑
摘要:"第一题" "第三题" "第四题" 阅读全文
posted @ 2020-03-15 13:37 Shendu.CC 阅读 (7) 评论 (0) 编辑