05 2021 档案
摘要:1、按Ctrl+F,弹出“替换”的窗口; 2、选择“替换”菜单; 3、“查找目标”内容输入为:\r\n; 4、“替换为”内容为空; 5、“查找模式”选择为正则表达式; 6、设置好之后,点击“全部替换”,即可将多行数据合并成一行。 参考:使用Notepad++将多行数据合并成一行
阅读全文
摘要:介绍 布隆过滤器(Bloom Filter,下文简称BF)由Burton Howard Bloom在1970年提出,是一种空间效率高的概率型数据结构。它专门用来检测集合中是否存在特定的元素。 设计思想 布隆过滤器是由一个长度为m比特的位数组(bit array)与k个哈希函数(hash functi
阅读全文
摘要:二叉树理论基础 满二叉树:如果一棵二叉树只有度为0的结点和度为2的结点,并且度为0的结点在同一层上,则这棵二叉树为满二叉树。 完全二叉树:在完全二叉树中,除了最底层节点可能没填满外,其余每层节点数都达到最大值,并且最下面一层的节点都集中在该层最左边的若干位置。若最底层为第 h 层,则该层包含 1~
阅读全文
摘要:1.统计出IP的文件,哪个ip出现的次数最多,一行一个ip。如果文件很大,超过内存。 (1)将ip地址放入多个小文件中,保证每种IP只出现在一个文件中(2)利用hashmap统计每个小文件中IP出现的次数(3)利用最小堆得到所有IP访问次数最多的100个 2.给定a、b两个文件,各存放50亿个url
阅读全文
摘要:1、相似性度量(八种常用相似距离计算): 基于用户的协同过滤和基于物品的协同过滤的适用场景
阅读全文

浙公网安备 33010602011771号