.Net Core 中的 MurmurHash

    MurmurHash 是一种非加密型哈希算法,适用于一般的哈希检索操作,具有高性能、低碰撞率的特点。由 Google 的工程师 Austin Appleby 于2008年创建。MurmurHash 与其它流行的哈希函数相比,对于规律性较强的 Key,其随机分布特征表现的更好。非加密意味着着相对 MD5,SHA 这些函数它的性能更高(性能是 MD5 等加密算法的十倍以上),也正是由于它的这些优点,所以虽然它出现于2008年,但目前已经广泛应用到 Redis 等众多著名的软件中。MurmurHash 提供了两种长度的哈希值,32 bit,128 bit。MurmurHash 的英文为:(multiply and rotate) and (multiply and rotate)。

    最新版本是 MurmurHash3,基于MurmurHash2 改进了一些小瑕疵,使得速度更快,尤其对大块的数据,具有较高的平衡性与低碰撞率。

    .Net Core 使用 MurmurHash 要先使用 NuGet 添加 System.Data.HashFunction.MurmurHash 这个包。

//using System.Data.HashFunction.MurmurHash;
byte[] srcBytes = Encoding.UTF8.GetBytes("001");
// HashSizeInBits=32 or 128
var cfg = new MurmurHash3Config() { HashSizeInBits = 32,  Seed = 0 };
var mur = MurmurHash3Factory.Instance.Create(cfg);
var hv = mur.ComputeHash(srcBytes);
var base64 = hv.AsBase64String();
var hashBytes = hv.Hash;

对于规律性较强的 key,MurmurHash 的随机分布特征表现更良好,简单测试如下:
String   Hash值(Base64)
001 => oPj2oQ
002 => HWDyLA
003 => Qiz+PQ

虽然字符串 001,002,003 有规律,但其 Hash 值 oPj2oQ,HWDyLA,Qiz+PQ 已经没有规律了;

 

String   Hash值(Base64)
ade => HGGhPQ
bde => Ourovw
cde => slivpw

虽然字符串 ade,bde,cde 有规律,但其 Hash 值 HGGhPQ,Ourovw,slivpw 已经没有规律了。

 

HashSizeInBits=128时, Base64的Hash值长度是22位;HashSizeInBits=32时, Base64的Hash值长度只有6位;6位长度Hash值,很适合用于一般的哈希检索。

英文 (multiply and rotate) and (multiply and rotate)

posted on 2020-03-18 17:20  大豆男生  阅读(972)  评论(0编辑  收藏  举报

导航