写点什么

模拟 HashMap 冲突

作者:Jeremy Lai
  • 2022-12-01
    广东
  • 本文字数:1946 字

    阅读完需:约 6 分钟

最近看 HashMap 的源码,其中相同下标容易产生 hash 冲突,但是调试需要发生 hash 冲突,本文模拟 hash 冲突。

hash 冲突原理

HashMap冲突是 key 首先调用hash()方法:


static final int hash(Object key) {    int h;    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);}
复制代码


然后使用 hash 值和 tab 数组长度做与操作:


 (n - 1) & hash
复制代码


算出来的下标,如果一致就会产生冲突。

通过 ASKII 码获取单个字符

开始想到单字符,比如a、b、c、d、e这类字符,但是如果一个一个试的话特别繁琐,想到了ASKII码:



遍历1~100ASKII码。通过ASKII码获取单字符:


for (int i = 33; i < 100; i++) {    char ch = (char) i;    String str = String.valueOf(ch);}
复制代码


通过str获取下标,HashMap默认长度为16,所以n-1为 15:


int index = 15 & hash(str);
复制代码

获取发生 hash 冲突的字符

算出index一致的话,就放在一个列表中。不同的index放在HashMap中,完整代码如下:


Map<Integer, List<String>> param = new HashMap<>();for (int i = 33; i < 100; i++) {    char ch = (char) i;    String str = String.valueOf(ch);    int index = 15 & hash(str);    List<String> list = param.get(index);    if (list == null) {        list = new ArrayList<>();    }    list.add(str);    param.put(index,list);}param.forEach((k,v) -> System.out.println(k + " " + Arrays.toString(v.toArray())));
复制代码


输出结果:


0 [0, @, P, `]1 [!, 1, A, Q, a]2 [", 2, B, R, b]3 [#, 3, C, S, c]4 [$, 4, D, T]5 [%, 5, E, U]6 [&, 6, F, V]7 [', 7, G, W]8 [(, 8, H, X]9 [), 9, I, Y]
复制代码

源码调试

根据上面算出来的结果,使用其中的一个例子:


1 [!, 1, A, Q, a]
复制代码


先添加数据:


 Map<String,Integer> map = new HashMap<>(); map.put("!",1); map.put("1",1); map.put("A",1);
复制代码


先添加1, A, Q三个数据。然后添加Q


打开调式,定位到putVal方法:


final V putVal(int hash, K key, V value, boolean onlyIfAbsent,                   boolean evict) {    Node<K,V>[] tab; Node<K,V> p; int n, i;    if ((tab = table) == null || (n = tab.length) == 0)        n = (tab = resize()).length;    if ((p = tab[i = (n - 1) & hash]) == null)        tab[i] = newNode(hash, key, value, null);    else {        Node<K,V> e; K k;        if (p.hash == hash &&            ((k = p.key) == key || (key != null && key.equals(k))))            e = p;        else if (p instanceof TreeNode)            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);        else {            for (int binCount = 0; ; ++binCount) {                if ((e = p.next) == null) {                    p.next = newNode(hash, key, value, null);                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st                        treeifyBin(tab, hash);                    break;                }                if (e.hash == hash &&                    ((k = e.key) == key || (key != null && key.equals(k))))                    break;                p = e;            }        }        if (e != null) { // existing mapping for key            V oldValue = e.value;            if (!onlyIfAbsent || oldValue == null)                e.value = value;            afterNodeAccess(e);            return oldValue;        }    }    ++modCount;    if (++size > threshold)        resize();    afterNodeInsertion(evict);    return null;}
复制代码


在源码解析文章详解HashMap源码解析(下)中知道,发生 hash 冲突是会在上面代码的第16行,一直for循环遍历链表,替换相同的key或者在链表中添加数据:


for (int binCount = 0; ; ++binCount) {    if ((e = p.next) == null) {        p.next = newNode(hash, key, value, null);        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st            treeifyBin(tab, hash);        break;    }    if (e.hash == hash &&        ((k = e.key) == key || (key != null && key.equals(k))))        break;    p = e;}
复制代码


调式:



会一直遍历for循环,直到p.next==null遍历到链尾,然后在链表尾部添加节点数据:


p.next = newNode(hash, key, value, null);
复制代码

总结

  • 通过(h = key.hashCode()) ^ (h >>> 16)高位运算hash码(n - 1) & hash哈希表数组长度取模,分析hash冲突原理。

  • 通过ASKII码遍历获取字符串,获取发生hash冲突的字符。

  • 调用put方法,调用hash冲突源码。

用户头像

Jeremy Lai

关注

还未添加个人签名 2018-02-12 加入

还未添加个人简介

评论

发布
暂无评论
模拟HashMap冲突_hashmap_Jeremy Lai_InfoQ写作社区