HashMap的实现原理主要基于数组、链表和红黑树组成的复杂数据结构。put()
方法的执行流程包括计算哈希值、处理冲突、以及更新或添加元素等。扩容机制涉及触发条件、扩容过程、以及节点重新定位等方面。
HashMap的实现原理:
-
基础数据结构:
- 数组:HashMap底层使用一个数组来存储键值对。数组的长度总是2的幂次方,这是为了优化索引计算的性能[4]。
- 链表和红黑树:当数组的某个索引位置上出现多个键值对(即发生哈希冲突)时,这些键值对会以链表或红黑树的形式存储,以保持HashMap的性能[3][4]。
-
哈希函数与冲突解决:
- 哈希函数:用于根据键计算出应该存储在数组中哪个索引位置的哈希值。良好的哈希函数能使键值对均匀分布在整个数组中[3]。
- 冲突解决:HashMap通过链地址法解决哈希冲突,即在同一个数组索引位置上,通过链表或红黑树连接多个键值对[3]。
-
阈值和加载因子:
- 阈值:表示HashMap中最多可以存储多少个键值对而不需要扩容。计算公式为:数组长度 * 加载因子[3]。
- 加载因子:决定HashMap填满到什么程度时需要进行扩容,默认值为0.75[3]。
put()方法的执行流程:
-
插入新键值对:
- 首先根据键的哈希值确定在数组中的索引位置。
- 如果该位置没有元素,直接在这个索引处创建一个新的节点存放键值对。
- 如果该位置已经有元素(发生冲突),则比较当前键与现有键是否相等:
- 如果找到相等的键,更新对应的值;
- 如果不等,将新的键值对添加到该索引处的链表或红黑树中[4]。
-
扩容操作:
- 如果添加新元素后,元素数量超过了阈值,则会触发扩容操作。HashMap将创建一个新的双倍大小的数组,并重新计算所有已存键值对的位置,将其移到新的数组中。这个过程称为rehashing[2]。
扩容机制:
-
扩容触发条件:
- 当HashMap中的元素数量超过当前数组长度与加载因子的乘积时,就会触发扩容[2]。
-
扩容过程:
- 创建一个新的数组,长度是原数组的两倍。
- 遍历原数组,重新计算每个键值对的哈希值,并将其放到新数组的合适位置。
- 更新HashMap的数组引用到新的数组,并更新阈值[2]。
-
节点重新定位:
- 在扩容过程中,重要的一步是确保所有已存在的键值对在新数组中保持相同的相对顺序,以确保HashMap的正确性和性能[2]。
综上,HashMap是一个极其高效的数据结构,它利用数组和链表(及红黑树)的结合来解决哈希冲突,并通过适时的扩容来保持操作的高效性。