网站首页 全球最实用的IT互联网站!

人工智能P2P分享Wind搜索发布信息网站地图标签大全

当前位置:诺佳网 > 软件工程 > 后端开发 > Python >

【python】字典数据结构的设计原理学习

时间:2025-12-02 23:52

人气:

作者:admin

标签:

导读:先说结论: python的dict,底层是哈希表(hash table)与开放寻址方案(二次探测#160; 伪随机跳跃) 其中, 核心结构:哈希表是一个“数组” 每个 dict 底层对应一块数组(table),数组每个...

先说结论:

python的dict,底层是哈希表(hash table)与开放寻址方案(二次探测 + 伪随机跳跃)

其中,

核心结构:哈希表是一个“数组”

每个 dict 底层对应一块数组(table),数组每个槽位(slot)可能存一个 key-value。

index:   0   1   2   3   4   5   6   7
value:  [ ] [ ] [ ] [ ] [ ] [ ] [ ] [ ]

任何输入的key 会被哈希(hash(key))

d["abc"] = 123

# python会计算

h = hash("abc")   →  得到一个整数,如 918273645
slot = h % table_size   →  如 918273645 % 8 = 5

于是 key 放到 槽位 5

index:   0   1   2   3   4   5   6   7
value:  [ ] [ ] [ ] [ ] [ ] [('abc',123)] [ ] [ ]

如果计算出的槽位已经被占用,dict 不会链表化存储,而是 继续找下一个空槽位,其中会使用 开放寻址(Open Addressing)

slot 6 空? → 放这里
slot 6 也有人? → 看 slot 7

  

dict 会控制“负载因子”(使用率),比如如果槽位使用率超过 ~2/3,自动扩容。扩容后空间很大,冲突变少,因此 dict 的性能保持 O(1)。

扩容操作:

  • table 大小扩成原来的 2 倍
  • 所有 key 重新哈希并放入新 table(rehash)

 

看具体的应用场景:使用dict进行查找、插入操作,时间复杂度是O(1)

1. 查找过程

查找 d[key]

  1. 计算 hash(key)

  2. 定位槽位 slot = hash % table_size

  3. 看到槽位里是不是这个 key

    • 是 → 找到

    • 否 → 使用开放寻址规则继续探测

那么影响时间长短的,就要看hash算法的底层原理了,hash函数大致是位运算+随机化

1 adict = {}
2 adict[key]=value
3 if i not in adict: # i是否属于adict的key

 

 

 

 

 

 

 

温馨提示:以上内容整理于网络,仅供参考,如果对您有帮助,留下您的阅读感言吧!
相关阅读
本类排行
相关标签
本类推荐

CPU | 内存 | 硬盘 | 显卡 | 显示器 | 主板 | 电源 | 键鼠 | 网站地图

Copyright © 2025-2035 诺佳网 版权所有 备案号:赣ICP备2025066733号
本站资料均来源互联网收集整理,作品版权归作者所有,如果侵犯了您的版权,请跟我们联系。

关注微信