Custom Gem5 实现汇总
当前 Gem5 版本:v25.1.0.0
fork repo: https://github.com/xixi-shredp/gem5
BPU, BTB
| Branch | Description |
|---|---|
| dev-segmented-btb | 实现了 intel patents: segmented btb |
| dev-inf-btb | 实现了一个无限容量的全相联 BTB,用于分析 BTB 优化的性能上界 |
| dev-pipeline-bpu | 实现了一个更接近真实硬件的多周期分支方向预测器,后级的精确预测器可以纠正前级预测器的预测结果 |
| dev-directed-btb | 实现了用 BTB 做粗粒度方向预测(基于 dev-pipeline-bpu 分支) |
Cache Prefetcher
| Branch | Description |
|---|---|
| prefetcher | 参考 xs-gem5,实现了 Berti 预取器 |
| dev-ideal-cache | 实现了一个 Ideal DCache (直通到 Memory,绕过中间 cache), 用于分析 cache 优化的性能上界 |
| merged-multi-pf | 实现了一个简单的多预取器管理策略,将多个子预取器的预取请求中地址相同的请求合并 |
| dev-ipop | 实现了 2026 HPCA I-POP 的多预取器管理策略 |
性能分析
| Branch | Description |
|---|---|
| dev-ftrace | 用于生成 function call/ret trace (google trace event) |
| top-down | 参考 xs-gem5,实现 intel top-down 性能归因 |
All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.