同步性能优化（三）

上一篇的重点在于修复卡顿，而本篇的重点在于，在一切正常的情况下，让同步性能提升，作为一个程序，优化三把斧：

提高 cpu、内存利用率
提高带宽/io 等利用率
串行并行化

只要硬件上没有神秘之力加成，优化就并没有什么神秘的东西，总结一句话，尽可能把资源榨干。

优化策略

IBD concurrent download

Cache system cell

Download scheduler

后期优化点

重复下载和异步化下载验证

“孤块池中的 block 可以被重复请求”这个问题目前只在 IBD 状态下解决了，非 IBD 状态下还是会有这样的问题，这也是一个未来的优化点，那么为什么要保留这个东西呢？原因很简单，这是当前 Request/Response 验证块架构下的固有问题，这也涉及到另一个优化点，当前的设计里，验证和下载块是串行的，如果将其并行化（异步化），性能又会有不小的提高，与此同时也彻底解决重复请求的问题。这是后期优化的一个点。

优化 scheduler

Download scheduler 目前用的策略是每次 block 的接受做计算并根据固定参数动态调节任务数，这个方案只是一个临时的方案，它有两个问题：

计算频率太高了，会影响本身的性能
固定参数不够灵活，无法很好支持多变的环境

虽然从目前的测试数据来看，效果还算理想，但上诉的两个问题其实是可以改善的，并且也是可预期的未来就会碰到的。

首先第一个问题，如果翻看了 PR 的同学们就可以看到，有大量的 benchmark 数据，从数据看，不在非 IBD 禁用调度器的调整功能会导致 15% 的性能下降，这是为什么：

benchmark 的测试用例在测试时有部分同步的场景，导致数据稍有失真，但却可以从侧面看出该调度器的计算过于频繁
非 IBD 时有重复下载的问题，导致调度器的计算次数被进一步放大，进而影响性能

第二个问题，目前是全网的块交易数据并不多，需要同步的 block size 也小，以 10M 带宽做计算算出来的上下界固定值调整不会有特别大的问题，但后期可见的数据量提升、每个人带宽的不一致、连接节点数的不一致会让该调整界限在很多情况下失去应有的效果，进而退化为没有 scheduler 能力的节点。

那么应对的方案已经存在于我脑海里了，但还并没有形成 PR，这里我简单描述一下方案：

设定一个 128 或者更高的数组，初始化调整界限为当前的 1.5s
每接一个 block 将时间插入数组中，并记录 index
当 index 到达数组上限时，回滚 0，重新开始插入
给当前的数组排序，取中位数并与当前的调整界限值进行平均，作为下一个期间的调整界限

这样首先将计算任务延时为一个 gap 一次的排序和取中位数，其次通过中位数与上期的平均，让该调整界限不会因为极端值而大幅抖动导致意外地逐出节点。使用中位数而不是平均数的原因也是为了避免极端值的影响。

当然，上述方案还没有经过测试，最近几天都在被其他事情干扰，导致被拖延了，看上去做个简单的测试还是很容易的，假期过后差不多就开始这项工作了。

跳过验证

将上述所有东西都实现完之后，同步的性能几乎就是在拼用户 cpu 性能了，那么有没有更快的方式呢？有，那就是跳过验证，也就是在到达某个 block 之前的所有 block 都不校验了，认为它们是安全的，这样在没有验证的情况下，同步性能可以提升到网络能支持的极致。这个方案不少其他项目有支持，在本项目下，它的实现应该会在上诉优化都完成之后。

小结

其实整体的优化并没有什么黑魔法，就是非常普通的改善方案。

这篇应该是本次优化系列的最后一篇，之后写其他的又要想标题了，有点烦躁。