在了解 UDP 校验和的时候,发现资料很少,如果看教材的话,一定看到过下面这两张图,但是又看不懂,加上解释之后也难懂:
本文先说具体怎么算的,再说一些细节,过程中顺带解释一下这两个图(第一张图是布局情况,第二张图是解释如何计算的)。
如何计算UDP校验和
为什么很多教材里的解释那么奇怪?
很多教材里的相关解释都来自于《TCP/IP Illustrated:Volume 1 The Protocol》,但是这本书的 UDP 校验和是为了后续的 UDP-Lite 铺路,告诉读者为什么会有个 UDP-Lite。因为 UDP 在八十年代的某些设备上是直接不检查校验的,也就是没人在意,毕竟有些程序丢/错几位也没什么问题,不检查还能提高性能(现在是默认开了)。而且很多实现方法不同,还是看文档比较快。所以书上并没有详细说明是如何计算的。
此外,很多教材的弊病就是把书当作课堂的辅助,所以一些事情并不会很好的进行解释,因为有老师去讲(但是忽略了老师水平可能不行的情况)。
任何检验算法都有个核心算法。汉明码是奇偶校验,CRC 是除法。
UDP 校验和就是加法。不过和其他校验方法相似的是,UDP 校验和的计算除了加法之外,还有一些额外的操作。
UDP 校验和的流程为:
UDP伪头+UDP头+数据 (+ 补0)
第一步UDP伪头+UDP头+数据 (+ 补0)
,看着很复杂,其实原理就一个:用所有相关数据组成一个 16 位倍数的部分,这样方便后续累加(其他算法大多缺位也都是补0
)。
16 位是因为 UDP 大部分属性都是 2 字节,比如端口号是 2 字节,也就是 16 位。
比如如果最后两部分是1011 1001 1011 0110
和0101
,不补0
的话就要考虑如何加(哪一位对哪一位),所以直接选择后续用0
填充:
1011 1001 1011 0110
+ 0101 0000 0000 0000
开头的伪头
是从 IP 数据报中拿来的,比如源 IP、目的 IP 以及协议、UDP 长度。也就是开头第一张图:
伪头+头+数据+0
,最后得到的也就是第二张图的这部分:
累加和进位
累加就很简单了,就每 16 位相加。如下:
不过加法可能会产生进位的情况,如果有进位,就当作1
加入结果:
1011 1001 1011 0110
+ 0110 0101 1100 0101
----------------------
1 0001 1111 0111 1011
这时候把进位加回到结果中:
0001 1111 0111 1011
+ 1
----------------------0001 1111 0111 1100
全部执行完就是上面图中的这部分:
取反得到最终校验码
对于上述操作的结果取反,就可以得到最终校验码,比如:
0001 1111 0111 1100
---------------------
1110 0000 1000 0011
也就是上图中的这部分:
这个算法不难,就是没材料理清楚,希望能帮到有需要的人~
参考资料
《TCP/IP Illustrated:Volume 1 The Protocol》
RFC768 User Datagram Protocol