摘要重传机制 超时重传 快速重传 SACK重传 Duplicate SACK 重传机制 TCP重传机制主要是为了防止网路包丢弃,重传的工作方式主要借助TCP头部中的序列号和确认号来决定是否重传,重传的触发方式主要由以下几种: 超时重传 快速重传 SACK D-SACK 超时重传 什么是超时重传? 发送方在发送数据时设置一个定时器,当超过指定时间后如果还没有收到接收方的ACK响应,就会重发数据包。 超时重传的发生场景 数据包丢失 ACK响应丢失 什么是RTT?什么是RTO? RTT就是数据包的往返时间,RTO就是超时重传时间。 RTO的长短对数据包的重传有什么影响? 如果过长,假设发生数据包丢失,那么需要很长时间才能重传,效率低下 如果过短,如果数据包因为网络状况阻塞传输慢但没有丢失,这时也会触发重传,会导致网络更加阻塞,触发更多的重传。 RTO如何设置? RTO既不能过长也不能过短,略微大于RTT是最好的。但RTT会因为网络的变化而发生变化,所以在Linux系统中为了计算RTO,会对RTT进行两个采样: 通过采样RTT时间,然后加权平均,算出一个平滑RTT值,这个RTT值因网络状况不断变化 采样RTT的波动范围,避免发现不了过大波动的情况。 RFC6289建议使用以下公式计算RTO: # 首次计算RTO,R1为第一次测量的RTT SRTT = R1 DevRTT = R1/2 RTO = μ * SRTT + δ * DevRTT = μ * R1 + δ * (R1/2) # 后续计算RTO,R2为新测量的RTT # SRTT是平滑的RTT值 SRTT = SRTT + α * (RTT - SRTT) = R1 + α * (R2 - R1) # DevRTT是平滑的RTT和当前的RTT之间的差值 DevRTT = (1 - β) * DevRTT + β * (|RTT-SRTT|)= (1 - β) * (R1/2) + β * (R2 - R1) RTO = μ * SRTT + δ * DevRTT 上述表达式中,在linux中α = 0.125,β = 0.25,μ = 1,δ = 4,至于为啥是这些值,别问问就是前人大量的测试积累得出。 假设因为网络阻塞触发了超时,如何避免频繁重发加剧网络阻塞? 超时时间加倍,就是每当重传的时候,都会将下一次的超时时间设置为当前值的两倍,避免频繁重发导致网络更加阻塞。 超时重传的弊端是什么? 超时周期可能相对较长,重传的等待时间可能过长。 快速重传 什么是快速重传? 快速重传不再以时间作为重传的标准,而是以数据作为重传的标准。 上述Seq2因为某些原因没有抵达接收方,但接收方已经收到了Seq3、4、5的数据包,并且回复了三次ACK2的数据包。发送端在收到三次ACK2的数据包以后,就会在超时定时器之前重传Seq2的数据包。 重传所有包还是重传丢失的包? 由于发送端并不知道三次ACK2的数据包是由发送方的哪几个数据包响应回来的(也就是Seq3、4、5),因此只重传Seq2还是要重传所有的数据包也是个问题。 根据TCP实现的不同,上述两种情况都可能存在。 SACK重传 SACK重传其实就是选择性重传,它是为了解决快速重传不知道需要重传哪些包的问题。 SACK是如何让发送方知道重传哪些包的? TCP的选项字段增加一个SACK字段,接收方会将已经收到数据包序列号范围发送给发送方,这样发送方通过SACK信息就能找到丢失的数据包重传此数据包。 SACK的使用条件 SACK必须要发送方和接收方同时支持,在linux中可以通过net.ipv4.tcp_sack参数开启(Linux2.4以后默认开启)。 Duplicate SACK(D-SACK) SACK可以让发送方准确的知道哪些数据包接收方没有收到,而D-SACK可以让发送方知道有哪些数据包被重复接收了。 D-SACK的优点是什么? 可以让发送方知道是发出去的包丢了还是接收方回应的ACK包丢了 可以知道是不是发送方的数据包被网络延迟 可以知道发送方的数据包是不是在网络中被复制 D-SACK如何让发送方知道ACK包丢失 上图中接收方收到了3000~3999的数据包,但回应的ACK发生了丢失,假设此时触发了超时重传,发送方会首先重传3000~3499的数据包,接收方在收到该包以后发现该包已经被接收过了,于是会回复一个SACK = 3000~3500告诉发送方该数据包已经被接受过了,因为ACK已经到4000了,所以这里是一个D-SACK。发送方在收到报文以后可以知道数据包没有丢,丢的只是ACK报文。 D-SACK如何判断数据包发送延时 上图中1000~1499的数据包被网络延迟,后续发送方收到了三个连续ACK 1000的报文触发了超时重传,重传以后,延时的网络包也抵达了接收方,此时接收方会回复一个SACK=1000~1500,因为ACK已经到了3000,所以这里是一个D-SACK,表示收到了重复的包。发送方收到了该ACK报文以后也可以判断出快速重传的原因是因为网络延迟。 如何开启D-SACK 在Linux下可以通过net.ipv4.tcp_dsack参数开启/关闭这个功能(Linux 2.4后默认打开)。