TCP 如何保证可靠传输？重传、滑动窗口与拥塞控制详解

Guide约 8549 字大约 29 分钟

TCP 常被说成可靠传输协议，但“可靠”不是一句抽象承诺，而是一组具体机制共同配合出来的结果。

丢包要重传，乱序要重排，接收方处理不过来要流量控制，网络拥塞时要主动降速。把这些机制串起来，才能真正理解 TCP 为什么能在不可靠的 IP 网络之上提供可靠传输。

这篇文章主要回答几个问题：

TCP 通过哪些机制保证数据可靠到达？
超时重传、快速重传、SACK、D-SACK 分别解决什么问题？
TCP 如何通过滑动窗口实现流量控制？
拥塞控制中的慢开始、拥塞避免、快速重传、快恢复分别怎么理解？

先澄清一个容易误解的点：TCP 可靠的是字节流，不是应用层的一条条“消息”。TCP 不会保留 HTTP、RPC 或业务协议里的消息边界，它做的是给字节流编号，并尽量把这些字节按序、无重复地交付给应用层。至于“一个请求从哪里开始、到哪里结束”，要靠上层协议自己定义，比如长度字段、分隔符、HTTP 报文格式等。

TCP 粘包 / 拆包为什么会出现？

TCP 如何保证传输的可靠性？

基于数据块传输：应用数据被分割成 TCP 认为最适合发送的数据块，再传输给网络层，数据块被称为报文段或段。
对失序数据重新排序以及去重：TCP 不能阻止网络丢包，它能做的是给字节流编号，并通过 ACK、重传、排序、去重等机制，让应用层看到的是有序、无重复的数据流。TCP 的序列号本质上是字节序号，不是按报文段逐个编号。一个 TCP 段携带一段连续字节，接收端根据这些序号区间完成重排和去重。
校验和：TCP 会对 TCP 首部、数据以及 IP 伪首部计算校验和。这是一个端到端的校验和，目的是检测数据在传输过程中的变化。如果收到的报文段校验和有差错，TCP 会丢弃这个报文段，并且不会确认收到它。不过，TCP 校验和只是 16 位的一补和校验，主要用于发现常见的传输错误，并不是强完整性校验，也不能防止恶意篡改。实际系统里的数据完整性通常还会依赖链路层 CRC、TLS AEAD 或应用层 hash 等机制。
重传机制：在 TCP 段丢失或延迟的情况下，重新发送数据，直到收到对方的确认应答（ACK）。TCP 重传机制主要有：基于计时器的重传（也就是超时重传）、快速重传（基于接收端的反馈信息来引发重传）、SACK（选择确认，在 ACK 选项中携带已经收到的非连续数据块范围，这样发送方就知道哪些数据段已经到达接收方了）、D-SACK（重复 SACK，在 SACK 的基础上，额外告知发送方有哪些数据段被重复接收）。D-SACK 的价值在于帮助发送方判断一次重传是否可能是“误重传”：比如原始数据其实已经到达接收方，只是 ACK 丢失、网络乱序或重传定时器过早触发，导致发送方误以为丢包并触发重传。接收方通过 D-SACK 告诉发送方“这段数据我重复收到了”，发送方就能推断这次重传可能只是误判，而不一定是真正发生了拥塞。不过，D-SACK 只能提供线索，不能单独证明某一种具体原因。
流量控制：TCP 连接的每一方都有一定大小的缓冲空间。接收端通过接收窗口（rwnd）告诉发送端自己还能接收多少数据，发送端据此控制发送速率，避免接收端处理不过来而丢包。
拥塞控制：当网络拥塞时，减少数据的发送。TCP 在发送数据的时候，需要考虑两个因素：一是接收端当前可用接收缓冲区能力，二是网络的拥塞程度。接收方的接收能力由接收窗口（rwnd）表示，网络的拥塞程度由拥塞窗口（cwnd）表示。发送方允许保持在网络中的未确认数据量，通常受 min(rwnd, cwnd) 约束，这样既不会超过接收方的处理能力，也不会给网络注入过多数据。

先用 ARQ 理解 TCP 重传

上面几个机制里，最能体现“可靠传输”的是重传。为了不让超时重传、快速重传、SACK 这些概念显得凭空出现，我们先看 ARQ 这个抽象模型。

自动重传请求（Automatic Repeat-reQuest，ARQ）是 OSI 模型中数据链路层和传输层的错误纠正协议之一。它通过使用确认和超时这两个机制，在不可靠服务的基础上实现可靠的信息传输。如果发送方在发送后一段时间之内没有收到确认应答（Acknowledgments，ACK），它通常会重新发送，直到收到确认或者重试超过一定的次数。

TCP 可以用 ARQ 思想来理解，但它不是教材里的某一种简单 ARQ。现代 TCP 同时结合了累积 ACK、RTO、快速重传、SACK、拥塞控制和流量控制，重传策略会受到这些机制共同影响。

默认 ACK 是累积确认：ACK 表示“这个序号之前的数据我都已经收到了”。
开启 SACK 后，接收方还能额外告诉发送方“我已经乱序收到了哪些区间”，发送方可以只重传缺失的数据段。

因此，停止等待 ARQ 和 Go-Back-N 更适合理解可靠传输的基础思想，而现代 TCP 在 SACK 的帮助下更接近选择重传。

ARQ 与 TCP 重传机制的关系

ARQ 包括停止等待 ARQ 协议和连续 ARQ 协议。

停止等待 ARQ 协议

停止等待协议是为了实现可靠传输的，它的基本原理就是每发完一个分组就停止发送，等待对方确认（回复 ACK）。如果过了一段时间（超时时间后），还是没有收到 ACK 确认，说明没有发送成功，需要重新发送，直到收到确认后再发下一个分组。

在停止等待协议中，若接收方收到重复分组，就丢弃该分组，但同时还要发送确认。

1）无差错情况：

发送方发送分组，接收方在规定时间内收到，并且回复确认。发送方再次发送。

2）出现差错情况（超时重传）：

停止等待协议中超时重传是指只要超过一段时间仍然没有收到确认，就重传前面发送过的分组（认为刚才发送过的分组丢失了）。因此每发送完一个分组需要设置一个超时计时器，其重传时间应比数据在分组传输的平均往返时间更长一些。这种自动重传方式常称为自动重传请求（ARQ）。另外在停止等待协议中若收到重复分组，就丢弃该分组，但同时还要发送确认。

3）确认丢失和确认迟到

确认丢失：确认消息在传输过程丢失。当 A 发送 M1 消息，B 收到后，B 向 A 发送了一个 M1 确认消息，但却在传输过程中丢失。而 A 并不知道，在超时计时过后，A 重传 M1 消息，B 再次收到该消息后采取以下两点措施：1. 丢弃这个重复的 M1 消息，不向上层交付。2. 向 A 发送确认消息。（不会认为已经发送过了，就不再发送。A 能重传，就证明 B 的确认消息丢失）。
确认迟到：确认消息在传输过程中迟到。A 发送 M1 消息，B 收到并发送确认。在超时时间内没有收到确认消息，A 重传 M1 消息，B 仍然收到并继续发送确认消息（B 收到了 2 份 M1）。此时 A 收到了 B 第二次发送的确认消息。接着发送其他数据。过了一会，A 收到了 B 第一次发送的对 M1 的确认消息（A 也收到了 2 份确认消息）。处理如下：1. A 收到重复的确认后，直接丢弃。2. B 收到重复的 M1 后，也直接丢弃重复的 M1。

连续 ARQ 协议

连续 ARQ 是一类滑动窗口式重传思想，典型形式包括 Go-Back-N 和选择重传。它可以提高信道利用率：发送方维持一个发送窗口，凡位于发送窗口内的分组可以连续发送出去，而不需要等待对方确认。接收方一般采用累计确认，对按序到达的最后一个分组发送确认，表明到这个分组为止的所有分组都已经正确收到了。

优点：信道利用率高，容易实现，即使确认丢失，也不必重传。
缺点：如果采用 Go-Back-N，不能向发送方反映出接收方已经正确收到的所有分组的信息。比如：发送方发送了 5 条消息，中间第三条丢失（3 号）。在 Go-Back-N 中，即使 4、5 号分组已经到达，接收方也会因为它们失序而丢弃，只重复确认最后一个按序收到的 2 号分组。发送方最终需要从 3 号开始回退重传。SACK 的作用，正是让 TCP 接收方能告诉发送方这些非连续但已经收到的数据区间，避免大量不必要的回退重传。

有了 ARQ 这条线，再看 TCP 的具体重传机制就顺了。

TCP 重传机制速查

TCP 的重传不是只有一种触发方式。最基础的是超时重传：发送方等 ACK 等太久，就认为这段数据可能丢了，于是重传。后来又有快速重传：接收方连续 ACK 同一个旧序号，说明中间可能缺了一段，发送方就不用傻等超时。SACK 和 D-SACK 则是在 ACK 里带更多信息，让发送方知道“哪些段已经到了、哪些重传可能是误判”。

所以下面这张表不是新知识点，而是一张地图：先把几种重传相关机制摆在一起，后面再从最基础、也最兜底的 RTO 超时重传 开始展开。

机制	触发条件	解决什么问题
超时重传（RTO）	超过 RTO 仍未收到 ACK	兜底处理丢包
快速重传	收到 3 个 duplicate ACK，即连续确认同一个旧累计 ACK 号	不等超时，尽快重传疑似丢失的数据段
SACK	ACK 中携带已收到的数据区间	告诉发送方哪些段已收到，只重传真正缺失的部分
D-SACK	SACK 中报告重复收到的数据段	帮助识别误重传、ACK 丢失或网络乱序

超时重传如何实现？超时重传时间怎么确定？

先看表里的第一行：超时重传（RTO）。它是 TCP 重传机制的兜底方案。无论有没有 SACK、有没有触发快速重传，只要某段数据发出去以后迟迟没有等到 ACK，最终都要靠 RTO 来判断“不能再等了，该重传了”。

当发送方发送数据之后，它会启动一个定时器，等待目的端确认收到这个报文段。接收端对已成功收到的 TCP 段发回相应的 ACK。如果发送端在合理的往返时延（RTT）内未收到确认，那么对应的数据段就会被认为可能已经丢失，并进行重传。

RTT（Round Trip Time）：往返时间，也就是 TCP 段从发出去到收到对应 ACK 的时间。
RTO（Retransmission Time Out）：重传超时时间，即从数据发送时刻算起，超过这个时间便执行重传。

RTO 超时时间的计算流程

RTO 的确定是一个关键问题，因为它直接影响到 TCP 的性能和效率。如果 RTO 设置得太小，会导致不必要的重传，增加网络负担；如果 RTO 设置得太大，会导致数据传输的延迟，降低吞吐量。因此，RTO 应该根据网络的实际状况，动态地进行调整。

RTT 的值会随着网络的波动而变化，所以 TCP 不能直接使用某一次 RTT 样本作为 RTO。现代 TCP 的 RTO 计算应以 RFC 6298 为主线：根据 RTT 样本维护平滑后的往返时间 SRTT 和往返时间波动 RTTVAR，再计算 RTO；发生超时后还会做指数退避。

Karn 算法的核心点是：对已经重传过的报文段，其 ACK 不用于 RTT 采样，避免“这个 ACK 到底对应原始发送还是重传”的样本歧义。

简单理解就是：RTO 不是 RTT，而是“平滑 RTT + 抖动余量”。如果一条连接的 RTT 样本大约是 100 ms，但抖动很大，RTO 就必须留出更大的安全余量；如果仍然超时，下一次 RTO 还会继续退避，避免在拥塞时把重传压力继续打到网络里。

快速重传是如何工作的？

超时重传可靠但偏慢，因为发送方必须等到 RTO 过期以后才会重传。快速重传（Fast Retransmit）解决的就是这个等待问题：它不依赖计时器，而是依赖接收方连续发回的重复 ACK 来更早发现疑似丢包。

TCP 使用累积确认。假设接收方已经按序收到了 [0, 1000) 这段字节，接下来期望收到从 1000 开始的数据。如果它先收到了 [2000, 3000)，说明中间 [1000, 2000) 这段还没到。接收方不会把 ACK 推进到 3000，而是继续回复 ACK = 1000，表示“我仍然在等 1000 之后的数据”。这种再次确认同一个旧 ACK 号的报文，就是 duplicate ACK。

发送方如果连续收到 3 个 duplicate ACK，通常会认为 ACK 指向的那段数据大概率已经丢失，于是不等 RTO 超时，直接重传缺失的数据段。之所以不是收到 1 个 duplicate ACK 就重传，是因为网络里可能出现短暂乱序：后发出的包先到，不一定代表前面的包真的丢了。3 个 duplicate ACK 是在“尽快恢复”和“避免误判乱序”之间做的折中。

快速重传只能更快定位“最早的缺口”。如果一个发送窗口里同时丢了多段数据，仅靠累积 ACK 仍然很难告诉发送方哪些区间已经到了、哪些区间还缺着，这就需要 SACK。

SACK 是如何提升重传效率的？

SACK（Selective Acknowledgment，选择性确认）用来补足累积 ACK 的信息盲区。普通 ACK 只能表达“某个序号之前的数据都收到了”，但无法表达“后面的某些区间虽然乱序，也已经收到了”。SACK 会在 ACK 的 TCP 选项里携带已经收到的非连续字节区间，帮助发送方只重传真正缺失的部分。

SACK 需要在三次握手时通过 SACK-Permitted 选项协商。启用后，ACK 号本身仍然遵循累积确认规则，SACK 选项额外携带一个或多个 SACK block。每个 SACK block 由 Left Edge 和 Right Edge 组成，表示接收方已经收到的字节区间 [Left Edge, Right Edge)。

举个例子：发送方连续发送 [0, 1000)、[1000, 2000)、[2000, 3000)、[3000, 4000)，其中 [1000, 2000) 丢失，但后面两段已经到达。接收方的累计 ACK 仍然只能停在 ACK = 1000，但它可以在 SACK 里报告已经收到 [2000, 4000)。发送方据此就知道 [1000, 2000) 需要重传，而 [2000, 4000) 不必重复发送。

TCP 选项长度有限。SACK 选项本身需要 2 字节，每个 SACK block 需要 8 字节，所以一个 TCP 段最多能携带 4 个 SACK block；如果同时携带时间戳等其他 TCP 选项，可用空间还会更少。也就是说，SACK 不能无限记录所有乱序区间，但它已经足以显著减少多段丢包时的无效重传。

D-SACK 有什么作用？

D-SACK（Duplicate SACK，重复选择性确认）是对 SACK 的扩展，定义在 RFC 2883 中。SACK 主要告诉发送方“哪些非连续区间已经收到”，D-SACK 则进一步告诉发送方“哪些区间被重复收到了”。

D-SACK 不引入新的 TCP 选项，而是复用 SACK block。它约定：如果第一个 SACK block 描述的是一段已经被累计 ACK 覆盖的数据，或者描述的是一段已经出现在后续 SACK block 中的数据，那么这个 block 就是在报告重复数据。

为什么重复数据有价值？因为一次重传不一定代表原始数据真的丢了。常见情况包括：

原始数据已经到达接收方，但 ACK 在返回途中丢失，发送方等到 RTO 后误以为数据丢了，于是重传。
原始数据在网络中严重乱序或延迟，发送方先触发了快速重传，随后原始数据和重传数据都到达接收方。

收到 D-SACK 后，发送方可以推断这次重传可能是误重传，并进一步判断网络中是否存在 ACK 丢失、严重乱序或 RTO 设置过小等问题。它不能单独证明某一种具体原因，但能为拥塞控制和排查重传异常提供重要线索。

TCP 如何实现流量控制？

TCP 利用滑动窗口实现流量控制。流量控制是为了控制发送方发送速率，保证接收方来得及接收。 滑动窗口是 TCP 的核心机制之一，它既用于追踪“哪些数据已经发送但还没被 ACK”，也用于承载流量控制。接收方会在 ACK 报文中通过窗口字段通告自己的接收窗口（rwnd），发送方据此调整发送窗口。将窗口字段设置为 0，就表示接收方暂时没有可用缓冲区，发送方不能继续发送普通新数据。

TCP 首部里的窗口字段本身是 16 位，最大只能表示 65,535 字节。如果需要更大的接收窗口，还要依赖 TCP Window Scale 选项对窗口大小进行扩展。实际排查时，可以在三次握手的 SYN/SYN-ACK 报文里看到双方是否协商了 Window Scale。

零窗口怎么恢复？ 当接收方通告 rwnd = 0 时，发送方会暂停发送新数据。但如果接收方后来腾出了缓冲区，并发送了新的窗口通告，而这个 ACK 在网络中丢失，双方就可能陷入互相等待：发送方等窗口打开，接收方等新数据到来。

TCP 零窗口探测机制

为了解决这个问题，TCP 引入了零窗口探测（Zero Window Probe）。发送方在窗口为 0 时，依赖持续计时器（persist timer）定期发送很小的探测报文，迫使接收方回复当前窗口大小。这样即使之前的窗口更新 ACK 丢失，发送方也能重新得知窗口是否已经打开。

零窗口探测只负责打破“窗口更新 ACK 丢失”造成的僵持，不等于业务层连接健康检查。如果接收端应用长期不读取 socket，连接可能长期停留在小窗口或零窗口状态，仍然会占用双方资源。实际工程中通常还需要应用层读写超时、空闲连接回收等机制兜底。

为什么需要流量控制？ 这是因为双方在通信的时候，发送方的速率与接收方的速率不一定相等。如果发送方的发送速率太快，会导致接收方处理不过来。如果接收方处理不过来，就只能把数据先放到 接收缓冲区（receive buffer） 里（失序的数据段也会被存放在缓冲区里）。正常情况下，接收方会通过缩小 rwnd，甚至通告零窗口，让发送方停止发送新数据。只有在窗口控制来不及生效、对端实现异常、缓冲耗尽或网络队列溢出时，才可能出现丢弃。因此，我们需要控制发送方的发送速率，让接收方与发送方处于一种动态平衡。

这里需要注意的是（常见误区）：

发送端不等同于客户端
接收端不等同于服务端

TCP 为全双工（Full-Duplex，FDX）通信，双方可以进行双向通信，客户端和服务端既可能是发送端，也可能是接收端。因此，两端各有一个发送缓冲区与接收缓冲区，两端都各自维护一个发送窗口和一个接收窗口。接收窗口大小取决于应用、系统、硬件的限制（TCP 传输速率不能大于应用的数据处理速率）。通信双方维护窗口的逻辑是类似的。

TCP 发送窗口可以划分成四个部分：

已经发送并且确认的 TCP 段（已经发送并确认）；
已经发送但是没有确认的 TCP 段（已经发送未确认）；
未发送但是接收方准备接收的 TCP 段（可以发送）；
未发送并且接收方也暂时不能接收的 TCP 段（不可发送）。

TCP 发送窗口结构图示：

TCP发送窗口结构

SND.WND：发送窗口。
SND.UNA：Send Unacknowledged，表示最早尚未被确认的序号，也就是发送窗口左边界。
SND.NXT：Send Next 指针，指向可用窗口的第一个字节。

只看接收窗口约束时，可用发送窗口大小 约为 SND.UNA + SND.WND - SND.NXT。真实发送还要再受 cwnd、MSS、发送缓冲区等限制。

TCP 接收窗口可以划分成三个部分：

已经接收并且已经确认的 TCP 段（已经接收并确认）；
等待接收且允许发送方发送 TCP 段（可以接收未确认）；
不可接收且不允许发送方发送 TCP 段（不可接收）。

TCP 接收窗口结构图示：

TCP接收窗口结构

接收窗口的大小是动态调整的。 它通常会受应用读取速度、接收缓冲区占用、系统 socket buffer 配置和自动调优策略影响。

另外，这里的滑动窗口大小只是为了演示使用，实际窗口大小通常会远远大于这个值。

糊涂窗口综合征（Silly Window Syndrome，SWS） 指的是发送方或接收方不断以很小的粒度发送数据、通告窗口，导致网络中充满“头部很大、载荷很小”的小包，传输效率很差。

SWS、Nagle 算法与延迟 ACK 的关系

常见优化有几类：

接收方侧 SWS 避免：不要每释放一点点缓冲区就立刻通告新窗口，而是等到可用空间达到一定阈值后再更新窗口。
发送方侧 Nagle 算法：如果还有未确认的小包在网络中，新的小数据先缓存起来，等收到 ACK 或凑够 MSS 后再发送。
延迟 ACK：接收方不一定每收到一个段就马上 ACK，可以稍等一小段时间，看能否和反向数据一起发送，或对多个段合并确认。它本身是 ACK 生成策略，不是专门为 SWS 设计的机制，但会和小包发送策略发生交互。

需要注意，Nagle 算法和延迟 ACK 在某些小包交互场景下可能相互等待，带来几十毫秒级的额外延迟。对延迟敏感的交互式应用，常见做法是通过 TCP_NODELAY 关闭 Nagle。代价是小包数量可能增加，包头开销和系统中断压力也会升高。批量响应或文件发送更适合聚合写入；在 Linux 上还可以结合 TCP_CORK 这类平台相关选项控制“攒包”时机。

TCP 的拥塞控制是怎么实现的？

在某段时间，若对网络中某一资源的需求超过了该资源所能提供的可用部分，网络性能就会下降，表现为排队变长、延迟升高、丢包增加。这种情况就叫拥塞。拥塞控制就是为了防止过多的数据注入到网络中，这样就可以使网络中的路由器或链路不致过载。拥塞控制所要做的都有一个前提，就是网络能够承受现有的网络负荷。拥塞控制是一个全局性的过程，涉及到所有的主机、路由器，以及与降低网络传输性能有关的所有因素。相反，流量控制往往是点对点通信量的控制，是个端到端的问题。流量控制所要做到的就是抑制发送端发送数据的速率，以便使接收端来得及接收。

TCP的拥塞控制

为了进行拥塞控制，TCP 发送方要维持一个 拥塞窗口（cwnd） 的状态变量。拥塞窗口的大小取决于网络的拥塞程度，并且动态变化。发送方让自己的发送窗口取为拥塞窗口和接收方的接收窗口中较小的一个。

按 RFC 5681 / Reno 系的基础框架，TCP 拥塞控制常拆成四个机制来讲，即 慢开始、拥塞避免、快速重传（Fast Retransmit） 和 快恢复。现代系统里的 CUBIC、BBR、DCTCP 会在这个基础上有不同实现和状态机。在网络层也可以使路由器采用适当的分组丢弃策略（如主动队列管理 AQM），以减少网络拥塞的发生。

慢开始：慢开始算法的思路是当主机开始发送数据时，如果立即把大量数据字节注入到网络，可能会引起网络阻塞，因为现在还不知道网络的负荷情况。较好的方法是先探测一下，即由小到大逐渐增大发送窗口，也就是由小到大逐渐增大拥塞窗口。慢开始并不意味着一开始只能发送 1 个 MSS。RFC 6928 提议并实验性允许把初始窗口从 2～4 个段提高到最多 10 个段（IW10），很多现代实现采用了类似 IW10 的默认值，但仍要以具体系统配置为准。以常见 MSS 1460 字节计算，10 个 MSS 在首个 RTT 内大约可以发送 14 KB 数据，这对 HTTP 短连接和页面首屏加载很重要。慢开始阶段的关键是：根据 ACK 反馈快速增大窗口，通常表现为每经过一个 RTT，cwnd 近似翻倍。
拥塞避免：拥塞避免算法的思路是让拥塞窗口 cwnd 缓慢增大。简化理解是每个 RTT 大约增加 1 个 MSS；实现上通常通过每个 ACK 小幅增加 cwnd 来近似线性增长。慢开始会在 cwnd 达到慢开始门限（ssthresh）后进入拥塞避免。ssthresh 初始值通常设得比较大，第一次有效调整往往发生在检测到丢包之后。
快速重传：发送方收到 3 个 duplicate ACK，也就是连续 3 个 ACK 都在确认同一个旧的累计确认号时，通常认为后面某个段丢失，于是不等 RTO 超时就重传缺失的数据段。
快恢复：下面是 Reno 语境下的经典快恢复流程。收到第 3 个 duplicate ACK 时，将 ssthresh 设置为当前拥塞窗口的一半；重传丢失的数据段，并将 cwnd 设置为 ssthresh + 3 × MSS；后续每多收到一个 duplicate ACK，cwnd 再增加 1 个 MSS；当收到新的 ACK，说明重传的数据已经被确认，将 cwnd 降回 ssthresh，进入拥塞避免阶段。快恢复不直接回到慢开始，是因为重复 ACK 说明后续数据仍然能到达接收方，网络并没有完全不可用。现代 TCP 如果启用了 SACK、NewReno、CUBIC 或 RACK/TLP，丢包恢复过程会更复杂，但理解 Reno 仍然是入门基础。

快速重传对单个报文段丢失很有效，但如果一个窗口内有多个报文段同时丢失，仅靠重复 ACK 很难一次性告诉发送方所有“洞”在哪里。这也是 SACK 出现的重要原因：接收方可以显式告诉发送方哪些数据段已经收到，发送方只重传缺失的部分。

需要注意的是，上面讲的慢开始、拥塞避免、快速重传、快恢复，是理解 TCP 拥塞控制的经典基础框架。现代操作系统通常还会在此基础上使用更复杂的拥塞控制算法：

CUBIC：已经由 RFC 9438 更新为标准轨 TCP 拥塞控制算法，并取代旧版 CUBIC 规范。CUBIC 用三次函数调整拥塞窗口，在高带宽、长 RTT 链路上比 Reno 的线性增长更友好，目前已被 Linux、Windows、Apple 等主流协议栈采用为默认拥塞控制算法之一。
BBR：Google 提出的基于模型（model-based）的拥塞控制算法，通过估计瓶颈带宽和最小 RTT 来控制发送速率，目标是高吞吐和低排队延迟。在 bufferbloat 明显的链路上可能表现更好。但 BBR 的具体效果受版本、队列管理、竞争流类型、RTT 公平性和部署环境影响，不能简单理解成“无脑替代 CUBIC”。
DCTCP：主要用于受控数据中心网络，依赖 ECN 标记估算拥塞程度，目标是在浅缓冲交换机场景下降低排队延迟。它不适合直接拿到公网环境里泛用。

不过，慢开始、拥塞避免、快速重传、快恢复依然是理解这些现代算法的基础。

还有一个工程上很重要的边界：丢包不一定等于拥塞。传统 Reno/CUBIC 主要把丢包视为拥塞信号，但无线链路误码、路径切换、设备队列溢出也可能导致丢包；ECN 则可以在不丢包的情况下反馈拥塞。对比拥塞算法时，也不要只看平均吞吐量，还要看 P95/P99 RTT、丢包率、重传率、队列长度、与 CUBIC/Reno 共存表现，以及具体内核版本和参数配置。

总结

TCP 的可靠性不是“保证网络不丢包”，而是在不可靠的 IP 网络之上，通过一组机制让应用层看到的是有序、无重复、尽量完整的字节流。它的核心可以概括为四点：

用序列号和 ACK 确认数据状态：TCP 给字节流编号，接收方通过 ACK 告诉发送方哪些数据已经收到，发送方据此判断哪些数据还在路上、哪些数据需要继续等待。
用重传机制补齐丢失数据：超时重传负责兜底，快速重传用于更快发现单段丢失，SACK/D-SACK 则让发送方更精确地知道哪些数据已经到达、哪些重传可能是误判。
用滑动窗口做流量控制：接收方通过 rwnd 告诉发送方自己还能接收多少数据，发送方根据接收窗口控制在途数据量，避免把接收缓冲区打爆。
用拥塞控制保护网络：发送方通过 cwnd 估计网络承载能力，在慢开始、拥塞避免、快速重传、快恢复以及 CUBIC、BBR 等算法的配合下，尽量避免把过多数据注入网络。

一句话总结：TCP 不是让网络变得可靠，而是通过编号、确认、重传、排序去重、流量控制和拥塞控制，在不可靠网络之上“拼”出一个对应用层相对可靠的字节流通道。

参考

《计算机网络（第 7 版）》
《图解 HTTP》
TCP and UDP Tutorial：https://www.9tut.com/tcp-and-udp-tutorial
Computer Network：https://github.com/wolverinn/Waking-Up/blob/master/Computer Network.md
TCP Flow Control：https://www.brianstorti.com/tcp-flow-control/
TCP 流量控制（Flow Control）：https://notfalse.net/24/tcp-flow-control
TCP 之滑动窗口原理：https://cloud.tencent.com/developer/article/1857363
RFC 9293 - Transmission Control Protocol：https://www.rfc-editor.org/rfc/rfc9293
RFC 6928 - Increasing TCP's Initial Window：https://www.rfc-editor.org/rfc/rfc6928
RFC 5681 - TCP Congestion Control：https://datatracker.ietf.org/doc/html/rfc5681
RFC 2018 - TCP Selective Acknowledgment Options：https://www.rfc-editor.org/rfc/rfc2018
RFC 2883 - An Extension to the Selective Acknowledgement（SACK） Option for TCP：https://www.rfc-editor.org/rfc/rfc2883
RFC 9438 - CUBIC for Fast and Long-Distance Networks：https://www.rfc-editor.org/rfc/rfc9438
RFC 8257 - Data Center TCP（DCTCP）：https://www.rfc-editor.org/rfc/rfc8257
BBR: Congestion-Based Congestion Control, ACM Queue, 2016：https://queue.acm.org/detail.cfm?id=3022184
RFC 1122 - Requirements for Internet Hosts - Communication Layers：https://datatracker.ietf.org/doc/html/rfc1122
RFC 6298 - Computing TCP's Retransmission Timer：https://www.rfc-editor.org/rfc/rfc6298
RFC 7323 - TCP Extensions for High Performance：https://datatracker.ietf.org/doc/rfc7323/