【网络原理】TCP/IP协议

文章列表

【网络原理】TCP/IP协议

1.应用层

2.传输层（核心问题）

2.1 UDP协议

2.1.2 UDP的特点

2.1.3 基于UDP的应用层协议

2.2 TCP协议（重点内容）

2.2.1 TCP/IP 协议含义

2.2.2 TCP协议端格式：

2.2.3 TCP的特点

2.3 TCP原理

2.4 确认应答机制（安全机制）

2.5 超时重传机制（安全机制）

2.5.1 数据直接丢了，接收方没收到，自然不会发 ack

2.5.2 接收方收到数据，返回的 ack 丢了

2.6 TCP 是如何实现可靠性的？

🔥2.7 连接管理机制（安全机制）（三次握手与四次挥手）（整个网络原理最核心的考点）

1️⃣TCP 建立连接：三次握手

❓2.7.1 为什么需要三次握手，两次不行吗？

❓❓2.7.2 四次握手呢？

2️⃣TCP 断开连接：四次挥手

❓❓❓2.7.3 为啥三次握手能100%合并，四次挥手就不能合并？

❓❓❓❓2.7.4 挥手为什么需要四次？

2.8 滑动窗口（效率机制）

2.8.1 批量发送的过程中，如果出现丢包咋办？？

2.8.2 滑动窗口、快速重传是在批量传输大量数据的时候，会采取的措施

2.9 流量控制（安全机制）

2.9.1 如何实现流量控制

2.10 拥塞控制（安全机制）

2.10.1 拥塞窗口（拥塞控制实验出来的窗口）

2.11 延迟应答（效率机制）

2.11.1 如何进行延时应答

2.12 捎带应答（效率机制）

2.13 面向字节流

2.13.1 解决粘包问题

2.14 TCP异常情况

2.15 TCP小结

2.16 TCP 和 UDP 的差别

📖按照网络协议这几个层次展开：

1.应用层

应用层和代码直接相关的一层，决定了数据要传输什么，拿到数据之后如何使用；应用层虽然存在一些现有的协议（HTTP），但是也有很多情况，需要程序员自定制协议

约定应用层数据报，数据结构就是在自定义协议

❗❓如何约定？

1️⃣确定要传输哪些信息（根据所需求来）

2️⃣确定数据按照什么样的格式来组织(随意约定的)

网络上传输的，本质上都是 0101，视为二进制的字符串，需要把上述这些信息整合成一个字符串

实际开发中，有一种现成的格式，可以直接使用的：典型的格式1️⃣xml ——通过标签的形式来组织2️⃣json

2.传输层（核心问题）

2.1 UDP协议

2.1.1 UDP协议端格式：

2.1.2 UDP的特点

1️⃣无连接 ：知道对端的IP和端口号就直接进行传输，不需要建立连接；

2️⃣不可靠 ：没有任何安全机制，发送端发送数据报以后，如果因为网络故障该段无法发到对方，UDP协议层也不会给应用层返回任何错误信息；

3️⃣面向数据报 ：应用层交给UDP多长的报文，UDP原样发送，既不会拆分，也不会合并；

用UDP传输100个字节的数据：

如果发送端一次发送100个字节，那么接收端也必须一次接收100个字节；而不能循环接收10次，每次接收10个字节。

4️⃣缓冲区 ：UDP只有接收缓冲区，没有发送缓冲区

UDP没有真正意义上的 发送缓冲区。发送的数据会直接交给内核，由内核将数据传给网络层协议进行后续的传输动作；

UDP具有接收缓冲区，但是这个接收缓冲区不能保证收到的UDP报的顺序和发送UDP报的顺序一致；如果缓冲区满了，再到达的UDP数据就会被丢弃；

UDP的socket既能读，也能写，这个概念叫做 全双工

5️⃣大小受限 ：UDP协议首部中有一个16位的最大长度。也就是说一个UDP能传输的数据最大长度是64K（包含UDP首部）。

2.1.3 基于UDP的应用层协议

NFS：网络文件系统

TFTP：简单文件传输协议

DHCP：动态主机配置协议

BOOTP：启动协议（用于无盘设备启动）

DNS：域名解析协议

当然，也包括你自己写UDP程序时自定义的应用层协议

2.2 TCP协议（重点内容）

2.2.1 TCP/IP 协议含义

✨从字面意义上讲，有人可能会认为 TCP/IP 是指 TCP 和 IP 两种协议。实际生活当中有时也确实就是指这两种协议。然而在很多情况下，它只是利用 IP 进行通信时所必须用到的协议群的统称。具体来说，IP 或 ICMP、TCP 或 UDP、TELNET 或 FTP、以及 HTTP 等都属于 TCP/IP 协议。他们与 TCP 或 IP 的关系紧密，是互联网必不可少的组成部分。TCP/IP 一词泛指这些协议，因此，有时也称 TCP/IP 为网际协议群。

互联网进行通信时，需要相应的网络协议，TCP/IP 原本就是为使用互联网而开发制定的协议族。因此，互联网的协议就是 TCP/IP，TCP/IP 就是互联网的协议

2.2.2 TCP协议端格式：

源/目的端口号：表示数据是从哪个进程来，到哪个进程去；

32位序号/32位确认号：后面详细讲；

4位TCP报头长度：表示该TCP头部有多少个32位bit（有多少个4字节）；所以TCP头部最大长度是 15 * 4 = 60

6位标志位:

URG：紧急指针是否有效

ACK：确认号是否有效

PSH：提示接收端应用程序立刻从TCP缓冲区把数据读走

RST：对方要求重新建立连接；我们把携带RST标识的称为复位报文段

SYN：请求建立连接；我们把携带SYN标识的称为同步报文段

FIN：通知对方，本端要关闭了，我们称携带FIN标识的为结束报文段

16位窗口大小：后面再说

16位校验和：发送端填充，CRC校验。接收端校验不通过，则认为数据有问题。此处的检验和不光包含TCP首部，也包含TCP数据部分。

16位紧急指针：标识哪部分数据是紧急数据；

40字节头部选项：暂时忽略；

2.2.3 TCP的特点

1️⃣有连接

2️⃣可靠传输

3️⃣面向字节流

4️⃣全双工

2.3 TCP原理

TCP对数据传输提供的管控机制，主要体现在两个方面：安全和效率。这些机制和多线程的设计原则类似：保证数据传输安全的前提下，尽可能的提高传输效率。

2.4 确认应答机制（安全机制）

TCP 将每个字节的数据都进行了编号。即为序列号。

每一个ACK都带有对应的确认序列号，意思是告诉发送者，我已经收到了哪些数据；下一次你从哪里开始发。

2.5 超时重传机制（安全机制）

丢包是一种典型的情况

如果中间任何一个节点出现问题，都有可能导致丢包

每个设备都是在承担很多的转发任务；每个设备转发能力都是有上限的；某一时刻某个设备，上边的流量达到峰值，就可能会引起部分数据被丢失

🔥发送方对于丢包的判定是：一定时间内没有收到 ack

2.5.1 数据直接丢了，接收方没收到，自然不会发 ack

主机A发送数据给B之后，可能因为网络拥堵等原因，数据无法到达主机B；如果主机A在一个特定时间间隔内没有收到B发来的确认应答，就会进行重发

2.5.2 接收方收到数据，返回的 ack 丢了

主机A未收到B发来的确认应答，也可能是因为ACK丢失了；因此主机B会收到很多重复数据；这个时候TCP 会在接收缓冲区中根据收到的数据的序号，自动去重——保证了应用程序读到的数据仍然只有一份

🙈那么，如果超时的时间如何确定？

最理想的情况下，找到一个最小的时间，保证 "确认应答一定能在这个时间内返回"。

但是这个时间的长短，随着网络环境的不同，是有差异的。

如果超时时间设的太长，会影响整体的重传效率；

如果超时时间设的太短，有可能会频繁发送重复的包；

TCP 为了保证无论在任何环境下都能比较高性能的通信，因此会动态计算这个最大超时时间。

2.6 TCP 是如何实现可靠性的？

🙈大家觉得答案是什么呢

🙉答案是 确认应答+超时重传

✅总结：

1️⃣一切顺利，使用确定应答保证可靠性

2️⃣出现丢包，使用超时重传作为补充

这两个机制是 TCP 可靠性的基石

🔥2.7 连接管理机制（安全机制）（三次握手与四次挥手）（整个网络原理最核心的考点）

连接管理机制包括 TCP 建立连接 与 TCP 断开连接

1️⃣TCP 建立连接：三次握手

建立连接一定是由客户端主动发起的

🌈握手（handshake）:指的是通信双方进行一次网络交互；相当于客户端和服务器之间，通过三次交互建立了连接关系(双方各自记录对方的信息)

简单图解：

第一次握手：客户端将标志位SYN置为1，随机产生一个值seq=J，并将该数据包发送给服务器端，客户端进入SYN_SENT状态，等待服务器端确认。

第二次握手：务器端收到数据包后由标志位SYN=1知道客户端请求建立连接，服务器端将标志位SYN和ACK都置为1，ack=J+1，随机产生一个值seq=K，并将该数据包发送给客户端以确认连接请求，服务器端进入SYN_RCVD状态。

第三次握手：客户端收到确认后，检查ack是否为J+1，ACK是否为1，如果正确则将标志位ACK置为1，ack=K+1，并将该数据包发送给服务器端，服务器端检查ack是否为K+1，ACK是否为1，如果正确则连接建立成功，客户端和服务器端进入ESTABLISHED状态，完成三次握手，随后客户端与服务器端之间可以开始传输数据了。

三次握手这个过程本质上是投石问路，验证了客户端和服务器，各自的发送能力和接收能力是否正常

❓2.7.1 为什么需要三次握手，两次不行吗？

弄清这个问题，我们需要先弄明白三次握手的目的是什么，能不能只用两次握手来达到同样的目的。

第一次握手：客户端发送网络包，服务端收到了。
这样服务端就能得出结论：客户端的发送能力、服务端的接收能力是正常的。

第二次握手：服务端发包，客户端收到了。
这样客户端就能得出结论：服务端的接收、发送能力，客户端的接收、发送能力是正常的。不过此时服务器并不能确认客户端的接收能力是否正常。

第三次握手：客户端发包，服务端收到了。
这样服务端就能得出结论：客户端的接收、发送能力正常，服务器自己的发送、接收能力也正常。

因此，需要三次握手才能确认双方的接收与发送能力是否正常。

试想如果是用两次握手，则会出现下面这种情况：

如客户端发出连接请求，但因连接请求报文丢失而未收到确认，于是客户端再重传一次连接请求。后来收到了确认，建立了连接。数据传输完毕后，就释放了连接，客户端共发出了两个连接请求报文段，其中第一个丢失，第二个到达了服务端，但是第一个丢失的报文段只是在某些网络结点长时间滞留了，延误到连接释放以后的某个时间才到达服务端，此时服务端误认为客户端又发出一次新的连接请求，于是就向客户端发出确认报文段，同意建立连接，不采用三次握手，只要服务端发出确认，就建立新的连接了，此时客户端忽略服务端发来的确认，也不发送数据，则服务端一致等待客户端发送数据，浪费资源。

❓❓2.7.2 四次握手呢？

四次握手相当于把中间的 syn 和 ack 开分开分别发送，可以但没必要；分成两次发，效率不如合成一次

2️⃣TCP 断开连接：四次挥手

1️⃣2️⃣上述两个过程和可靠性有一点关系仅此而已；但是TCP是通过确认应答 + 超时重传实现可靠性的

断开连接是客户端和服务器都有可能先发起的

通信双方，各自给对方发送一个 FIN（结束报文），在各自给对方返回 ACK

四次挥手：即终止TCP连接，就是指断开一个TCP连接时，需要客户端和服务端总共发送4个包以确认连接的断开。在socket编程中，这一过程由客户端或服务端任一方执行close来触发。

由于TCP连接是全双工的，因此，每个方向都必须要单独进行关闭，这一原则是当一方完成数据发送任务后，发送一个FIN来终止这一方向的连接，收到一个FIN只是意味着这一方向上没有数据流动了，即不会再收到数据了，但是在这个TCP连接上仍然能够发送数据，直到这一方向也发送了FIN。首先进行关闭的一方将执行主动关闭，而另一方则执行被动关闭。

简单图解：

ack 和 fin 有一定概率合并成一个的！！但是通常情况下，不能合并的

第一次挥手：客户端发送一个FIN=M，用来关闭客户端到服务器端的数据传送，客户端进入FIN_WAIT_1状态。意思是说"我客户端没有数据要发给你了"，但是如果你服务器端还有数据没有发送完成，则不必急着关闭连接，可以继续发送数据

第二次挥手：服务器端收到FIN后，先发送ack=M+1，告诉客户端，你的请求我收到了，但是我还没准备好，请继续你等我的消息。这个时候客户端就进入FIN_WAIT_2 状态，继续等待服务器端的FIN报文。

第三次挥手：当服务器端确定数据已发送完成，则向客户端发送FIN=N报文，告诉客户端，好了，我这边数据发完了，准备好关闭连接了。服务器端进入LAST_ACK状态。

第四次挥手：客户端收到FIN=N报文后，就知道可以关闭连接了，但是他还是不相信网络，怕服务器端不知道要关闭，所以发送ack=N+1后进入TIME_WAIT状态，如果Server端没有收到ACK则可以重传。服务器端收到ACK后，就知道可以断开连接了。客户端等待了2MSL后依然没有收到回复，则证明服务器端已正常关闭，那好，我客户端也可以关闭连接了。

❓❓❓2.7.3 为啥三次握手能100%合并，四次挥手就不能合并？

三次握手：ack 和 syn 是同一个时机触发的（都是内核来完成的）

四次挥手：ack 和 fin 则是不同时机触发的（ack 是内核完成的，会在收到 fin 的时候第一时间返回；fin 则是应用程序代码控制的，在调用 socket 的close 方法的时候才会触发 fin）

❓❓❓❓2.7.4 挥手为什么需要四次？

因为当服务端收到客户端的SYN连接请求报文后，可以直接发送SYN+ACK报文。其中ACK报文是用来应答的，SYN报文是用来同步的。但是关闭连接时，当服务端收到FIN报文时，很可能并不会立即关闭SOCKET，所以只能先回复一个ACK报文，告诉客户端，“你发的FIN报文我收到了”。只有等到我服务端所有的报文都发送完了，我才能发送FIN报文，因此不能一起发送。故需要四次挥手

TCP 要保证的不仅仅是可靠性（提升可靠性往往意味着损失效率），还有效率

2.8 滑动窗口（效率机制）

对每一个发送的数据段，都要给一个ACK确认应答。收到ACK后再发送下一个数据段。这样做有一个比较大的缺点，就是性能较差。尤其是数据往返的时间较长的时候。

此时 A 这边就花了大量时间在等待 ACK；想逃提高效率，就需要缩短等待时间——这时候就需要 批量发送数据

一次发多条数据，一次等多个 ack

✨这里就是批量发送4条数据，发完之后，统一等待 ack；每次收到一个 ack 就立即发下一条（不是收到4个 ack 再发下一组）

使用一份时间，等待多个 ack；总的等待时间缩短了，整体效率就提升了（是和没有批量发送进行对比的，而不是和没有可靠性对比的）

上述批量传输数据的过程，称为 滑动窗口

批量不是无限发送，是发送到一定程度就等待 ack ，不等待直接发送的数据量是有上线的，而且是回来一个 ack 就立即发下一条，相当于总的要批量等待的数据是一致的，把批量等待数据的数量，就称为“窗口大小”

滑动：收到一个 ack 就立即发下一条

2.8.1 批量发送的过程中，如果出现丢包咋办？？

可靠性第一，效率靠后

1️⃣ack 丢了——没有任何影响，因为后一个 ack 会对前一个 ack 进行包含，不影响数据的可靠传输

2️⃣数据丢了——重新传输数据

当 1001 这个数据重传过来之后，此时缺失的拼图就补全了；接下来就要从 7001 开始索要的

如果是 4001也缺失，那么收到的 1001-2000 之后，接下来返回的 ack 就是索要 4001；同理反复索要；发送方就会重传 4001

上述重传过程，没有任何冗余的操作；丢了的数据才会重传，不丢的数据不必重传，整体速度是比较快的，这个重传过程也称为快速重传

2.8.2 滑动窗口、快速重传是在批量传输大量数据的时候，会采取的措施

如果只传一条两条、少量的、低频的操作，就不会按照滑动窗口这么搞了，仍然是前面朴素的确认应答和超时重传了

2.9 流量控制（安全机制）

滑动窗口，批量发送；窗口越大，相当于批量的数据越多，整体的速度就越快

✨接收端处理数据的速度是有限的。如果发送端发的太快，导致接收端的缓冲区被打满，这个时候如果发送端继续发送，就会造成丢包，继而引起丢包重传等等一系列连锁反应。这样就会得不偿失，需要通过流量控制来实现

流量控制（也是保证可靠性的机制）：本质上就是让接收方来限制一下发送方的速度

2.9.1 如何实现流量控制

接收端将自己可以接收的缓冲区大小放入 TCP 首部中的 "窗口大小" 字段，通过ACK端通知发送端；

窗口大小字段越大，说明网络的吞吐量越高；

接收端一旦发现自己的缓冲区快满了，就会将窗口大小设置成一个更小的值通知给发送端；

发送端接受到这个窗口之后，就会减慢自己的发送速度；

如果接收端缓冲区满了，就会将窗口置为0；这时发送方不再发送数据，但是需要定期发送一个窗口探测数据段，使接收端把窗口大小告诉发送端。

发送方的窗口大小 = 流量控制 + 拥塞控制

2.10 拥塞控制（安全机制）

✨滑动窗口的大小取决于流量控制（衡量了接收方的处理能力）和拥塞控制（衡量了传输路径的处理能力）

传输路径上任何一个设备，处理能力如果遇到瓶颈，都会对整体的传输速率产生明显的影响

📖拥塞控制：衡量中间节点传输的能力

🙈中间路径上有多少个节点？每个节点当前的情况？甚至每次传输走的路径都不同

✅通过实验的方法，找到一个合适的发送速率：

开始的时候按照一个小的速率发送，如果不丢包就可以提高一下速率（扩大窗口大小）；如果出现丢包，则立即把速率再调小；重复上述过程

此外，网络的堵塞情况，也不是一成不变的，即时刻变化的；此时拥塞控制这样的策略就也能很好的适应网络环境

2.10.1 拥塞窗口（拥塞控制实验出来的窗口）

实际发送方的窗口大小 = min （拥塞窗口，流量窗口）

当TCP开始启动的时候，慢启动阈值等于窗口最大值；在每次超时重发的时候，慢启动阈值会变成原来的一半，同时拥塞窗口置回1；少量的丢包，我们仅仅是触发超时重传；大量的丢包，我们就认为网络拥塞；

当TCP通信开始后，网络吞吐量会逐渐上升；随着网络发生拥堵，吞吐量会立刻下降；拥塞控制，归根结底是TCP协议想尽可能快的把数据传输给对方，但是又要避免给网络造成太大压力的折中方案。

TCP拥塞控制这样的过程，就好像 热恋的感觉

2.11 延迟应答（效率机制）

TCP 可靠性的核心是确认应答；ACK 要发，但是不是立即发，而是等一会再发

这样做的目的是提高传输速率；

TCP中决定传输速率的关键元素就是窗口大小；窗口大小由流量控制和拥塞控制共同约束

🌈流量控制通过接收方的接收缓冲区的剩余空间大小

延时应答：通过延时让接收方应用程序，趁机多消费点数据，此时反馈的窗口大小就会更大一些，此时发送方的发送速率也就能快一些（同时满足让接收方能够处理过来）——提高传输速率

2.11.1 如何进行延时应答

并不是所有的包都延时：

1️⃣数量限制：每隔N个包就应答一次；

2️⃣时间限制：超过最大延迟时间就应答一次；

2.12 捎带应答（效率机制）

基于延时效应，客户端服务器之间的通信模型，通常情况是“一问一答”的模式

客户端服务器通信模式：1️⃣一问一答：绝大多数服务器都是这样的2️⃣多问一答：上传文件3️⃣一问多答：下载大文件4️⃣多问多答：游戏串流

2.13 面向字节流

❓❓这里边存在一个 粘包问题

✅这就是一个 粘包问题

所谓的“一句话”就相当于一个“应用层数据报”

当 A 给 B 连续发了多个应用层数据报之后，这些数据就都积累到 B 的接收缓冲区，紧紧挨在一起，此时 B 的应用程序再读数据的时候，就难以区分从哪到哪是一个完整的应用层数据报，这样有可能就很容易读出半个包/一个半...

2.13.1 解决粘包问题

1️⃣定义分隔符（像如 xml 或者 json，本质上都是通过分隔符的方式来实现）

2️⃣约定长度：约定数据的前4个字节，表示整个数据报的长度（HTTP协议，既会使用分隔符，也会使用约定长度）

都是自定义应用层协议的注意事项

2.14 TCP异常情况

1️⃣进程关闭/进程崩溃：

进程没了，socket 是文件，随之关闭；虽然进程没了，但是连接还在，仍然可以继续四次挥手

2️⃣主机关机（正常流程关机）：

先杀死所有的用户进程，也会触发四次挥手。如果挥完，则更好；如果没挥手完，比如对方发的 fin 过来了，这时候还没来得及 ack 就关机了，此时对端就会重传 fin，重传几次之后，发现都没有 ack，尝试重新连接，如果还不行就直接释放连接

3️⃣主机掉电（拔电源）：

瞬间关机，来不及任何操作

1）对端是发送方

对端就会收不到 ack ----> 超时重传 ----> 重置连接 ----> 释放连接

2）对端是接收方

对端是没法立即知道，这边是还没来得及发的数据，还是直接没了？

在 TCP 内置了心跳包——保活机制

a）周期性：虽然对端是接收方，对端就会定期给发一个心跳包（ping），就返回一个（pong）

b）如果心跳没了，挂了：如果每个 ping 都有及时的 pong ，这个时候说明当前对端的状态良好；如果 ping 过去之后，没用 pong，说明心跳没了，怕是这边挂了

4️⃣网络断开：同上

2.15 TCP小结

2.16 TCP 和 UDP 的差别

1️⃣TCP的特点有连接 可靠传输 面向字节流 全双工

2️⃣UDP的特点无连接 不可靠 面向数据报 缓冲区

最大的差别是：应用场景不同

1️⃣TCP 可靠传输，效率没那么高（绝大多数场景下，都可以是使用 TCP）

2️⃣UDP 不可靠传输，效率高（对于效率比较高、可靠性要求不高的情况下）

赞一把

【网络原理】TCP/IP协议

1.应用层

2.传输层（核心问题）

2.1 UDP协议

2.1.2 UDP的特点

2.1.3 基于UDP的应用层协议

2.2 TCP协议（重点内容）

2.2.1 TCP/IP 协议含义

2.2.2 TCP协议端格式：

2.2.3 TCP的特点

2.3 TCP原理

2.4 确认应答机制（安全机制）

2.5 超时重传机制（安全机制）

2.5.1 数据直接丢了，接收方没收到，自然不会发 ack

2.5.2 接收方收到数据，返回的 ack 丢了

2.6 TCP 是如何实现可靠性的？

🔥2.7 连接管理机制（安全机制）（三次握手与四次挥手）（整个网络原理最核心的考点）

1️⃣TCP 建立连接：三次握手

❓2.7.1 为什么需要三次握手，两次不行吗？

❓❓2.7.2 四次握手呢？

2️⃣TCP 断开连接：四次挥手

❓❓❓2.7.3 为啥三次握手能100%合并，四次挥手就不能合并？

❓❓❓❓2.7.4 挥手为什么需要四次？

2.8 滑动窗口（效率机制）

2.8.1 批量发送的过程中，如果出现丢包咋办？？

2.8.2 滑动窗口、快速重传是在批量传输大量数据的时候，会采取的措施

2.9 流量控制（安全机制）

2.9.1 如何实现流量控制

2.10 拥塞控制（安全机制）

2.10.1 拥塞窗口（拥塞控制实验出来的窗口）

2.11 延迟应答（效率机制）

2.11.1 如何进行延时应答

2.12 捎带应答（效率机制）

2.13 面向字节流

2.13.1 解决粘包问题

2.14 TCP异常情况

2.15 TCP小结

2.16 TCP 和 UDP 的差别

相关问题

公告

标签