3.3 快速参考与实战补充

我们在这一章里拆解了 ICMPv4 和 ICMPv6 的内部运作机制，从初始化流程到报文的收发，看了大量的内核代码。现在，是时候把这些散落在代码里的细节收拢一下，做一个速查，顺便补充两个在工程实践中非常容易忽略的「角落」。

这一节看起来像是个「附录」，但我强烈建议你不要只把它当字典看。后面提到的 procfs 参数和 iptables REJECT 目标，直接决定了你生产环境的防火墙「拒绝」行为到底是礼貌地挥手，还是暴躁地沉默。

📚 核心方法速查

我们在代码漫游中反复遇到了这些函数，它们是 ICMP 子系统的「四肢」。

接收处理

int icmp_rcv(struct sk_buff *skb);

位置：net/ipv4/icmp.c

这是 ICMPv4 的主入口函数。当一个 IP 数据包被剥去 IP 头部，发现协议号是 IPPROTO_ICMP (1) 时，内核就会直接跳转到这个函数。它负责校验和检查、报文分发，以及触发生成对应的 ICMP 回复（如 Echo Reply）。

发送处理

void icmp_send(struct sk_buff *skb_in, int type, int code, __be32 info);

位置：net/ipv4/icmp.c

内核向外发送 ICMPv4 错误消息（如 Destination Unreachable）的核心函数。

skb_in：触发错误的那个原始数据包（provoking SKB）。内核会从这个包里剥取 IP 头来做诊断，并把这个 IP 头嵌入到新产生的 ICMP 错误包的数据部分。
type / code： ICMP 消息的类型和代码。
info：通常用于传递 MTU（在 Fragmentation Needed 场景下）或指向出错的指针。

void icmpv6_send(struct sk_buff *skb, u8 type, u8 code, __u32 info);

位置：net/ipv6/icmp.c

ICMPv6 版本的发送函数。虽然名字很像，但内部实现要调用 ip6_append_data 和 ip6_push_pending_frames，走的是 IPv6 的发送路径。

void icmpv6_param_prob(struct sk_buff *skb, u8 code, int pos);

位置：net/ipv6/icmp.c

这是一个封装函数，专门用于发送 ICMPv6 Parameter Problem 报文。它的作用是省去你手动填 ICMPV6_PARAMPROB 类型的麻烦，并且会在发送完毕后自动释放 skb（因为参数问题严重到包没法处理了，必须丢弃）。

辅助工具

struct icmp6hdr *icmp6_hdr(const struct sk_buff *skb);

位置：include/linux/icmpv6.h

一个简单的内联辅助函数，用于从 skb 中安全地获取 icmp6hdr 指针。在 IPv6 的扩展头处理中，SKB 的指针可能一直在移动，用这个宏能避免指针运算的错误。

📋 关键数据表：错误代码字典

ICMP 的「错误」消息主要靠 Type（大类）和 Code（小类）来区分。下面这几个表是你在抓包分析时需要随时对照的「字典」。

1. ICMPv4 目的不可达

这是最常见的一类错误。当路由器找不到路，或者主机端口没开时，你会收到这些。

Code	内核符号	人类可读含义
0	`ICMP_NET_UNREACH`	网络不可达（路由表里没这网段）。
1	`ICMP_HOST_UNREACH`	主机不可达（ARP 没解析到，或者主机挂了）。
2	`ICMP_PROT_UNREACH`	协议不可达（比如你发了 TCP，但目标机器内核没装 TCP 模块）。
3	`ICMP_PORT_UNREACH`	端口不可达（最常见，UDP 发到一个没监听的端口）。
4	`ICMP_FRAG_NEEDED`	需要分片，但 DF 标志置位了（PMTU 发现的关键报文）。
5	`ICMP_SR_FAILED`	源路由失败（很少用了，说明指定的源路由路径有问题）。
9	`ICMP_NET_ANO`	网络被管理禁止（防火墙觉得你不该去这儿）。
10	`ICMP_HOST_ANO`	主机被管理禁止（防火墙觉得这台主机受保护）。
13	`ICMP_PKT_FILTERED`	包被过滤（通常由防火墙生成）。

(注：省略了部分极少见的 TOS 相关及 Historical 代码)

2. ICMPv4 重定向

主机 A 想发数据给主机 C，必须要经过路由器 R。但路由器 R 发现，主机 A 其实可以直接发到主机 B，再由主机 B 转发，或者 R 知道一条更近的路。这时候 R 就会给 A 发 Redirect。

Code	内核符号	含义
0	`ICMP_REDIR_NET`	重定向网络。
1	`ICMP_REDIR_HOST`	重定向主机。
2	`ICMP_REDIR_NETTOS`	重定向网络（基于 TOS）。
3	`ICMP_REDIR_HOSTTOS`	重定向主机（基于 TOS）。

3. ICMPv4 超时

Code	内核符号	含义
0	`ICMP_EXC_TTL`	TTL 超时（Traceroute 工作的核心）。
1	`ICMP_EXC_FRAGTIME`	分片重组超时（收齐所有分片的时间太久了，扔掉）。

4. ICMPv6 目的不可达

IPv6 的定义略有不同。注意 IPv6 里 ICMPV6_PKT_TOOBIG 是一个独立的 Type，而不是 Code。

Code	内核符号	含义
0	`ICMPV6_NOROUTE`	没有路由到目的地。
1	`ICMPV6_ADM_PROHIBITED`	被管理禁止（管理员不许）。
3	`ICMPV6_ADDR_UNREACH`	地址不可达（通常指邻居不可达，NDP 失败）。
4	`ICMPV6_PORT_UNREACH`	端口不可达。

5. ICMPv6 参数问题

Code	内核符号	含义
0	`ICMPV6_HDR_FIELD`	头字段错误（不认得这个字段）。
1	`ICMPV6_UNK_NEXTHDR`	未知的 Next Header（扩展头链断了）。
2	`ICMPV6_UNK_OPTION`	未知的 IPv6 选项。

⚙️ procfs 接口：从用户空间控制 ICMP

Linux 允许你在不重新编译内核的情况下，通过 /proc/sys 调整 ICMP 的行为。这些变量都属于 netns_ipv4 结构体，是网络命名空间隔离的。

关键配置项

1. icmp_echo_ignore_all

路径：/proc/sys/net/ipv4/icmp_echo_ignore_all
默认值：0 (关闭)
作用：置为 1 后，内核将忽略所有 ICMP Echo Request（Ping 请求）。
- 场景：这是「隐身模式」的第一步。注意，这只是忽略 Ping，不代表主机不可达。

2. icmp_echo_ignore_broadcasts

路径：/proc/sys/net/ipv4/icmp_echo_ignore_broadcasts
默认值：1 (开启)
作用：置为 1 后，忽略发往广播/组播地址的 Ping 或 Timestamp 请求。
- 场景：一定要保持开启。如果你的网络里有个病毒在疯狂 Ping 广播地址，把这个关掉会直接导致网络风暴。

3. icmp_ratelimit

路径：/proc/sys/net/ipv4/icmp_ratelimit
默认值：1 * HZ (即 1 秒，1000ms)
作用：限制特定 ICMP 错误报文（由 icmp_ratemask 定义）的发送频率。单位是毫秒。0 表示不限制。
- 警告：如果设为 0，攻击者可以伪造大量流量触发你的 ICMP 错误回复，导致你变成反射放大攻击的帮凶（虽然 ICMP 包很小，但也足够拥塞链路了）。

4. icmp_ratemask

路径：/proc/sys/net/ipv4/icmp_ratemask
默认值：0x1818 (二进制 0001 1000 0001 1000)
作用：一个位掩码，决定哪些 ICMP Type 需要被速率限制。每一位对应一个 ICMP Type。
- 比如，如果你想限制 Destination Unreachable (Type 3) 和 Time Exceeded (Type 11)，就需要把对应的位打开。默认值主要针对错误消息。

5. icmp_errors_use_inbound_ifaddr

路径：/proc/sys/net/ipv4/icmp_errors_use_inbound_ifaddr
默认值：0
作用：决定发送 ICMP 错误消息时，源 IP 地址怎么选。
- 0 (默认)：使用出站接口（outbound）的主地址。
- 1：使用入站接口（inbound，即收到触发包的那个接口）的主地址。
- 坑点：在多宿主主机或复杂的非对称路由场景下，如果你选错了源地址，对方收到的错误包可能被当作伪造包丢弃，或者对方回复时又迷路了。通常保持默认就好，除非你的网络拓扑非常特殊。

🛡️ 主动拒接：使用 iptables/ip6tables REJECT

防火墙有一条铁律：拒绝比丢弃更好。

DROP：你的机器直接把包扔了，客户端会一直等，直到超时。体验很差，且攻击者很难判断是被防火墙拦了还是机器挂了。
REJECT：你的机器礼貌地回一个 ICMP 错误包（"Host Unreachable" 或 "Port Unreachable"）。客户端立刻知道「此路不通」，并停止尝试。

但在 IPv4 和 IPv6 下，这个机制的细节有点不同。

IPv4 (iptables)

ipt_REJECT 模块允许你指定返回什么样的 ICMP 错误。

最常用的例子：禁止访问，并告知对方「管理员禁止」。

iptables -A INPUT -j REJECT --reject-with icmp-host-prohibited

--reject-with 可选参数：

参数	发送的 ICMP 消息	含义
`icmp-net-unreachable`	`ICMP_NET_UNREACH`	网络不可达。
`icmp-host-unreachable`	`ICMP_HOST_UNREACH`	主机不可达。
`icmp-port-unreachable`	`ICMP_PORT_UNREACH`	端口不可达（这是默认行为）。
`icmp-proto-unreachable`	`ICMP_PROT_UNREACH`	协议不可达。
`icmp-net-prohibited`	`ICMP_NET_ANO`	网络被禁止。
`icmp-host-prohibited`	`ICMP_HOST_ANO`	主机被禁止（常用）。
`icmp-admin-prohibited`	`ICMP_PKT_FILTERED`	被管理过滤（明确告知是过滤动作）。

额外彩蛋：--reject-with tcp-reset。如果这是一个 TCP 包，内核会伪造一个 TCP RST 包回去，而不是 ICMP。这对打破处于 SYN_SENT 状态的僵死连接非常有效。

IPv6 (ip6tables)

在 IPv6 下，ip6t_REJECT 的工作方式类似，但可用的错误类型变少了（因为 IPv6 的错误类型本身就精简了）。

例子：拒绝某个 IPv6 网段的 ICMPv6 请求。

ip6tables -A INPUT -s 2001::/64 -p ICMPv6 -j REJECT --reject-with icmp6-adm-prohibited

--reject-with 可选参数：

参数	发送的 ICMPv6 消息
`no-route` / `icmp6-no-route`	`ICMPV6_NOROUTE`
`adm-prohibited` / `icmp6-adm-prohibited`	`ICMPV6_ADM_PROHIBITED`
`addr-unreach` / `icmp6-addr-unreachable`	`ICMPV6_ADDR_UNREACH`
`port-unreach` / `icmp6-port-unreachable`	`ICMPV6_PORT_UNREACH`

本章回响

ICMP 经常被误解。很多人把它和「Ping」画等号，甚至觉得它是安全隐患，恨不得在防火墙第一行就把它全禁了。

但通过这一章的源码漫游，你应该建立了一个新的认知：ICMP 是 IP 协议的维保人员。如果没有 ICMP 错误报文，IP 路由就是单向的盲目投递——包发出去没人收，或者发错了路，发送者永远不知道。PMTU 发现会挂掉（导致大包通而不畅），重定向会失效（导致路径永远是次优的），连通性测试会变成「盲人摸象」。

我们在本章开头提到的那几个直觉——Ping 只是测试连通性、防火墙要禁 Ping——现在看来，都太粗糙了。

Ping 测试的不只是连通性，还包括路由的完整性、名字解析的效率（如果在 IPv6 环境下涉及 NDP）。
防火墙不应该盲目 DROP 所有 ICMP，而应该精细控制（允许 Type 3 Code 4 用于 MTU 发现，允许 Type 11 用于 Traceroute），并优先使用 REJECT 目标而不是 DROP。

理解了 ICMP 的收发机制、数据结构和 inet 协议注册流程，你就掌握了调试网络层问题的「听诊器」。当网络出问题时，不要只盯着 TCP 三次握手，把视角下沉到 L3，问自己一句：ICMP 报错了吗？报的是什么错？ 那个错误包里，往往藏着真相。

接下来，我们将正式进入 IPv4 网络层的核心——那些负责路由、分片和转发的核心引擎。既然已经搞定了「控制信号」，接下来就是看「数据车流」是怎么被调度和转场的了。

练习题

练习 1：understanding

题目：在 Linux 内核初始化阶段，icmp_sk_init() 函数会为每个 CPU 创建一个内核套接字（net->ipv4.icmp_sk[i]）。请问创建这些套接字时指定的协议类型（protocol）是什么？这些套接字的主要用途是什么？

答案与解析

答案：协议类型是 IPPROTO_ICMP (值为 1)。这些套接字是内核用来发送 ICMP 错误消息（如目的不可达、超时）或回复消息（如 Echo Reply）的，它们属于 Raw Socket，不用于用户态直接通信，而是内核协议栈内部使用。

解析：根据文中 icmp_sk_init 的代码片段： err = inet_ctl_sock_create(&sk, PF_INET, SOCK_RAW, IPPROTO_ICMP, net); 可以看出，第三个参数 IPPROTO_ICMP 指定了协议类型。这些套接字在文中被描述为“kernel ICMP socket for sending ICMP messages”，并在 icmp_push_reply() 中被使用，用于构建和发送内核产生的 ICMP 报文。

练习 2：application

题目：假设你的主机作为路由器正在转发一个数据包。如果该数据包的长度（1500 字节）超过了下一跳链路的 MTU（1400 字节），且 IP 头部设置了 DF（Don't Fragment）标志。此时内核会向发送方返回哪种 ICMP 消息？在内核代码中，是哪个函数负责发送此消息，以及它携带的 info 参数代表什么含义？

答案与解析

答案：返回“Destination Unreachable” (Type 3)，代码为“Fragmentation Needed” (Code 4) 的 ICMP 消息。发送函数为 icmp_send() (在 ip_forward 中调用)。 info 参数（对应下一跳 MTU 的值）会被设置为 1400 (即 dst_mtu(&rt->dst))。

解析：这是一个典型的 MTU 发现场景。根据文中 ip_forward 函数的代码片段： icmp_send(skb, ICMP_DEST_UNREACH, ICMP_FRAG_NEEDED, htonl(dst_mtu(&rt->dst))); 当数据包长度大于 MTU 且 DF 标志置位时，内核会触发此逻辑。icmp_send 函数的第四个参数 info 在这种情况下用于告知对方需要的 MTU 大小，从而实现 Path MTU Discovery。

练习 3：thinking

题目：在 icmp_rcv() 函数处理接收到的 ICMPv4 报文时，如果校验和检查失败，内核通常会丢弃该报文。请思考并分析：为什么内核在校验和失败时只更新统计计数器并丢弃报文，而不返回负错误值（如 -EINVAL）？

答案与解析

答案：因为 ip_local_deliver_finish() 中的协议处理机制如果收到负返回值，会尝试重新处理该数据包（例如可能认为是传输层问题等）。然而，对于 ICMP 报文本身校验和错误，表明报文已损坏，没有任何恢复或重处理的必要，唯一的正确做法就是丢弃。返回 0 表示协议栈已处理完毕（即使处理方式是丢弃），避免系统无谓的消耗。

解析：文中提到：The icmp_rcv() method does not return an error in this case... when a protocol handler returns a negative error, another attempt to process the packet is performed, and it is not needed in this case. 这是网络协议栈健壮性设计的一部分。ICMP 主要是控制报文，校验和错误意味着内容不可信，必须静默丢弃以防止基于错误报文的操作。如果返回错误，可能会触发上层重传或其他副作用，这是不安全的。

要点提炼

ICMP 是 IP 网络中不可或缺的“神经系统”，它超越了单纯的 Ping 工具范畴，充当了网络层的异常处理与反馈机制。其核心价值在于打破 IP 协议“尽力而为”投递的黑盒属性，通过报告错误（如目标不可达、超时）和传输诊断信息，让发送端能感知网络状态并进行调整（如 PMTU 发现），是维护网络可调试性和健壮性的基石。

内核处理 ICMP 的核心机制依赖于高效的分发与并行架构。对于接收路径，内核通过查表或跳转分发，将不同类型的包（如 Echo、超时、不可达）交给特定的 Handler 处理；对于发送路径，为了规避多核系统下的锁竞争，Linux 内核采用了为每个 CPU 创建独立 Raw Socket 的设计，确保即使在高负载下也能高效地生成和发送控制报文。

ICMPv4 与 ICMPv6 虽名相似，但在职责上存在本质差异。ICMPv4 主要用于辅助 IPv4 进行差错报告；而 ICMPv6 在 IPv6 架构中地位极高，它不仅继承了报错功能，还彻底接管了 ARP（地址解析）和 IGMP（组播管理）的职责，成为邻居发现（ND）和组播监听（MLD）的统一载体，是 IPv6 网络运作的绝对核心。

为了防止网络风暴，ICMP 的发送受到严格的速率限制。内核默认会对错误报文进行限流，以避免因网络故障引发的“雪崩式”反馈导致拥塞崩溃。然而，这一规则有两个关键例外：PMTU 发现所需的“包太大”报文和发给回环设备的报文必须立即发送，以确保路径 MTU 的及时更新和本地通信的流畅。

工程实践中，安全策略应倾向于“拒绝”而非“丢弃”。盲目使用防火墙 DROP 所有 ICMP 会导致 MTU 发现失败（引发大包传输卡死）和 Traceroute 失效；更明智的做法是利用 iptables REJECT 目标或精细化的 procfs 配置（如 icmp_echo_ignore_all），在隐藏主机特定信息的同时，允许必要的错误消息（如 Fragmentation Needed）通过，以确保网络连通性。

📚 核心方法速查​

接收处理​

发送处理​

辅助工具​

📋 关键数据表：错误代码字典​

1. ICMPv4 目的不可达​

2. ICMPv4 重定向​

3. ICMPv4 超时​

4. ICMPv6 目的不可达​

5. ICMPv6 参数问题​

⚙️ procfs 接口：从用户空间控制 ICMP​

关键配置项​

🛡️ 主动拒接：使用 iptables/ip6tables REJECT​

IPv4 (iptables)​

IPv6 (ip6tables)​

本章回响​

练习题​

练习 1：understanding​

练习 2：application​

练习 3：thinking​

要点提炼​

📚 核心方法速查

接收处理

发送处理

辅助工具

📋 关键数据表：错误代码字典

1. ICMPv4 目的不可达

2. ICMPv4 重定向

3. ICMPv4 超时

4. ICMPv6 目的不可达

5. ICMPv6 参数问题

⚙️ procfs 接口：从用户空间控制 ICMP

关键配置项

🛡️ 主动拒接：使用 iptables/ip6tables REJECT

IPv4 (iptables)

IPv6 (ip6tables)

本章回响

练习题

练习 1：understanding

练习 2：application

练习 3：thinking

要点提炼