原子操作实战指南：Linux内核7.0最轻量的并发控制

前言：为什么简单的`a = 3`并不简单

上一节我们花了很大力气去识别「谁是危险分子」。一旦你找到了那个需要保护的共享变量——比如一个记录设备打开次数的全局计数器——你面临的第一道防线就是原子操作。

它是内核中最轻量级的保护机制，轻到有时候你甚至感觉不到它的存在，但它解决的却是并发世界里最本质的崩坏问题：「读取—修改—写入」这三步，绝对不能被打断。

老实说，我在刚开始写驱动的时候，对这个概念是完全不理解的。我当时想：「不就是个计数器吗？counter++能有什么问题？」

然后我就收获了人生中第一个Kernel Panic。然后打开日志一看——不是哥们，怎么这些值变得面目全非的？？？后来知道了——啊哈，并发是你干的！

从C语言到汇编：理解为什么`a++`不是原子的

先抛开内核的术语，我们从最直觉的一个误解开始。

在C语言里，给变量加1是天经地义的：

a++;

这一行代码在你眼里是不可分割的一步。但在CPU眼里，它不是。

绝大多数现代架构（包括我们用的ARM）都不能直接对内存变量进行自增操作。这事儿必须通过寄存器中转。假设变量a存放在内存地址0x30000000，编译器把上面那行优雅的C语言编译成汇编后，实际上变成了三件事：

把变量a的值从内存读入寄存器r0
在寄存器r0里加1
把r0的值写回内存地址

对应的ARM汇编代码大概长这样：

asm

ldr r0, [r1]          /* 从内存读取 a 的值到 r0 */
add r0, r0, #1        /* r0 = r0 + 1 */
str r0, [r1]          /* 把 r0 写回内存 */

这三条指令，就是CPU眼里的「三步」。

这有什么问题？

单线程世界没问题。但在并发世界里，这就是世界崩塌的开始。

想象一下，现在有两个线程，线程A想把a加1，线程B也想把a加1。如果没有保护，理想中的执行顺序应该是这样的：

线程A走完三步（a变成了1）→ 线程B再走完三步（a变成了2）。最终a是2。

这很完美，谁也不干扰谁。但现实是残酷的，CPU的调度是随机的。真正的执行流程很可能是这样交错的：

线程A执行了第1步（读取a=0）
← 调度发生！切到线程B
线程B执行完了全部三步（把a设为了1）
← 调度切回线程A
线程A继续执行第2、3步（把a设为1）

结果是什么？线程B的工作白干了。最终a的值是1，而不是预期的2。

这就是竞争。它之所以会发生，是因为C语言里的「一步」，在机器层面变成了「三步」。这三步如果不打包在一起执行，谁插一脚进来，数据就乱了。

要解决这个问题，核心思路只有一个：把这三步强行捏合成一个不可分割的整体。这就是「原子操作」名字的由来——像原子一样不可再分，要么全做完，要么别做。

环境：基于Linux 7.1

项目	版本/信息
内核版本	Linux 7.1 (主线内核)
架构	ARMv7-A
相关头文件	`include/linux/atomic.h`

原子整形操作：不是所有的`int`都能直接用

在内核里，你不能随便拿个int变量就开始原子操作。内核用了一个专门的结构体来承载这种「不可分割」的属性，叫atomic_t。

它在include/linux/types.h里的定义非常朴素：

typedef struct {
    int __aligned(sizeof(int)) counter;
} atomic_t;

#define ATOMIC_INIT(i) { (i) }

为什么要包一层结构体，而不是直接用int？

这是为了强制类型检查，防止你一不小心把它当成普通整数传给了不支持原子的函数（比如++i这种C语言操作）。把它封装起来，就是在提醒使用者：「这玩意儿特殊，请走专用通道。」

而且，__aligned(sizeof(int))这个对齐修饰符也很重要。它确保原子变量总是按照int的大小对齐的，这对于某些架构的原子操作指令是必需的。

定义与初始化

怎么用？首先定义原子变量。

最简单的定义方式：

atomic_t a;  /* 定义一个原子变量 a */

通常我们在定义的时候就要给它赋个初值，这时候要用专用宏ATOMIC_INIT：

atomic_t b = ATOMIC_INIT(0);  /* 定义 b 并初始化为 0 */

在Linux 7.0中，你还可以使用新的初始化方式：

atomic_t c = ATOMIC_INIT(0);  /* 静态初始化 */

/* 或者动态初始化 */
atomic_set(&c, 0);  /* 运行时设置 */

常用操作 API

一旦你有了atomic_t变量，以后对它的所有读写改，都不能再直接用=号或++了，必须通过内核提供的函数表。

下面的表格请务必多看两眼，这是驱动开发的「高频词汇表」：

函数	描述
`ATOMIC_INIT(int i)`	初始化宏，定义原子变量时用它来赋初值
`int atomic_read(atomic_t *v)`	读：读取`v`的值并返回
`void atomic_set(atomic_t *v, int i)`	写：向`v`写入`i`值（注意，这本身是原子的）
`void atomic_add(int i, atomic_t *v)`	加：给`v`加上`i`
`void atomic_sub(int i, atomic_t *v)`	减：从`v`减去`i`
`void atomic_inc(atomic_t *v)`	自增：给`v`加1（相当于`i++`）
`void atomic_dec(atomic_t *v)`	自减：从`v`减1（相当于`i--`）
`int atomic_dec_return(atomic_t *v)`	减并返回：`v`减1，并且返回新值
`int atomic_inc_return(atomic_t *v)`	加并返回：`v`加1，并且返回新值
`int atomic_sub_and_test(int i, atomic_t *v)`	减并测试：`v`减`i`，如果结果为0返回真，否则假
`int atomic_dec_and_test(atomic_t *v)`	减一并测试：`v`减1，如果结果为0返回真（常用于引用计数归零检测）
`int atomic_inc_and_test(atomic_t *v)`	加一并测试：`v`加1，如果结果为0返回真（极少用）
`int atomic_add_negative(int i, atomic_t *v)`	加并测负：`v`加`i`，如果结果是负数返回真

Linux 7.0新增：内存顺序变体

在Linux 7.0中，原子操作API有了一个重要的扩展：内存顺序变体。

这是为了支持更精细的内存屏障控制，特别是在ARM这样的弱内存序架构上。新的API带有后缀：

_relaxed - 无序访问，性能最好
_acquire - 获取语义，保证之后的操作不会被重排到前面
_release - 释放语义，保证之前的操作不会被重排到后面
无后缀 - 完全有序，默认版本

例如：

/* 完全有序（默认） */
int val = atomic_read(&v);

/* 松散序（性能最好，但无顺序保证） */
int val = atomic_read_relaxed(&v);

/* 获取序 */
int val = atomic_read_acquire(&v);

/* 释放序 */
atomic_set_release(&v, 10);

⚠️ 注意
对于大多数驱动代码，使用默认的完全有序版本就足够了。内存序优化是高级主题，只有在确实需要 squeezing out 性能时才考虑。

实战片段：引用计数管理

把这些串起来，代码段大概是这样的：

/* 定义并初始化原子变量 */
atomic_t ref_count = ATOMIC_INIT(1);  /* 初始引用计数为1 */

/* 获取引用 */
void get_ref(void) {
    atomic_inc(&ref_count);  /* 引用计数加1 */
}

/* 释放引用 */
void put_ref(void) {
    /* 如果这是最后一个引用，清理资源 */
    if (atomic_dec_and_test(&ref_count)) {
        /* ref_count减1后变成了0，释放资源 */
        kfree(resource);
        pr_info("Resource freed.\n");
    }
}

/* 查询当前引用数 */
int get_ref_count(void) {
    return atomic_read(&ref_count);
}

这背后的机制是：每个函数内部，都会通过CPU的特定指令（比如ARM的LDREX和STREX）确保「读—改—写」这三步在硬件层面被锁死，别的核不可能插进来。

原子位操作：对「标志位」的精准控制

除了整数计数，我们经常还需要操作某一位。比如设备状态里有一个标志位，表示「设备正忙」。这时候就需要原子位操作。

原子位操作不需要像atomic_t那样的特殊结构体，它是直接对内存地址下手的。你传给它一个内存地址（比如你的设备结构体里的某个成员），再传给它一个位号（第几位），它就能保证只操作那一位，而且绝不乱套。

常用 API

这里同样有一张高频表：

函数	描述
`void set_bit(int nr, void *p)`	置位：将地址`p`的第`nr`位设置为1
`void clear_bit(int nr, void *p)`	清零：将地址`p`的第`nr`位清零
`void change_bit(int nr, void *p)`	翻转：将地址`p`的第`nr`位取反（0变1，1变0）
`int test_bit(int nr, void *p)`	测试：读取第`nr`位的值（非原子读，仅用于查询）
`int test_and_set_bit(int nr, void *p)`	测并置位：原子地设置第`nr`位为1，并返回它原来的值（常用于加锁）
`int test_and_clear_bit(int nr, void *p)`	测并清零：原子地清除第`nr`位，并返回它原来的值
`int test_and_change_bit(int nr, void *p)`	测并翻转：原子地翻转第`nr`位，并返回它原来的值

这里的「原来」二字是关键。

test_and_set_bit是实现「先到先得」逻辑的神器。两个线程都试着调用它去抢同一个标志位：

线程A调用test_and_set_bit(0, &addr)，因为原来是0，返回0，线程A知道「是我先抢到的」，并且把位变成了1
线程B随后调用，因为已经是1了，返回1，线程B知道「已经有人抢了」，只好放弃或等待

这其实就是一个最简单的「自旋锁」的原型。

实战片段：设备状态管理

/* 设备状态标志位定义 */
#define DEVICE_BUSY 0   /* 第0位：设备忙标志 */
#define DEVICE_ERROR 1  /* 第1位：设备错误标志 */

/* 设备结构体 */
struct my_device {
    unsigned long flags;  /* 状态标志位 */
    /* ... 其他成员 ... */
};

/* 设备打开时检查忙标志 */
int my_device_open(struct my_device *dev) {
    /* 尝试设置BUSY位，如果返回1表示已经被设置了 */
    if (test_and_set_bit(DEVICE_BUSY, &dev->flags)) {
        /* 设备忙，返回错误 */
        return -EBUSY;
    }

    /* 成功获取设备访问权 */
    return 0;
}

/* 设备关闭时清除忙标志 */
void my_device_close(struct my_device *dev) {
    clear_bit(DEVICE_BUSY, &dev->flags);
}

/* 错误处理 */
void my_device_error(struct my_device *dev) {
    set_bit(DEVICE_ERROR, &dev->flags);
}

/* 检查错误状态 */
int my_device_check_error(struct my_device *dev) {
    return test_bit(DEVICE_ERROR, &dev->flags);
}

64位原子操作：当32位不够用时

如果你在64位的SoC上跑内核（比如Cortex-A53），你可能需要处理64位整数。内核也提供了对应的atomic64_t结构体和一系列atomic64_xxx函数。

/* 定义64位原子变量 */
atomic64_t counter64 = ATOMIC64_INIT(0);

/* 使用方式与32位版本完全相同 */
atomic64_inc(&counter64);
atomic64_add(1000, &counter64);
u64 val = atomic64_read(&counter64);

用法和32位版本一模一样，只是把int换成了long long。

不过，鉴于我们的板子是32位的Cortex-A7，用32位原子操作就够了。但知道有64位版本存在是好事，万一以后换板子了呢。

什么时候用原子操作，什么时候用锁？

原子操作是内核并发控制的基石。它虽然只能保护简单的整数或位，但在很多场景下（比如简单的引用计数、开关标志），它不仅够用，而且是性能最好的选择——因为它没有锁带来的上下文切换开销，CPU也不用在那空转。

但原子操作有它的局限：它只能保护「一个变量」。如果你的代码逻辑需要同时保护两个变量，或者需要保护一大段复杂的数据结构，原子操作就显得力不从心了。

决策树：

需要保护的是单个整数或位吗？
├─ 是 → 可以用原子操作
│  └─ 操作很简单（inc/dec/test_set）？
│     └─ 是 → 优先用原子操作（性能最好）
└─ 否 → 需要用锁（自旋锁或互斥体）

这一小节就到这里

原子操作是最轻量级的并发控制机制。当你只需要保护一个简单的计数器或标志位时，它是首选。

但记住它的局限性：只能保护单个变量。一旦你需要保护复杂的数据结构或一段逻辑代码，就需要升级到更重型的武器——锁。

下一节，我们要接触那个让CPU「忙等待」的自旋锁，以及那个让线程「睡大觉」的互斥体。它们会引入新的问题，但也会带来更强的控制力。

本章要点

原子操作解决的是「读—改—写」不可分割的问题。在C语言里看似原子的一步操作，在CPU层面可能是多步。
atomic_t是专门的原子整数结构体，不能直接用++或--操作，必须使用内核提供的API。
Linux 7.0新增了内存顺序变体（_relaxed、_acquire、_release），但大多数驱动用默认版本即可。
原子位操作直接对内存地址操作，常用于标志位管理。test_and_set_bit是实现简单锁的原型。
原子操作的适用场景：保护单个整数或位。复杂场景需要用锁。

内核核心功能

使用主线内核构建脚本

字符设备驱动教程

设备树基础教程

Platform LED 驱动教程

蜂鸣器驱动教程

GPIO 按键驱动（轮询）教程

消抖按键驱动（中断方式）

Input 子系统按键驱动教程

AP3216C I2C 驱动教程

ICM-20608 SPI 驱动教程

RTC 驱动教程（SNVS）

电容触摸驱动教程（goodix）

Firmware Apply

Modules

原子操作实战指南：Linux内核7.0最轻量的并发控制

前言：为什么简单的`a = 3`并不简单

从C语言到汇编：理解为什么`a++`不是原子的

环境：基于Linux 7.1

原子整形操作：不是所有的`int`都能直接用

定义与初始化

常用操作 API

Linux 7.0新增：内存顺序变体

实战片段：引用计数管理

原子位操作：对「标志位」的精准控制

常用 API

实战片段：设备状态管理

64位原子操作：当32位不够用时

什么时候用原子操作，什么时候用锁？

这一小节就到这里

本章要点

原子操作实战指南：Linux内核7.0最轻量的并发控制 ​

前言：为什么简单的a = 3并不简单 ​

从C语言到汇编：理解为什么a++不是原子的 ​

环境：基于Linux 7.1 ​

原子整形操作：不是所有的int都能直接用 ​

定义与初始化 ​

常用操作 API ​

Linux 7.0新增：内存顺序变体 ​

实战片段：引用计数管理 ​

原子位操作：对「标志位」的精准控制 ​

常用 API ​

实战片段：设备状态管理 ​

64位原子操作：当32位不够用时 ​

什么时候用原子操作，什么时候用锁？ ​

这一小节就到这里 ​

本章要点 ​

原子操作实战指南：Linux内核7.0最轻量的并发控制

前言：为什么简单的`a = 3`并不简单

从C语言到汇编：理解为什么`a++`不是原子的

环境：基于Linux 7.1

原子整形操作：不是所有的`int`都能直接用

定义与初始化

常用操作 API

Linux 7.0新增：内存顺序变体

实战片段：引用计数管理

原子位操作：对「标志位」的精准控制

常用 API

实战片段：设备状态管理

64位原子操作：当32位不够用时

什么时候用原子操作，什么时候用锁？

这一小节就到这里

本章要点