中断子系统 - 硬件和软件的桥梁
上一章我们讲了为什么要用中断方式,现在我们具体看看 Linux 的中断子系统是怎么工作的。说实话,中断这个概念在操作系统里挺复杂的,但在驱动开发层面,我们需要掌握的核心 API 其实不多。把这几个 API 用熟了,大部分中断相关的驱动都能搞定。
中断是什么
先从最基础的概念说起。中断是硬件通知 CPU 的一种机制。当某个硬件事件发生时(比如按键按下、数据到达、DMA 完成),硬件会产生一个中断信号。CPU 收到这个信号后,会暂停当前正在执行的任务,跳转到中断处理函数执行。处理完之后,再回到原来的任务继续执行。
你可以把它想象成一个插队机制。CPU 正在按顺序处理各种任务,突然一个硬件说"我有急事",CPU 就停下来去处理这个急事。处理完了,再回来继续之前的任务。
为什么叫"中断"
因为 CPU 正在执行的程序被"打断"了。这个概念最早来自硬件设计,CPU 的指令执行流程被外部信号中断。
GPIO 中断配置
在 i.MX 系列处理器上,GPIO 可以配置成中断源。我们需要配置两件事:触发方式和中断处理函数。
触发方式指的是在什么条件下触发中断:
#define IRQF_TRIGGER_RISING 0x00000001 // 上升沿触发
#define IRQF_TRIGGER_FALLING 0x00000002 // 下降沿触发
#define IRQF_TRIGGER_HIGH 0x00000004 // 高电平触发
#define IRQF_TRIGGER_LOW 0x00000008 // 低电平触发对于按键这种设备,我们通常用边沿触发,因为按键状态变化是我们关心的。上升沿对应按键松开(如果硬件设计是松开为高电平),下降沿对应按键按下。
我们的驱动用双边沿触发,这样按键按下和松开都能检测:
unsigned long irq_flags = IRQF_TRIGGER_RISING | IRQF_TRIGGER_FALLING;电平触发 vs 边沿触发
电平触发适合那些需要持续监控的信号,比如外部设备的"忙"信号。边沿触发适合状态变化事件,比如按键、传感器信号。对于按键,边沿触发是更好的选择,因为我们只关心状态变化的那一刻。
从 GPIO 到中断号
GPIO 子系统和中断子系统是紧密集成的。我们可以通过 GPIO 描述符获取对应的中断号:
int irq = gpiod_to_irq(gpio);
if (irq < 0) {
pr_err("Failed to get IRQ for GPIO: %d\n", irq);
return irq;
}gpiod_to_irq() 这个函数会在 GPIO 的 irqchip 里查找对应的中断号。如果成功,返回一个正整数(中断号);如果失败,返回一个负的错误码。
说实话,这个函数的名字可能会让人困惑。它不是真的"转换"什么东西,而是查找 GPIO 对应的中断号。在硬件层面,每个 GPIO(或者一组 GPIO)都对应一个中断线,这个函数就是找出那个中断线的编号。
注册中断处理函数
拿到中断号之后,我们就可以注册中断处理函数了:
ret = devm_request_irq(dev, irq, key_irq_handler, irq_flags,
"imxaes_key_debounce", dev);
if (ret < 0) {
pr_err("Failed to request IRQ %d: %d\n", irq, ret);
return ret;
}我们用的是 devm_request_irq(),这是 request_irq() 的托管版本。devm_ 前缀代表"managed resource",当设备卸载时,内核会自动释放这个中断。不用 devm_ 版本的话,你得在 remove 函数里手动调用 free_irq(),很容易忘。
参数说明:
dev:设备指针,用于资源管理irq:中断号,就是我们刚才用gpiod_to_irq()获取的key_irq_handler:中断处理函数指针irq_flags:中断标志,包括触发方式"imxaes_key_debounce":中断名称,会出现在/proc/interrupts里dev:传递给中断处理函数的私有数据
查看中断统计
你可以通过 /proc/interrupts 文件查看系统中断的统计信息:
cat /proc/interrupts | grep imxaes这会显示你的驱动触发了多少次中断,调试时很有用。
中断处理函数
中断处理函数是整个中断机制的核心。它的签名是固定的:
static irqreturn_t key_irq_handler(int irq, void *dev_id)
{
struct key_debounce_dev* dev = dev_id;
/* 递增中断计数器 */
atomic_inc(&dev->irq_count);
/* 调度工作队列进行消抖处理 */
schedule_work(&dev->work);
return IRQ_HANDLED;
}这个函数的第一个参数是中断号,第二个参数是我们在注册时传递的私有数据(dev)。返回值是 irqreturn_t 类型,有两个可能的值:
typedef enum irqreturn {
IRQ_NONE = 0, // 不是这个设备的中断
IRQ_HANDLED = 1, // 已处理
} irqreturn_t;中断处理函数的约束
中断处理函数运行在中断上下文,有很多约束:
- 不能睡眠(不能调用 msleep、mutex_lock 等)
- 不能调用可能睡眠的函数
- 必须快速执行(通常不超过几微秒)
- 不能访问用户空间内存
违反这些约束会导致内核 panic 或系统死锁。
中断共享
Linux 支持中断共享,多个设备可以共享同一个中断线。这就是为什么中断处理函数需要返回值——如果返回 IRQ_NONE,内核会把中断传给下一个共享这个中断的处理器。
在注册共享中断时,需要设置 IRQF_SHARED 标志:
request_irq(irq, handler, IRQF_SHARED, "name", dev);共享中断时,所有注册的处理器都会被调用,每个处理器需要判断是否是自己的中断。如果不是,返回 IRQ_NONE。
实际经验
GPIO 中断通常不需要共享,因为每个 GPIO 有自己独立的中断号。但在 PCI 设备中,中断共享很常见,因为多个设备可能连接到同一个 IRQ 引脚。
中断处理的时机
你可能会问,中断处理函数什么时候被调用?是在中断触发后立即调用吗?
答案是:几乎立即。中断触发后,CPU 会完成当前指令,然后保存当前状态,跳转到中断处理函数。这个过程通常在几微秒内完成。
但要注意的是,中断处理函数运行在中断上下文,而不是进程上下文。这意味着:
- 它没有进程控制块(没有
current指针) - 它不能被调度(不能睡眠)
- 它运行在高优先级,会打断普通进程
内核的中断管理
在内核内部,中断管理比我们看到的要复杂得多。request_irq() 最终会调用到中断核心代码,在 /kernel/irq/manage.c 里:
int request_threaded_irq(unsigned int irq, irq_handler_t handler,
irq_handler_t thread_fn, unsigned long irqflags,
const char *devname, void *dev_id)
{
/* 分配 irq_desc 结构 */
/* 设置 handler 和 thread_fn */
/* 启用中断线 */
/* ... */
}内核维护了一个 irq_desc 数组,每个中断号对应一个 irq_desc。这个结构体包含了中断的所有信息:处理函数、状态、锁等。当硬件触发中断时,内核会查找对应的 irq_desc,调用注册的处理函数。
顶半部和底半部
你可能会听到"顶半部"(top half)和"底半部"(bottom half)这两个词。这是 Linux 中断处理的一种设计模式。
顶半部就是中断处理函数本身,必须快速执行,不能睡眠。底半部可以推迟执行,可以睡眠,可以做耗时操作。
我们的驱动就是典型的顶半部/底半部分离:
- 顶半部:中断处理函数,只是调度一个工作队列
- 底半部:工作队列处理函数,延时读取 GPIO,报告事件
// 顶半部(中断处理函数)
static irqreturn_t key_irq_handler(int irq, void *dev_id) {
schedule_work(&dev->work); // 只是调度,立即返回
return IRQ_HANDLED;
}
// 底半部(工作队列处理函数)
static void key_work_handler(struct work_struct *work) {
msleep(20); // 可以睡眠!
// 做实际的处理...
}什么时候需要底半部
如果你的中断处理需要做以下事情之一,就需要底半部:
- 耗时操作(超过几十微秒)
- 需要睡眠(比如等待互斥锁)
- 需要访问可能睡眠的 API
对于按键这种低速设备,几乎总是需要底半部的。
中断的调试技巧
中断相关的问题有时候很难调试,因为涉及到硬件和时序。这里有几个实用的技巧:
- 查看中断统计:
cat /proc/interrupts这会显示每个中断线的触发次数,可以用来验证中断是否真的触发了。
- 打印调试: 在中断处理函数里加个打印:
pr_info("IRQ %d triggered\n", irq);但要注意,打印操作本身很慢,不要在生产代码里保留。
- ftrace 追踪: 内核的 ftrace 可以追踪中断的延迟:
echo 1 > /sys/kernel/debug/tracing/events/irq/enable
cat /sys/kernel/debug/tracing/trace调试中断的坑
别在中断处理函数里加太多打印,这会让系统变慢甚至死锁。中断处理函数必须快速返回,打印操作可能需要几十微秒,对于高频中断来说是不可接受的。
本章小结
这一章我们深入了解了 Linux 的中断子系统。核心 API 其实就两个:gpiod_to_irq() 获取中断号,devm_request_irq() 注册中断处理函数。中断处理函数必须快速返回,不能睡眠,所以我们需要用工作队列来实现底半部,做实际的处理。
中断机制是操作系统里的经典设计,它解决了硬件事件如何及时通知 CPU 的问题。Linux 的中断子系统经过了多年演进,既保证了性能,又提供了简洁的 API。理解这个机制,对于编写高效的驱动程序至关重要。
下一章我们会详细讲工作队列机制,看看为什么中断里不能睡眠,以及如何安全地推迟执行。
相关文档: