【Linux驱动】字符设备驱动内核源码深度解析

Linux内核主要包括三种驱动模型:字符设备驱动、块设备驱动以及网络设备驱动。其中,字符设备驱动是Linux驱动开发中最常见、最基础的驱动模型。
本文将从内核源码角度出发,拆解字符设备驱动的机制,涵盖:
-
字符设备号管理:内核如何分配和追踪设备号
-
字符设备对象(cdev):内核如何抽象和管理字符设备
-
kobj_map 哈希映射机制:设备号到 cdev 的快速查找
-
mknod 与 open 系统调用全链路:从用户态到内核驱动的完整路径
-
共享内存字符设备驱动案例:简单的字符设备驱动使用方法代码
📌 提示:本文基于 Linux 内核 5.x 版本源码进行分析,主要源码文件位于
fs/char_dev.c
include/linux/cdev.h
drivers/base/map.c
一、字符设备号管理
本小节的主线是内核如何管理哪些设备号已经分配,哪些设备号可用
1.1 dev_t 设备号概述
在Linux内核中,每个字符设备都由一个 32 位的设备号(dev_t) 唯一标识。这个 32 位数值被划分为两部分:
-
主设备号(Major Number):占用高 12 位(bit 12-31),用于标识设备驱动类型
-
次设备号(Minor Number):占用低 20 位(bit 0-19),用于区分同一驱动下的不同设备实例
内核提供了三个关键宏来操作设备号:
#define MINORBITS 20 #define MINORMASK ((1U << MINORBITS) - 1) #define MAJOR(dev) ((unsigned int) ((dev) >> MINORBITS)) /* 提取主设备号 */ #define MINOR(dev) ((unsigned int) ((dev) & MINORMASK)) /* 提取次设备号 */ #define MKDEV(ma,mi) (((ma) << MINORBITS) | (mi)) /* 组合生成设备号 */
💡 设计思想:主设备号相当于"设备类型标识",例如所有I2C设备共享一个主设备号;次设备号则用于区分具体是哪个I2C设备(如 MPU6050 传感器还是 EEPROM 存储器)。这种分层设计使得内核可以在保持设备号空间紧凑的同时,支持大量设备实例
1.2 char_device_struct 结构体
内核通过char_device_struct结构体来记录系统中已分配的设备号范围(主设备号 + 次设备号区间),形成一个资源管理表,防止设备号冲突。内核维护了chrdevs哈希表来记录设备号的使用情况:
/* 定义在 fs/char_dev.c */ #define CHRDEV_MAJOR_HASH_SIZE 255 static struct char_device_struct { struct char_device_struct *next;/* 将相同哈希值的节点链接成链表 */ unsigned int major; /* 主设备号 */ unsigned int baseminor; /* 次设备号起始值 */ int minorct; /* 次设备号数量 */ char name[64]; /* 设备名称 */ struct cdev *cdev; /* 内核字符对象(已废弃) */ } *chrdevs[CHRDEV_MAJOR_HASH_SIZE];
🔑 关键设计:内核使用chrdevs维护设备号的分配信息
chrdevs数组大小仅为 255,但主设备号范围是 0~511(甚至理论上可以更大)。内核通过取模操作major % 255将主设备号映射到哈希桶。具体来说:
-
主设备号 0、255、510... 都落在桶 0
-
主设备号 1、256、511... 都落在桶 1
-
桶内链表按主设备号从小到大排序
这种设计下:在不增加数组规模的前提下,理论上支持无限的主设备号范围,且查找效率不受影响。
1.3 __register_chrdev_region 函数
__register_chrdev_region是设备号分配的核心函数,负责在chrdevs哈希表中查找或插入一个空闲的设备号区间,并返回对应的char_device_struct指针
/* 定义在 fs/char_dev.c */ static struct char_device_struct *__register_chrdev_region(unsigned int major, unsigned int baseminor, int minorct, const char *name) { struct char_device_struct *cd, **cp; intret=0; inti; /* 1. 分配新的 char_device_struct 节点 */ cd = kzalloc(sizeof(struct char_device_struct), GFP_KERNEL); if (cd == NULL) return ERR_PTR(-ENOMEM); mutex_lock(&chrdevs_lock); /* 2. 如果 major == 0,动态分配主设备号 */ if (major == 0) { ret = find_dynamic_major(); if (ret < 0) { pr_err("CHRDEV \"%s\" dynamic allocation region is full\n", name); goto out; } major = ret; } /* 3. 主设备号范围校验 */ if (major >= CHRDEV_MAJOR_MAX) { pr_err("CHRDEV \"%s\" major requested (%u) greater than max (%u)\n", name, major, CHRDEV_MAJOR_MAX - 1); ret = -EINVAL; goto out; } cd->major = major; cd->baseminor = baseminor; cd->minorct = minorct; strlcpy(cd->name, name, sizeof(cd->name)); /* 4. 计算哈希桶位置 */ i = major_to_index(major); /* 5. 在链表中找到合适的插入位置(按主设备号、次设备号排序) */ for (cp = &chrdevs[i]; *cp; cp = &(*cp)->next) { if ((*cp)->major > major || ((*cp)->major == major && ((*cp)->baseminor >= baseminor || (*cp)->baseminor + (*cp)->minorct > baseminor))) break; } /* 6. 检查次设备号是否冲突(三种重叠检测) */ if (*cp && (*cp)->major == major) { int old_min = (*cp)->baseminor; intold_max= (*cp)->baseminor+ (*cp)->minorct-1; intnew_min=baseminor; intnew_max=baseminor+minorct-1; /* 新范围与已有范围重叠 → 冲突 */ if (new_max >= old_min && new_max <= old_max) { ret = -EBUSY; goto out; } if (new_min <= old_max && new_min >= old_min) { ret = -EBUSY; goto out; } /* 新范围完全覆盖已有范围 */ if (new_min < old_min && new_max > old_max) { ret = -EBUSY; goto out; } } /* 7. 插入链表 */ cd->next = *cp; *cp = cd; mutex_unlock(&chrdevs_lock); return cd; out: mutex_unlock(&chrdevs_lock); kfree(cd); return ERR_PTR(ret); }
🔑 冲突检测逻辑解析:内核在插入新设备号时,会检查三种可能的冲突场景:
-
新范围尾部与已有范围重叠:
new_max落在[old_min, old_max]区间内 -
新范围头部与已有范围重叠:
new_min落在[old_min, old_max]区间内 -
新范围完全覆盖已有范围:
new_min < old_min且new_max > old_max
只有三种情况都不满足时,才认为设备号范围无冲突,可以安全注册。
1.4 find_dynamic_major 函数
当驱动调用alloc_chrdev_region(传入 major=0)请求动态分配设备号时,内核会调用find_dynamic_major从空闲范围中查找可用的主设备号:
static int find_dynamic_major(void){ int i; struct char_device_struct *cd; /* 高优先级:在 234~254 范围内查找 */ for (i = ARRAY_SIZE(chrdevs) - 1; i >= CHRDEV_MAJOR_DYN_END; i--) { if (chrdevs[i] == NULL) return i; } /* 低优先级:在 511~384 范围内查找 */ for (i = CHRDEV_MAJOR_DYN_EXT_START; i >= CHRDEV_MAJOR_DYN_EXT_END; i--) { for (cd = chrdevs[major_to_index(i)]; cd; cd = cd->next) { if (cd->major == i) break; } if (cd == NULL) return i; } return -EBUSY; }
📌 两级查找策略:
| 优先级 | 查找范围 | 说明 |
|---|---|---|
| 高 | 234 ~ 254 | 传统动态分配区域,"向后兼容"的保留区间 |
| 低 | 511 ~ 384 | 扩展动态分配区域,满足更多设备注册需求 |
相关宏定义:
-
CHRDEV_MAJOR_MAX 512 -
CHRDEV_MAJOR_DYN_END 234 -
CHRDEV_MAJOR_DYN_EXT_START 511 -
CHRDEV_MAJOR_DYN_EXT_END 384
1.5 设备号分配的两大对外接口
内核提供了两种设备号分配方式,对应不同的使用场景:
| 接口 | 方式 |
|---|---|
register_chrdev_region() |
静态分配 |
alloc_chrdev_region() |
动态分配 |
两者最终都调用__register_chrdev_region()完成实际注册操作。在Linux系统中,可以通过cat /proc/devices查看所有已注册的设备号列表。设备号注销时,无论静态还是动态分配,统一调用unregister_chrdev_region()归还资源
二、字符设备对象(cdev)
本小节的主线是了解两个结构体的设计,分别是内核字符设备结构体cdev,以及管理字符设备的结构体 kobj_map。
2.1 cdev 结构体
struct cdev是内核中表示字符设备的核心数据结构。每个字符设备驱动都需要创建一个cdev实例,并将其注册到内核中:
/* 摘自 include/linux/cdev.h */ struct cdev { struct kobject kobj; /* 内嵌的kobject,用于设备模型管理 */ struct module *owner; /* 指向所属模块,通常为THIS_MODULE */ const struct file_operations *ops; /* 设备操作函数集 */ struct list_head list; /* 用于将cdev链接到对应设备号的cdev列表 */ dev_t dev; /* 记录该字符设备关联的起始设备号 */ unsigned int count; /* 从dev开始连续占用的次设备号数量 */ } __randomize_layout;
| 成员变量 | 作用 |
|---|---|
kobj |
嵌入的内核对象,使 cdev 能被 sysfs 设备模型管理 |
owner |
指向拥有该设备的模块,用于引用计数管理 |
ops |
指向设备操作函数集(open/read/write/ioctl 等) |
list |
链表节点,用于将使用该 cdev 的 inode 链接起来 |
dev |
起始设备号(主设备号 + 次设备号) |
count |
该 cdev 管理的连续次设备号数量 |
2.2 kobj_map 结构体(哈希表)
struct kobj_map是一个内核内部结构体,定义在drivers/base/map.c中,用于建立设备号(dev_t)到 struct cdev 的快速查找映射。
-
kobj_map负责将设备号范围映射到对应的struct cdev结构体。当内核通过设备号访问字符设备时(如打开设备文件时),会根据设备号在kobj_map中查找对应的struct cdev,从而获得其操作函数集 -
void *data指针中保存了cdev结构体指针 -
probes数组是一个哈希桶,每个桶是一个链表,链表节点记录了设备号范围及对应的data(通常指向struct cdev)和获取kobject的函数 -
通过
cdev_add将一个cdev添加到系统中时,实际上就是在kobj_map中插入一个节点
/* 摘自 drivers/base/map.c */ struct kobj_map { struct probe { struct probe *next; /* 链表下一个节点 */ dev_t dev; /* 起始设备号 */ unsigned long range; /* 次设备号范围 */ struct module *owner; /* 模块所有者 */ kobj_probe_t *get; /* 获取kobject的函数(用于查找) */ int (*lock)(dev_t, void *); /* 锁定函数 */ void *data; /* 私有数据,通常指向cdev */ } *probes[255]; /* 255个桶的哈希表 */ struct mutex *lock; /* 保护映射表的锁 */ };
🔑 chrdevs 和 cdev_map —— 两套哈希表的职责分工:
| 哈希表 | 存储内容 | 职责 |
|---|---|---|
chrdevs |
已分配的设备号范围 | 设备号资源管理,防止冲突 |
cdev_map |
设备号到 cdev 映射 | 运行时快速查找设备驱动 |
三、cdev 注册函数
本小节的主线是内核如何将用户定义的cdev结构体注册到内核 cdev_map中
3.1 cdev_init 函数
cdev_init用于初始化一个已经分配的cdev结构体,将其与文件操作集关联,并设置内嵌 kobject的类型:
void cdev_init(struct cdev *cdev, const struct file_operations *fops) { memset(cdev, 0, sizeof *cdev); /* 清零结构体 */ INIT_LIST_HEAD(&cdev->list); /* 初始化链表头 */ kobject_init(&cdev->kobj, &ktype_cdev_default); /* 初始化内嵌kobject */ cdev->ops = fops; /* 绑定文件操作集 */ } EXPORT_SYMBOL(cdev_init);
EXPORT_SYMBOL宏将该函数导出到内核符号表,使内核模块(.ko 文件)可以调用它。
3.2 cdev_add 函数
完成设备号,次设备数量等参数记录,并将字符设备注册到内核
int cdev_add(struct cdev *p, dev_t dev, unsigned count) { int error; p->dev = dev; /* 记录起始设备号 */ p->count = count; /* 记录次设备号数量 */ /* 调用kobj_map注册,将设备号范围映射到该cdev */ error = kobj_map(cdev_map, dev, count, NULL, exact_match, exact_lock, p); if (error) return error; /* 增加模块引用计数,防止模块被卸载 */ kobject_get(p->kobj.parent); return 0; } EXPORT_SYMBOL(cdev_add);
3.3 kobj_map 函数
这是将 cdev 插入到全局哈希表cdev_map的核心函数,接下来才可以通过设备号查找对应的字符设备,定义在drivers/base/map.c中:
int kobj_map(struct kobj_map *domain, dev_t dev, unsigned long range, struct module *module, kobj_probe_t *probe, int (*lock)(dev_t, void *), void *data) { /* 1. 计算跨越了几个不同的主设备号 */ unsigned n = MAJOR(dev + range - 1) - MAJOR(dev) + 1; unsigned index = MAJOR(dev); unsigned i; struct probe *p; if (n > 255) n = 255; /* 安全限制 */ /* 2. 分配 n 个连续的 probe 结构体 */ p = kmalloc_array(n, sizeof(struct probe), GFP_KERNEL); if (p == NULL) return-ENOMEM; /* 3. 初始化 n 个 probe(每个的 data 都指向同一个 cdev) */ for (i = 0; i < n; i++, p++) { p->owner = module; p->get = probe; p->lock = lock; p->dev = dev; p->range = range; p->data = data; } /* 4. 将 probe 节点插入哈希表,按 range 排序 */ mutex_lock(domain->lock); for (i = 0, p -= n; i < n; i++, p++, index++) { struct probe **s = &domain->probes[index % 255]; /* 按 range 大小排序,range 小的在前 */ while (*s && (*s)->range < range) s = &(*s)->next; p->next = *s; *s = p; } mutex_unlock(domain->lock); return 0; }
💡 为什么按 range 排序?当查找设备号对应的 cdev 时,kobj_lookup函数会遍历链表,选择range最小且包含该设备号的 probe。这种"最佳匹配"策略确保当多个 cdev 的设备号范围有重叠时,能精确匹配到最具体的那一个。
四、字符设备号与字符设备对象的关系
-
chrdevs—— 设备号资源管理
记录主设备号的使用区间,防止冲突。在驱动加载时调用register_chrdev_region或alloc_chrdev_region分配设备号时,进行冲突检测。 -
cdev_map—— 运行时查找设备
根据打开设备文件的设备号,快速找到cdev结构体,获得file_operations。在cdev_add函数中调用kobj_map函数构建哈希表。
五、次设备号的解析与多实例管理
本小节用一个非常简单的例子解析为什么需要区分主次设备号,一个主设备号是如何与多个次设备号关联起来的
在实际应用中,多个功能相同的子设备可以共用同一套驱动程序:
-
不同子设备功能逻辑一样,操作函数集(
open、read、write等)完全相同 -
没必要为每个次设备号都分配一个 cdev,只需要一个cdev就能管理多个实例
-
用户空间看到三个独立的设备文件(
/dev/device1对应次设备号0,device2对应1,device3对应2),但内核中都导向同一个file_operations
5.1 注册 cdev
dev_t devno = MKDEV(major, 0); /* 起始次设备号 0 */ cdev_init(&my_cdev, &fops); cdev_add(&my_cdev, devno, 3); /* 占用次设备号 0, 1, 2 */
5.2 定义设备私有结构体和数组
struct my_device { void __iomem *regs; /* 该设备的寄存器映射地址 */ struct mutex lock; /* 互斥锁 */ /* ... 其他私有数据 */ }; static struct my_device devs[3]; /* 三个实例 */
5.3 在 open 中用次设备号绑定私有数据
static int my_open(struct inode *inode, struct file *filp) { int minor = iminor(inode); /* 获取次设备号 */ if (minor < 0 || minor >= 3) return -ENODEV; struct my_device *dev = &devs[minor]; /* 根据次设备号选择设备 */ filp->private_data = dev; /* 保存到私有数据中 */ return 0; }
📌 次设备号使用:这种"一个 cdev → 多个次设备号 → 多个设备实例"的模式是 Linux 驱动开发中的标准做法。通过 iminor(inode)获取次设备号,再通过 filp->private_data保存设备私有数据,后续的 read/write/ioctl 操作都能通过 filp->private_data获取到正确的设备实例
六、mknod与 open系统调用的完整流程
本小节介绍从用户态打开一个字符设备驱动的完整流程,关注内核如何通过字符设备号找到对应的字符设备结构体,以及用户定义的操作函数如何被替换
6.1 系统调用的整体流程
让我们从用户态的一条命令开始
mknod /dev/mydevice c 250 0
这个命令触发的过程被拆解为四个关键步骤:
-
使用
mknod创建一个字符设备 inode 节点,该节点中保存了默认 open 函数chrdev_open。节点定义在/dev/mydevice -
在用户空间使用
open函数,传入"/dev/mydevice" -
通过一系列系统调用,最后到达
do_dentry_open函数,该函数会调用inode节点对应的默认 open 函数chrdev_open -
chrdev_open函数在全局哈希表cdev_map中,根据设备号找到用户定义的f_ops操作函数,并替换inode和file中的操作函数。至此,用户自定义的操作函数正式被调用
6.2 mknod创建 node节点
在控制台调用 mknod函数时,经过一系列系统调用,最后会调用 init_special_inode函数。该函数是 VFS 层处理特殊文件的基石,根据文件类型为 inode挂载合适的操作函数表,并保存必要的设备号信息。
void init_special_inode(struct inode *inode, umode_t mode, dev_t rdev) { inode->i_mode = mode; /* 保存文件类型和权限 */ if (S_ISCHR(mode)) { /* 字符设备文件 */ inode->i_fop = &def_chr_fops; /* 默认字符设备操作表 */ inode->i_rdev = rdev; /* 保存设备号 */ } else if (S_ISBLK(mode)) { /* 块设备文件 */ inode->i_fop = &def_blk_fops; inode->i_rdev = rdev; } else if (S_ISFIFO(mode)) /* 命名管道 */ inode->i_fop = &pipefifo_fops; else if (S_ISSOCK(mode)) ; /* 套接字不设置操作表 */ else printk(KERN_DEBUG "bogus i_mode for inode %s:%lu\n", inode->i_sb->s_id, inode->i_ino); }
🔑 理解:此时 inode 中的 i_fop指向的是 def_chr_fops,一个仅包含默认 open 方法的操作表。真正的驱动专用操作函数表要等到用户调用 open()时,才会通过 chrdev_open函数动态替换。这是一种"延迟绑定"的设计模式
6.3 def_chr_fops —— 字符设备的默认操作函数
/* 来源: fs/char_dev.c */ const struct file_operations def_chr_fops = { .open = chrdev_open, /* 只定义了一个 open 方法 */ .llseek = noop_llseek, /* 一个什么都不做的寻址函数 */ };
6.4 chrdev_open —— 字符设备 open 默认函数
chrdev_open是整个字符设备驱动机制中最关键的桥接函数:
/* 来源: fs/char_dev.c */ static int chrdev_open(struct inode *inode, struct file *filp) { struct cdev *p; struct cdev *new = NULL; int ret=0; /* 第一步:获取或查找 cdev */ p = inode->i_cdev; if (!p) { struct kobject *kobj; int idx; /* 根据设备号在全局哈希表 cdev_map 中查找对应的 cdev */ kobj = kobj_lookup(cdev_map, inode->i_rdev, &idx); if (!kobj) return -ENXIO; /* 通过 kobject 反推出包含它的 cdev */ new = container_of(kobj, struct cdev, kobj); /* 并发安全:再次检查并设置 inode->i_cdev(缓存优化) */ p = inode->i_cdev; if (!p) { inode->i_cdev = p = new; inode->i_cindex = idx; list_add(&inode->i_devices, &p->list); new = NULL; } } /* 第二步 ★核心★ 替换文件操作表 */ /* 将 file 的 f_op 从 def_chr_fops 替换为驱动自己的 fops */ filp->f_op = fops_get(p->ops); if (!filp->f_op) return -ENXIO; /* 第三步:调用驱动自身的 open 函数 */ if (filp->f_op->open) { ret = filp->f_op->open(inode, filp); } return ret; }
🔑 chrdev_open 三步走核心逻辑:
-
查找 cdev:通过
kobj_lookup()在全局哈希表中查找,用container_of反推出 cdev。首次查找后缓存到inode->i_cdev -
替换 f_op:
filp->f_op = fops_get(p->ops)——最关键的一步,将 file 的文件操作表从def_chr_fops替换为驱动自己的file_operations -
调用驱动 open:如果驱动实现了自己的 open 方法,则调用它。至此,后续对该文件的 read/write 等操作都会直接调用驱动的对应函数。
6.5 open 函数的完整调用链
6.5.1 用户态 open() 到系统调用入口
用户态的open()是 glibc 等 C 库提供的封装函数,它最终会触发系统调用__NR_open。在 x86-64 架构上,通过syscall指令陷入内核。
6.5.2 内核通用打开流程:do_sys_open → do_filp_open
do_sys_open 将用户态的文件路径名拷贝到内核空间,构造open_how结构(包含打开标志和模式),然后调用do_sys_openat2:
SYSCALL_DEFINE3(open, const char __user *, filename, int, flags, umode_t, mode) { return do_sys_open(AT_FDCWD, filename, flags, mode); } long do_sys_open(int dfd, const char __user *filename, int flags, umode_t mode) { struct open_how how = build_open_how(flags, mode); return do_sys_openat2(dfd, filename, &how); }
do_sys_openat2 执行三个关键动作:
static long do_sys_openat2(int dfd, const char __user *filename, struct open_how *how) { struct filename *tmp = getname(filename); /* 拷贝路径到内核空间 */ int fd = get_unused_fd_flags(how->flags); /* 分配空闲fd */ struct file *f = do_filp_open(dfd, tmp, how); /* ★路径查找并打开★ */ d_install(fd, f); /* 关联 fd 与 file */ return fd; }
6.5.3 路径查找与打开:path_openat → vfs_open
do_filp_open最终调path_openat(定义在 fs/namei.c),它完成路径的遍历(逐级查找目录项),找到 inode 节点,最后调用vfs_open来实际打开文件。
6.5.4 do_dentry_open —— 核心函数
do_dentry_open负责初始化struct file,并根据 inode 类型设置文件操作表,最终调用open方法。对于字符设备文件,inode->i_fop指向的是def_chr_fops。所以f->f_op->open实际上就是chrdev_open:
static int do_dentry_open(struct file *f, struct inode *inode, int (*open)(struct inode *, struct file *)) { f->f_mode = OPEN_FMODE(f->f_flags) | FMODE_LSEEK | FMODE_PREAD | FMODE_PWRITE; f->f_inode = inode; f->f_mapping = inode->i_mapping; /* ★获取文件操作表:优先使用 inode->i_fop★ */ f->f_op = fops_get(inode->i_fop); if (!f->f_op) return -ENXIO; if (open) error = open(inode, f); /* 否则调用文件操作表中的 open 方法 */ /* 对于字符设备 = chrdev_open! */ if (!error && (f->f_mode & FMODE_OPENED) && f->f_op->open) error = f->f_op->open(inode, f); return error; }
📌 完整调用链路总结:
用户态 open()→ sys_open()→
do_sys_open()→do_sys_openat2()→
do_filp_open()→ path_openat()→
vfs_open()→do_dentry_open()→
chrdev_open()(替换 fops)→ 驱动的 open()
七、字符设备驱动开发中的函数详解
7.1 container_of 宏
container_of是 Linux 内核中常用的宏之一,它通过一个结构体成员的指针,反向获取包含该成员的结构体的起始地址:
/** * container_of - 通过结构体成员指针获取父结构体指针 * @ptr: 成员变量的指针 * @type: 包含该成员的结构体类型 * @member: 成员变量在结构体中的名称 */ #define container_of(ptr, type, member) ({ \ void *__mptr = (void *)(ptr); \ BUILD_BUG_ON_MSG(!__same_type(*(ptr), ((type *)0)->member) && \ !__same_type(*(ptr), void), \ "pointer type mismatch in container_of"); \ ((type *)(__mptr - offsetof(type, member))); }) /* 简化理解版本: */ #define container_of(ptr, type, member) \ ((type *)((char *)(ptr) - offsetof(type, member)))
该函数根据结构体成员变量的指针,通过该变量相对于结构体的偏移,得到了该变量对应的结构体的指针。这是一个非常灵活的用法,通过保存某个结构体变量的指针,可以通过该指针反向推出该结构体的指针。
💡 container_of 的应用场景:在 Linux 内核中,这个宏无处不在。比如在chrdev_open中,内核通过kobj_lookup拿到了 cdev 内嵌的kobject的指针,然后通过container_of(kobj, struct cdev, kobj)反推出完整的cdev结构体指针。这种"内嵌 + 反推"的设计是内核面向对象编程思想的经典体现
7.2 register_chrdev_region
register_chrdev_region是 Linux 内核中用于注册字符设备编号范围的函数。该函数为驱动程序预留一段连续的设备号(主设备号 + 起始次设备号),后续将字符设备(通过cdev_add)绑定到这些设备号上
/** * register_chrdev_region - 注册字符设备编号范围 * @first: dev_t 类型,指定要注册的起始设备号(使用 MKDEV(major, minor) 宏生成) * @count: 需要注册的连续设备号数量(次设备号的范围) * @name: 设备名称,会出现在 /proc/devices 文件中 * 返回值: 成功返回 0 * 参数无效返回 -EINVAL * 设备号被占用返回 -EBUSY */ int register_chrdev_region(dev_t first, unsigned int count, const char *name);
7.3 THIS_MODULE
THIS_MODULE是一个宏,定义在<linux/module.h>头文件中。它本质上是一个指向当前模块的struct module结构体的指针:
-
当代码被编译为可加载内核模块(.ko)时,
THIS_MODULE指向该模块的struct module实例 -
当代码被静态编译进内核(built-in)时,
THIS_MODULE通常被定义为NULL或一个无实际作用的占位符
static struct file_operations my_fops = { .owner = THIS_MODULE, /* 防止模块在使用中被卸载 */ .open = my_open, .read = my_read, .write = my_write, .release = my_release, }; struct cdev my_cdev; cdev_init(&my_cdev, &my_fops); my_cdev.owner = THIS_MODULE; cdev_add(&my_cdev, devno, count);
内核通过owner字段知道哪个模块拥有这个字符设备。当用户空间程序通过系统调用(如 open)打开设备文件时,内核会自动调用try_module_get(THIS_MODULE)增加模块的引用计数;当设备被关闭时,内核会调用module_put(THIS_MODULE)减少引用计数。
🔑 这样做的目的是确保模块在设备被打开期间不会被卸载。如果用户正在使用设备,而管理员执行 rmmod试图卸载驱动,内核会检查模块的引用计数是否为零。若不为零(表示设备正在被使用),则卸载操作会被拒绝,防止因模块代码突然消失而导致系统崩溃。这是一个经典的"资源使用计数"保护模式。
7.4 file_operations 结构体
file_operations是把系统调用和驱动程序关联起来的关键数据结构:
| 函数指针 | 对应系统调用 | 说明 |
|---|---|---|
owner |
—— | 指向拥有该结构的模块(THIS_MODULE) |
llseek |
lseek | 修改文件读写位置 |
read |
read | 从设备读取数据 |
write |
write | 向设备写入数据 |
open |
open | 打开设备文件 |
release |
close | 关闭设备文件(引用计数归零时) |
unlocked_ioctl |
ioctl | 设备控制操作(无 BKL 版本) |
mmap |
mmap | 将设备内存映射到用户空间 |
poll |
poll/select | 询问设备是否可非阻塞读写 |
🎯 总结
本文从内核源码角度,完整梳理了 Linux 字符设备驱动的核心机制:
-
设备号管理(chrdevs):通过 255 大小的哈希数组,利用取模操作管理 0~511 乃至更大的主设备号空间,配合链表按顺序组织,提供了高效的设备号冲突检测机制。
-
cdev 对象与 kobj_map:cdev 是字符设备的抽象表示,cdev_map 是设备号到 cdev 的映射哈希表。两套哈希表各司其职——chrdevs 管理资源分配,cdev_map 支持运行时查找。
-
延迟绑定机制:inode 创建时只挂载默认的
def_chr_fops(仅含 chrdev_open),真正驱动专用的 fops 要等到用户 open 时才通过 chrdev_open 动态替换。 -
完整调用链路:
open → sys_open → do_sys_open → do_filp_open → path_openat → do_dentry_open → chrdev_open(替换fops) → 驱动open() -
container_of 设计模式:通过内嵌结构体成员指针反推外围结构体,是 Linux 内核"面向对象"编程思想的集中体现。
-
引用计数保护:通过
THIS_MODULE和owner字段,防止设备在使用中被意外卸载。
文章内容为作者过往学习的笔记,接下来会按期更新,预计下一期更新内核结构体kobject解析。如果本文对你有帮助,欢迎点赞、在看、转发,让更多 Linux 驱动开发者受益 🚀

浙公网安备 33010602011771号