已校对 by小眼儿

This commit is contained in:
tinyeyeser 2016-05-09 11:30:31 +08:00
parent 73b06dc23e
commit 30c8e2f46a

View File

@ -5,7 +5,7 @@ Linux 内核里的数据结构——双向链表
-------------------------------------------------------------------------------- --------------------------------------------------------------------------------
Linux 内核自己实现了双向链表,可以在[include/linux/list.h](https://github.com/torvalds/linux/blob/master/include/linux/list.h)找到定义。我们将会从双向链表数据结构开始`内核的数据结构`。为什么?因为它在内核里使用的很广泛,你只需要在[free-electrons.com](http://lxr.free-electrons.com/ident?i=list_head) 检索一下就知道了。 Linux 内核自己实现了双向链表,可以在[include/linux/list.h](https://github.com/torvalds/linux/blob/master/include/linux/list.h)找到定义。我们将会从双向链表数据结构开始介绍`内核的数据结构`。为什么?因为它在内核里使用的很广泛,你只需要在[free-electrons.com](http://lxr.free-electrons.com/ident?i=list_head) 检索一下就知道了。
首先让我们看一下在[include/linux/types.h](https://github.com/torvalds/linux/blob/master/include/linux/types.h) 里的主结构体: 首先让我们看一下在[include/linux/types.h](https://github.com/torvalds/linux/blob/master/include/linux/types.h) 里的主结构体:
@ -25,7 +25,7 @@ struct GList {
}; };
``` ```
通常来说一个链表会包含一个指向某个项目的指针。但是内核的实现并没有这样做。所以问题来了:`链表在哪里保存数据呢?`。实际上内核里实现的链表实际上是`侵入式链表`。侵入式链表并不在节点内保存数据-节点仅仅包含指向前后节点的指针,然后把数据是附加到链表的。这就使得这个数据结构是通用的,使用起来就不需要考虑节点数据的类型了。 通常来说一个链表结构会包含一个指向某个项目的指针。但是Linux内核链表实现并没有这样做。所以问题来了:`链表在哪里保存数据呢?`。实际上内核里实现的链表是`侵入式链表`。侵入式链表并不在节点内保存数据-它的节点仅仅包含指向前后节点的指针,以及指向链表节点数据部分的指针——数据就是这样附加在链表上的。这就使得这个数据结构是通用的,使用起来就不需要考虑节点数据的类型了。
比如: 比如:
@ -36,7 +36,7 @@ struct nmi_desc {
}; };
``` ```
让我们看几个例子来理解一下在内核里是如何使用`list_head` 的。如上所述,在内核里有实在很多不同的地方用到了链表。我们来看一个在杂项字符驱动里面的使用的例子。在 [drivers/char/misc.c](https://github.com/torvalds/linux/blob/master/drivers/char/misc.c) 的杂项字符驱动API 被用来编写处理小型硬件虚拟设备的小驱动。这些驱动共享相同的主设备号: 让我们看几个例子来理解一下在内核里是如何使用`list_head` 的。如上所述,在内核里有很多很多不同的地方都用到了链表。我们来看一个在杂项字符驱动里面的使用的例子。在 [drivers/char/misc.c](https://github.com/torvalds/linux/blob/master/drivers/char/misc.c) 的杂项字符驱动API 被用来编写处理小型硬件虚拟设备的小驱动。这些驱动共享相同的主设备号:
```C ```C
#define MISC_MAJOR 10 #define MISC_MAJOR 10
@ -84,7 +84,7 @@ struct miscdevice
}; };
``` ```
可以看到结构体的第四个变量`list` 是所有注册过的设备的链表。在源代码文件的开始可以看到这个链表的定义: 可以看到结构体`miscdevice`的第四个变量`list` 是所有注册过的设备的链表。在源代码文件的开始可以看到这个链表的定义:
```C ```C
static LIST_HEAD(misc_list); static LIST_HEAD(misc_list);
@ -103,7 +103,7 @@ static LIST_HEAD(misc_list);
#define LIST_HEAD_INIT(name) { &(name), &(name) } #define LIST_HEAD_INIT(name) { &(name), &(name) }
``` ```
现在来看看注册杂项设备的函数`misc_register`。它在开始就用 `INIT_LIST_HEAD` 初始化了`miscdevice->list`。 现在来看看注册杂项设备的函数`misc_register`。它在开始就用函数 `INIT_LIST_HEAD` 初始化了`miscdevice->list`。
```C ```C
INIT_LIST_HEAD(&misc->list); INIT_LIST_HEAD(&misc->list);
@ -119,13 +119,13 @@ static inline void INIT_LIST_HEAD(struct list_head *list)
} }
``` ```
在函数`device_create` 创建了设备后我们就用下面的语句将设备添加到设备链表: 接下来,在函数`device_create` 创建了设备后我们就用下面的语句将设备添加到设备链表:
``` ```
list_add(&misc->list, &misc_list); list_add(&misc->list, &misc_list);
``` ```
内核文件`list.h` 提供了链表添加新项的API 接口。我们来看看它的实现: 内核文件`list.h` 提供了链表添加新项的API 接口。我们来看看它的实现:
```C ```C
@ -138,8 +138,8 @@ static inline void list_add(struct list_head *new, struct list_head *head)
实际上就是使用3个指定的参数来调用了内部函数`__list_add` 实际上就是使用3个指定的参数来调用了内部函数`__list_add`
* new - 新项。 * new - 新项。
* head - 新项将会被添加到`head`之前. * head - 新项将会插在`head`的后面
* head->next - `head` 之后的项。 * head->next - 插入前,`head` 后面的项。
`__list_add`的实现非常简单: `__list_add`的实现非常简单:
@ -155,9 +155,9 @@ static inline void __list_add(struct list_head *new,
} }
``` ```
我们在`prev`和`next` 之间添加一个新项。所以我们用宏`LIST_HEAD_INIT`定义的`misc` 链表会包含指向`miscdevice->list` 的向前指针和向后指针。 这里,我们在`prev`和`next` 之间添加一个新项。所以我们开始时用宏`LIST_HEAD_INIT`定义的`misc` 链表会包含指向`miscdevice->list` 的向前指针和向后指针。
有一个问题:如何得到列表的内容呢?这里有一个特殊的宏: 儿还有一个问题:如何得到列表的内容呢?这里有一个特殊的宏:
```C ```C
#define list_entry(ptr, type, member) \ #define list_entry(ptr, type, member) \
@ -166,7 +166,7 @@ static inline void __list_add(struct list_head *new,
使用了三个参数: 使用了三个参数:
* ptr - 指向链表头的指针; * ptr - 指向结构 `list_head` 的指针;
* type - 结构体类型; * type - 结构体类型;
* member - 在结构体内类型为`list_head` 的变量的名字; * member - 在结构体内类型为`list_head` 的变量的名字;
@ -207,7 +207,7 @@ int main() {
最终会打印`2` 最终会打印`2`
下一点就是`typeof`,它也很简单。就如你从名字所理解的,它仅仅返回了给定变量的类型。当我第一次看到宏`container_of`的实现时,让我觉得最奇怪的就是`container_of`中的0.实际上这个指针巧妙的计算了从结构体特定变量的偏移,这里的`0`刚好就是位宽里的零偏移。让我们看一个简单的例子: 下一点就是`typeof`,它也很简单。就如你从名字所理解的,它仅仅返回了给定变量的类型。当我第一次看到宏`container_of`的实现时,让我觉得最奇怪的就是表达式`((type *)0)`中的0.实际上这个指针巧妙的计算了从结构体特定变量的偏移,这里的`0`刚好就是位宽里的零偏移。让我们看一个简单的例子:
```C ```C
#include <stdio.h> #include <stdio.h>
@ -226,13 +226,13 @@ int main() {
结果显示`0x5`。 结果显示`0x5`。
下一个宏`offsetof` 会计算从结构体的某个变量的相对于结构体起始地址的偏移。它的实现和上面类似: 下一个宏`offsetof`会计算从结构体起始地址到某个给定结构字段的偏移。它的实现和上面类似:
```C ```C
#define offsetof(TYPE, MEMBER) ((size_t) &((TYPE *)0)->MEMBER) #define offsetof(TYPE, MEMBER) ((size_t) &((TYPE *)0)->MEMBER)
``` ```
现在我们来总结一下宏`container_of`。只需要知道结构体里面类型为`list_head` 的变量的名字和结构体容器的类型,它可以通过结构体的变量`list_head`获得结构体的起始地址。在宏定义的第一行,声明了一个指向结构体成员变量`ptr`的指针`__mptr`,并且把`ptr` 的地址赋给它。现在`ptr` 和`__mptr` 指向了同一个地址。从技术上讲我们并不需要这一行,但是它可以方便进行类型检查。第一行保证了特定的结构体(参数`type`)包含成员变量`member`。第二行代码会用宏`offsetof`计算成员变量相对于结构体起始地址的偏移,然后从结构体的地址减去这个偏移,最后就得到了结构体。 现在我们来总结一下宏`container_of`。只需给定结构体中`list_head`类型 字段的地址、名字和结构体容器的类型,它就可以返回结构体的起始地址。在宏定义的第一行,声明了一个指向结构体成员变量`ptr`的指针`__mptr`,并且把`ptr` 的地址赋给它。现在`ptr` 和`__mptr` 指向了同一个地址。从技术上讲我们并不需要这一行,但是它可以方便进行类型检查。第一行保证了特定的结构体(参数`type`)包含成员变量`member`。第二行代码会用宏`offsetof`计算成员变量相对于结构体起始地址的偏移,然后从结构体的地址减去这个偏移,最后就得到了结构体。
当然了`list_add` 和 `list_entry`不是`<linux/list.h>`提供的唯一功能。双向链表的实现还提供了如下API 当然了`list_add` 和 `list_entry`不是`<linux/list.h>`提供的唯一功能。双向链表的实现还提供了如下API