2012-07-17 12:47:54 +08:00
1. 头文件
------------
通常每一个 `` .cc `` 文件都有一个对应的 `` .h `` 文件. 也有一些常见例外, 如单元测试代码和只包含 `` main() `` 函数的 `` .cc `` 文件.
正确使用头文件可令代码在可读性、文件大小和性能上大为改观.
下面的规则将引导你规避使用头文件时的各种陷阱.
2015-07-17 19:05:35 +08:00
1.1. Self-contained 头文件
头文件应该能够自给自足( self-contained) , 以 `` in.h `` 结尾。至于用来插入文本的文件,说到底它们并不是头文件,所以应以 `` .inc `` 结尾。
所有头文件要能够自给自足。换言之,用户和重构工具不需要为特别场合而包含额外的头文件。详言之,一个头文件要有 #define 保护, 统统包含它所需要的其它头文件, 也不要求定义任何特别符号( symbols) 。
不过有一个例外,即一个文件并不是 self-contained 的, 而是用来安插到代码某处里, 特别是要安插多次的时候。或者, 文件内容实际上是其它头文件的特定平台( platform-specific) 扩展部分。这些文件就要用 `` .inc `` 文件扩展名。
如果 `` .h `` 文件声明了一个模板或内联函数,同时也在该文件加以定义。凡是有用到这些的 `` .cc `` 文件,就得统统包含该头文件,否则程序可能会在构建中链接失败。现在不要把这些定义放到分离的 -inl.h 文件里了(译者注:过去该规范曾提倡把定义放到 -inl.h 里过)。
As an exception, a function template that is explicitly instantiated for all relevant sets of template arguments, or that is a private member of a class, may be defined in the only .cc file that instantiates the template.
2015-07-17 15:12:20 +08:00
2012-07-17 12:47:54 +08:00
.. _define_guard:
2015-07-17 15:12:20 +08:00
1.2. #define 保护
2012-07-17 12:47:54 +08:00
~~~~~~~~~~~~~~~~~~~~
.. tip ::
所有头文件都应该使用 `` #define `` 防止头文件被多重包含, 命名格式当是: `` <PROJECT>_<PATH>_<FILE>_H_ ``
为保证唯一性, 头文件的命名应该依据所在项目源代码树的全路径. 例如, 项目 `` foo `` 中的头文件 `` foo/src/bar/baz.h `` 可按如下方式保护:
.. code-block :: c++
#ifndef FOO_BAR_BAZ_H_
#define FOO_BAR_BAZ_H_
…
#endif // FOO_BAR_BAZ_H_
.. _inline-functions:
2015-07-17 15:12:20 +08:00
1.4. 内联函数
2012-07-17 12:47:54 +08:00
~~~~~~~~~~~~~~~~~~~~
.. tip ::
只有当函数只有 10 行甚至更少时才将其定义为内联函数.
定义:
当函数被声明为内联函数之后, 编译器会将其内联展开, 而不是按通常的函数调用机制进行调用.
优点:
当函数体比较小的时候, 内联该函数可以令目标代码更加高效. 对于存取函数以及其它函数体比较短, 性能关键的函数, 鼓励使用内联.
缺点:
滥用内联将导致程序变慢. 内联可能使目标代码量或增或减, 这取决于内联函数的大小. 内联非常短小的存取函数通常会减少代码大小, 但内联一个相当大的函数将戏剧性的增加代码大小. 现代处理器由于更好的利用了指令缓存, 小巧的代码往往执行更快。
结论:
一个较为合理的经验准则是, 不要内联超过 10 行的函数. 谨慎对待析构函数, 析构函数往往比其表面看起来要更长, 因为有隐含的成员和基类析构函数被调用!
另一个实用的经验准则: 内联那些包含循环或 `` switch `` 语句的函数常常是得不偿失 (除非在大多数情况下, 这些循环或 `` switch `` 语句从不被执行).
有些函数即使声明为内联的也不一定会被编译器内联, 这点很重要; 比如虚函数和递归函数就不会被正常内联. 通常, 递归函数不应该声明成内联函数.( YuleFox 注: 递归调用堆栈的展开并不像循环那么简单, 比如递归层数在编译时可能是未知的, 大多数编译器都不支持内联递归函数). 虚函数内联的主要原因则是想把它的函数体放在类定义内, 为了图个方便, 抑或是当作文档描述其行为, 比如精短的存取函数.
1.5. 函数参数的顺序
~~~~~~~~~~~~~~~~~~~~
.. tip ::
定义函数时, 参数顺序依次为: 输入参数, 然后是输出参数.
2013-02-26 14:11:04 +08:00
C/C++ 函数参数分为输入参数, 输出参数, 和输入/输出参数三种. 输入参数一般传值或传 `` const `` 引用, 输出参数或输入/输出参数则是非-`` const `` 指针. 对参数排序时, 将只输入的参数放在所有输出参数之前. 尤其是不要仅仅因为是新加的参数, 就把它放在最后; 即使是新加的只输入参数也要放在输出参数之前.
2012-07-17 12:47:54 +08:00
这条规则并不需要严格遵守. 输入/输出两用参数 (通常是类/结构体变量) 把事情变得复杂, 为保持和相关函数的一致性, 你有时不得不有所变通.
1.6. `` #include `` 的路径及顺序
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
.. tip ::
2015-07-17 14:32:58 +08:00
使用标准的头文件包含顺序可增强可读性, 避免隐藏依赖: 相关头文件, C 库, C++ 库, 其他库的 `.h` , 本项目内的 `.h` .
2012-07-17 12:47:54 +08:00
项目内头文件应按照项目源代码目录树结构排列, 避免使用 UNIX 特殊的快捷目录 `` . `` (当前目录) 或 `` .. `` (上级目录). 例如, `` google-awesome-project/src/base/logging.h `` 应该按如下方式包含:
2015-07-17 14:32:58 +08:00
2012-07-17 12:47:54 +08:00
.. code-block :: c++
#include “base/logging.h”
又如, `` dir/foo.cc `` 的主要作用是实现或测试 `` dir2/foo2.h `` 的功能, `` foo.cc `` 中包含头文件的次序如下:
2015-07-17 14:32:58 +08:00
2012-07-17 12:47:54 +08:00
#. `` dir2/foo2.h `` (优先位置, 详情如下)
#. C 系统文件
#. C++ 系统文件
#. 其他库的 `` .h `` 文件
#. 本项目内 `` .h `` 文件
这种排序方式可有效减少隐藏依赖. 我们希望每一个头文件都是可被独立编译的 (yospaly 译注: 即该头文件本身已包含所有必要的显式依赖), 最简单的方法是将其作为第一个 `` .h `` 文件 `` #included `` 进对应的 `` .cc `` .
`` dir/foo.cc `` 和 `` dir2/foo2.h `` 通常位于同一目录下 (如 `` base/basictypes_unittest.cc `` 和 `` base/basictypes.h `` ), 但也可以放在不同目录下.
按字母顺序对头文件包含进行二次排序是不错的主意 (yospaly 译注: 之前已经按头文件类别排过序了).
2015-07-17 14:32:58 +08:00
您所依赖( rely upon) 的符号( symbols) 被哪些头文件所定义, 您就应该包含( include) 哪些头文件, forward declaration 情况除外。比如您要用到 `` bar.h `` 中的某个符号,哪怕您所包含的 `` foo.h `` 已经包含了 `` bar.h `` , 也照样得包含 `` bar.h `` , 除非 `` foo.h `` 有明确说明它会自动向您提供 `` bar.h `` 中的符号。不过,凡是 cc 文件所对应的「相关头文件」已经包含的,就不用再重复包含进其 cc 文件里面了,就像 `` foo.cc `` 只包含 `` foo.h `` 就够了,不用再管后者所包含的其它内容。
2012-07-17 12:47:54 +08:00
举例来说, `` google-awesome-project/src/foo/internal/fooserver.cc `` 的包含次序如下:
2015-07-17 14:32:58 +08:00
.. code-block:: c++
#include "foo/public/fooserver.h" // 优先位置
#include <sys/types.h>
#include <unistd.h>
#include <hash_map>
#include <vector>
#include "base/basictypes.h"
#include "base/commandlineflags.h"
#include "foo/public/bar.h"
2012-07-17 12:47:54 +08:00
2015-07-17 14:32:58 +08:00
例外:
有时, 平台特定( system-specific) 代码需要条件编译( conditional includes) , 这些代码可以放到其它 includes 之后。当然,您的平台特定代码也要够简练且独立,比如:
.. code-block:: c++
#include "foo/public/fooserver.h"
#include "base/port.h" // For LANG_CXX11.
#ifdef LANG_CXX11
#include <initializer_list>
#endif // LANG_CXX11
2012-07-17 12:47:54 +08:00
译者 (YuleFox) 笔记
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
#. 避免多重包含是学编程时最基本的要求;
#. 前置声明是为了降低编译依赖,防止修改一个头文件引发多米诺效应;
#. 内联函数的合理使用可提高代码执行效率;
#. `` -inl.h `` 可提高代码可读性 (一般用不到吧:D);
#. 标准化函数参数顺序可以提高可读性和易维护性 (对函数参数的堆栈空间有轻微影响, 我以前大多是相同类型放在一起);
#. 包含文件的名称使用 `` . `` 和 `` .. `` 虽然方便却易混乱, 使用比较完整的项目路径看上去很清晰, 很条理, 包含文件的次序除了美观之外, 最重要的是可以减少隐藏依赖, 使每个头文件在 "最需要编译" (对应源文件处 :D) 的地方编译, 有人提出库文件放在最后, 这样出错先是项目内的文件, 头文件都放在对应源文件的最前面, 这一点足以保证内部错误的及时发现了.