TranslateProject/translated/tech/20190715 What is POSIX- Richard Stallman explains.md

16 KiB
Raw Blame History

POSIX 是什么?让我们听听 Richard Stallman 的诠释

从计算机自由先驱口中探寻操作系统兼容性标准背后的本质。

Scissors cutting open access to files

POSIX 是什么?为什么如此重要?你可能在很多的技术类文章中看到这个术语,但往往会在探寻其本质时迷失在技术初始主义techno-initialisms的海洋中或是以 X 结尾的行话jargon-that-ends-in-X中。

Richard Stallman 认为用 “开源” 和 “闭源” 来归类软件是一种错误的方法。Stallman 将程序分类为 尊重自由的freedom-respecting(“自由free” 或 “自由(西语)libre”)和 践踏自由的freedom-trampling(“非自由non-free” 或 “专有proprietary”)。开源话语通常会为了(用户)实际得到的优势/便利advantages考虑,而去鼓励某些做法,而非作为道德层面上的约束。

Stallman 在由其本人于 1984 年发起的自由软件运动中表明,不仅仅是这些 优势/便利advantages 受到了威胁。计算机的用户 理应得到deserve 计算机的控制权,因此拒绝被用户控制的程序即是 非正义injustice,理应得到拒绝rejected排斥eliminated。对于用户的控制权,程序应当给予用户 四项基本自由

  • 自由度0无论用户出于何种目的必须可以按照用户意愿自由地运行该软件。
  • 自由度1用户可以自由地学习并修改该软件以此来帮助用户完成用户自己的计算。作为前提用户必须可以访问到该软件的源代码。
  • 自由度2用户可以自由地分发该软件的拷贝这样就可以助人。
  • 自由度3用户可以自由地分发该软件修改后的拷贝。借此用户可以把改进后的软件分享给整个社区令他人也从中受益。作为前提用户必须可以访问到该软件的源代码。

关于 POSIX

Seth: POSIX 标准是由 IEEE 发布,用于描述 “可移植操作系统” 的文档。只要开发人员编写符合此描述的程序,他们生产的便是符合 POSIX 的程序。在科技行业,我们称之为 “规范specification” 或将其简写为 “spec”。 就技术用语而言,这是可以理解的,但我们不禁要问是什么使操作系统 “可移植”?

RMS: 我认为完成这项任务应该是 接口, 接口就应该做到可移植(在不同系统中皆然),而不应只支持任何一种 系统。实际上,各种各样的系统内部构造虽然不同,但仍会支持一部分 POSIX 接口规范。

Seth: 因此,如果两个系统皆具有 POSIX 兼容程序,那么他们便可以相互对对方做出假设,也就使他们知道如何相互 “交谈”。我了解到 “POSIX” 这个简称是你想出来的。那你是怎么想出来的呢?它是如何就被 IEEE 采纳了呢?

RMS: IEEE 已经完成了规范的开发,但还没为其想好简练的名称。标题上写的是 “便携式操作系统接口”,虽然我已记不清确切的单词。委员倾向于将 “IEEEIX” 作为简称。而我认为那不太好。发音有点怪 - 听起来像恐怖的尖叫“Ayeee” - 所以我觉得人们反而会倾向于称之为 “Unix”。

但是,由于 GNU 并不是 UnixGNU's Not Unix,并且它打算取代之,所以我不希望人们将 GNU 称为 “Unix 系统”。因此,我提出了人们在实际使用中会比较好用的简称。那个时候也没有什么灵感,我就用了一个并不是非常聪明的方式创造了这个简称:我使用了 “便携式操作系统portable operating system” 的首字母缩写,并在末尾添加了 “ix” 作为简称。IEEE 也欣然接受了。

Seth: POSIX 中的 “操作系统” 是仅涉及 Unix 和类 Unix 的系统如GNU还是意图包含所有操作系统

RMS: 缩写中的 “操作系统” 一词涵盖的系统并不完全指的是类 Unix 系统,也不是完全要符合 POSIX 规范。但是,该规范适用于大量类 Unix 的系统;也只有这样的系统才会去遵守 POSIX 规范。

Seth: 你是否参与审核或更新当前版本的 POSIX 标准?

RMS: 现在不了。

Seth: GNU Autotools 工具链能使应用程序更容易移植,至少在构建和安装的时间上是这样的。所以可以认为 Autotools 是构建便携式基础设施的重要一环吗?

RMS: 是的,因为即使在遵循 POSIX 的系统中,也存在着诸多差异。而 Autotools 可以使程序更容易适应这些差异。顺带一提,如果有人想助力 Autotools 的开发,可以发邮件联系我。

Seth: 我认为,是 GNU 首先开始让人们意识到这种可能,一个非 Unix 的系统可以从专有的技术中挣脱出来的可能。关于自由软件如何协作方面,在实现的途中应该有些缺乏明确性地方吧!。

RMS: 我认为没有任何空白或不确定性。我只是简单地照着 BSD 的接口写而已。

Seth: 一些 GNU 应用程序符合 POSIX 标准,而另一些 GNU 应用程序则具有不在 POSIX 规范中的或者是缺少规范要求的 GNU 特定功能。对于 GNU 应用程序 POSIX 合规性有多重要?

RMS: 遵循标准对于为用户服务的程度很重要。我们不仅将标准视为权威,而且将其作为可能有用的指南来遵循。因此,我们谈论的是遵循following标准而不是“遵守complying”。可以参考 GNU 编码标准中的 非 GNU 标准 段落。

我们努力在大多数问题上与标准兼容,因为这样做在大多数的问题上能为用户提供最好的服务。但也偶有例外。

例如POSIX 指定某些实用程序以 512 字节为单位测量磁盘空间。我要求委员会将其改为 1K但被拒绝了说是有个官僚主义的规则bureaucratic rule强迫选用 512。我不记得有多少人试图争辩说用户会对这个决定感到满意的。

由于 GNU 的第二优先级,在用户的自由freedom之后即是用户的便利convenience,我们使 GNU 程序以默认 1K 为单位按块测量磁盘空间。

然而,为了防止竞争对手利用这点给 GNU 安上 “不合规noncompliant” 的骂名,我们实现了遵循 POSIX 和 ISO C 的可选模式,这种妥协着实可笑。想要遵循 POSIX只需设置环境变量 POSIXLY_CORRECT即可使程序符合以 512 字节为单位的 POSIX 列表磁盘空间。如果有人知道实际使用 POSIXLY_CORRECT 或者 GCC 中的 --pedantic 会为某些用户提供什么实际利益的话,请务必告诉我。

Seth: 符合 POSIX 标准的自由软件项目是否更容易移植到其他类 Unix 系统?

RMS: 我认为是这样,但自 80 年代开始,我决定不再把时间浪费在将软件移植到 GNU 以外的系统上。我开始专注于推进 GNU 系统,使其不必使用任何非自由软件。至于将 GNU 程序移植到非类 GNU 系统就留给想在其他系统上运行它们的人们了。

Seth: POSIX 对于软件的自由很重要吗?

RMS: 本质上说,(遵不遵循 POSIX其实没有任何区别。但是POSIX 和 ISO C 的标准化确实使 GNU 系统更容易迁移,这有助于我们更快地实现从非自由软件中解放用户的目标。在 90 年代早期,使用自由软件成功地打造出 Linux同时也填补了 GNU 中对于内核的空白。

POSIX 采纳 GNU 的创新

我还讯问过 Dr. Stallman是否有任何 GNU 特定的创新或惯例后来被采纳为 POSIX 标准。他无法回想起具体的例子,但友好地代我向几位开发人员发了邮件。

开发人员 Giacomo CatenazziJames YoungmanEric BlakeArnold Robbins 和 Joshua Judson Rosen 都根据当前版本的 POSIX 以及诸多前回版本做出了回应。POSIX 是一个 “活的living” 标准,因此会不断被行业专业人士更新和评审,许多从事 GNU 项目的开发人员会提出对于 GNU 特性的包容。

为了回顾这些有趣的历史,接下来会罗列一些脍炙人口的已经融入 POSIX 的 GNU 特性。

Make

一些 GNU Make 的特性已经被 POSIX 定义的 make 所采用。相关的 规范 提供了从现有实现中借来特性的详细归属。

Diff 和 patch

diffpatch 命令都直接从这些工具的 GNU 版本中引进了 -u-U 选项。

C 库

POSIX 采用了 GNU C 库 glibc 的许多特性。血统Lineage一时已难以追溯,但 James Youngman 如是写道:

“我非常确定 GCC 首创了许多 ISO C 的特性。例如,_Noreturn 是 C11 中的新特性,但 GCC-1.35 便具有此功能(使用 volatile 作为声明函数的修饰符)。另外尽管我不确定该 GCC-1.35 支持的可变长度数组似乎与现代 C 中的(柔性数组conformant array没有找到准确的翻译,推测是柔性数组)非常相似。“

Giacomo Catenazzi 援引 Open Group 的 文章 strftime,并指出其归因:“这是基于某版本 GNU libc 的 strftime() 的某特性。”

Eric Blake 指出,对于 getline() 和各种基于本地环境的 *_l() 函数GNU 绝对是这方面的先驱。

Joshua Judson Rosen 补充道,他对采纳 getline 函数的印象深刻,特别是在目睹了全然不同操作系统的代码中和类 GNU 代码相似却又怪异的做法后。

“等等……那是 GNU 特有的……不是吗?显然已经不再是了。”

Rosen 指出的 getline 手册页 中写道:

getline()getdelim() 最初都是 GNU 扩展。在 POSIX.1-2008 中被标准化。

Eric Blake 向我发送了一份其他扩展的列表,这些扩展可能会在下一个 POSIX 修订版中添加(代号为 Issue 8大约在 2021 年前后):

关于用户空间的扩展

POSIX 不仅为开发人员定义函数和特性,还为用户空间定义了标准行为。

ls

-A 选项会排除符号 .(代表当前位置)和 ..(代表上一级目录)这些来自 ls 命令的结果。被 POSIX 2008 采纳。

find

The find command is a useful tool for ad hoc for loops and as a gateway into parallel processing.

find 命令是一个专门的ad hoc for loops 工具,也是 并行parallel 处理的出入口。

A few conveniences made their way from GNU to POSIX, including the -path and -perm options.

一些从 GNU 引入到 POSIX 的便捷操作conveniences,包括 -path-perm 选项。

-path 选项帮你过滤与文件系统路径模式匹配的搜索结果,并且 1996 年前 GNU 版本的 find (根据 findutil 在 Git 仓库中最早的记录便可使用此选项。James Youngman 指出 HP-UX 也很早就有这个选项,所以究竟是 GNU 还是 HP-UX 做出的这一创新(抑或两者兼而有之)无法考证。

-perm 选项帮你按文件权限过滤搜索结果。1996 年 GNU 版本的 find 中便已存在,随后被纳入 POSIX 标准 “IEEE Std 1003.1,2004 Edition” 中。

xargs 命令是 findutils 软件包的一部分1996 年的时候就有一个 -p 选项会将 xargs 置于交互模式(用户将被提示是否继续),随后被纳入 POSIX 标准 "IEEE Std 1003.1, 2004 Edition." 中。

Awk

GNU awk(即 /usr/bin 目录中的 gawk 命令,可能也是符号链接 awk 的目标地址)的维护者 Arnold Robbins 说道,gawkmawk另一个GPL 的 awk 实现)允许使用 RS 作为正则表达式,即 RS 的长度大于 1 时的情况。这一特性还不是 POSIX 的特性,但有 迹象表明它即将会是

在扩展正则表达式中未定义的行为将导致 NUL 结果,以支持 GNU gawk 程序未来对于处理二进制数据的扩展。

使用多字符 RS 值的未指定行为是为了支持未来可能基于扩展正则表达式使用记录分隔符的特性。历史实现为采用字符串的第一个字符而忽略其他字符。

这是一个重大的增强,因为 RS 符号定义了记录之间的分隔符。可能是逗号、分号、短划线、或者是任何此类字符,但如果它是字符 序列,则只会使用第一个字符,除非你使用的是 gawkmawk。想象一下这种情况,使用省略号(连续的三个点)作为解析 IP 地址文档的分隔记录,只是想获取在每个 IP 地址的每个点处解析的结果。

Mawk 首先支持这个功能,但是几年来没有维护者,留下来的火把由 gawk 接过。(Mawk 已然获得了一个新的维护者,可以说是大家薪火传承地将这一特性推向共同的预期值。)

POSIX 规范

总的来说Giacomo Catenzzi 指出,“……因为 GNU 的实用程序使用广泛,而且许多其他的选项和行为又对标规范。在 shell 的每次更改中Bash 都会被用作比较(作为一等公民)。” 当某些东西被纳入 POSIX 规范时,无需提及 GNU 或任何其他影响,你可以简单地认为 POSIX 规范会受到许多方面的影响GNU 只是其中之一。

共识是 POSIX 存在的意义所在。一群技术人员共同努力为了实现普世的规范,再分享给数以百计独特的开发人员,经由他们的赋能,从而实现软件的独立性,以及开发人员和用户的自由。


via: https://opensource.com/article/19/7/what-posix-richard-stallman-explains

作者:Seth Kenlon 选题:lujun9972 译者:译者ID 校对:校对者ID

本文由 LCTT 原创编译,Linux中国 荣誉推出