第 1 章

一个开关能做什么

你有没有在黑暗中摸索过电灯开关？手指碰到那个小小的拨片，轻轻一按，整个房间瞬间亮了。就是这样一个最简单的动作，藏着整个计算机世界的秘密。

这一章，我们从一个开关出发。不是因为这是最简单的起点，而是因为这真的是计算机的全部起点——从你手机里几百亿个晶体管，到运行 ChatGPT 的数据中心，本质上都是开关在做事。

Level 1：建立直觉

开关是什么

开关最本质的特征只有一个：它只有两种状态。开，或者关。亮，或者灭。通，或者断。

这听起来太简单了，简单到令人怀疑：就这个？能干什么大事？

让我们先别急着跳到复杂的地方。想象你面前有一个电灯开关。

状态 A：开关向上 → 电路接通 → 灯亮
状态 B：开关向下 → 电路断开 → 灯灭

就这两种状态。没有"半亮"，没有"差不多通"，只有绝对的"是"或"否"。

这种非此即彼的特性，正是计算机最需要的东西。

为什么？因为模糊是计算的敌人。

想象一下，如果你用电压的高低来表示数字：0.1V 代表 0，0.2V 代表 1，0.3V 代表 2……听起来很合理对吗？但现实中，电路会受温度影响，会有噪声干扰，0.2V 的信号跑着跑着可能就变成了 0.19V 或者 0.21V——你的数字就悄悄地出错了。

而开关不同。它不在乎是 4.8V 还是 5.2V，只要超过阈值，就是"开"；只要低于阈值，就是"关"。这种容错性让开关成为构建可靠计算系统的完美基础。

一个开关能表示什么

一个开关，能表示一个比特（bit）——计算机世界里最小的信息单位。

"bit"这个词来自"binary digit"（二进制数字）的缩写。一个比特只能是 0 或者 1，就像一个开关只能是关或者开。

开关状态    比特值    可能的含义
  关          0      否/假/低/无
  开          1      是/真/高/有

一个开关能表示的信息量是有限的：只能区分两种情况。但有意思的是，随着开关数量的增加，能表示的信息量会指数级增长。

想象你有 2 个开关：

开关1  开关2    组合
  0     0      → 状态00
  0     1      → 状态01
  1     0      → 状态10
  1     1      → 状态11

2 个开关，有 4 种组合（2² = 4）。

3 个开关，有 8 种组合（2³ = 8）。

8 个开关，有 256 种组合（2⁸ = 256）——正好够表示所有英文字母、数字和常用符号。

64 个开关，有 18,446,744,073,709,551,616 种组合（2⁶⁴）——比宇宙中的沙粒还多。

这就是二进制魔法的核心：少量的开关，通过组合，可以表示天文数字级别的信息。

用图来想象：信息量爆炸

想象一排灯泡，每个灯泡只有亮和灭两种状态：

◉ ◯ ◉ ◉ ◯ ◉ ◯ ◯

这 8 个灯泡的状态，就构成了一个"字节"（byte）。每种不同的亮灭组合，就是一个不同的值。上面这个组合是 10110100，转换成十进制是 180。

你的名字是怎么存在计算机里的？就是这样：每个字母对应一个数字（比如 'A' = 65），每个数字用 8 个比特的灯泡组合表示。一张图片？无数个这样的比特组，每个代表一个像素的颜色值。一首音乐？也是无数个比特，记录着每一刻的声音振幅。

世界上所有的信息，最终都被化简成了一排排开关的开与关。

Level 2：原理剖析

从机械开关到晶体管

好，我们理解了开关的逻辑。但计算机里的"开关"并不是电灯开关那种机械玩意儿——它是晶体管（transistor）。

为什么要用晶体管？因为机械开关有两个致命问题：

1. 速度太慢

机械开关靠物理接触来通断电路，每秒钟能开关几百次就不错了。而现代 CPU 的晶体管，每秒钟可以翻转数十亿次——你的 3GHz 处理器，每秒能执行 30 亿次开关操作。

2. 太大了

一个普通的机械开关有几厘米大。而今天最先进的晶体管，只有 2 纳米大——这是什么概念？一根头发丝大约 80,000 纳米，一个 2nm 的晶体管比头发丝细了 40,000 倍。

晶体管是怎么工作的？

最常用的是MOSFET（金属氧化物半导体场效应晶体管），名字很长，原理其实很直观：

        栅极 (Gate)
           |
源极 ──────┤├────── 漏极
(Source)   ↕    (Drain)
        基底 (Substrate)

晶体管有三个引脚：

源极：电流的入口
漏极：电流的出口
栅极：控制信号

当栅极施加高电压时，源极和漏极之间的"沟道"被开启，电流可以流过——开关打开。

当栅极电压为零时，沟道关闭，电流被阻断——开关关闭。

栅极就是"控制旋钮"。它本身不消耗太多能量，却能控制一条更大的电流通路的开关。 这就是"放大"的另一面——晶体管既可以当放大器，也可以当开关，而在计算机里，我们只需要它当开关。

逻辑门：开关的组合拳

单个开关只能表示一个比特，但我们需要的是运算——比如"如果A是真，并且B也是真，那么输出真"。

这就是逻辑门的来历。

AND 门（与门）

想象两个开关串联（像圣诞树灯串，一根线串起来）：

电源 → 开关A → 开关B → 灯泡

只有当 A 和 B 都闭合，灯才会亮。这就是 AND 门：

A  B  输出
0  0   0
0  1   0
1  0   0
1  1   1    ← 只有这种情况输出1

OR 门（或门）

两个开关并联（像两条路通向同一个地方）：

        开关A
电源 →  ╔═══╗  → 灯泡
        ╚═══╝
        开关B

A 或 B 任意一个闭合，灯就会亮：

A  B  输出
0  0   0
0  1   1    ← A关B开，灯亮
1  0   1    ← A开B关，灯亮
1  1   1    ← 都开，灯亮

NOT 门（非门）

一个开关，但逻辑反过来——开关闭合时，输出反而是 0；断开时，输出是 1。

A  输出
0   1
1   0

这看起来奇怪，但在电路里实现起来很自然：把晶体管接在"下拉"位置，默认输出高电压（1），晶体管导通时把输出拉低（0）。

这三种门——AND、OR、NOT——是整个计算机逻辑的基础。 所有更复杂的运算，加法、乘法、比较、甚至人工智能的矩阵运算，最终都可以分解成这三种基本操作的组合。

NAND：万能积木

有意思的是，其实只需要一种门就够了——NAND 门（与非门）。

NAND 是 AND 的反面：只有当两个输入都是 1 时，输出才是 0；其他情况输出都是 1：

A  B  NAND输出
0  0    1
0  1    1
1  0    1
1  1    0

为什么 NAND 是"万能"的？因为你可以用 NAND 门搭出任何其他门：

NOT：把 NAND 的两个输入接在一起（A NAND A = NOT A）
AND：NAND 后面再接一个 NOT
OR：两个 NOT 接一个 NAND

这意味着，理论上你只需要生产一种晶体管电路（NAND 门），就能搭出整个计算机。

现实中，芯片设计师会用多种门类型来优化面积和速度，但 NAND 的"完备性"在计算机科学中具有深刻意义：复杂性可以从极度简单的规则中涌现出来。

数字的本质：约定的编码

现在我们有了能进行逻辑运算的开关组合，但还有一个问题：数字 "5" 怎么表示？字母 "A" 怎么表示？

答案是：约定。

计算机里的数字，采用二进制表示：

十进制  二进制（4位）
  0      0000
  1      0001
  2      0010
  3      0011
  4      0100
  5      0101
  6      0110
  7      0111
  8      1000
  9      1001
 10      1010
 ...
 15      1111

每一位二进制数对应一个开关的状态。4个开关能表示 0 到 15，8个开关（一个字节）能表示 0 到 255，16个开关能表示 0 到 65535。

字母呢？早期用 ASCII 码：把字母和符号编上数字就好了。'A' = 65（二进制 01000001），'B' = 66，'a' = 97……

今天，我们用 Unicode，把全球所有语言的字符都编了号——中文"你"是 U+4F60，日文"あ"是 U+3042。但最终，这些编号还是存成了二进制比特串。

开关的状态本身没有意义，意义来自于我们对状态的解释。 同样的比特串，解释为整数是 180，解释为 ASCII 是字符"´"，解释为颜色可能是某种橙红色。这个"解释"的过程，就是数据类型的由来。

Level 3 · 规范怎么定义的（资深）

布尔代数与逻辑完备性

开关的数学基础是布尔代数（Boolean Algebra），由 George Boole 在 1854 年的《思维的规律》中首次形式化。IEEE Std 91/91a 定义了逻辑门的标准图形符号，而 IEC 60617-12 则是国际电工委员会对数字逻辑符号的规范。在这些标准中，逻辑门的行为被严格定义为真值表——输入与输出之间的确定性映射关系。

NAND 门的"功能完备性"并非直觉，而是有严格数学证明的。1913 年，Henry Sheffer 证明了 NAND（Sheffer stroke，记作 "|"）可以表达所有布尔函数，这被称为 Sheffer 定理。同样，NOR 门也具备功能完备性。这意味着任何组合逻辑电路都可以仅用 NAND 或 NOR 门实现——这一结论直接影响了 CMOS 电路设计，因为 NAND 门在 CMOS 工艺中天然比 AND 门更高效（少一级反相器）。

晶体管层面，MOSFET 的行为由 BSIM（Berkeley Short-channel IGFET Model）模型描述，目前最新版本是 BSIM-CMG（用于 FinFET 和 GAA 结构）。BSIM 模型被 Compact Model Coalition（CMC）采纳为工业标准，所有主流 EDA 工具（Cadence Spectre、Synopsys HSPICE）都以此为基础进行电路仿真。模型包含数百个参数，精确描述了亚阈值漏电流、沟道长度调制、量子限制效应等物理现象。

Level 4 · 边界与陷阱（所有人）

陷阱 1：亚阈值漏电不是零

教科书常说晶体管"关闭"时电流为零，但在纳米级工艺下，亚阈值漏电流（subthreshold leakage）不可忽略。一颗 5nm 芯片即使完全空闲，数十亿晶体管的漏电流总和也能消耗数瓦功率。这就是为什么现代 SoC 需要电源门控（power gating）——直接切断不活跃模块的供电，而不只是让晶体管"关闭"。Intel 的 Haswell 架构因为低估了漏电问题，导致移动端功耗不达预期，这是一个真实的工程教训。

陷阱 2：逻辑门的传播延迟会累积

逻辑门不是瞬时响应的。每个门都有传播延迟（propagation delay），通常在皮秒级。当你串联几十级逻辑门（如一个 64 位加法器的进位链），延迟会累积到纳秒级，直接限制了 CPU 能达到的最高时钟频率。1999 年 Intel 曾计划将 Pentium 4 推到 10GHz，但因为深流水线的门延迟累积和功耗问题，最终止步于 3.8GHz 就放弃了这条路线。

陷阱 3：信号完整性——开关并不总是"干净"的

在理想模型中，信号从 0 变到 1 是瞬时的。但真实电路中，信号翻转有上升时间和下降时间，期间电压处于中间状态（亚稳态）。如果在这个瞬间采样，结果不确定。更严重的是，高速信号在走线时会产生串扰（crosstalk）和反射（reflection），导致相邻导线上的信号被干扰。DDR5 内存之所以采用差分信号（DQ/DQS），就是为了对抗这种信号完整性问题。忽视这些物理效应是 FPGA 初学者最常遇到的"玄学 bug"来源。

本章评分

4.7 / 5 (109 评分)

一个开关能做什么

一个开关能做什么

Level 1：建立直觉

开关是什么

一个开关能表示什么

用图来想象：信息量爆炸

Level 2：原理剖析

从机械开关到晶体管

逻辑门：开关的组合拳

NAND：万能积木

数字的本质：约定的编码

Level 3 · 规范怎么定义的（资深）

布尔代数与逻辑完备性

Level 4 · 边界与陷阱（所有人）

陷阱 1：亚阈值漏电不是零

陷阱 2：逻辑门的传播延迟会累积

陷阱 3：信号完整性——开关并不总是"干净"的

💬 留言讨论