第 22 章

CGo：与 C 共舞的代价

Go 生态系统中存在一条不成文的共识：如果你的项目使用了 CGo，那你就走上了一条需要特别谨慎的道路。CGo 让 Go 程序能够调用 C 代码，这个能力有时是不可替代的——世界上有太多成熟的 C 库（SQLite、OpenSSL、BLAS/LAPACK、libpcap、Linux 内核接口），它们经历了数十年的打磨，而相应的纯 Go 实现要么不存在，要么质量差距明显。

但 CGo 的代价是真实的，且往往被低估。每次跨越 Go/C 边界的调用大约耗时 100 纳秒，goroutine 必须切换到系统栈，垃圾回收器的暂停时间可能变长，交叉编译几乎变得不可能，构建时间显著增加，调试器的支持也变得不稳定。

这不是一篇反对 CGo 的文章，而是一篇帮你在真正需要时正确使用它的文章。

Level 1 · 你需要知道的

什么时候 CGo 是必须的

场景一：调用成熟的 C 库

世界上存在大量经历了几十年实战考验的 C 库，这些库的可靠性是纯 Go 实现短期内无法企及的：

SQLite：全世界部署最广泛的数据库，mattn/go-sqlite3 通过 CGo 封装，是 Go 生态中最常用的 SQLite 驱动。纯 Go 实现（如 modernc/sqlite）存在，但历史上性能差距显著，且行为细节有差异。
OpenSSL/BoringSSL：在需要 FIPS 140-2/3 认证的场景（金融、医疗、政府），必须使用经过认证的密码学实现，而 Go 标准库的 crypto 包不在认证范围内。
图形/音频库：OpenGL（go-gl）、Vulkan、PortAudio 等，Go 生态中不存在独立的纯 Go 实现。
机器学习加速：调用 cuBLAS、MKL 等硬件加速库，用 Go 操作 GPU。

场景二：操作系统级 API

某些 OS API 没有更好的调用方式：

调用特定的 ioctl 命令（字符设备驱动交互）
使用 Linux 的 io_uring 接口（在 Go 尚未提供高层封装的情况下）
与内核模块交互的特殊系统调用

场景三：遗留系统集成

已有大量 C/C++ 代码的企业，在迁移到 Go 的过程中，CGo 是渐进式迁移的桥梁——让 Go 代码先调用现有 C 库，逐步替换，而不是全量重写。

CGo 不是免费的：代价概览

在决定使用 CGo 之前，需要清楚了解它的代价：

代价维度	具体表现
调用开销	每次 Go→C 调用约 100ns（vs. Go 函数调用 ~1ns）
构建时间	引入 C 工具链，构建时间增加 2-10 倍
交叉编译	`CGO_ENABLED=0` 支持完整交叉编译；启用 CGo 后需要目标平台的 C 交叉编译工具链
GC 压力	C 内存不受 GC 管理，需要手动 `C.malloc`/`C.free`，内存泄漏风险
调试复杂性	混合栈帧，`dlv`/`gdb` 在 C 帧处表现不稳定
静态分析	`go vet`、`staticcheck` 等工具对 CGo 代码覆盖有限
Docker 镜像	使用 CGo 后无法用 `scratch` 基础镜像，需要 `alpine` 或 `debian`

Level 2 · 原理

CGo 调用的底层机制

理解 CGo 的开销，必须理解它的调用路径。一次 Go 调用 C 函数，经历了以下步骤：

Go goroutine (用户栈, 2KB-1GB 动态)
    ↓
1. entersyscall / cgocall 入口
    ↓
2. 将当前 goroutine 状态切换为 _Csyscall
    ↓
3. 保存 Go 寄存器状态
    ↓
4. 切换到 M（OS 线程）的系统栈（固定大小，默认 8MB）
    ↓
5. 执行 C 函数（在系统栈上）
    ↓
6. C 函数返回
    ↓
7. 切换回 Go goroutine 栈
    ↓
8. 恢复 goroutine 状态为 _Grunning
    ↓
9. 继续执行 Go 代码

为什么需要切换到系统栈？

Go 的 goroutine 使用分段增长栈（segmented/copying stack）——初始只有 2KB，按需增长。C 代码不了解这个机制，它假设栈是连续的、大小固定的（C 调用惯例）。如果 C 函数在 Go 的小栈上运行，任何一个递归层级深、使用大量局部变量的 C 函数都可能导致栈溢出。

因此，每次 Go 调用 C，必须切换到 M 的系统栈（通常 8MB，类似 OS 线程的默认栈大小），这个切换本身就需要保存/恢复寄存器、更新调度器状态，耗费约 60-100ns。

GC 和 CGo 的交互

当一个 goroutine 正在执行 C 代码时：

Go 的 GC 不知道 C 代码什么时候结束
GC 触发时，会把这个 goroutine 标记为 _Csyscall 状态，然后继续（不等待它）
这意味着 CGo 调用时间过长会延迟 GC 能够回收内存的时机，增大 heap 峰值

Go runtime 通过 getg().m.incgo 等机制追踪是否在 CGo 调用中，但这种追踪本身也有开销。

goroutine 栈与 C 调用的完整图示

OS 线程 M:
┌─────────────────────────────────────────────────────┐
│  系统栈（固定 8MB）                                   │
│  ┌─────────────────────────────────────────────┐    │
│  │  C 函数帧 n                                  │    │
│  │  C 函数帧 n-1                                │    │
│  │  ...                                         │    │
│  │  CGo 桥接代码（cgocall/cgocallback）          │    │
│  └─────────────────────────────────────────────┘    │
│                                                      │
│  goroutine G:                                        │
│  ┌─────────────────────────────────────────────┐    │
│  │  Go 函数帧（goroutine 栈上，2KB-1GB）        │    │
│  │  callCgoFunc(...)  ← 调用发起点              │    │
│  │  [goroutine 在此暂停，等待 C 返回]            │    │
│  └─────────────────────────────────────────────┘    │
└─────────────────────────────────────────────────────┘

C 内存与 Go GC 的边界

Go 的 GC 只管理 Go 堆上的内存。C.malloc 分配的内存在 C 的堆上，GC 完全不可见：

Go 堆（GC 管理）：
  ┌──────────┐    ┌──────────┐    ┌──────────┐
  │ Go 对象  │    │ Go 对象  │    │ Go 对象  │
  └──────────┘    └──────────┘    └──────────┘
       ↑                                ↑
       GC 标记和回收

C 堆（libc 管理）：
  ┌──────────┐    ┌──────────┐
  │ C.malloc │    │ C.malloc │   ← GC 完全看不到这里
  │ 分配内存  │    │ 分配内存  │   ← 必须手动 C.free
  └──────────┘    └──────────┘

关键规则：Go 指针不能被 C 代码"保存"超过调用期——C 代码持有一个指向 Go 内存的指针，但 GC 不知道这件事，可能移动或回收这块内存。这是 CGo 规则（cgo rules）中最严格的约束之一。

CGo 对构建系统的影响

CGo 将 C 工具链引入 Go 的构建流程：

go build with CGo:
  1. go tool cgo 预处理 .go 文件中的 C 伪代码
  2. 生成 _cgo_gotypes.go、_cgo_export.h 等中间文件
  3. 调用 C 编译器（gcc/clang）编译 C 代码为 .o 文件
  4. 链接器将 Go 对象和 C 对象链接成最终二进制

构建时间对比（中型项目）：
  CGO_ENABLED=0:  ~3 秒
  CGO_ENABLED=1:  ~15-30 秒（额外的 C 编译时间）

交叉编译影响：

# 纯 Go：轻松交叉编译
CGO_ENABLED=0 GOOS=linux GOARCH=arm64 go build

# CGo：需要目标平台的 C 交叉编译工具链
GOOS=linux GOARCH=arm64 CC=aarch64-linux-gnu-gcc CGO_ENABLED=1 go build
# 错误：找不到 aarch64-linux-gnu-gcc

Level 3 · 代码实践

从 Go 调用 C 函数

最基本的 CGo 用法——在 Go 文件中嵌入 C 代码，通过 C. 前缀调用：

package main

/*
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <math.h>

// C 函数：计算两个向量的点积
double dot_product(const double* a, const double* b, int n) {
    double sum = 0.0;
    for (int i = 0; i < n; i++) {
        sum += a[i] * b[i];
    }
    return sum;
}

// C 函数：字符串反转（返回新分配的字符串，调用方负责 free）
char* reverse_string(const char* s) {
    int len = strlen(s);
    char* result = (char*)malloc(len + 1);
    if (!result) return NULL;
    for (int i = 0; i < len; i++) {
        result[i] = s[len - 1 - i];
    }
    result[len] = '\0';
    return result;
}
*/
import "C"
import (
    "fmt"
    "unsafe"
)

func DotProduct(a, b []float64) float64 {
    if len(a) != len(b) || len(a) == 0 {
        return 0
    }
    return float64(C.dot_product(
        (*C.double)(unsafe.Pointer(&a[0])),
        (*C.double)(unsafe.Pointer(&b[0])),
        C.int(len(a)),
    ))
}

func ReverseString(s string) string {
    cstr := C.CString(s)          // Go string → C string（堆分配，需要 free）
    defer C.free(unsafe.Pointer(cstr))

    reversed := C.reverse_string(cstr) // C 分配的字符串
    if reversed == nil {
        return ""
    }
    defer C.free(unsafe.Pointer(reversed)) // 必须 free！

    return C.GoString(reversed) // C string → Go string（拷贝到 Go 堆）
}

func main() {
    a := []float64{1, 2, 3, 4}
    b := []float64{5, 6, 7, 8}
    fmt.Printf("Dot product: %.2f\n", DotProduct(a, b)) // 70.00

    fmt.Println(ReverseString("Hello, CGo!")) // !oGC ,olleH
}

关键注意点：

import "C" 必须紧跟在 C 代码注释之后，中间不能有空行
C.CString 分配 C 内存，必须用 C.free 释放
C.GoString 将 C 字符串拷贝到 Go 堆，安全

将 Go 切片传递给 C

Go 切片的底层数组可以直接传给 C，但必须遵守 CGo 规则：

package main

/*
#include <stdlib.h>

// 原地将数组的每个元素乘以 2
void double_array(int* arr, int n) {
    for (int i = 0; i < n; i++) {
        arr[i] *= 2;
    }
}

// 计算数组总和
long long sum_array(const int* arr, int n) {
    long long sum = 0;
    for (int i = 0; i < n; i++) {
        sum += arr[i];
    }
    return sum;
}
*/
import "C"
import (
    "fmt"
    "unsafe"
)

func DoubleSlice(s []int32) {
    if len(s) == 0 {
        return
    }
    C.double_array((*C.int)(unsafe.Pointer(&s[0])), C.int(len(s)))
}

func SumSlice(s []int32) int64 {
    if len(s) == 0 {
        return 0
    }
    return int64(C.sum_array((*C.int)(unsafe.Pointer(&s[0])), C.int(len(s))))
}

func main() {
    data := []int32{1, 2, 3, 4, 5}
    fmt.Println("Before:", data)   // [1 2 3 4 5]
    DoubleSlice(data)
    fmt.Println("After:", data)    // [2 4 6 8 10]
    fmt.Println("Sum:", SumSlice(data)) // 30
}

切片传递的安全性：在 C 函数执行期间，Go 的 GC 不会移动 Go 堆对象（Go 目前不使用移动式 GC），所以临时传递切片底层数组的指针给 C 是安全的。但如果 C 保存了这个指针供后续使用，就违反了 CGo 规则。

内存管理规则：C.malloc 与 C.free

package main

/*
#include <stdlib.h>
#include <string.h>

typedef struct {
    char* name;
    int   age;
    double salary;
} Employee;

Employee* create_employee(const char* name, int age, double salary) {
    Employee* e = (Employee*)malloc(sizeof(Employee));
    if (!e) return NULL;
    e->name = strdup(name);  // strdup 内部也 malloc
    e->age = age;
    e->salary = salary;
    return e;
}

void free_employee(Employee* e) {
    if (e) {
        free(e->name);  // 先 free 内部指针
        free(e);        // 再 free 结构体本身
    }
}
*/
import "C"
import (
    "fmt"
    "runtime"
    "unsafe"
)

// Employee 是 C 结构体的 Go 封装
type Employee struct {
    ptr *C.Employee
}

// NewEmployee 创建一个 C Employee，并注册 finalizer
func NewEmployee(name string, age int, salary float64) *Employee {
    cname := C.CString(name)
    defer C.free(unsafe.Pointer(cname))

    cptr := C.create_employee(cname, C.int(age), C.double(salary))
    if cptr == nil {
        return nil
    }

    e := &Employee{ptr: cptr}
    // 注册 finalizer：当 Go GC 回收 e 时，自动调用 free_employee
    // 注意：finalizer 不保证及时运行，不应依赖它做关键资源回收
    runtime.SetFinalizer(e, func(emp *Employee) {
        C.free_employee(emp.ptr)
    })
    return e
}

func (e *Employee) Name() string {
    return C.GoString(e.ptr.name)
}

func (e *Employee) Age() int {
    return int(e.ptr.age)
}

// Close 显式释放 C 内存（推荐，比依赖 finalizer 更可靠）
func (e *Employee) Close() {
    if e.ptr != nil {
        C.free_employee(e.ptr)
        e.ptr = nil
        runtime.SetFinalizer(e, nil) // 取消 finalizer，避免双重释放
    }
}

func main() {
    emp := NewEmployee("Alice", 30, 95000.0)
    if emp == nil {
        fmt.Println("Failed to create employee")
        return
    }
    defer emp.Close() // 明确的资源管理

    fmt.Printf("Name: %s, Age: %d\n", emp.Name(), emp.Age())
}

CGO_ENABLED=0 的纯 Go 构建

对于想要静态链接、无外部依赖的部署场景，禁用 CGo 是正确选择：

# 构建不依赖任何 C 库的静态二进制
CGO_ENABLED=0 GOOS=linux GOARCH=amd64 go build -o myapp ./cmd/myapp

# 验证：没有动态链接依赖
file myapp
# myapp: ELF 64-bit LSB executable, x86-64, statically linked

# Docker：使用 scratch 镜像（最小化）
# Dockerfile:
# FROM scratch
# COPY myapp /myapp
# ENTRYPOINT ["/myapp"]

条件编译：如果你的包需要在 CGo 可用和不可用两种情况下工作，用 build tags：

//go:build cgo
// +build cgo

// cgo_impl.go - CGo 可用时使用
package mydb

import "C"

func openDB(path string) (*DB, error) {
    // 使用真实的 C SQLite 库
    ...
}

//go:build !cgo
// +build !cgo

// pure_impl.go - CGo 不可用时使用纯 Go 实现
package mydb

func openDB(path string) (*DB, error) {
    // 使用纯 Go 的 SQLite 实现（modernc/sqlite）
    ...
}

从 C 回调 Go 函数

C 调用 Go 函数是 CGo 中最复杂的场景之一，因为涉及栈方向的反转：

package main

/*
#include <stdio.h>

// 声明 Go 函数（CGo 会生成实现）
extern void goCallback(int value);

// C 函数：遍历数组，对每个元素调用回调
void process_array(int* arr, int n) {
    for (int i = 0; i < n; i++) {
        goCallback(arr[i]);
    }
}
*/
import "C"
import (
    "fmt"
    "unsafe"
)

//export goCallback
func goCallback(value C.int) {
    fmt.Printf("Callback received: %d\n", int(value))
}

func main() {
    data := []C.int{10, 20, 30, 40, 50}
    C.process_array(&data[0], C.int(len(data)))
}

//export 指令的限制：

同一个包中，使用 //export 的文件不能包含非导出的 C 代码
导出的 Go 函数在 C 调用时会经历 cgocallback 路径，类似于 CGo 调用的逆向
不能在 //export 函数中使用 recover（C 不理解 Go 的 panic 机制）

Level 4 · 进阶与边界

go-sqlite3 的内部机制

mattn/go-sqlite3 是 Go 生态中最重要的 CGo 项目之一，深入研究它的实现可以学到很多。

构建机制：go-sqlite3 将 SQLite 的完整 C 源码（约 23 万行的 sqlite3.c amalgamation）打包在仓库中，通过 CGo 直接编译。这意味着：

不需要系统安装 libsqlite3
SQLite 版本由 go-sqlite3 管控
但每次 go build 都需要编译这 23 万行 C 代码（约 30 秒额外时间）

连接生命周期：

// go-sqlite3 的连接打开（简化）
func (d *SQLiteDriver) Open(dsn string) (driver.Conn, error) {
    // 分配 C.sqlite3 指针
    var db *C.sqlite3
    cdsn := C.CString(dsn)
    defer C.free(unsafe.Pointer(cdsn))

    // 调用 C 层的 sqlite3_open_v2
    rv := C.sqlite3_open_v2(cdsn, &db,
        C.SQLITE_OPEN_FULLMUTEX|C.SQLITE_OPEN_READWRITE|C.SQLITE_OPEN_CREATE,
        nil)
    if rv != C.SQLITE_OK {
        return nil, fmt.Errorf("sqlite3: open %s: %d", dsn, rv)
    }

    conn := &SQLiteConn{db: db}
    runtime.SetFinalizer(conn, (*SQLiteConn).Close)
    return conn, nil
}

查询执行路径：每次 db.Query 都经历 Go→C→Go 多次跨越：

sqlite3_prepare_v2（编译 SQL 到字节码）
sqlite3_bind_*（绑定参数，每个参数一次 CGo 调用）
sqlite3_step（执行一行，一次 CGo 调用）
sqlite3_column_*（读取列值，每列一次 CGo 调用）
sqlite3_finalize（释放 statement）

对于一个返回 100 行、10 列的查询，光是读取数据就需要约 1000 次 CGo 调用。这是 go-sqlite3 在高并发场景下性能的主要瓶颈之一。

性能 Profiling：识别 CGo 开销

用 go tool pprof 分析 CGo 密集型程序时，CGo 调用在 CPU profile 中表现为 runtime.cgocall：

# 开启 CPU profile
go test -cpuprofile=cpu.prof -bench=. ./...

# 分析
go tool pprof cpu.prof
(pprof) top 20
(pprof) web  # 在浏览器中查看火焰图

在 profile 中寻找：

runtime.cgocall：每次 Go→C 调用的入口
runtime.cgocallbackg：每次 C→Go 回调的入口
syscall.cgocaller：syscall 层的 CGo 调用

批处理优化：如果发现 CGo 调用是热点，考虑在 C 层批量处理：

// 低效：Go 循环调用 C，N 次 CGo 调用
for i, v := range data {
    C.process_one(C.int(v))
}

// 高效：一次 CGo 调用处理整个批次
C.process_batch((*C.int)(unsafe.Pointer(&data[0])), C.int(len(data)))

purego：不用 CGo 的动态库调用

purego 是 Ebitengine（Go 游戏引擎）团队开发的库，允许在不使用 CGo 的情况下调用系统动态库（.so/.dylib/.dll）：

package main

import (
    "fmt"
    "github.com/ebitengine/purego"
)

func main() {
    // 在 macOS 上加载系统 libSystem
    libc, err := purego.Dlopen("/usr/lib/libSystem.B.dylib", purego.RTLD_NOW|purego.RTLD_GLOBAL)
    if err != nil {
        panic(err)
    }

    var strlen func(string) int
    purego.RegisterLibFunc(&strlen, libc, "strlen")

    fmt.Println(strlen("hello")) // 5
}

purego 的工作原理：使用平台 ABI（调用约定）直接构造调用帧，通过 syscall 或平台特定的汇编直接跳转到动态库函数，完全绕过 CGo 的桥接机制。

优点：

CGO_ENABLED=0 时仍然可用
无需 C 编译器，保留完整的交叉编译能力
调用开销低于 CGo（约 20-30ns vs 100ns）

缺点：

只能调用动态库（不能调用静态库）
类型映射需要手工处理（无 CGo 的自动类型转换）
不能调用 C 函数指针作为回调

WebAssembly 作为 CGo 替代方案

对于某些 C 库，可以将其编译为 WebAssembly，然后在 Go 中通过 WASM 运行时调用：

C 库源码 → emscripten/wasi-sdk → .wasm 文件 → Go WASM 运行时（wazero）→ 调用

wazero 是一个纯 Go WASM 运行时，无需 CGo：

package main

import (
    "context"
    "fmt"
    "os"

    "github.com/tetratelabs/wazero"
    "github.com/tetratelabs/wazero/imports/wasi_snapshot_preview1"
)

func main() {
    ctx := context.Background()

    // 创建 WASM 运行时（纯 Go 实现）
    r := wazero.NewRuntime(ctx)
    defer r.Close(ctx)

    // 实例化 WASI 支持
    wasi_snapshot_preview1.MustInstantiate(ctx, r)

    // 加载编译好的 WASM 模块（原本是 C 库）
    wasmBytes, _ := os.ReadFile("mylib.wasm")
    mod, _ := r.Instantiate(ctx, wasmBytes)

    // 调用 WASM 中的函数
    addFn := mod.ExportedFunction("add")
    results, _ := addFn.Call(ctx, 5, 3)
    fmt.Println("5 + 3 =", results[0]) // 8
}

适用场景：

需要沙箱隔离（WASM 提供内存隔离）
目标是跨平台（WASM 是跨架构的）
C 库的功能集相对独立（不需要大量 I/O）

不适用场景：

高性能计算（WASM JIT 比原生代码慢 1.5-3 倍）
C 库大量使用系统调用（WASI 的系统调用支持有限）

CGo 回调中的 panic 处理

C 不理解 Go 的 panic，因此在 //export 函数中 panic 会导致程序崩溃（而不是正常的 panic 传播）。正确的做法是在导出函数中捕获所有 panic：

//export safeGoCallback
func safeGoCallback(value C.int) (result C.int) {
    defer func() {
        if r := recover(); r != nil {
            // 记录日志，但不能让 panic 传播到 C
            fmt.Fprintf(os.Stderr, "panic in CGo callback: %v\n", r)
            result = -1 // 返回错误码
        }
    }()

    // 实际逻辑
    v := processValue(int(value))
    return C.int(v)
}

生产实践建议

1. 隔离 CGo 代码

将所有 CGo 代码集中在单独的包（如 internal/clib），向上层提供纯 Go 接口：

myproject/
├── cmd/
│   └── myapp/main.go
├── internal/
│   └── clib/
│       ├── clib.go      ← CGo 代码在这里
│       ├── wrapper.go   ← 纯 Go 封装
│       └── sqlite.h
└── pkg/
    └── database/
        └── db.go        ← 使用 internal/clib，上层不知道 CGo 存在

2. 始终测试 CGO_ENABLED=0 路径

在 CI 中同时测试两种构建：

# .github/workflows/ci.yml
- name: Test with CGo
  run: CGO_ENABLED=1 go test ./...

- name: Test without CGo
  run: CGO_ENABLED=0 go test ./...

3. 内存泄漏检测

使用 AddressSanitizer 和 Valgrind 检测 C 层的内存泄漏：

# 使用 AddressSanitizer（需要 gcc/clang 支持）
CGO_CFLAGS="-fsanitize=address -g" CGO_LDFLAGS="-fsanitize=address" \
    go test -count=1 ./...

4. 限制并发 CGo 调用

大量并发的 CGo 调用会创建大量 OS 线程（每个阻塞的 CGo 调用占用一个 M），可用信号量限制：

var cgoSem = make(chan struct{}, 16) // 最多 16 个并发 CGo 调用

func callCWithLimit(data []byte) {
    cgoSem <- struct{}{}
    defer func() { <-cgoSem }()
    C.process((*C.uchar)(unsafe.Pointer(&data[0])), C.int(len(data)))
}

小结

CGo 是一把双刃剑：

它能做的：调用几十年积累的 C 库、访问 OS 级 API、集成遗留系统——这些需求在真实工程中确实存在，无法回避。
它的代价：100ns/call 的边界开销、构建复杂性、交叉编译受限、GC 与 C 内存的双轨管理——这些代价都是实实在在的，不能视而不见。

在选择 CGo 之前，先问自己三个问题：

是否存在质量足够高的纯 Go 实现？（如 modernc/sqlite、cloudflare/circl）
能否用 purego 调用动态库，避免构建时的 C 编译器依赖？
能否用 wazero 加载 WASM 模块，保留跨平台能力？

只有当这三条路都行不通时，CGo 才是正确的答案。而当你确实使用 CGo 时，本章所讲的内存管理规则、回调安全、性能批处理、代码隔离原则，是避免掉入深坑的基本保障。

本章评分

4.5 / 5 (9 评分)

CGo：与 C 共舞的代价

CGo：与 C 共舞的代价

Level 1 · 你需要知道的

什么时候 CGo 是必须的

CGo 不是免费的：代价概览

Level 2 · 原理

CGo 调用的底层机制

goroutine 栈与 C 调用的完整图示

C 内存与 Go GC 的边界

CGo 对构建系统的影响

Level 3 · 代码实践

从 Go 调用 C 函数

将 Go 切片传递给 C

内存管理规则：C.malloc 与 C.free

CGO_ENABLED=0 的纯 Go 构建

从 C 回调 Go 函数

Level 4 · 进阶与边界

go-sqlite3 的内部机制

性能 Profiling：识别 CGo 开销

purego：不用 CGo 的动态库调用

WebAssembly 作为 CGo 替代方案

CGo 回调中的 panic 处理

生产实践建议

小结

💬 留言讨论