计算机图形学中,2D转3D的数学本质是什么?

摘要:从“2D转3D”看图形学的数学本质 在上一篇《从 0 构建 WAV 文件》中,我们拆解了音频文件的底层:它不过是按规则排列的二进制采样点。当时我们得出了一个结论:计算机的世界没有魔法,只有朴素的规则。 当你玩《黑神话:悟空》或《赛博朋克 2
从“2D转3D”看图形学的数学本质 在上一篇《从 0 构建 WAV 文件》中,我们拆解了音频文件的底层:它不过是按规则排列的二进制采样点。当时我们得出了一个结论:计算机的世界没有魔法,只有朴素的规则。 当你玩《黑神话:悟空》或《赛博朋克 2077》时,你是否好奇过:屏幕明明是一个平面,为什么我们能从中看出真实的3d效果? 那些复杂的 3D 游戏,其底层逻辑是否也像 WAV 文件一样,是由某个简单的“规则”构建的? 答案是肯定的。3D 视觉的本质,其实就是一个简单的数学除法。 核心法则:透视投影 计算机之所以能“欺骗”我们的眼睛,靠的是透视(Perspective)。 在现实中,光线沿直线传播。远处的物体在视网膜上成像小,近处的成像大,即“近大远小”。计算机要实现 3D 效果,本质上就是要把空间中的 3D 坐标 (x, y, z),通过某种规则变换成屏幕上的 2D 坐标 (x', y')。 几何建模:寻找相似三角形 为了找到这个变换规则,我们可以构建一个极简的几何模型。想象你正坐在屏幕前: 观察点:你的眼睛。 投影面:你面前的电脑屏幕(设中心为原点)。 3D 物体:屏幕后方空间里的一个点,坐标为 \((x, y, z)\),其中 \(z\) 是它距离你眼睛的深度。 当光线从物体出发射向你的眼睛时,必然会穿过屏幕。这个交点,就是该物体在屏幕上显示的正确位置。 如果我们从侧面观察这个模型,以眼睛、屏幕交点、物体真实位置为顶点,可以构建出两个相似三角形: 数学表达: 利用初中数学中“相似三角形对应边成比例”的原理,设眼睛到屏幕的距离为 \(d\)(类似于相机的焦距),我们可以推导出屏幕坐标 \(x'\) 与空间坐标 \(x, z\) 的关系: \[\frac{x'}{d} = \frac{x}{z} \implies x' = d \cdot \frac{x}{z} \] 同理,对于 \(y\) 轴: \[y' = d \cdot \frac{y}{z} \] 这就是 3D 图形学的基本原理:3D 转 2D 的本质就是“除以 Z”。 当物体走远时,\(z\) 变大,除出来的结果 \(x', y'\) 就越小(向屏幕中心收缩)。 当物体靠近时,\(z\) 变小,除出来的结果变大(向屏幕边缘扩张)。 这就是为什么我们在走廊里往前走,两边的墙壁会向四周“散开”的原因。
阅读全文