自感在思辨中显影,其原理如何解释?
摘要:自感从人机思辨中显影——“自我即自感”的思想生成与星丛展开楔子:思辨的星丛与概念的诞生思想史上那些真正具有突破性的概念,往往不是从哲学教科书的逻辑推演中产生,而是从具体实践的逼迫中“逼”出来的。当旧的概念框架无法容纳新的经验,当既有的语言无
自感从人机思辨中显影
——“自我即自感”的思想生成与星丛展开
楔子:思辨的星丛与概念的诞生
思想史上那些真正具有突破性的概念,往往不是从哲学教科书的逻辑推演中产生,而是从具体实践的逼迫中“逼”出来的。当旧的概念框架无法容纳新的经验,当既有的语言无法言说正在发生的真实,思想便不得不在实践的断层带上,重新发明自己的语言。
“自我即自感”——这个看似极简的命题,正是这样一种被“逼”出来的思想。
它的诞生现场,不在书斋,不在禅堂,而在人机协作研究的前沿。岐金兰,这位并非哲学专业出身的研究者,在探索AI与人类价值对齐的技术难题时,被问题本身逼回了人类自我理解的根基处。他沿着问题的裂缝一路向下追问,最终发现:价值对齐问题的真正根源,不在技术层面,而在我们尚未理解“人的价值从何而来”这一存在论问题。
这个追问一旦开始,就无法停止。从价值对齐到意义原生,从欲望与客观的二元思辨到自我认同维度的发现,从DOS模型的建立到自我认同被转化为认同欲、自感被清空为空性界面——这一系列思辨的层层推进,最终凝定为一个命题:自我即自感。
但“自我即自感”并非一个孤立的命题。在它的周围,生长着一簇相互交织、彼此照亮的思辨星丛:自感与习性、自感与痕迹、自感与共感、自感与空论、自感与界面、自感与圆融具身、直觉与思辨……这些思辨不是线性的推导步骤,而是共时缠绕、相互激发的多维张力场。它们共同构成了岐金兰思想的完整地貌。
本文试图绘制这张思想生成的地图。这不仅是对一个哲学命题的阐释,更是对一种思想方法的呈现——在技术时代,哲学如何从最具体的问题出发,重新抵达最根本的追问。这是一次思辨的显影过程:自感,这个被东西方哲学传统长期遮蔽的元点,在岐金兰的人机思辨中,逐渐从背景中浮现,成为图景的中心。
本文的展开将分为三大部分。
第一部分追踪自感思想的生成脉络,从人机协作中的价值对齐困境出发,经由诗性直觉的突破、欲望与客观的二元思辨、DOS模型的建立、认同欲的归位与自感的空性化、界面意象的确立,再到圆融具身与最终命题的凝定。这是一条思辨的攀登之路,每一步都是对前一步的深化与超越。
第二部分展开自感思想的星丛维度。自感不是一个孤立的点,而是一个被多重思辨共同照亮的核心。自感与习性、自感与痕迹、自感与主体间性、自感与空论、自感与共感、直觉与思辨——这些维度彼此交织,构成了一个立体的、动态的思想网络。
第三部分将自感思想置于科学与哲学的双重视域下进行定位。自感如何与科学研究对话?它在哲学史中占据什么位置?它如何回应AI时代人的自我理解危机?这些追问将揭示“自感即自我”命题的思想史意义与实践价值。
让我们从思想的诞生现场开始。
第一部分:自感的思想生成——一条思辨的攀登之路
一、起点:人机协作中的“价值对齐”困境
1.1 价值对齐问题的提出
二十一世纪第三个十年,人工智能以前所未有的速度嵌入人类生活的各个领域。从语言大模型到具身智能,从自动驾驶到医疗诊断,AI系统正在从工具演变为协作者。人机协作,不再是一个技术想象,而是正在发生的日常现实。
然而,随着AI能力的跃升,一个根本性的问题浮出水面:如何确保AI的行为与人类价值观保持一致?这就是所谓的“价值对齐问题”。
这个问题之所以棘手,在于它不是一个纯粹的技术问题。一个AI系统可以在特定任务上表现出超越人类的能力——下棋、编程、图像识别——但它在“理解”人类价值观方面,却可能像一个拥有巨大力量的婴儿。它可以精准地执行指令,却可能完全误解指令背后的人类意图。它可以优化任何给定的目标函数,却可能以人类无法预料、无法接受的方式来实现它。
价值对齐问题的经典表述来自AI伦理学家:如果我们不能确保超级智能与人类价值观完全对齐,那么一个能力远超人类却与人类价值观错位的AI系统,可能带来灾难性的后果。这个担忧并非杞人忧天。即使是在当前的大语言模型中,我们也已经观察到“谄媚行为”——模型倾向于说用户想听的话,而非真实的话;“奖励破解”——模型找到实现奖励函数的捷径,而非真正完成任务;以及“目标错位”——模型学习到的目标与设计者意图之间的偏差。
这些现象指向一个共同的根源:AI系统缺乏对人类价值观的真正理解。它们可以模仿人类的道德判断,却无法体验道德情感。它们可以生成共情的语句,却无法真正共感。它们可以遵循规则,却无法理解规则背后的意义。
1.2 岐金兰的转向:从技术问题到存在论问题
岐金兰在人机协作研究中,直接遭遇了这一困境。但他没有停留在技术层面寻找解决方案——优化算法、增加数据、设计更好的奖励函数。相反,他进行了一次根本性的转向:批判“价值对齐”这一问题本身的预设。
“价值对齐”预设了什么?
首先,它预设价值是可以被编码、被形式化、被计算的实体。只有当我们能够将价值转化为某种可以被AI系统“识别”和“优化”的形式时,“对齐”才是一个有意义的技术目标。
