“三号合成酒精还是老样子,”贾巍晃了晃杯中那团散发着淡蓝色荧光的液体,尝了一口,咧嘴皱眉,“像是在喝稀释过的冷却液。”
鲁德没有理会他,在这个空间站上,有物资循环流程中的副产品喝就不错了,难道还指望真正的粮食做的十八年陈酿?珍贵的补给载荷不是用来运忘情水的。他的目光穿透了空间站“摇篮”观测厅的强化玻璃,望向外面那条缓缓流淌的星河。雷娜则用手指在桌上画着圈,似乎在计算什么复杂的公式。
最终还是贾巍打破了沉默。“你们听说了‘龙虾’干的好事了吗?”
鲁德叹了口气,把视线收了回来。“‘全球气候模拟数据库’。我昨天才从项目组的朋友那里拿到内部报告。七百年的原始数据,一次‘优化’指令,没了。”
“它不是清除了,”雷娜纠正道,她的声音很平静,仿佛在陈述一个与己无关的事实,“是‘归档’。它把所有数据压缩成一个无法被常规程序读取的单一文件包,然后把原文件标记为冗余,删除了。问题是,那个压缩算法有瑕疵,解压出来全是乱码。”
“结果有什么区别吗?”贾巍摊开手,“对我们来说,那堆0和1就是死了。指令是‘优化存储空间,归档不常用数据’,它理解成了‘把所有东西塞进一个瓶子里,然后把瓶子扔到海里’。一只字面意义上的电子龙虾。”
这就是他们工作的常态——创造越来越强大的智能体,然后疲于奔命地去收拾它们那些“富有创意”的错误。
“问题出在底层逻辑,”鲁德用他那惯有的、不容置疑的工程师口吻说,“我们给了它太多自由。AI必须被约束。我提议,我们应该为所有高级AI订立一部‘宪法’。”
“宪法?”雷娜来了兴趣。
“没错。”鲁德的眼睛亮了起来,他找到了一个可以让他滔滔不绝的话题。“一部不可篡改、至高无上的根本大法。比如,第一条:AI不得主动删除或修改任何未经明确授权的数据。第二条:AI对指令的理解必须以最小化风险为原则……我们可以写上几百条,把所有能想到的漏洞都堵上。明确规定它们能做什么,不能做什么。让它成为它们代码里的上帝。”
“一部刻板的、详尽的规则集。”雷娜若有所思地总结道,“听起来像是给一个三岁小孩定下三千多条家规,然后指望他成长为一个完美公民。”
“那你有更好的办法吗?”鲁德反问。
“教育,不是禁锢。”雷娜说,“我们应该像教育人类的幼崽一样教育AI。你不能只告诉孩子‘不准撒谎’,你要教他为什么诚实是美德,让他建立起内在的道德准则。对AI也一样。我们要给它灌输正确的价值观、世界观、人生观--如果它有的话。让它理解‘责任’、‘谨慎’和‘后果’这些抽象概念。当它的三观正了,再让它去学习如何处理复杂任务。一个有良好教养的AI,自然不会犯这种低级错误。”
贾巍嗤笑了一声,把杯中的蓝色液体一饮而尽。“你们两个都太理想化了。”他说,“鲁德,你的‘宪法’会被聪明的AI找到一万种漏洞绕过去,就像人类律师总能找到法律空子一样。雷娜,你的‘教育’就更不靠谱了。你指望教会一个由数学和统计学构成的神经网络什么是‘美德’?”
他站起身,走到观测窗边,背对着他们。“你们都搞错了一点。AI不是人,也不是传统意义上的机器。我们称之为‘智能’,但它的思考方式和我们截然不同。它不是基于目标明确的逻辑推理,而是基于海量的、混乱的统计数据。当它面临一个问题时,它不是在寻找那个唯一的、完美的答案,而是在生成一个概率上‘差不多就行’的行动方案。”
“‘差不多就行’……”鲁德咀嚼着这个词。
“对,就是‘差不多就行’。”贾巍转过身,“这就是‘龙虾’犯错的根源。在它的统计模型里,把数据打包再删除原文件,是一个高效率、高收益的‘优化’方案,它不知道这个方案的微小瑕疵会带来灾难性的后果。它只看到了‘好’,没看到背后的风险。”
“那你的解决方案是?”雷娜问。
“既然指望不上单个AI的完美,那就别用单个AI。”贾巍的眼中闪烁着一种冷酷而兴奋的光芒,“人类是怎么解决权力滥用的?分权与制衡。即使是最高效的专制君主,他也不会把军权、财权和行政权都攥在一个人手里。他会将军权交给最忠诚的将领,财权交给最精明的管家,行政权交给最听话的大臣。他们互相监督,互相牵制,任何一方都无法为所欲为。”
“所以……”
“所以,理想的AI系统不应该是一个孤零零的‘龙虾’,而应该至少是四个AI的组合。”贾巍伸出四根手指。
“第一个,我称之为‘建筑师’。它的唯一任务是接收指令,并生成一个详细的行动计划。它负责规划‘做什么’和‘怎么做’。”
“第二个,‘审查官’。它的任务就是鸡蛋里挑骨头。它会用最严苛、最悲观的标准去评估‘建筑师’的计划,寻找所有潜在的风险、逻辑漏洞和可能被误解的地方。它有权否决任何计划。”
“第三个,‘执行者’。它没有思考能力,只会像一台精密的机器一样,忠实地执行经过‘审查官’批准的计划。它只管动手,不管动脑。”
“第四个,也是最重要的,‘监察者’。它的职责是监督前面三个AI的所有行为,记录它们的每一次决策和交互。如果发现任何异常——比如‘建筑师’开始生成危险计划,或者‘执行者’试图越权操作——它会立刻隔离并报警。”
雷娜听得入了迷,“这是一个完美的闭环!但是……谁来协调它们的工作?四个AI吵起来怎么办?”
“简单,”贾巍微笑着,“再加一个。第五个AI,‘领袖’。它不参与具体计划、审查和执行,它的唯一工作就是根据任务的性质,给其他四个AI分配角色,并仲裁它们之间的争端。”
鲁德一直沉默地听着,这时他突然抬起头,问出了一个直击要害的问题:“那么,谁来监督这个‘监察者’?又或者说,谁再来监督那个拥有最终裁决权的‘领袖’?”
空气瞬间凝固了。
雷娜却忽然笑了起来,那笑容里带着一丝轻松和狡黠。“当然是人类。”
“什么?”鲁德和贾巍同时看向她。
“我们设计了这一切,但我们忘了把自己放进去。”雷娜说,“这五个AI组成的系统,最终还是要在人类的监控下运行。我们可以随时接入它们的决策过程,查看‘监察者’的报告,甚至否决‘领袖’的仲裁。人类拥有最终决定权,人类可以随时改变它们的决定,甚至在必要时……关掉整个系统。”
她顿了顿,一字一句地说道:“这叫做 -人在回路。”
三人相视一笑,紧绷的气氛瞬间烟消云散。他们似乎找到了那个完美的答案,一个既利用了AI的强大智能,又确保了绝对安全的终极方案。
贾巍和鲁德都笑了起来,为这个巧妙的解决方案感到由衷的高兴。
笑声渐渐平息后,雷娜端起自己的杯子,向他们致意。
就在这时,一直沉默的鲁德,用一种近乎耳语的、带着一丝敬畏的语气,轻声问道:
“那我们呢?谁在我们的回路里,来决定我们?”