在线测试

文/冯博杰

走进房间,映入眼帘的是雪白的墙壁、雪白的地板、雪白的屋顶。在这一团刺眼的白光中,一件涂满清漆的大家具赫然屹立。这件家具通体青灰,分上下两层,下层的桌子上装着“综合智力测试”用的电脑,上层是床。电脑旁边的柜子里放着考试期间的食物、水和其他必需品。青灰色占据了大半个房间,使得屋内刚可容人。肖翰挤进座椅,望着这狭小的空间,他联想起参观贡院时所见的“号房”,古代的考生也是委身于狭小的空间中考试的。

肖翰从鞋子里摸出了一个小盒子,里面装的是他此前费尽周折从一个搞生物硬件研发的朋友那弄来的DNA主机,这种计算机不仅在运算和内存上有优势,更关键的是可以顺利通过安检。他将主机和“综合智力测试”用的电脑链接好,然后从柜子里拿出了一杯热咖啡,爬到**,将咖啡浇到桌子顶端的摄像头上。这个摄像头是为了监控考试者的健康状态而设,但出于保险起见,还是小心为妙。

“普通高等学校博士生全国统一综合智力水平测试欢迎您!”电脑开机后自动播送。第一大项是客观题,类似于韦氏智商测试:给出一组图片,再给出多张类似的图片,让受试者从中选出最恰当的一张,或者给出一段文字,经过推理分析后,选择回答;抑或是进行一些数学运算或符号推理。屏幕上的问题出现后,主机马上做出精准的回答,页面转跳到下一题……看着主机蓄势待发的样子,肖翰心想:这只是开胃菜,大头在后面。

“随着专家系统的发展,人工智能算法在诸如医疗诊断、法庭辩护、经济分析、保险信贷等诸多领域几乎完全取代人类。但在以学习能力为主的通用智能领域,计算机则暴露出明显的不足。为了促进人工智能学科的良性发展,构建和谐的人际关系,提高高素质人才的综合智力水平成为当务之急。因此,教育部决定在博士、硕士研究生的招生中设立‘综合智力水平测试’,从明年开始试行……”看着台上领导慢条斯理地朗读文件,肖翰嘴角微微上扬,笑道:“还是领导智能,什么点子都能想出来!”

旁边的同学一边看手机一边说:“管他呢,反正咱们都被推免博士了。”

开完会出来,大家闲聊起来,肖翰突然问:“你们觉得机器真的可以测试出人的智商吗?”

“当然可以,我们就是干这个的,在认知测试软件的基础上升一下级就行了。”马上传来一个回答。

“我不是问的技术层面。”肖翰追问道,“假设一个机器没有通用智能,那么它能测试出人类的综合智力吗?反之如果机器有了通用智能,搞这种测试还有什么意义呢?”

另一个同学说:“别想复杂了,我估计这和智商测试没什么两样,经过训练之后都能过关。”

“从本质上讲这是学历贬值造成的,所以要提高门槛,不过这和我们无关。”旁边一个搞经济分析的同学说道。之后几人就转移到了其他话题上。

测试进入第二项,人机竞赛环节。此环节一共设计了六个智力测试游戏,第一个最简单,就是博弈论中硬币游戏的翻版,之后难度逐渐增加,但总之也逃不出博弈论和概率论的范围。肖翰将主机暂停,亲自上阵答题。这样做是怕主机答题速度太快露出破绽,被反作弊功能侦测到,但更主要是想试试身手。对于研究人工智能的肖翰来说,概率论、博弈论都是基本功。他相信,凭自己的实力,即使不用主机作弊也完全可以通过“综合智力测试”,但他必须这么做。这关系到他追求真理的态度和不怕权威的科学精神。最后一题是一个棋类游戏,肖翰停了下来,开启主机,自动答题。望着屏幕上两个程序你来我往,肖翰回忆起了一年多前的那个夜晚。

火车在寒冷的黑暗中穿行,挤在硬座车厢内的肖翰正在缓慢地敲着手机屏幕。这次放假回家他走得急,忘了带书,为了消磨时光就和手机下棋。夜已经深了,周围的乘客昏昏欲睡,肖翰也困意十足。他已经下了两三个小时,机器的招数都烂熟于心,开头的几步闭着眼睛都能下出来。正在无聊至极之时,他突然看到附近有个乘客正在读茨威格的小说《象棋的故事》,他盯着封面上的棋子,突然双眼一亮,喃喃自语起来:“B博士是自己和自己下棋,那……”想到这,肖翰抓起手机,将象棋里的红黑两方都设置成水平相同的机器。当头炮,马来跳……红黑双方立刻相互厮杀在一起。看着这手机有条不紊地自己和自己下棋,肖翰灵机一动,之后陷入沉思。

“下车了!终点站到了!”听到列车员带着家乡口音的叫喊,肖翰直起身来,踉跄地站起身来,拖着书包摇晃地走出车厢。一路上他仍在思考昨天晚上的那个问题,在思索中来到家门前。

马上到了春节,家里的亲戚一起聚餐,酒足饭饱后肖翰继续低头沉思,而其他人在七嘴八舌的闲聊。闲聊间突然冒出一句:“瞧瞧你哥,人家博士都推免了,你考研考了两年都没考上,今年正赶上综合智力测试’我看你又够呛!”肖翰抬起头来,原来是姨妈在教育表弟。

姨妈又对肖翰解释道:“你表弟他学习不努力,今年终于过了,却又赶上了那个什么测试。第一年我们都摸不清情况,就找熟人帮他报了个培训班,也不知道靠不靠谱。”对面的表弟低头玩着手机一言不发。

姨妈又说:“你是搞智能的,找机会帮他补补。”

“其实我也不太了解,多做一些逻辑类、概率类的题目吧。”肖翰应付道。

饭后,肖翰和表弟交谈。肖翰问了许多关于测试和培训班的问题,表弟盯着手机爱搭不理。看着表弟慵懒地划着屏幕,肖翰停止了问话。

表弟性情开朗,自幼热爱文学,和肖翰很谈得来,可这一次却很少说话,把头埋在手机里。

表弟突然转过头来问:“你觉得机器能有和人类一样的智能吗?”

肖翰说:“可以有,并且我正是为此而努力。”

“那机器能写出《红楼梦》吗?”表弟追问。

肖翰答:“不能。但这和智力水平无关,仅仅是因为机器没有那段生活经历。”

“那你的意思是智能可以和生活经历无关而仅仅是一种能力?”

“是的。确切地说是一种学习推理能力。”

“机器也可以有智能?”

“没错!”肖翰不假思索地答道。

“我看这个测试就是把人变成机器。我是搞文学的,世事洞明才是学问。估计等我通过了这个测试,人就变成范进了。”

“行了,别发牢骚了,有这功夫多做两道题。”姨妈斥责道。

“把人变机器?”肖翰对这句话产生了兴趣,“你能详细说说吗?”

“别听他瞎说,他就是不努力。”姨妈补充说。

从饭店出来,大家一起去玩密室逃亡。表弟对此兴致勃勃,连连过关斩将,肖翰则对这些不感兴趣。

在他看来,这无非是把钥匙藏在某个地方再故意留下线索,或是通过反射镜偷看密码之类的小把戏。一家人在一起娱乐还行,益智嘛就谈不上。

表弟又过了一关,大家来到一个新的房间里,这次的游戏规则是通过问门外两个人指定的问题判断出钥匙在谁那。

肖翰一下子冲向前去,说:“这一关好过,让我来!”

“何以见得?”表弟问。

“这其实和图灵测试的原理类似,只不过图灵测试是在找谁是机器。判断的方法有很多,最简单的就是从表述或对方的反应中找到不合常理的地方。机器对语境的把握能力较弱,因此目前人类还是基本能通过图灵测试判断……”肖翰突然发觉早已没人听他讲科普,大家都挤在门前问问题,于是他也加入了进去。

那是多么快乐的时光啊!躺在**肖翰心想,该回家一趟了,为了准备这个测试,整个寒假都待在学校写代码。不过还好,明天测试就结束了。

第二天,测试进入第三大项,给出一个其他领域的问题,在八个小时的时间内,受试者要通过互联网搜集资料调查研究,并写出一篇小论文。肖翰抽到的题目是化学方面的,这是他最不擅长的学科,中学时代的化学知识他早就忘光了,不过有主机在,一切都不是问题。这一项内容考察的是考生的学习和信息收集整理能力,在设计专家系统时,机器学习和数据分析也是重中之重。“他们果然是拿测试机器的方式来测试人。”肖翰不由得佩服起表弟来。凭借强大的计算速度,主机已经收集到了足够多的论文资料和实验数据并开始分析。肖翰敲着电脑,摇摇头,叹口气道:“那篇论文啊!”

火车在铁路上飞驰,车窗外的山川从眼前飞过,肖翰时而远眺,时而静思,时而又奋笔疾书。回到学校后,他买了一箱方便面,躲进了寝室。三个星期后,蓬头垢面的他将一份论文投递给了本校学报编辑部,之后去理发。

数月之后的一天,同样是在这家理发店理发的他突然接到导师的电话:“你发表的论文我看了,有一些问题,你抓紧时间找我一趟。”

屋内只有两个人,沉默持续了很久。

导师低头翻看着论文,看了足足二十分钟,抬起头来冲着肖翰说:“你这个想法很有意思,但是问题很大。发表前怎么也不给我看一下,现在产生了一些影响,有点麻烦。”

“什么影响?有什么麻烦?”肖翰问。

导师晃晃脑袋,说:“咱们还是从文章开始吧。你先整体论述一下。”

“您认为智能能否通过‘综合智力测试’或其他方式表现出来,并被量化?”肖翰问。

导师说:“从理论上讲完全可以。只是目前我们的技术水平达不到,才使得实际操作中有一些误差。”

肖翰又说:“假设在理想状态下,智能就是一套可以执行的程序。操作这一套程序的既可以是人也可以是机器,但无论是操作者是谁都不影响这套程序本身。”

导师点点头。“那么,第一个问题出现了:如果我用一个计算程序来替代人,在考试中作弊,请问机器能够识别出来吗?”

“‘综合智力测试’是由国家主办的,调用了大量的超级计算机,并且设有验证和检测系统,普通的计算机很难冒充人作弊。”

“那新型计算机呢?如生物计算机、光子计算机等。”肖翰追问道。

“首先这些机器还处在实验状态,现实中不知道效果如何。再者,成本高昂。有这个技术水平和资源的人都不用担心那个测试。并且,考试时肯定还有防作弊检查。”导师顿了顿,补充道,“这些都不是你该考虑的问题。”

“当然!”肖翰马上接到,“我们只讨论理想状态下。受试者执行一套程序,而用于判定这套程序有无智能的程序是否有智能呢?”

“这个嘛,不好说。”导师一时语塞,他拿起茶杯喝了几口水,盖上盖子,又拿起了那篇论文,快速翻了几页,又拿起茶杯喝了几口水说,“你的意思是逆图灵测试?”

“对!”肖翰大声说道,“在传统的图灵测试中,有一个默认的前提,即判定者人类是有智能的。而能骗过判定者的机器,才是有智能的,即让人类误以为此机器是人类。这就存在两种可能:一是判定者和通过测试的受试者都有智能;二是判定者和受试者都没有智能。整个测试无非就是一个寻找同类的算法罢了。虽然这咋一听感觉有违常识,可事实就是如此。图灵测试里的判定者是人类,任何人也不会跳出来否定人类本身,所以才使得大家忽略了第二种可能。但如果测试者是机器呢?机器按照它的标准执行,判定出来能通过测试的当然是机器。而人类只要把自己伪装成机器,就能通过测试。所以,整个测试就是机器的自娱自乐,唯一的功效就是把人类变成机器。至于培养综合智能嘛,与此毫不相干。”论证完毕后肖翰喝了一口水,靠在椅子里。

导师沉默片刻,问:“可测试系统是人设计的,标准也是人定的。”

肖翰忽地站起身来,掏出手机打开象棋游戏,设置成机器对机器,程序马上开始自动运行了起来。

肖翰指着手机问:“请问这款象棋软件有没有智能?这是您上课讲过的。”

“没有。”导师答。

“那象棋的游戏规则是否是人发明的?”

“是的。”

“那这款软件也是人设计的吧!”

导师不语。这时棋局结束了,红方战胜了黑方。

肖翰趁机说:“我宣布:红方通过了象棋测试,拥有智能!”之后把目光转向导师。

导师沉默了良久,说:“即使你的论证是正确的,但还存在第一种可能性。科学是严谨的,没有百分之百的把握还是不要轻易发表观点。”

“没错,这只是一种猜想。但对于科学,怀疑精神更重要。科学当然应该严谨,在没有百分之百把握的情况下就进行‘综合智力测试’,是谁不严谨,是谁不科学?”肖翰气冲牛斗。

“做研究不要有所针对!”导师厉色道,“国家能举行‘综合智力测试’就一定有绝对的把握。怀疑是好的,但不要炒作成热点事件。现在很多媒体都报道了,说什么智能专业研究生撰文批判‘综合智力测试’。闹得圈内外沸沸扬扬,前几天还有记者来咱们学院要求采访你。领导很重视,才让我来找你谈话。”

“怎么会有这种事?”肖翰惊得语无伦次,“我绝对不是为了哗众取宠!只是觉得这个想法很有意思,想和更多的研究者分享,就发表了那篇文章。媒体怎么会……”

导师安慰肖翰说:“没事,我知道你不是那样的人。”

停了几秒后,导师骂道:“现在的社交媒体,消息比间谍都灵通。什么事经他们一炒作,准没有好结果。”

“那这件事怎么处理?”肖翰小心地问。

“冷处理呗。等过了这一段时间,媒体的兴趣点变了,这事就过去了。”

“那我呢?”肖翰接着问。

“推免博士的名额我尽量帮你争取。不过要做好最坏的打算。”这时,导师的手机响了,接完电话导师接着说,“院领导要我过去一趟,今天就到这吧。”临走前导师又安慰肖翰道:“相信自己的实力,考博士也不难。”面对空****的房间,雪白的墙壁,肖翰拿起那篇论文,默默地读了起来。

再过几个小时,一切都结束了。主机仍在全力写论文,肖翰爬到**休息着。这两天下来,一切都在预料之中。根据主机和测试软件的反应,肖翰觉得这两个机器表现得还不错,机器也并非没有智能,只是这种测试方式是错误的。并且人类的智能是自然演化出来的,而不是人为训练出来的,搞这种测试只能拔苗助长。这次不仅是对他的测试,更是他对这套测试方法的测试,后者对他来说意义非凡。虽然此次证伪仅有他一个人知道,但这已经证明了他敏锐的洞见和挑战权威的勇气。

床下发出了“滴滴”的提示音,测试结束了,肖翰从**直起身来。突然床下又传出几声急促刺耳的短声,电脑发出了提示音:“反作弊系统因发现您上网时的浏览习惯异常,怀疑有机器作弊。故此增添一个人工认证环节,请您不要遮挡摄像头。”听到此处,肖翰立刻从**跳了起来,慌乱间他脑袋撞到了屋顶,身子反弹了下去。肖翰全身腾空,他的脚出于本能地向前一蹬,但却不知道踩到了什么,整个人向前滑去。紧接着是一下猛烈的撞击,传来了木头的碎裂声和脊柱的咔嚓声。一阵剧痛冲上了肖翰的头顶,使他几乎昏厥。但强忍了下来,发现自己卡在椅子里,而椅子背已经完全被砸碎了。他只微微移动一下身子,一阵剧痛便涌上心头,并伴随着一阵咔咔声肖翰心想,脊柱已经断裂了,需要马上救助,可唯一与外界的联系—监控考生健康状况的摄像头已经被他破坏了。

这时电脑屏幕上已经重复好几次问话:“请回答!为什么要遮挡摄像头?请回答!”肖翰眼前一亮,强忍剧痛抬起胳膊,指尖刚刚可以触到键盘。他拼尽全力,在键盘上打字:“速来,救我!”对方没有回答。

肖翰再次打到:“速来,救我!”……重复了五六遍之后,电脑上终于传来回应:“你是人还是机器?”

“我是人!我是人!我是人!”肖翰疯狂地敲打着键盘。

“那你为什么遮挡摄像头?你是在故意作弊吗?”

看到这一句,肖翰心中波翻浪涌,无比气恼,他答道:“先救我再说,我受伤了。”

不料对方说:“摄像头就是为了检测你的健康情况,你故意遮挡摄像头,又说你受伤了,究竟意思啊?”

一股热血涌向心口,肖翰强压怒火,敲着键盘:“我从**摔下来了,碰到了摄像头,求求你,来个人。”

“那好,假使你是人,你怎么证明你受伤了?”

肖翰再也忍不住了,破口大骂:“别扯皮了!有这闲工夫,医疗队早就来了!”

不料对方火气更大:“你作弊还骂人。我就扯皮了,这是我的工作。你个机器也够智能的,还假装受伤。告诉你,这种小把戏我见得多了。”

肖翰无奈地在键盘上敲道:“我真是人,真受伤了,求求你好吧!”对方不再回应。无论肖翰怎么重复,电脑屏幕依然沉静如水。

突然,电脑屏幕变得漆黑一团,测试结束。

又是一阵剧痛袭来,肖翰两眼一黑,他努力地睁开双眼,可眼前也还是黑的。他闭上眼睛养精蓄锐,几秒钟之后再次睁眼,这次他看到了电脑屏幕,仍是一团漆黑。之后漆黑不断放大,成为无边无际的黑暗。

黑暗中,肖翰的疼痛反而减小了,一个奇妙的想法偏偏在这时冒了出来:“机器会昏迷吗?这种状态是可判定的吗?”忽然,他又对刚才的想法感到可笑,也对自己的行为感到可笑,更对这段经历感到可笑。“判定”本身就是荒谬的,是自己和自己做游戏而已。

在笑声中,他睡了过去。

雪亮的强光刺痛了他的双眼,在朦胧中肖翰看到导师站在床边。看见肖翰醒了,导师说:“已经做过手术了,没有什么大问题。你怎么搞的发生这种意外,偏巧摄像头还坏了。不幸中的万幸,‘综合智力测试’系统分析你的对话记录和打字速度,才发现了问题。还好人没大碍……”