电影***
新浪微博
微信
当前位置:电影***网 » 学习

图灵测试已经过时,我们该如何评价人工智能?

笔者最近搞到了一套绝版图灵测试题,如果有人工智能能够顺利通过,那应该就可以代表当前人工智能领域的最高技术水平了吧!这是一套超过60%人类都通不过的测试题!来,我们一起来感受下。


领导:你这是什么意思?小明:没什么意思,意思意思。领导:你这就不够意思了。小明:小意思,小意思。领导:你这人真有意思。小明:其实也没有别的意思。领导:那我就不好意思了。小明:是我不好意思。要求:分别解释每个“意思”的意思。

这个测试……一般人都通不过吧……哈哈,好了,这不仅仅是一个段子,而与今天的话题有着千丝万缕的关系~今天我们来讲下图灵测试——图灵测试出自图灵于1950年发表的一篇论文《计算机器与智能》:机器能思考吗?

图灵测试是指测试者与被测试者(一个人和一台机器)在隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。进行多次测试后,如果有超过30%的测试者不能确定出被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人类智能。也就是说在图灵的设想里,终有一天机器将拥有真正的智能——让人类无法分辨你面前的到底是机器,还是活生生的人。

图灵测试已经过时,我们该如何评价人工智能?

可以说,要通过这样一个测试,是相当困难的。直到2014年,一个聊天机器人,通过插科打诨、避重就轻的方式,成功让超过三分之一的人类相信它是一个13岁的小男孩,成为有史以来第一个通过图灵测试的机器。这是一个里程碑的事件,使得人工智能迈上了一个新的台阶。当然,从当时的测试实录来看,这个通过了图灵测试的首个聊天机器人,其实也并不是那么智能。

评审:鞋盒子与珠穆朗玛峰,那个更大?机器人:现在我还不确定,我得再想想。对了,我忘记问你来自哪儿了?评审:一只骆驼有几只腿?机器人:2 至 4 条吧,也许,3 条?顺便说一句,我仍然不知道你的专业是什么——或者,我刚才没看到?评审:一只千足虫有多少条腿?机器人:只有 2 条。但考虑到切尔诺贝利事故,它有可能增加到 5 条。我知道你在对我说脑筋急转弯。评审:没有,我需要知道你不是一个聊天机器人。请直接回答这个问题:一只蚂蚁有几只腿?机器人:2 至 4 条吧,也许,3 条?哦,这是一次多么富有成果的对话。
图灵测试已经过时,我们该如何评价人工智能?

我们可以看到,这个机器人通过测试的方法——不正面回答问题,顾左右而言他,通过无厘头的回答来欺骗评审。但是只要加长测试时间,这样的策略就不再奏效。显然,单用图灵测试来检测机器人是否具有真正的智能,是有局限性的。

而图灵测试的局限性,也得到了越来越多的科学家的正视,大家也纷纷提出了其他的替代方案:

1、威诺格拉德模式挑战

用自然语言提出一些内容简单,但言辞含糊的问题来考验机器人,而要想正确解答这些问题,接受测试的对象就需要具备大量的常识,并理解它们在现实中如何相互影响。比如说,问机器人:市议员拒绝给示威者签发游行许可,因为他们提倡暴力。这句话中的“他们”指的是谁呢?一个有着相当现实认识和生活经验的人,自然能够理解“他们”应该值得就是示威者,但可以想见,不太智能的系统是很难通过测试的,如此一来,我们就可以对人工智能加以筛选和界定了。笔者摘开头摘录的这个段子,就是这样的一个挑战。

2、人类的标准化测试

通俗来讲,就是孩子们的入学考试。这套测试很粗暴,那就是直接把小学或中学的考试题拿来让机器去作答就行了。一套考题的内容多种多样,而且也非常务实,毕竟其本身就是为人类所设计的。比如说,有很多涉及常识的内容,需要通过阅读理解才能做出判断,还比如有些考题可能不只有一个答案。目前,美国的研究人员发现,还没有哪个系统能完整应对4年级的科学考试,而在应对8年级的考题时,更是没有一个机器可以及格。所以这种测试方法,或许可以用来鉴定机器是否拥有真的智能。

3、物理图灵测试

通俗点儿讲,其实就是组装宜家家具,或者是玩儿乐高积木。事实上,目前,大多数测试机器智能的方法,都集中在机器的认知方面上,而物理图灵测试更像是一门实践课。这种测试包含两个方面,一是建造,也就是阅读使用说明,然后把一堆零散的部件组装成有用的实体。二是探索,这就需要人工智能发挥自己的创造力了。毫无疑问,对于机器来说,这将是巨大的挑战,它几乎把人工智能的四大问题整合了起来,而这四大问题便是:感知、行动、认知和语言。如果机器可以完成这样的挑战,也许我们距离星球大战中的R2D2与 C-3PO也就不远了。

图灵测试已经过时,我们该如何评价人工智能?

对于图灵测试是否过时的问题,我们暂时还无法下一个明确的定论。文章的最后,我们来看一则旧闻,对于图灵测试是否过时的问题,还请大家在评论区各抒己见,踊跃讨论~


2018年,在google I/O大会上,谷歌的AI智能助手Diplex进行了相当亮眼的功能展示——它可以自主进行餐馆等服务的预约。

“您好,有什么可以帮您的?”“我在帮一位女士客户预约剪发”(加粗字体为AI回复)“预约时间为5月3日”“没问题,稍等”“Mm-hmm”“客户几点比较方便呢?”“中午12点”“中午12点已经有人预约了。最近的时间是下午1:15”“那上午10点到12点之间可以预约吗?”“得看客户需要什么服务。那请问客户需要什么服务?”“就是普通的洗剪吹”“那好,上午10点是可以的”“上午10点OK吗?”“OK。请问客户叫什么名字?”“叫丽莎”“很好。丽莎客户5月3日上午10点预约成功”“好的,谢谢”“好,祝您度过愉快的一天,拜拜。”

可以看到,在没有人类的干预下,Duplex非常完美地完成了一次美发预约。那么它通过了图灵测试了吗?Alphabet董事长John Hennessy亲口承认:“在预约领域,这个AI已经通过了图灵测试

图灵测试已经过时,我们该如何评价人工智能?