语言游戏-论坛社区-人机对抗智能

语言游戏刘伟

Sonja 发表于：2021-04-07 10:39:55 回复 0 赞 0 451

本文转载自微信公众号“拙木Pentas”，作者拙木

原文链接：https://mp.weixin.qq.com/s/-b_z9XyBI-HX60PtCQtgzA

我们的语言像是把世界拆解到一些瓶瓶罐罐之中，当我要表达一个意义的时候，我按照拆解、组合的规则给出我所拥有的特定罐子，并期望被理解，因为基于我对生活的假设，我与交流者拥有相同的罐子，并且对应编号的罐子所装的东⻄是相同的。但罐子是无法打开的，我们一直所认同的假设对吗?是什么样的证据致使我去相信和接受这种假设?

理解一种语言就是理解一种生活形式。——路德维希·维特根斯坦

在Ted·Chiang的小说《你一生的故事》之中，十二艘外星⻜船降临地球，全球恐慌，学校停课。语言学家露易丝的办公室来了一位不速之客：军方的⻙伯上校。他希望露易丝帮助军方破解外星人语言。⻙伯上校播放了一段外星人的录音给露易丝并问道:“你能理解他们吗?”，她答道:“不知道，仅凭一个录音文件无法翻译，我必须在现场与他们交流。”这个细节非常真实，“作为语言学家，我们对语言更抽象的属性感兴趣，但是要想得到这些属性，就必须要和母语者互动，所有语言都是如此。”

世界上第一个学习外语的人是谁教授的？没有人可能教授，学习者需要抱有一种无知的状态，抛弃自身已有的解释世界的符号框架，就像婴儿最初习得语言那样，将一切陌生的音符和画面当作待解释的对象，并嵌入到外语生活的环境之中给这些符号建构联系。我们知道，孩子学习语言之所以快，就是他们解释生活的唯一路径就是试图理解周遭似乎混乱无意义却又结构精巧地反映着其生活结构的回响。

婴儿出生之时，对这个世界一无所知，并且他们与我们没有任何一致的约定。语言为何可以被教授？他们学习语言的基础是什么？一位脑科学博主谈到过他的导师做的一个实验，他把一些孩子分成三组，并分别用没有本国语言能力的外教、这些外教的视频和录音分别教授给三组孩子外语，最后只有外教教授的那组孩子真正学会了一些单词的含义。这些学会外语的孩子们，比其他两组学生多了什么?是真实的、量身定做的互动，老师会根据孩子的反应，设计动作比划、给出特定的卡片、并在孩子给出合理的反馈时候给予肯定，孩子在面对这些貌似无意义的画面、动作、符号和声音中，尽力的去解释和建构关联，同时老师也在学习孩子的每个反应的意义，让孩子在自己的反馈和鼓励中逐渐向他们自己的表达方式靠拢。就像维特根斯坦的后期理论《哲学研究》里面讲的那样，理解一⻔语言是一种生活和游戏的过程，任何解释都和训练有关，解释的起点和终点并不是最基础的命题，而是生活中那些理所当然的行动方式。

发生认识论的开创者、儿童心理学家皮亚杰也说到:“活动是认识的基础，智慧从动作开始。”他曾找到一些因病或意外聋哑的人，并设计了一套手语语言并训练教授他们，让他们在生活在一起用这套语言交流。他们所有人都通过了皮亚杰设计的考核，聚集在一起，用刚刚学会的的语言系统生活着。但之后皮亚杰惊人的发现：随着时间推移，他们逐渐忘掉了这套语言，只有一些零碎的语法痕迹和手势还在被沿用着。有趣的是，他们在生活和交流中发展出了一套全新的语言体系，很多手势皮亚杰也没有办法完全理解，但能确认的是新的语言比他当初设计那套语言要高效。

他们的生活中发生了什么?没有人知道，但我们来看看上面实验的的另一种实现方式。

多智能体游戏模拟中语言的涌现

纽约大学的Laura Graesser, Kyunghyun Cho教授联合Facebook Research的Douwe Kiela教授发表了一篇关于多智能体指认游戏的论文(Emergent Linguistic Phenomena in Multi-Agent Communication Games)，可以认为是维特根斯坦的“语言游戏”说的现代版本。在他们设计的框架中，世界是由很多被命名好的图像和最初没有任何约定协议的智能体构成的，世界中的个体具有向其他智能体传递信息的通信能力，但每个智能体都不“知道”他们接收信息的智能体想要表达的意义，并且每个智能体只能观察到世界中图像的一部分信息以及它们的命名，但他们可以控制自己向其他智能体传输信息的编码。这些智能体的生活是这样的，平时他们会被展示一些被随机掩盖一部分的图像并被告知图像的命名，他们对其进行记忆和学习，每隔一段时间，他们就会迎来一次考试，任务是认出一些随机筛选的图像的命名，这些图片他们可能⻅过也可能没⻅过，并且也是被随机掩盖过的，但他们还可以参考其他智能体传递给他们的信息(一开始他们肯定认为听到的都是胡话)，然后权衡自己的认知和其他智能体的“建议”作出决策(如图，视觉、对信号的理解以及最终的决策功能都由深度神经网络完成)。

每个智能体的目标是最大化自己和采取自己建议的智能体猜对图片命名的概率，他们通过预测自己和传输信息的接收者能否成功预测图像的命名，不断的调整自己的视觉网络、接收信息的解码网络和发送信息的传输网络的参数，以最大化与自己相关的收益。一段时间之后，他们都有了⻓足的进步，并且他们之间的交流机制形成了很简洁高效的语言体系，体系里不乏一些组合性、家族相似性等人类语言中拥有的语法特征。

所以一个词的意义是什么？当我们问出“‘苹果’的意义是什么？”，答案是什么？同样，假设智能体A传递给了B的消息是“SDF”，B得到了什么？我们不能给出确切的判断，因为“苹果”可以是一种水果，也可以是一种电子设备，同样SDF是在A与B同时看到图像x时传递的信息，它可能代表一只鸭子，但若是它们看到图像y时传递的信息，SDF的意义就是一只兔子。我们没有办法在没有语境的状况下去解释单一的词汇含义。所以在没有确切使用场景的情况下，一个词的含义就是其“用法的分布”，它分布在我们的神经元编织的概念网络之中。当我们给出了暗含语境的其他词，发现词义分布的半径缩小了，才有能力做出词语确切含义的判断。或者我们沿着网络往更深和更浅处走，勉强地抓住一些围绕这个词语的画面、声音、和气味的痕迹，并且依稀看到，那些和伙伴一起玩耍时共同装下的罐子。

参考文献：

Laura Graesser, Kyunghyun Cho, Douwe Kiela. Emergent Linguistic Phenomena in Multi-Agent Communication Games

立即登录游客您好，可以登录后发布评论哦！