总统列
勘探与开发:成人与儿童学习(再一次)
图片来源:一个模型显示的顽皮跳跳皮克斯电影节展览,海洋码头,港口城市,尖沙咀,2021年7月,香港,九龙。Achanhk,4.0 CC冲锋队通过维基共享。视为一种突破性进展在计算机动画中,Luxo Jr .)是一个两分钟的电影制作和发布的皮克斯销毁一个弹性小台灯和他的“父”玩一个球。
的年代,我的丈夫,Alvy射线史密斯,是一个聪明的年轻发明家的著名的施乐帕克研究中心,帕洛阿尔托研究设施。Alvy既是一位艺术家和一位工程师,他帮助设计的第一个电脑,可以让颜色图片。然后传来了坏消息。施乐公司管理层决定他们不再需要他的服务,因为没有对彩色图像的需要。“但颜色是未来!”他抗议。“这很可能是,”他们说,“但我们的业务是黑白复印机。“事实上,很多个人计算的基本原理,如鼠标和窗口界面,在施乐帕克研究中心开发然后忽略中央办公室管理人员。花了一个名不见经传的年轻的名叫比尔盖茨在一个小公司叫微软看到自己的潜力。
但当Alvy告诉这个故事,有一个终结。十年后,他成为一位高管自己当他创办了一家名为皮克斯的公司。然后年轻的天才工程师开始进入他的电脑能做什么激动人心的新想法。而可悲的是回忆他年轻的自己,他就会提醒他们坚持公司的业务。
Alvy的故事说明了一个基本的紧张最近很多激动人心的焦点在认知科学和心理学研究:勘探开发之间的权衡。这种紧张关系远远超出适用创业,尽管它仍然是非常相关的。你如何平衡创新和实现的可能性和实用性?你如何解决之间的紧张关系的诱惑疯狂的新事物,尝试和真正的避风港?
计算机科学家制定这种紧张关系在数学上的搜索一个高维空间的可能性。想象一个非常大的盒子你可以采取可能的行动。你开始在特定点框,你开始与一组特定的技术来解决常见的问题。当你面对一个新的问题,通过寻找新的解决方案。你可以搜索更狭窄的和集中的方式,接近你开始,迅速找到解决方案,只是利用好为难的选择。或者你可以搜索更广泛和不定地,尝试选择非常不同于你以前做过什么,试图找到最好的解决方案探索选项。
更大范围、更具探索性搜索允许更大范围的可能性,并提供更多的信息。但是你可能浪费很多时间考虑奇怪实际上是比当前的解决方案。窄,更多的搜索更有可能迅速导致一个有效的解决方案。但它可能让你陷入所谓的局部最优。在当地的最适条件,所有微小的变化将导致更糟糕的选择,尽管一个大转变可能会导致一个更好的。
施乐帕克研究中心的发明是一个很好的例子。想试图找出如何用电脑写字。你也可以尝试小键盘上熟悉的变化——毕竟,这是你用于印刷和打字。我们中的一些人仍然记得DOS提示符后键入幽灵般的绿色的字母组合,试图让该死的机器工作,困在键盘局部最优。鼠标滑动在你的书桌上非常不同于熟悉的键盘。远得多的解决方案空间,和它飞跃想象如何用它来剪切或复制或编辑文本。
开发可以让你在短期内积累的资源和成功。迅速缩小解决单一选项使您能够专注于选择有效地实现。探索,另一方面,是昂贵的,需要的资源来支持你当你探索(中央行政办公室资助研发部门)。但探索可能最终还清,特别是当环境复杂和时间范围。正如Alvy所说,颜色是未来。
数学不好的消息是,没有简单的方法来解决这个trade-off-no方法同时最大化勘探开发的好处。然而,有不同的策略,帮助平衡勘探和开发,确保勘探发生尽管短期成本。通常这些策略包括开始探索,然后缩小在利用。
探索可能最终还清,特别是当环境复杂和时间范围。正如Alvy所说,颜色是未来。
例如,“模拟退火”是一个算法基于退火的物理冶金技术。加热金属,然后冷却使其更加健壮。同样,机器学习系统从一个更高的“温度”,吵着,更多的随机搜索之前逐渐“冷却”更详细的和集中的搜索。学习者就像一个分子跳跃在大盒子的可能的解决方案。如果你先把温度高,分子会迅速移动的许多地方,尝试各种各样的选择,但从不定居很久。随着温度下降,分子移动更慢,直到它到达一个特定的位置。模拟退火中扮演着重要的角色在许多机器学习技术。
总是容易好好dichotomy-implicit与明确,先天和后天,内向的人与外向的人,应用它无处不在,特别是当它涉及与美味的押韵或一个不错的头韵。有人曾说过,有两种人:那些把一切分为二分类和那些不。但explore-exploit对比确实帮助我们了解一个非常广泛的心理现象。
强化学习是一个典型的心理想法,但它也扮演着重要的角色在现代人工智能和神经科学。代理需要一个特定的行动和指出,如果它会导致奖励他们应该重复,行动;如果不,他们不能。但如果代理只尝试行动前成功(利用策略)他们可能永远不会发现一个更有效的新可能性。这需要探索。所以有时候一台机器或一个动物或一个人应该尝试新事物,即使他们不知道如何解决。计算机科学家,认知科学家和神经科学家制定正式的模型最好的方法。但总的来说,最好早做更多的探索,然后缩小最有益的行为。
我认为生物有机体可能采用类似的技术寿命。他们开始与一个受保护的探索时期童年,当资源提供照顾他人,逐渐转移到更有能力但限制开发的时期。我的口号是,童年是进化的方式解决explore-exploit权衡和执行模拟退火。事实上,很多孩子的性格看起来像虫子从开发的角度来看可能会从探索的角度特性。孩子是出了名的无重点,缺乏执行功能和长期规划、夸张和比喻吵了。这使得孩子不善于表演效果,但擅长学习、探索和发现。
当然,孩子只能这样做是因为他们有护理人员照顾他们,当他们在研发阶段。孩子们真的只需要一个开发策略:一样可爱的你可能可以让人们爱你和照顾你。幸运的是,他们是非常有效的。
你可以看到这个explore-exploit序列在许多不同领域的发展。在我的实验室,我们表明,幼儿可以了解不同寻常的因果系统比成年人可以更好。在语言学习中,婴儿开始学习能力语音对比世界上所有的语言。随着他们年龄的增长和获得更多的经验,他们狭窄的可能性的范围考虑,甚至作为成年人,他们很难听到区别在其他语言中,更不用说学习使用它们。在这两种情况下,早期广泛搜索允许勘探的潜在空间,但是一个更完美的系统更有效。
explore-exploit序列出现在注意力和记忆力的研究,。成年人比孩子在关注事件相关的目标,他们记住相关事件也更好。但新的研究表明,孩子们更好地注意和记住偶然事件信息不相关的内容,但可能会让你学到一些东西,以后会有用的。我们说孩子关注有困难,但是他们真的有麻烦了不注意到。对他们来说,有趣的事情总是拍一些重要的东西。
你可以看到explore-exploit序列相同大脑发育。在婴儿期,童年早期,许多新的神经连接的形成和我们的大脑更“塑料”——更容易改变。随着我们年龄的增长,我们用很多的联系变得更强大和更有效的,和其他的可能性都消失了。APS威廉·詹姆斯奖研究员等心理学家珍妮特·沃克和帕特里夏·库尔表明这些大脑发展早期语言发展变化有关。在相同的方式,执行前额叶皮层是未开发的,但逐渐施加更多控制大脑的休息。前额叶控制是必不可少的有效的行动,但是心理学家像莎朗Thompson-Schill,另一个APS的家伙,已经表明,它可能会限制创造力和探索。
我们说孩子关注有困难,但他们真的很难不注意。对他们来说,有趣的事情总是拍一些重要的东西。
这一切听上去相当令人沮丧的成年人来说似乎无法摆脱沉闷的开发角色的同时,孩子们所有的乐趣。但勘探开发是互补的。孩子不能没有成年人利用探索,和我们所有人获得回报集中的注意力和有效的行动。也许是安慰,一些最有效的计算机科学技术使用重复周期的勘探和开发,而不是一个单一的转变。成年人也找到了方法来定期返回状态探索上更像小孩子,可塑性和开放性。施乐帕克研究中心这样的地方在60年代年代或贝尔实验室为工程师提供保护的空间。冥想,神秘体验,甚至迷幻药可能恢复更广泛的关注和更多的探索性的态度。或者你可以试一试我最喜欢技术,花些时间玩一个2岁。
反馈这篇文章?电子邮件aps188金宝搏官方网站observer@psychologicalscience.org或登录置评。对写作感兴趣吗?阅读我们的贡献者的指导方针。

APS定期打开特定的在线文章讨论在我们的网站上。有效的2021年2月,你必须登录APS成员发表评论。通过发布评论,你同意我们社区指导原则和显示您的个人信息,包括你的名字和联系。任何意见、发现、结论或建议在文章评论的作家和不一定反映APS的观点或文章的作者。有关更多信息,请参阅我们的社区指导原则。
请登录你的APS账户置评。