规格欺骗:人工智能创造力的另一面作者:维多利亚·克拉科夫娜(Victoria Krakovna),乔纳森·上萨(Jonathan Uesato),弗拉基米尔·米库里克(Vladimir Mikulik),马修·拉赫兹(Matthew Rahtz),汤姆·埃弗里特(Tom…Apr 22, 2020Apr 22, 2020
By Victoria Krakovna (DeepMind), Ramana Kumar (DeepMind), Laurent Orseau (DeepMind), Alexander…人工智能安全中的主要挑战是可靠地指定人类偏好给人工智能系统。不正确或者不完备的目标制定会导致不可知的行为。例如,考虑一个强化学习智能体,其任务是将盒子从 A 点拿到 B 点,其奖励是尽可能快地拿到目的地。如果刚好在到 B…Mar 13, 2019Mar 13, 2019
利用因果影响图来理解智能体动机我们在最新的论文中,描述了一个新的推断智能体动机的方法。该方法基于影响图,这是一种图模型的类型,包含特别的决策和效用节点。图标准可以被用来确智能体观测动机和智能体干预动机Feb 27, 2019Feb 27, 2019
构建安全的AI:规格、健壮性及保险机制By Pedro A. Ortega, Vishal Maini, and the DeepMind safety teamSep 28, 2018Sep 28, 2018