李飞飞团队创建深度学习游乐场AI也在自我进化，细思极恐

　　来源：Stanford
　　编辑：好困 瘦瘦  【新智元导读】近日，斯坦福李飞飞教授等人的研究「深度进化强化学习」登上nature子刊，首次证明了「鲍德温效应」。或许，机器人形态的设计也可以通过一波「进化」来搞定？
　　动物的智慧是在和环境互动的过程中与身体形态同步进化的。
　　例如，仓鼠通过「进化」出长了好多腿的仓鼠球来逃避猫的追捕（doge）。
　　好吧，言归正传，AI也相当聪明，但与动物不同的是，AI通常是在硅基的芯片上实现的，并没有实体。
　　那么，如果给AI一个「身体」，这对于智能的进化是否重要？如果是的话，又该如何利用来创造更聪明的人工智能？
　　在李飞飞的带领下，斯坦福大学的研究小组创建了一个计算机模拟的「游乐场」——DERL（深度进化强化学习），其中被称为「Unimals」（通用动物）的智能体在经历不断变异和自然选择。论文刊登在《自然通讯》杂志上。
　　https://www.nature.com/articles/s41467-021-25874-z
　　研究结果显示，虚拟生物的身体形状影响了它们学习新任务的能力，在更具挑战性的环境中学习和进化的形态，或者在执行更复杂的任务时，比那些在更简单的环境中学习和进化的形态学习进化得更快、更好。
　　在这项研究中，具有最成功的形态的Unimal也比前几代更快地掌握了任务，尽管它们最初的基线智力水平与前代相同。也就是说，「具身化」是智能进化的关键。
　　「我们通常专注于AI是如何实现人类大脑中神经元的功能，」研究小组成员、斯坦福大学HAI的联合主任李飞飞表示，「然而将AI看作是具有物理实体的东西是一种完全不同的范式。」
　　研究报告的共同作者、人文与科学学院应用物理学副教授、HAI副主任Surya Ganguli说：「据我们所知，这是第一次相关的模拟实验，其结果表明可以通过改变形态来加快学习的速度。」
　　「Unimal」宇宙
　　团队设置了一个虚拟空间，并将简单的模拟生物放入其中。当然，这些生物只是一些通过「随机方式」进行移动的「几何图形」（Unimal）。
　　在学习阶段中，有平坦的地形，有更具挑战性的地形，包括块状山脊、阶梯和光滑的山丘。Unimal必须在多变的地形上将一个块状物移动到目标位置。
　　训练结束后，每个Unimal与其他三个在相同环境/任务组合中训练过的Unimal进行比赛。胜者将产生一个单一的后代，该后代在面对与父母相同的任务之前，经历了一次涉及肢体或关节变化的突变。
　　最终，在训练了4000种不同的形态后，团队结束了模拟。此时，幸存的Unimal平均经历了10代的进化，其形态令人惊讶地多样化，包括两足动物、三足动物以及有手臂和无手臂的四足动物。
　　而最初，「几乎图形」只有一个「脑袋」和发达的「四肢」，他们有许多奇形怪状的姿势，「有些人蹒跚前行，有些如蜥蜴般的行走姿势。其他人挥舞着十分逗趣的行为风格，让人联想到「八爪鱼」。
　　咦？看起来似乎与旧实验没区别，别急，进化才刚刚开始。
　　这些Unimal生长在不同的星球中，星球中充满了「起伏的山丘」和「低矮的障碍物」，他们在更加激烈的环境中展开竞争。看看是否如大家所说，「逆境是成功之母」。
　　每个环境中的前 10 名Unimal被安排在了新任务中，从「新障碍」到将球移动到目标位置、将盒子推上山或在两点之间巡逻。这些「角斗士」真正展示了他们的虚拟勇气。
　　最终，那些能在「复杂的地形中」行走的 Unimal 比在「平地上的表亲」更快地学习新任务，并且完成的更好。
　　换句话说，它们通过「生存」而「进化」，但并不是「边做边学」。而是在复杂的环境中同时进行「进化」和「学习」，比如有台阶、丘陵、山脊和移动的地形，以便在这些复杂环境中进行操作。
　　在平坦的地形上，「章鱼flop」可能会以相同的时间到达终点线，但「适应山丘和山脊的身体配置」往往是更快速、更稳定和能力最强的。他们多才多艺的身体能够更好的利用他们的经验教训 - 很快他们就将竞争对手抛在了脑后。
　　都交给「进化」去做吧
　　通用计算框架DERL利用两个相互作用的适应过程来制造具身的智能体
　　进化的外循环通过变异操作优化智能体的形态（b），内部强化学习循环优化了神经控制器的参数(c)。在可变地形的操纵中，智能体必须从初始位置（绿色球体）开始，将一个盒子移动到目标位置（红色方块）。
　　在每个环境完成三次进化运行后（每次有4000种形态），团队从每个环境中挑选出表现最好的10个Unimal，并从头开始训练它们完成8项全新的任务，如绕过障碍物、操纵一个球或将一个箱子推上斜坡。
　　最成功的Unimal在个体（通过较少的训练获得更好的表现）和跨代的学习方面也更快。团队发现，在早期祖先生命后期习得的行为能够在他们的后代生命早期表达出来。
　　此外，在10代之后，最成功的Unimal形态在学习同一任务的时间是其最早祖先的一半。
　　这也验证了美国心理学家James Mark Baldwin在19世纪末提出的假设：「学习具有适应性优势的事物的能力」可以通过达尔文的自然选择来传承。
　　人类不一定知道如何为奇怪的任务设计机器人的身体，例如爬过核反应堆提取废物，在地震后提供救灾，引导纳米机器人穿过人体，甚至做洗碗或叠衣服等家务。
　　或许，设计这些机器人的唯一出路就是交给「进化」去实现。
　　参考资料：
　　https://www.nature.com/articles/s41467-021-25874-z
　　https://hai.stanford.edu/news/how-bodies-get-smarts-simulating-evolution-embodied-intelligence
　　https://techcrunch.com/2021/10/06/simulated-ai-creatures-demonstrate-how-mind-and-body-evolve-and-succeed-together/

乡村爱情中王小蒙商演，离开滤镜后粗壮的身体不如伴舞乡村爱情中饰演王小蒙的毕畅现身商演，在舞台上火辣热舞引发热议。以前我觉得毕畅的戏感好强，一举手一投足，浑身都是戏，和杨幂有一拼，比杨还要高一点。不过这次商演，在跳舞过程中显得那么漫爱情公寓5首播用力过猛，歌舞表演成败笔，网友大呼赵海棠别唱了由陈赫娄艺潇孙艺洲李金铭等人主演的电视剧爱情公寓可以说是承载了许多80后90后青春的回忆，虽然爱情公寓从播出后就一直备受争议，但每一季都受到很多人的追捧，从第一季到第四季积累了非常精英律师秘书赌气辞职，靳东拼命挽留，二人之间真有爱情？精英律师秘书赌气辞职，靳东拼命挽留，二人之间真有爱情？精英律师已经更新了10多集了，随着剧情的发展剧中人物的感情路线也是越来的越清晰。在昨晚的剧情当中绝对是让观众捏了一把汗，那么究汪峰今晚的歌手之旅，你打几分？今晚歌手在万众期待中播出了，这是即过年和结实姐退赛的第一次排位赛。据歌手官方公布，结实姐在排练中，意味生病无法参加排位赛，但在下一期的淘汰赛，估计结实姐就可以回来。不过，有网友网上相声新势力在河南郑州开分社，跟德云社扳手腕又近一步相声新势力开拓市场，立足中原。据消息称相声新势力在郑州开设分社了，这是相声新势力除本土西安的两个茶馆外在省外开设的另一家茶馆。从创社到现在短短的一年多时间，相声新势力茶馆开设有两三欢乐喜剧人来了，宋小宝和岳云鹏带教老师，助力演员出道伴随着2021年的到来，欢乐喜剧人也无声无息地陪伴了我们6个年头。今年迎来了新的一季，第七季喜剧人集合如约而至，搞笑我们是认真的，再次点燃冬天的激情。曾经的美好还历历在目，打死你个岳云鹏跟刘雨昕对山歌，捧哏式对法太欢乐，发现宝藏女孩刘雨昕捧哏式对山歌，岳云鹏找到了说相声的感觉，嘎嘎乐。喜剧演员和女团演员在一起，他们会产生不一样的乐趣。岳云鹏回归打卡吧吃货团跟刘雨昕刘维组队，一起开始一段快乐的美食之旅。女团成员东方卫视播出造谣新闻？网友个别采编人盲目追求所谓热点最近一些公众人物去河南救灾，在救灾过程中一些行为引起热议，一部分认为无论如何都是做贡献，还有一部分认为是作秀。最近有博主指出7月27日东方卫视午间30分节目原1217分播出的造谣新选对热点话题萌萌的头条君给了我96万的展现量我的花样生活作为一个头条的小白（小白痴），根据一年来写稿的观察，发现头条对原创和热点文章，有着别样的厚爱。我这样一个粉丝数昨天刚刚达到200的小作者，头条平台在一个月的时间给了我4姚威和养父母一家关系好不好？看了路上相遇的照片，你就明白了每个人都是一个宇宙中说人活在世上，第一重要的还是做人，懂得自尊自爱，使自己有一颗坦荡又充实的灵魂，足以承受得住命运的打击，也配得上命运赐予，倘能这样也就算得想做命运的主人。没有谁的猎狐大结局王柏林故事结束并不是终点？猎狐永远在路上明明都知道一失足成千古恨，可是在权与利的诱惑下，又有多少人抱着侥幸的心理一步步陷入欲望的深渊。昨晚收官的猎狐就给我们好好上了一课。一部关于经侦一部关于人性的大剧，紧张刺激的剧情再加

<<<<<<－>>>>>>

白天鹅刘诗诗，为何嫁大17岁的吴奇隆？从婚礼花销就能看出来文大嘴卓伟曾说她是娱乐圈最干净的女明星。她低调含蓄，感情生活简单，像只与世无争的白天鹅，是众多宅男心中的白月光和娱乐圈的一股清流。人如其名，刘诗诗一直都以自己独特的气质压倒众女星。怎样欣赏书法？书法艺术，汉字是载体，思想感情是内容，创作就是通过汉字书写来表达作者的思想感情，根据这个定义，书法不是一般的写字，书法欣赏不能斤斤计较于字形是否规范与端正，苏轼说论画以形似，见与儿赵丽颖离婚东北虎进村？今天，是一个神奇的日子！赵丽颖刚离婚，东北野老虎立刻进村？难道，东北虎想抢亲？其实不是这的！野生的老虎它是会更加惧怕人类的，如果看到人类它们的第一反应则是选择回避，因为会觉得人类会王羲之我爱滑冰？王羲之，偷看美女跳舞，你很坏。王羲之兰亭序。天下第一行书。也是左低右高。难道王羲之曾经偷看美女滑冰吗？王羲之被称为千古书圣。是中国历史上最伟大的书法家。他的书法被称为笔尖上的舞蹈。高考11次，33岁还在复读，他想干什么？身为农家子弟的唐尚珺深知，读书是他唯一的出路，因此他从读初一的时候，就萌生了要考中国科技大学的念头。但是梦想有多丰满，现实就有多骨感，直到他复读的第7个年头，他才考上了中国政法大学唐楷第一欧阳询，不如虞世南？欧阳询书法是厚重块面虞世南书法是线条流畅欧阳询书法是厚重块面虞世南书法是线条流畅欧阳询书法是密不透风虞世南书法是舒朗宽绰欧阳询书法是险峻凌厉虞世南书法是平和温柔欧阳询书法是凝重深沉杨开慧，为了谁？追寻先烈足迹追寻先烈足迹那一天，杨开慧在牢房里，不断地思考着自己人生的最后一次的告别29岁在这个世界的最后一次闪亮登场！她请前来探视的亲人送来了化妆品，送来了她和润之结婚时穿过的新衣服。她严肃谁？指使冯承素伪造兰亭序？有人说当年，贞观盛世，为了效法秦始皇车同轨，书同文，统一文化，统一书法，唐太宗李世民将王羲之捧为书圣！并指使冯承素伪造兰亭序？我想说的是一，兰亭序是真的！二，冯承素摹本，最接近兰亭小小的一事时间流水，去而不复。一晃，二十多年过去了。学生时代的人和事，你还记得几件呢。某年某月的某一天，看见了某一个人的一对儿女，就想起了那一个人的那一件事。那是一个什么样的时代呢？那是一个苏东坡我的书法，就是玩？就是滑冰？苏轼与花样滑冰运动员，有故事！苏轼，也会花样滑冰？没错！你先看图！这些字选自苏轼的名作黄州寒食诗帖。黄州寒食诗帖被称为天下三大行书排名第三。天下三大行书分别是天下第一行书王羲之兰亭贾浅浅，对不起！贾浅浅，对不起！贾浅浅，我想对你说对不起！因为我今天看到了一首诗不须放屁！这首诗，是一位什么样著名的诗人写的呢？我想大家都知道的！念奴娇鸟儿问答1965年鲲鹏展翅，九万里，翻动扶摇