您现在的位置是：首页 >人工智能 > 2019-11-12 14:24:04

为了识别图片中的猫深度学习模型可能需要先查看数百万张照片

神经网络为研究人员提供了一个强大的工具，可以用来展望未来并做出预测。但是一个缺点是他们对处理所有这些信息的数据和计算能力(“计算”)的无限需求。在麻省理工学院，对计算的需求估计是研究所提供的需求的五倍。为了缓解这种紧缩，行业介入了。IBM最近捐赠的一台价值1160万美元的超级计算机已于今年秋天上线，并且在过去的一年中，IBM和Google都向MIT Quest for Intelligence提供了云信用额度，以便在整个校园内分发。下面重点介绍了IBM和Google云捐赠促成的四个项目。

较小，更快，更智能的神经网络

为了识别图片中的猫，深度学习模型可能需要先查看数百万张照片，然后人工神经元才能“学习”以识别猫。正如试图衡量人工智能(AI)碳足迹的新研究突出显示的那样，该过程需要大量的计算并且会带来巨大的环境成本。

但是可能有一种更有效的方法。麻省理工学院的最新研究表明，仅需模型的一小部分即可。麻省理工学院电气工程与计算机科学系(EECS)的研究生乔纳森·弗兰克(Jonathan Frankle)说：“培训一个大型网络时，只有一个小型网络可以完成所有工作。”

在研究的共同作者和EECS教授迈克尔·卡宾(Michael Carbin)的帮助下，弗兰克勒(Frankle)估计，如果一开始就找到正确的子网，那么神经网络的连接数将减少十分之一。通常，在训练过程之后会修剪神经网络，然后删除不相关的连接。弗兰克勒想知道，为什么不训练这种小型模型呢?

Frankle在他的笔记本电脑上进行了两个神经元网络的实验，结果令人鼓舞，并转向MNIST和CIFAR-10等较大的图像数据集，并尽可能借用了GPU。最后，通过IBM Cloud，他确保了足够的计算能力来训练真实的ResNet模型。他说：“我以前所做的一切都是玩具实验。” “我终于能够运行许多不同的设置，以确保可以在我们的论文中提出主张。”

弗兰克勒(Frankle)在Facebook办公室讲话，他在夏季工作，探索他的彩票假说论文提出的想法，该论文是在今年的国际学习代表大会上获得最佳论文奖的两个人之一。弗兰克勒说，这项工作的潜在应用超越了图像分类，还包括强化学习和自然语言处理模型。Facebook AI Research，普林斯顿大学和Uber的研究人员已经发表了后续研究。

“我对神经网络的热爱是我们甚至还没有奠定基础，”弗兰克尔说。他最近从研究密码学和技术政策转向了人工智能。“我们真的不了解它是如何学习的，它在哪里好，在哪里失败。这是距牛顿1000年的物理学。”

将事实与假新闻区分开

像Facebook和Twitter这样的网络平台使查找优质新闻变得前所未有的容易。但是，太多时候，真实新闻被在线发布的误导性信息或完全虚假信息淹没。最近关于美国众议院议长南希·佩洛西(Nancy Pelosi)被篡改以使自己的声音醉酒的视频的困惑，只是对错误信息和虚假新闻构成民主的最新例证。

麻省理工学院(MIT)的高级和EECS专业学生Moin Nadeem说：“现在，您几乎可以在互联网上发布任何内容，有些人会相信。”

如果技术有助于解决问题，那么它也可以帮助解决问题。这就是Nadeem选择一个superUROP项目的原因，该项目的重点是建立一个自动系统来对抗虚假和误导性新闻。Nadeem在MIT计算机科学与人工智能实验室的研究员James Glass的实验室工作，并受Mitra Mohtarami的监督。Nadeem通过搜索Wikipedia和被记者定为高质量，混合质量或低质量。

为了验证索赔，该模型测量了来源之间的一致性，较高的一致性得分表明该索赔可能是正确的。对于类似“ ISIS渗透到美国”这样的说法，其较高的异议分数是假新闻的有力指标。他说，这种方法的一个缺点是该模型不能识别独立的事实，而不能描述大多数人认为的真实情况。

Nadeem在Google Cloud Platform的帮助下进行了实验，并建立了一个交互式网站，使用户可以立即评估索赔的准确性。他和他的合著者在6月的北美计算语言学协会(NAACL)会议上介绍了他们的研究结果，并将继续扩大研究范围。

纳迪姆(Nadeem)在有关他的工作的视频中说：“以前的说法是眼见为实。” “但是我们正在进入一个不正确的世界。如果人们不相信自己的眼睛和耳朵，那将成为我们可以信任什么的问题?”

可视化变暖的气候

从海面上升到干旱加剧，气候变化的影响已经开始显现。从现在开始的几十年里，世界将变得更温暖，更干燥，更不可预测。麻省理工学院航空与航天系(AeroAstro)的研究生布兰登·莱什金斯基(Brandon Leshchinskiy)正在试验生成对抗网络(GAN)，以想象那时的地球会是什么样。

GAN通过使一个神经网络与另一个神经网络相互抵触来产生超逼真的图像。第一个网络学习一组图像的底层结构并尝试重现它们，而第二个网络确定哪些图像看起来不可信，并告诉第一个网络再试一次。

受使用GAN来从街景图像中可视化海平面上升投影的研究人员的启发，Leshchinskiy希望了解卫星图像是否可以同样个性化气候投影。Leshchinskiy目前正与他的顾问AeroAstro教授Dava Newman一起，使用免费的IBM Cloud积分来训练美国东部海岸线的图像上具有相应海拔高度的GAN。目的是可视化2050年的海平面上升预测将如何重绘海岸线。如果该项目可行，Leshinskiy希望使用其他NASA数据集来想象未来的海洋酸化和浮游植物丰度的变化。

他说：“我们已经超过了缓解的重点。” “将世界从现在起的三十年想象成什么样，可以帮助我们适应气候变化。”

通过几个手势识别运动员

在场上或球场上的一些动作足以使计算机视觉模型识别单个运动员。这是由MIT Quest for Intelligence研究人员Katherine Gallagher领导的团队进行的初步研究得出的。

该团队对网球比赛，足球和篮球比赛的录像中的计算机视觉模型进行了训练，发现该模型可以从人体关键点的几帧中识别出单个运动员，从而提供骨骼的大致轮廓。

该团队使用Google Cloud API处理视频数据，并将其模型的性能与在Google Cloud的AI平台上训练的模型进行了比较。她说：“这种姿势信息是如此独特，以至于我们的模型可以准确地识别出运动员，其准确性几乎与提供更多信息(例如头发的颜色和衣服)的模型一样。”

他们的结果与体育分析系统中的自动运动员识别有关，并且它们可以为推断运动员疲劳以预测何时应更换运动员的进一步研究提供基础。自动姿势检测还可以通过允许运动员隔离与高尔夫球手的专业击球或网球运动员的获胜挥杆相关的精确动作来帮助运动员改进技术。

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

标签：为了识别图片中的猫