编译/VR陀螺
Facebook 在增强现实领域投入了大量人力和物力,包括联合 Ray-Ban 打造自己的 AR 眼镜。目前,这些小工具只能记录和共享图像,但这些小小的功能又能用来做什么呢?
由 Facebook 人工智能团队领导的一项新研究项目揭开了这层面纱。该项目希望人工智能系统使用第一人称视角不断分析人们的生活,记录他们的所见所闻,以帮助他们完成日常任务。Facebook 的研究人员概述了他希望这些系统开发的一系列技能,包括“情景记忆”(回答诸如“我把钥匙放在哪里?”之类的问题)和“视听日记化”(记住谁在什么时候说了什么)。
未来 Facebook 可能会利用这种研究
目前,任何人工智能系统都无法可靠地完成上述任务,Facebook 强调这是一个研究项目,而不是商业开发。然而,很明显,该公司将这些功能视为 AR 计算的未来。Facebook 人工智能研究科学家克里斯汀格劳曼(Kristen Grauman)表示:“当然,考虑到增强现实的未来实用性,我们有可能利用这种研究,”
这样的野心有着巨大的隐私影响,隐私专家已经对 Facebook 的 AR 眼镜如何让佩戴者秘密记录公众成员感到担忧。如果未来的硬件不仅能记录录像,还能分析和转录,把佩戴者变成行走的监控机器,这种担忧只会加剧。
Facebook 研究项目的名称是 Ego4D,它指的是对第一人称或“以自我为中心”的视频的分析。它由两个主要部分组成:一个开放的以自我为中心的视频数据集和一系列 Facebook 认为 AI 系统在未来应该能够解决的问题。
来源:The Verge
Facebook 收集了 3205 小时来自世界各地的第一人称镜头
该数据集是有史以来最大的数据集,Facebook 与全球 13 所大学合作收集数据。总共有大约 3205 小时的镜头由居住在九个不同国家的 855 名参与者录制。负责收集数据的是大学,而不是 Facebook。参与者(其中一些人获得报酬)佩戴 GoPro 相机和 AR 眼镜来录制无脚本活动的视频。拍摄范围从建筑工作到食物烘焙,再到与宠物玩耍和与朋友交往。大学对所有镜头进行了去标识化处理,其中包括模糊旁观者的面部并删除有关个人身份信息。
Grauman 表示,该数据集“在规模和多样性方面都是同类中的首创”。她说,最接近的可比项目包含 100 小时完全在厨房拍摄的第一人称镜头。“我们不仅将这些人工智能系统的视野打开到了英国和意大利西西里岛的厨房,而且还有来自沙特阿拉伯、东京、洛杉矶和哥伦比亚的镜头。”
来源:The Verge
Ego4D 的第二个组成部分是一系列基础功能,Facebook 希望世界各地的研究人员使用在其数据集上训练的 AI 系统尝试和解决这些问题。
具体来看,这些需要解决的问题包括:
现在,人工智能系统会发现,解决这些问题中的任何一个都非常困难,但创建数据集和基准测试是一种长久合理方法,它可以刺激人工智能领域的发展。
事实上,创建一个特定的数据集和相关的年度竞赛,称为 ImageNet,通常被认为是最近人工智能热潮的开始。ImagetNet 数据集由研究人员训练 AI 系统识别的各种对象的图片组成。2012 年,比赛的获胜者使用一种特殊的深度学习方法来击败竞争对手,开启了如今的研究时代。
Facebook 希望 Ego4D 项目能够对增强现实世界产生类似的影响。该公司表示,在 Ego4D 上训练的系统有朝一日不仅可以用于可穿戴设备产品,还可以用于家庭助理机器人,这些机器人也依靠第一人称视角来观察周围的世界。
Grauman 说:“该项目有机会以一种尚未真正实现的方式真正促进该领域的工作,将我们的领域从分析人类拍摄的大量照片和视频的能力转移到这种持续变化的第一人称视觉流上,AR 系统和机器人都需要在这种持续的背景下活动。”
来源:The Verge
Facebook 开发人工智能监控系统会让很多人感到担忧
尽管 Facebook 概述的任务确实看起来很实用,但该公司在这一领域的目标却让很多人感到担忧。Facebook 在隐私方面的记录非常糟糕,此前还因数据泄露遭到了来自联邦贸易委员会的50 亿美元罚款。
它也被 显示 多次,该公司值增长和参与上述用户在许多领域的福祉。考虑到这一点,令人担忧的是,这个 Ego4D 项目中的基准测试不包括突出的隐私保护措施。例如,“视听日记”任务(转录不同人所说的内容)从未提及删除有关不想被记录的人的数据。
此外,在许多领域, Facebook 更重视增长和参与度,而不是用户的福利。比如,在这个Ego4D 项目中的基准测试并不包括突出的隐私保护,具体表现为,在“视听日记”功能中(转录不同的人说的话),从来没有提到删除关于不想被记录的人的数据。
当被问及这些问题时,Facebook 的一位发言人告诉媒体,它预计将进一步引入隐私保护措施。发言人说:“我们预计,在公司使用此数据集开发商业应用程序的时候,他们将为此类应用程序开发保护隐私保护措施。例如,在 AR 眼镜可以增强某人的声音(音量)之前,它可能会发送一个协议来征求他人的许可,或者他们可以限制设备的使用范围,使其只能从戴眼镜的人那里接收声音。
目前,此类保障措施只是假设性的。
来源:The Verge
投稿/爆料:tougao@youxituoluo.com
稿件/商务合作: 六六(微信 13138755620)
加入行业交流群:六六(微信 13138755620)
版权申明:本文经原作者授权发布,不代表VR陀螺立场,如需转载请直接联系原作者
元宇宙数字产业服务平台
下载「陀螺科技」APP,获取前沿深度元宇宙讯息