标签:好的 和我 生产 img 变化 成熟 轻松 自动 完全
《阿丽塔·战斗天使》近日在中国内地上映,你有没有和我一样,被硬核少女阿丽塔美丽动人水汪汪的大眼睛迷倒?“如果说眼睛是心灵的窗户,那我们有非常漂亮的大窗户——她的眼睛极其迷人有吸引力,展示了她内心的一切。”这是该电影的导演罗伯特·罗德里格兹面对采访时对女主大眼睛讨论所做出的回应,言语中带着些自豪。他还表示“用放大版的眼睛呈现一个漫画角色”的设定,其实是源于詹姆斯·卡梅隆的坚持。
然而,创造出一双这样逼真的眼睛比我们想象的要难得多。电影的特效团队通过CG技术在制作过程中尝试过各式各样的“眼睛”大小、间距、瞳孔大小、虹膜大小,光是眼珠“虹膜”就运用了830 万多边形数量的几何建模,再从眼球壁到血管膜到视网膜每一层结构的制作和渲染,经过复杂的光路追踪,最终将这双眼睛呈现在观众面前。
图片源于网络
在阿丽塔电影问世很久之前,爱莫的小伙伴们也创造出了一双双炯炯有神的眼睛,虽然这些眼睛没有被搬上大银幕,但他们的目标也是让计算机能像阿丽塔一样,更好地看见、看懂这个世界。先来看看这些杰作:
爱莫的小伙伴们创造的眼睛成为了让神经网络不断进化升级的驱动力。
这些年无论是下围棋无敌手的AlphaGo,还是比电视播音员发挥稳定的虚拟播音,都离不开人工智能领域最火热的技术——深度学习。深度学习的效果非常棒,但“胃口”却特别大,是被称为Data-Hungry的“怪物”,没有几百上千万的数据量,它都纹丝不动。
所以,呕心沥血的工程师们只能依靠大量的手工标注样本数据来“打动”深度学习,人工智能变成了:有多少“人工”就有多少”智能”。
拿简单的眼球跟踪和视线估计问题来说,如果要给眼球周围打上点,需要收集至少100万张眼睛图片,然后每天一人标注100张(绝对让人 热血澎湃 精疲力尽),团队20人需要整整500天才能完成任务。标注眼睛点还算好,视线可就难了,一张图片要把眼睛看的方向(α / β / Φ 角度)标注出来非常不容易,两个人标注出来的结果都可能差别巨大。而数据标注工厂开价也不低,很多和爱莫一样的创业公司必须精打细算用好每一分钱。
动手效率太低,爱莫的小伙伴们只能动脑了,虽然一直从事的是计算机视觉(以下简称CV)技术,这次必须求助于与CV相爱相杀的CG技术了。
爱莫通过自研CG引擎,对眼部结构、眼部纹理、肌肉肌理、运动模式等进行高精准建模,目的就是“以假乱真”,让计算机和深度学习算法完成由虚(虚拟模型)到实(真实应用)的过渡。采用这种方式可以源源不断产生数据,并且,这些数据还可以按需产生,眼球的转向完全可控,使得数据分布非常均匀,训练出来的神经网络深度学习模型,就可以勇敢面对真实世界的所有场景了。
这样的技术已经被团队广泛应用到 驾驶员状态监测、人机交互、AR眼镜、新零售用户关注点分析等领域。
爱莫车载视觉管理应用案例展示
这些眼睛为爱莫的技术拓展带来新思路,尝到自动数据标注的甜头,他们把CG引擎扩展到人脸3D渲染、身体3D渲染中去,对表情变化、光照变化、姿态变化等进行了高逼真的仿真,填补真实采集的数据分布不均的缺陷,同时大大减少了人力标注的成本,并且使得训练出来的人工智能模型在与对手的pk中争取更大优势,特别是在处理“疑难杂症”上,优势更为明显,比如在人脸识别中,因为对不同角度和光照条件都进行了很好的模拟,可以轻松完成大角度、复杂光照环境下的人脸准确识别。
爱莫在线人脸比对结果(输入人脸图源于网络)
爱莫通过计算机仿真和图像恢复生成不同的人脸3D模型
通过恢复的人脸3D模型生产大量干扰条件下的数据
我们很高兴的看到越来越多的公司加入这个阵营,用CG的方式产生数据辅助深度学习算法的训练,比如无人驾驶3D仿真的Carla,用GAN来让虚拟样本更真实的Apple等等。
阿丽塔在成长过程思考自己立身于世的意义,她逐渐认识到自己有能力成为一个改变世界的英雄,整个从纯真到成熟的变化也都映射到了眼神变化中。也希望她这双动人的眼睛,可以为人工智能领域的同行们开辟一片全新天地!
标签:好的 和我 生产 img 变化 成熟 轻松 自动 完全
原文地址:https://blog.51cto.com/14232792/2360570