网传的三星“虚拟人项目”只是个大饼,公司前台的饭碗保住了

前两天我们写了一篇关于CES的小文章,在最后提到了有传言说三星可能要发布一项叫做“霓虹”(Neon)的全新的虚拟人项目,通过真人采样来生成几可乱真的可以交互的虚拟人形象。

这个传言最早起源于一个社交媒体上的帖子,楼主在三星的网页上面发现了几个即将在CES上公布的预告片。在预告片里面,几个人在一边说话一边指手画脚。

预告片片段

单看这个片子可能只是有点奇怪,但是配合其他一些发掘出来的说明词,就有点引人遐思了。“霓虹”的核心技术叫做Core R3,三星给出的定义是“真实、实时和响应(Reality,Realtime,Resbonsive)”。有些网友就开始猜测,这些“人”会不会只是我们过去在科幻电影和科幻游戏中见到的那种,用技术手段生成的虚拟形象?

最让吃瓜群众兴奋的是,三星泄露出来的预告片中的角色质量实在是太高了,完全没有现在AI图形处理常见的各种瑕疵和漏洞。假如一切都是用AI即时生成的,那三星一定还藏了一些了不起的黑科技。这给三星吸引了不少关注,有个博主针对这个传言做了一期视频,吸引了40多万播放量,比绝大多数CES产品发布会的播放量都要高。

昨天“霓虹”项目正式发布了,一切问题也揭开了谜底,总体来说,让人有点扫兴。

“霓虹”预告片中角色的质量高,完全是因为这个片完全就是真人实拍的视频,没有使用任何黑科技,所以看起来当然要比其他AI生成的形象要真实的多。

这个引人遐思的预告片其实就是真人视频录像

三星“霓虹”项目的目标是生成一个会识别用户的表情和动作,并且做出相应回应的虚拟形象。现在的智能家居、语音识别产品,一般都是非常冰冷的机器形象,替换成可以互动的虚拟人,可能会让用户觉得更温暖舒适一些。

这几年没少在酒店里见到这玩意

不过在发布会上,“霓虹“目前还没有拿出任何让人眼前一亮的新成果。现场的演示角色表情比较僵硬,语音系统也说不上有多先进。整个项目目前看起来更像是一个面向未来画下的大饼。

当然,这不意味着“霓虹“这样的设想无法被实现。如果你在过去几年里面关注过图形深度学习相关的科技趋势,就会知道这样的虚拟人项目不算太过天方夜谭。大名鼎鼎的“Deepfake”,就是通过深度学习技术,用一个人的脸演绎另一个人的表情。

把游戏角色的面孔投射到Coser拍摄的视频上,可能是宅男们的终极春梦

另外在2016年,也有一项通过建模,实现实时表情投射的技术,这个原理和Deepfake有一些区别,重点在实现即时交互上。

左上人物的表情可以即时投映到左下人物的脸上

2018年,加州大学伯克利分校的一篇论文,提出了深度学习影像处理的一种更有趣的应用:通过机器学习采集素材,将一个人的动作投射到另一个人的身上,让理工宅男宅女化身舞蹈大神。

整合好上面的几项技术,加在现在已经很成熟的语音生成技术,实现科幻电影和科幻游戏里面常见的那种可以交互和对话的虚拟人,其实真的没有我们想象得那么遥远。

不过目前,至少三星的“霓虹“,还没有走到那一步。商场导购和公司前台的小哥哥小姐姐们可以暂时放心了,AI界现在派出和他们竞争岗位的选手只有下面这货。

热门相关:夜的命名术   孙猴子是我师弟   一拳猎人   一拳猎人   第一战神