第96章(1 / 2)

“而我们的神经网络又会对这些含义进行一个二次处理,将AI的应答先转化为文本,再根据宿主的声音进行语音合成,此处特别鸣谢季想老师为我们提供了大量的真人语音资料。”

PPT翻至下一页,屏幕上出现了一堆花里胡哨的结构图,李可唯耐心地向观众解释道:“相比于‘掌中偶像’1.0的处理方式,我们在2.0中选择用CNN(卷积神经网络)来代替RNN(循环神经网络)对大量的语句进行处理。”

“有接触过深度学习的人应该知道,CNN多被广泛应用于计算机视觉的图像处理领域,而近年来,也有许多人将其运用到NLP中去。”

李可唯按下激光笔,屏幕上顿时出现了几个红红绿绿的表格,下方标了“像素”两个字。

“我们都知道,CNN是根据图像的像素值来进行处理的,而NLP处理的是文本和语句,那问题来了,怎么把这两个风马牛不相及的东西组合到一起呢?……”

季想坐在台下,目不转睛地望着台上演讲得愈发从容的李可唯。

尽管那人口中的专业术语他一个字也听不懂,但他喜欢那人认真的样子,喜欢那人沉浸在自己世界里的样子。

每当这时,李可唯的眼睛里都会带着一种光,炙热而夺目,令人一点也移不开视线。

“或许,我们可以把语句中的每一个单词划分开,分割成一个n维的向量,将形成的矩阵看成是一个特殊的图像,而每一个向量就相当于图像的像素,这样我们就可以对其进行处理了。”

屏幕一闪,出现了两个q版小人的测试模型,旁边的表格里展示了两个网络对自然语言处理的速度。

李可唯接着道:“大家可以看到,CNN的处理速度明显比RNN快,更换了神经网络之后,虚拟人像的接收延迟也从1.02s变成了0.34s。”

他点了点屏幕,画面变成了一个视频播放器:

“接下来让我们看一下动作捕捉的演示视频”

谁知那激光笔点在播放键上时,竟像突然失灵了一般,失去了该有的反应。

李可唯面色不变,走到操作台前,用鼠标又点了一下播放键,这一回,视频终于开始播放了起来:

片刻寂静后,会场回荡着一个奇怪又模糊的“沙沙”声,噪点的颗粒感非常明显。

李可唯不由皱了皱眉,心里猜测可能是网络问题,便站在原地打算静观其变。

不一会儿,漆黑的屏幕上终于闪过一个画面,一个老式住宅单位的客厅出现在了众人的视野里。

贴满了贴纸的老式旧冰箱、饭桌旁的红木座椅、被蓝色玻璃填满的窗子、墙上的金童玉女日历、铁门上挂着的鲜红“福”字……

视频似乎是用零几年流行的DV机进行拍摄的,室内的所有物品都透着一股陈旧过时的气息,远处的盆景在低分辨率的画质下模糊得像一团绿色的物块。

相机左下角显着一行橙红的小字:2012-04-08-17:38

正当席下众人开始窃窃私语时,画面明显地抖了几下,似乎是拍摄的人拿不稳,随着摄像机的转向,镜头也对焦到了一个人的脸上。

季想曝光的脸陡然出现在了大屏幕上。

视频里的他望上去很年轻,身上穿了一件格子衬衫,脸上全是丰盈的胶原蛋白,嫩得一掐就能掐出水来,那双极具厌世感的三白眼静静地看着镜头。

“这个构思还挺有意思的啊”

“这是真实的录像?原来Eris十年前也有婴儿肥……”

“这是出道前拍的吧,脸这么嫩,开头我还以为闹鬼了,结果原来是视频创意!”

“……”

而此刻坐在席上的季