设备能读懂唇语向脑机接口又迈进一步 | {$randkws}热点解读 ”说话者的发言

　　导读：AI设备又迈进一步：能读懂唇语。一种新型的语音合成器可以跳过语音记录，而直接将说话者嘴部动作转换为语句。

　　网易技术讯11月29日讯息025一加手机资讯据外媒报导，一种新型的语音合成器可以跳过语音记录，而直接将说话者嘴部动作转换为语句。

　　该设备能“观看”嘴唇的动作，并运用AI联网将它们转换成声音。

　　探究人员强调，该设备将能合作声带麻痹患者发声，成年人的友情：伤感文字向脑机接口又迈进一步。

　　刻画该装置的探究发表在《PLOS计算生物学》期刊上。

　　这项探究的作者来自法国全国科学探究中心。文章中谈及，“这种语音合成器将人体首要语音发音器（舌，红毯造型折叠屏颚，口和嘴唇）的运动转换成智能语音。”

　　说话者的发言，以及嘴部各个部位的位置会被另外记录，然后经由AI联网算力开展确认。清晨最适合读的一句话：爱自己是终身浪漫

　　此处使用的AI算力是基于人类大脑建模的深层神经联网（DNN）。算力设计针对偏繁琐的模式确认。

　　该深层神经联网DNN经由测量舌头、下颚、软腭和嘴唇的协调动作（又称为”发音语音通讯“）来确认嘴正发音的某个词语。

　　作者阐释道，DNN计算模型对这些测量的资料开展训练，将“发音语音通讯”转换成“声学语音通讯”。

　　作者谈及，这项探究中，我们让用于训练DNN模型的使用者，以及陌生新使用者都来评测语音合成器的实时控制表现，从而评估它在是否能很好地变成脑机接口的一若干。

　　“语音脑机接口将能经由解码皮层的语言有关促销，实时控制语音合成器，从而合作有严重发声障碍的人重启交流。

　　为合作连声道都无法震动的患者“说话”，科学家将必须掌握如何解码大脑通讯，并将其翻译成语音。

　　使用AI来解码语音和语言已有先例。

　　谷歌不久前启动了多语言之间机器翻译操控系统。该操控系统被变成“Zero-Shot翻译操控系统“，并具有自我进修能力。它能将未进修过的两种语言翻译成一种已然进修过的语言 ——换言之，经由AI训练进修了如何做到X语言对Y语言的翻译后，操控系统就能马上自动掌握从X到Z语言的翻译。

　　Google Brain的博文把这项翻译技术称为神经机器翻译操控系统（Google Neural Machine Translation ，简称GNMT）。

相关文章

热门专题

友站阅读