您当前位置:首页 > 聚焦国际 > 业界 >

业界 | 深度学习拯救濒危语言

2017-02-03 来 源:新锦海官网 编辑:新锦海娱乐场官网

参与:侯韵楚、杜夏德

当我最终按下生成的音频文件的播放键,听到受过训练的深度学习神经网络试图生成某种濒危语言中从未被说过的句子时,房间里生出一种尖锐的存在感。最后一个能流利说这种语言的人在 2003 年便去世了。当爱迪生发明了留声机,很快便产生了将其主要用于聆听逝者的声音,而非用于播放音乐的构想。记录在留声机上的声音被认为没有实体,是空间中的灵魂。仔细聆听声音时,最初我只能听到静态噪声,但其内部的各种光谱形状和脉冲标志着它们确实存在。我想,缅甸赌场开户,当它奏出第一段幽灵般的人声录音时,一定很像爱迪生。

  

业界 | 深度学习拯救濒危语言

两个早期版本的实验:音频请点击阅读原文听取

最近人工智能和机器学习领域取得了巨大突破。短短几年内,它发现了从自动驾驶汽车和医学影像处理到自动翻译算法(包括语音识别和自然语言处理)的各种新颖的用途。目前谷歌、Facebook、苹果、亚马逊、微软和百度等公司为了在该领域聘用最优秀的人才,正在全球各大学的计算机科学系进行争夺战。

推动这场革命的技术之一便是深度学习和深度神经网络。简而言之,计算的形式便是由大脑与其数十亿的神经元并行工作,根据其周围环境来阐释和行动。形成神经网络旧观点的因素同时也造就这一次复出的是最近大数据的可用性——在网络的训练过程中使用的大数据集,以及现代 GPU 芯片组中并行处理的速度。

作为一名对语言和计算领域都十分感兴趣的艺术家及电子音乐家,我在 2016 年秋发表了一篇关于 Google 科学家已经转向音频领域来尝试改善人工语音 [1] 的文章。激发我的想象力的并非他们在使计算机语音听起来更加自然这个方面的成功,而是在音乐材料和其他声音方面技术的怪异的副产品。我需要亲自做出尝试,大胆地在谷歌的一个云基础的计算引擎上安装必要软件来运行测试。我的第一个实验利用水生昆虫田野记录集及我自己的音乐来观察它是否可以学习去「发出」像我的音乐项目 phonophani 或 alog 轨道一样的「声音」(这很可能会让我失业!)。

水生昆虫:点击阅读原文在原文中听取

Phonophani 音乐:点击阅读原文在原文中听取

与之前的技术相比,真正巨大的进步在于训练的模型是逐个样本水平的,所以对于算法来说,训练的声音无所谓是工厂警报器,水昆虫还是钢琴。神经网络是一个黑盒子,很难想象其内部实际上如何运作。它是自主学习的,不存在关于如何复制发送过来的声音的指令。若不与严格标记的材料相关联,那么它仅会胡言乱语,像是在说方言。或在使用音乐材料的情况下,它听起来会有点口吃,断断续续蹦出乐章。使用音乐与深度学习的一个巨大的挑战是大数据集的可获得。十年来,在计算机视觉研究中,有标记的视觉材料大型数据库很容易获得,这使得多种神经深度梦境项目的惊人视觉艺术成为可能(灵感来自 2015 年 Google 的初始项目 [2])。但在音乐和声音领域,大数据集正为此进行第一次组装 [3]。

我将实验又转回到语言方面。它是否能为一种濒危语言训练一个深度学习网络呢?在之前的艺术项目中,我广泛使用了濒危或已消失的语言(即濒危语言 [4])。每十天便会有一种语言消失,所以按照这个速率,几代之内世界上大约 6000 种语言中便会有一半消失。濒危语言的概念是一种非常复杂的机制,为了维持语言的生存,其在普通家庭及在家庭世代间的使用是至关重要的。一种语言能够为其后代保存下来吗?还是只能存在于社会的活跃使用中?语言能否脱离人们的文化、知识和身份?在使用萨米族语言(挪威北部、瑞典、芬兰和俄罗斯的土著群体)的家庭中,有一些语言已然灭绝或仅有少数的古老语言保存下来,但他们正在努力使其中几种语言复活。

通过与研究萨米人语言的弗莱堡研究小组联系,我得到了来自俄罗斯西北部已消失的一种语言 Akkala Sámi 存留最后的记录材料。该语言最后的使用者之一 Piotr 讲述了一个故事并唱了一首歌。如果我使用这类材料来训练一个深度学习模型来讲这种「失落」语言,将会怎么样呢?它能让我们再次听到这种语言,就像它还存在于世上一样吗?它能做出和已经存在的记录材料不同的声音吗?它能够赋予一种语言「复活」的虚幻感觉吗?

用于训练的原始故事(摘录):点击阅读原文在原文中听取

学习过程的三个阶段 [5]:点击阅读原文在原文中听取

从艺术的优势点来看,这个实验中是否保留了说话者的含义、知识或正确的语法等并不重要,我只关心声音、材料内容或介质本身。一些神秘的生成文件(uncanniest generated files)几乎是没有声音的,其中仅仅产生介于呼吸和单词之间的细微声音。当神经网络自身内转时,这种咿呀,或称「梦呓」,是突出纯语音元素的一个极佳方法。它还能明白对于一种语言来说,什么是独一无二的特质;因此如果一门语言消失了,那么对于问题可能的答案也就消失了。

最后,我不会标榜我实验的成功。它们只是一个想法的基本草图,充其量是概念的证明。在我对音乐材料的实验中,我感兴趣的并非音乐结果的质量,而是在没有人类意识制定计划或程序的情况下产生的声音中的外部存在感或差异性(otherness)感觉。我认为这是我经历过的任何「深度」艺术经验的核心部分,有一些奇异而未知的方法或秘密的自主算法在乐曲内起作用,使它万分迷人。简而言之,这个作品变成了一个角色——一张你面前的面孔,但不一定是人类的面孔。

用图灵测试测量一个像我创造的那样一个人工智能。在我的例子中可以使用略微修改的版本——艺术类图灵测试。在初始测试中,人类受试者要辨别他或她是否被机器愚弄以决定它是否有人类意识。对于这样简单的测试,有很多可以反对的地方,但我认为其最大的缺点在于,它在根本上是以人类为中心的方法。为什么人类可以判定什么是智能?如果我们在任何时候都在这种「强烈」的意义上满足人工智能的某种形式,那么它会被赋予总差异性(total otherness)的特征,也不是以任何一种能与我们的思考方式相媲美的方式;它将像有多个深度学习层的黑盒子,在那里我们将永远不能将它的多维结构可视化。与动物能否像我们一样思考或感觉的问题类似,整个智力问题在范围上会变得太过狭窄。重要的是我们的自然反应和情绪。

最终生成版本:点击阅读原文在原文中听取

文章下方广告
大牌电商日报: Arrow搞NFC智能衬衫

“村淘”网购搅热农村市场 电商拉近城乡差距

电子商务 助推贵阳经济发展加速度

广州家电卖场:春节期间开门迎接来客

深圳:跨境电商“大本营”

[电商杂谈]女子中英文怒骂老司机 场面失控

江苏省商务厅来江宁区“赶超网”考察调研

山东将支持大型快递企业落户 多项措施助力农村电商发展

上一篇:上一篇:【业界】LNG 运力的强劲增长使得运费持续承压

下一篇:下一篇:业界 | 波士顿动力透露最新机器人Handle,用轮子取代双足

新锦海娱乐-新锦海娱乐场-新锦海娱乐开户-新锦海娱乐平台-新锦海平台开户-新锦海网上娱乐开户-新锦海官网-新锦海官方网站-html-xml
网站内容来自于http://www.sxjh343.com/转载必究

COPYRIGHT © 2012 THE TEAM, US. ALL RIGHTS RESERVED.