人工智能的外部性

图片:Ylanite Koppens
Whatsapp
Facebook
Twitter
Instagram
Telegram

通过 塔尔西西奥·佩雷斯*

滥用技术会导致人们认为音乐变得过于合成和非人性化

1.

人工智能,特别是机器学习及其最新产物——生成式人工智能——已被广泛推广为一项革命性创新,能够改变多个行业,包括文本、艺术、音乐和其他形式的内容创作。 。烟火和生成人工智能的双曲线传播与 1785 年由鲁道夫·埃里希 (Rudolf Erich) 普及的明希豪森男爵的故事之间的相似之处是值得注意的。

一个具体的事实是,尽管有热心人士值班,但这项技术仍然被高估了。虽然它可以处理大量数据并识别复杂的模式,但它缺乏对表达人类创造的背景、情感和文化细微差别的深入理解。例如,人工智能生成的文本可能在技术上是正确的且信息丰富,但它缺乏写作所特有的情感结构、原创性和独特的声音。

计算产品以肤浅和通用的内容形式实现,无法捕捉人类经验的丰富性和复杂性。值得记住的是,人类的创造力是由个人经历、情感和对世界的直观理解驱动的,这些元素本质上很难编码到算法中。

讨论这个问题核心的技术细节可能有点乏味。出于这个原因,我们将继续根据时间的推移,建议性地尝试音乐美学的近似值。

2.

在古代,歌唱是宗教和文化习俗的重要组成部分。例如,希腊人拥有丰富的合唱音乐传统,并研究了声音的数学特性,建立了构成音阶基础的音程。希腊哲学家和音乐家毕达哥拉斯确定了声音频率之间的关系,并发展了辅音音程理论,例如八度、五度和四度。

在中世纪,格里高利圣歌成为西欧神圣音乐的主要形式。这种单音风格的特点是旋律简单,没有乐器伴奏,强调礼拜文本的清晰度。歌手开发了呼吸和投射技术,以在大教堂等混响空间中保持声音的纯度和连续性。 Neumes 是格里高利圣歌手稿中使用的符号,仅提供了旋律的粗略指示。

九世纪末十世纪初,西方音乐开始使用全音阶,这是一系列七个音符,成为西方音乐理论的基础。吉多·达雷佐 (Guido d'Arezzo) 是一位 11 世纪的本笃会修道士,人们常常认为他发明了一种记谱形式,这种记谱形式后来演变成了现代乐谱。他引入了四字母组(由四行组成的一组字母,可以更轻松地阅读音符),并创建了一个记忆系统来教授音程(后来演变为“C、D、E、F、G、A、B”)。

在文艺复兴时期,具有多个相互关联的旋律线的复调音乐成为主流。帕莱斯特里纳 (Palestrina) 和若斯昆德斯·普雷兹 (Josquindes Prez) 等作曲家探索了和声与对位,要求歌手具有复杂的声音控制能力和保持独立旋律线的能力。乐谱随着五线五角星的发展而发展,成为标准并允许更精确地表示音符音高。

在巴洛克时期,歌剧作为一种新的音乐流派出现,并发展了新的歌唱技巧。歌手需要极大的声音灵活性来演奏复杂的装饰并表达广泛的情感。技术如 美声唱法强调旋律线和气息控制之美的曲子开始成型。像法里内利这样的歌手,最著名的歌手之一 卡斯特拉蒂,体现了那个时期的技术和表现力。随着高音谱号、低音谱号和其他谱号的引入来指示不同的声乐和乐器音域,乐谱变得更加复杂。

新古典主义和浪漫主义带来了额外的风格变化。歌剧和音乐会音乐需要能够在大型管弦乐队中投射的声音。强调声音力量和音色清晰度的抒情歌唱技术的发展成为中心。玛丽亚·马利布兰和恩里科·卡鲁索等歌手展现了将精致技巧与戏剧性表达相结合的能力。

在 20 世纪,声乐技术随着新音乐流派的引入而不断发展,例如 爵士乐,戏剧音乐剧,以及最终 流行的 Ø 岩石。麦克风使用等技术允许更亲密和自然的歌唱方式,而古典训练仍然为许多不同风格的歌手提供了基础。声乐教育学也取得了显着进步,人们对声音的解剖学和生理学有了更深入的了解。

结束我们的历史回顾,近年来,技术 自动调整 被引入音乐制作中,提供了调整和纠正音高的工具。它的工作原理是自动将演唱的音符调整到最接近正确音高的音符,这使得歌手即使在他们的音高不高的情况下也能保持完美的音高。 表演 技术上并非完美无缺。

3.

我们的分析中出现了一个有趣的问题。一种用于纠正歌手调音中的小缺陷的技术——我们刚刚报道的从古代角度看音乐的锦上添花——正开始被用来帮助普通歌手更加调音。随着时间的推移,使用 自动调整 它超越了原来谨慎校正的功能,开始以更明显的方式使用,创造出特有的声音效果。这种风格化的使用 自动调整在 1990 世纪 XNUMX 年代末期,由 Cher 等艺术家以及后来的 T-Pain 所推广,产生了一种新的声音美学,其特点是声音具有人工和机器人的品质,成为许多音乐领域的主要元素。 命中 同时代的人。

这种做法在音乐行业和听众中引发了一系列争论和批评:滥用技术导致人们认为音乐变得过于合成和非人性化。听众对声音缺陷的容忍度变得越来越低,期望 表演 无论是在录音还是现场表演中,总是无可挑剔,这给音乐制作带来了更大的压力,使人为的循环永久化。

此外,当大量使用时, 自动调整 显着改变声音的原始质量,消除了声音表现力所必需的细微差别。一个明显的例子是颤音的效果,颤音是一种声乐技巧,歌手通过轻微振荡音符的音高来为歌曲增添温暖和情感。 性能。颤音是歌剧和其他古典风格歌手(例如男高音)特别重视的一个特征,他们控制和改变颤音的能力是先进声乐技术的标志。

O 自动调整,试图自动、精确地校正音高会无意中软化甚至消除颤音,导致声音听起来机械稳定且单调。这种细微差别的损失使得 性能 不那么自然和情绪化,产生一种人造的感觉。与其增强声乐表现,不如 自动调整在这种情况下,最终标准化了每个声音的独特特征,抵消了歌手的技术和表现力工作。换句话说,经过几个世纪的丰富演变,音乐正在被计算实用性公然地巴氏消毒。

除了颤音之外,还可以使用 自动调整 对多个方面产生负面影响 性能 人声和音乐的质量。歌手的情感表达能力可能会降低,因为音高、动态和音色的微妙变化对于传达情感至关重要。每个人独特的音色也可以被标准化,使不同的声音听起来更相似,而不那么有特色。动态,即声音强度和音量的变化,对于创建声音至关重要 性能 引人入胜且情感丰富。氧 自动调整 它可以平衡这些变化,从而获得更平坦、动态性更低的性能。

声音产生的共鸣和谐波的质量也可以通过以下方式改变: 自动调整。和声是与主音符一起产生的附加频率,有助于增加声音的丰富性和复杂性。数字处理也可以修改这些谐波。先进的歌唱技巧,如 Melismas、 滑奏 e 行为,在数字调整时失去自然性和流动性。

这些技术依赖于精确的声音控制,并且可以通过数字处理进行软化或人造化。此外,声音和伴奏乐器之间的关系可能会受到影响,因为 自动调整 独立调整声音的音高,在声音和乐器之间产生微妙的脱节,特别是在重视音乐家之间自发互动的音乐流派中。

依赖于 自动调整 它还影响了声乐训练和音乐教育。勤奋的经济学家会将这种副作用称为“负外部性”:基本上,如果可以通过数字修补实现技术卓越,那么歌手投入时间和精力来发展其自然发声能力的动力就会减少。此外, 自动调整 使听众沉迷于新的音乐和审美标准,迫使自然艺术家模仿这种效果来接触公众,这导致流行音乐的同质化和对真正声乐人才的欣赏的减少。

4.

显然,明希豪森男爵在他的堂吉诃德式冒险中没有提到这些。以类似的方式 自动调整 在音乐领域,经验丰富的读者完全有能力察觉人工智能生成的文本中缺乏情感深度和真实性,而普通读者可能只是觉得有些东西“缺失”,或者文本听起来“太完美”和“缺乏人情味”。 ”。

如果音乐的巴氏消毒是一件值得庆祝的事情,那么当前围绕人工智能的纳巴贝式烟火表演确实是公平的。

*塔西西奥·佩雷斯 他是圣保罗州技术学院的科学教授。除其他书籍外,作者还包括 从鲨鱼身上获利:股票市场的陷阱以及如何利用它们为您带来优势。

参考文献


伯克霍尔德,J.彼得;格鲁特,唐纳德·杰伊;帕利斯卡,克劳德·V. 诺顿西方音乐选集。 WW 诺顿公司,2019。

格鲁特,唐纳德·杰伊;帕利斯卡,克劳德·V. 西方音乐史。 WW 诺顿公司,2014。

拉斯佩,鲁道夫·埃里希。 孟乔森男爵的惊奇冒险。企鹅经典,1993。

拉塞尔,斯图尔特·J.;诺维格,彼得。 人工智能:现代方法。普伦蒂斯·霍尔,2021 年。


地球是圆的 有谢谢 致我们的读者和支持者。
帮助我们保持这个想法。
贡献

查看作者的所有文章

过去 10 天内阅读最多的 7 篇文章

查看作者的所有文章

搜寻

研究

THEMES

新刊物