首页/文章/ 详情

MP3的神奇魔法：揭秘你耳朵被骗的真相

声学号角

3月前浏览2393

如今，各大音乐平台纷纷支持FLAC无损格式，MP3似乎已经淡出我们的视野。然而，这个曾经风靡一时的音频格式，虽然体积远小于无损格式，但音质却几乎不逊色。究竟MP3使用了什么神奇技术？让我们一探究竟。

自从爱迪生发明留声机以来，人类在保存和传播声音方面已经走过了140多年的历程。然而，在过去的20年中，一种新的音频格式彻底改变了我们的听觉体验，那就是MP3。

作为全球最广泛使用的音频格式，MP3的出现使音乐真正成为了一种大众消费品。许多人第一次拥有的音乐播放器就是MP3播放器，那个时代，MP3几乎成为了音乐的代名词。

但与CD相比，MP3的文件大小只有其十二分之一，而听觉上却几乎没有太大区别。那么，MP3到底是如何实现的呢？

今天我们就来揭秘MP3的背后秘密。

MP3到底舍弃了什么？

为了减小文件体积，最直接的方法就是压缩。通常，压缩是通过缩短文件中的重复部分来实现的，这种方式不会丢失数据，称为无损压缩。然而，声音是一种复杂且信息量巨大的数据，仅靠无损压缩无法显著减小其体积。因此，MP3采用了有损压缩。

心理声学与MP3：探索听觉的盲区

心理声学研究揭示了人耳对不同频率声音感知的巨大差异。人类听觉范围在20Hz到20kHz之间，但在这个范围内，对不同频率的声音敏感度各不相同。MP3算法正是利用了这一特点，通过丢弃人耳不敏感的频率部分，来大幅减少文件体积。

等响曲线：揭示听觉的非线性

等响曲线显示，不同频率的声音在人耳中的感知响度是不一样的。低频声音需要更大的声压才能与中频声音达到相同的感知响度。因此，MP3在压缩过程中，保留了人耳敏感的频率，舍弃了低频和高频部分，从而实现了文件体积的显著缩小。

声音掩蔽（Sound Masking）

声音掩蔽效应是指一种声音被另一种同时发出的声音覆盖，导致前者难以被听到。MP3算法通过分析声音的频率成分，丢弃那些会被掩蔽的声音数据，从而进一步减小文件体积。

时间掩蔽（Temporal Masking）

时间掩蔽效应指的是当我们听到一个声音突然停止时，会有一个短暂的时间段内较弱的声音会被掩蔽。MP3算法利用这一效应，在减小文件体积的同时，尽量保持音质的完整。

MP3压缩算法的核心：心理模型的精细应用

MP3压缩算法的核心是一种精心迭代多年的听觉心理模型。该模型将音乐的每一个瞬间对应到MP3文件格式的每一帧，检查每一帧内发生的掩蔽作用，并丢弃那些我们听不到的音频信息。MP3算法的发明和改进，在很大程度上依赖于人的主观感受。

MP3的诞生故事

1970年代末，德国教授Dieter Seitzer设想通过ISDN电话线点播音乐。然而，ISDN的速率只有128kbps，远不足以传输CD音频数据量。于是，他将这个挑战交给了他的学生Karlheinz Brandenburg。

Brandenburg利用心理声学的原理，发明了MP3压缩算法。经过多年迭代和无数次测试，MP3算法最终在1995年问世。

Brandenburg与Suzanne Vega的故事

在MP3压缩算法测试的最后阶段，Brandenburg遇到了一个大难题。他在杂志上看到大家喜欢用Suzanne Vega的歌曲《Tom's Diner》测试音箱，于是他将这首歌用MP3压缩。结果，这首纯人声歌曲在压缩后声音变得沙哑、不自然。为了完美压缩这首歌，Brandenburg和他的团队进行了数千次调整，最终成功解决了问题。

MP3的兴起与衰落

尽管MP3在最初并不被看好，但随着万维网和Windows 95的普及，MP3逐渐被大众接受，成为新的音频编码标准。然而，随着技术的进步，FLAC等无损格式逐渐普及，MP3逐渐走向被淘汰的边缘。

结语

MP3的诞生是一个复杂而漫长的过程，它通过巧妙利用人耳听觉的特点，成功在保持较好音质的同时，大幅减小了文件体积。尽管MP3逐渐退出历史舞台，但它对音乐产业的影响是不可忽视的。让我们怀念那个MP3盛行的时代，以及那些陪伴我们的动人旋律。

来源：声学号角

非线性声学

著作权归作者所有，欢迎分享，未经许可，不得转载

首次发布时间：2024-07-28