首页/文章/ 详情

MP3的神奇魔法:揭秘你耳朵被骗的真相

3月前浏览2547

如今,各大音乐平台纷纷支持FLAC无损格式,MP3似乎已经淡出我们的视野。然而,这个曾经风靡一时的音频格式,虽然体积远小于无损格式,但音质却几乎不逊色。究竟MP3使用了什么神奇技术?让我们一探究竟。

自从爱迪生发明留声机以来,人类在保存和传播声音方面已经走过了140多年的历程。然而,在过去的20年中,一种新的音频格式彻底改变了我们的听觉体验,那就是MP3。

作为全球最广泛使用的音频格式,MP3的出现使音乐真正成为了一种大众消费品。许多人第一次拥有的音乐播放器就是MP3播放器,那个时代,MP3几乎成为了音乐的代名词。

但与CD相比,MP3的文件大小只有其十二分之一,而听觉上却几乎没有太大区别。那么,MP3到底是如何实现的呢?

今天我们就来揭秘MP3的背后秘密。

MP3到底舍弃了什么?

为了减小文件体积,最直接的方法就是压缩。通常,压缩是通过缩短文件中的重复部分来实现的,这种方式不会丢失数据,称为无损压缩。然而,声音是一种复杂且信息量巨大的数据,仅靠无损压缩无法显著减小其体积。因此,MP3采用了有损压缩。

心理声学与MP3:探索听觉的盲区

心理声学研究揭示了人耳对不同频率声音感知的巨大差异。人类听觉范围在20Hz到20kHz之间,但在这个范围内,对不同频率的声音敏感度各不相同。MP3算法 正是利用了这一特点,通过丢弃人耳不敏感的频率部分,来大幅减少文件体积。

等响曲线:揭示听觉的非线性

等响曲线显示,不同频率的声音在人耳中的感知响度是不一样的。低频声音需要更大的声压才能与中频声音达到相同的感知响度。因此,MP3在压缩过程中,保留了人耳敏感的频率,舍弃了低频和高频部分,从而实现了文件体积的显著缩小。

声音掩蔽(Sound Masking)

声音掩蔽效应是指一种声音被另一种同时发出的声音覆盖,导致前者难以被听到。MP3算法通过分析声音的频率成分,丢弃那些会被掩蔽的声音数据,从而进一步减小文件体积。

时间掩蔽(Temporal Masking)

时间掩蔽效应指的是当我们听到一个声音突然停止时,会有一个短暂的时间段内较弱的声音会被掩蔽。MP3算法利用这一效应,在减小文件体积的同时,尽量保持音质的完整。

MP3压缩算法的核心:心理模型的精细应用

MP3压缩算法的核心是一种精心迭代多年的听觉心理模型。该模型将音乐的每一个瞬间对应到MP3文件格式的每一帧,检查每一帧内发生的掩蔽作用,并丢弃那些我们听不到的音频信息。MP3算法的发明和改进,在很大程度上依赖于人的主观感受。

MP3的诞生故事

1970年代末,德国教授Dieter Seitzer设想通过ISDN电话线点播音乐。然而,ISDN的速率只有128kbps,远不足以传输CD音频数据量。于是,他将这个挑战交给了他的学生Karlheinz Brandenburg。

Brandenburg利用心理声学的原理,发明了MP3压缩算法。经过多年迭代和无数次测试,MP3算法最终在1995年问世。

Brandenburg与Suzanne Vega的故事

在MP3压缩算法测试的最后阶段,Brandenburg遇到了一个大难题。他在杂志上看到大家喜欢用Suzanne Vega的歌曲《Tom's Diner》测试音箱,于是他将这首歌用MP3压缩。结果,这首纯人声歌曲在压缩后声音变得沙哑、不自然。为了完美压缩这首歌,Brandenburg和他的团队进行了数千次调整,最终成功解决了问题。

MP3的兴起与衰落

尽管MP3在最初并不被看好,但随着万维网和Windows 95的普及,MP3逐渐被大众接受,成为新的音频编码标准。然而,随着技术的进步,FLAC等无损格式逐渐普及,MP3逐渐走向被淘汰的边缘。

结语

MP3的诞生是一个复杂而漫长的过程,它通过巧妙利用人耳听觉的特点,成功在保持较好音质的同时,大幅减小了文件体积。尽管MP3逐渐退出历史舞台,但它对音乐产业的影响是不可忽视的。让我们怀念那个MP3盛行的时代,以及那些陪伴我们的动人旋律。





来源:声学号角
非线性声学
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2024-07-28
最近编辑:3月前
声学号角
辜磊,专注数码声学产品仿真设计...
获赞 69粉丝 268文章 280课程 4
点赞
收藏
未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习 福利任务 兑换礼品
下载APP
联系我们
帮助与反馈