Mp3格式:概述

云烟 • 25分钟前 • 编程

欢迎大家来到IT世界,在知识的湖畔探索吧!

什么是MP3?

… Mp3格式 是一种压缩工具,可以减小歌曲的尺寸,但不明显影响声音的质量。每天有成百上千的MP3文件共享和下载。用这种格式,一个32兆字节的歌曲被压缩到大约3mb,这可以在我们的电脑硬盘上快速下载和存储数百首歌。它改变了人们过去寻找、听和储存音乐的传统方式。

欢迎大家来到IT世界,在知识的湖畔探索吧!

Fig. 1: 显示MP3格式工作的图表

需要MP3格式

你知道吗如果我们把存储在一个光盘上的数据延伸成一条直线,它会超过4英里长。很吃惊!好吧,让我们做数学来更好地理解。 CD中的音乐以每秒44100次的速度采样。样品长2字节(16位).因此,取样位总数等于44100倍/秒*16位,等于位/秒。另外,还对左、右扬声器进行了单独的取样,因此取样位总数为每秒钟比特/秒*2等于140万比特。

让我们来分析一下:如果一首歌平均长3分钟,也就是说。180秒后,CD上的平均歌曲消耗大约3200万字节(或32兆字节)的空间。所有这些数据都存储在光盘中,没有被高分辨率压缩 .当这种长度的歌曲存储在我们的桌面或手机上时,它将占用大量的空间。在另一种情况下我们想从网上下载歌曲, 即使有了高速电缆或DSL调制解调器,也只需要几分钟就可以下载一首声音质量好的歌曲,如果你是幸运的,你的网络连接速度慢的话,在歌曲下载的时候,它就会像永恒一样消失。

但在这张MP3格式的全图中,一个令人困惑的问题是,他们如何能够压缩文件而不损害歌曲的质量?

我们都用。以及。用来压缩图像或压缩文本的ZIP文件。在音频压缩中使用同样的概念.这两种方法都利用 压缩算法。

压缩算法 是计算机科学中使用的一种技术,它用比原来的表示数少的比特编码信息。这就像电报一样,不必要的词语被删除而又不失去信息的意义。

类似的,压缩算法是为音频开发的,它可以在不损害音乐质量的情况下移除音频的某些部分。为了建立一个良好的声音压缩算法 感知噪声成形 已经用过了。它是”感性的”,部分原因是MP3的格式使用了 人耳设计压缩算法.

让我们清楚地理解感性噪声成形的概念。

感知噪声成形

感知噪声形成- 感知噪声成形是一种用于开发将音频文件转换为MP3文件的压缩算法的技术。下图展示了三种不同的情景,展望了人类的耳朵。

感知噪音成形模型

Fig. 2: 图像显示感知噪音成形模型

下面的解释澄清了图像如何感知噪声塑造技术的工作。

1. 某些声音频率在人耳中比其他声音频率更好 .例如,如果两个音符非常相似,并且紧密地结合在一起,就像两个粉色箭头所示。我们的大脑只能感知其中一个。

2. 有些频率是人耳听不到的,因为 我们的听力只有20赫兹到20,000赫兹。 这一范围以上和以下的所有频率都不是人耳听到的。蓝色箭头位于20赫兹以下,因此它将从音频中移除。

3. 如果同时播放,更大的声音会淹没更柔和的声音. 当鼓声和笛声一起演奏时,我们的大脑会比笛声更专注于鼓声。利用这三个事实,设计了一种称为心理声学模型的全压缩算法排除歌曲的某些部分,但不会严重影响歌曲的质量。用众所周知的压缩技术压缩歌曲的其余部分,会大大缩小歌曲–至少是10倍。当你完成创建一个MP3文件时,你拥有的是一首尺寸和质量都可以接受的歌。

把所有的片段放在一起,让我们看看当一个普通文件被转换成MP3格式时到底会发生什么。

Mp3工作模式

Mp3格式工作模型

Fig. 3: Mp3格式工作模型

使用MP3格式

mp3不是一种数字记录方法,但它是一个在中间的过程,从现有记录中移除不相关的数据。所以,创建MP3文件的第一个要求我们需要一个音频文件。需要编码的音频通常为16位,采样频率为32千赫、44.1千赫和48千赫。在我们有音频文件后,MP3转换的过程开始与MP3编码器。MP3编码器是使用MP3编码器即开发的软件。制造MP3的压缩/解压缩算法。编码器分阶段工作。

第一阶段 –MP3编码器定期接收比特。利用”快速傅立叶变换”或”快速傅立叶变换”等数学算法,对这些比特进行分析并将其细分为数学模式。离散余弦变换”。一个音频信号将有非常不同的声音混合.它可能包含一个低音鼓声或高频率的声音,比如骑号管或声音,在它们之间的某个地方同时存在。正如我们所知,MP3需要将无关的声音与相关的声音分开。这就是为什么算法将音频信号按照频率划分为32个不同的声音部分。这些被称为子带。

第二阶段- 在MP3编码器的第二阶段,将这些子波段与上面解释的人类耳朵特征开发的心理声学模型进行了比较。由于音频信号已经分离,MP3编码器有可能根据频率对不同类型的声音进行排序,从而根据心理声学模型的要求,将某些声音优先于其他声音。

如果在上面的例子中,低音鼓的一些低频声音被认为是不相关的,编码器可以使用较少的数据位来编码包含这些频率的子带,从而使更多的位可以自由编码从声音中携带一些频率的子带–这可能对听者更”相关”,从而较少免除由于较低的比特率编码而引起的失真和噪音。

第三阶段 -经过比较后,他们通过过滤器去除不相关的声音。后面留下的子部分被组合成”框架”。编码器检查这些框架的内容,并在流程位分配的最后阶段使用这些信息。编码器决定需要使用多少位数据来编码每个帧。

MP3框架的简单结构如下所示。

无花果。4:图像解释MP3格式结构

每一个帧都以一个头开头,该头包含关于将要来的数据的额外信息。在一些编码中,这些框架可能相互作用。例如,如果一个框架有剩余的存储空间,而下一个框架没有足够的存储空间,那么它们可能会为最佳结果进行组合。在MP3文件的开头或结尾,或尾端,其中含有关于文件本身的额外信息,如艺术家的名字、歌曲标题、歌曲来源的专辑名称、录音年份、体裁和个人信息。可储存评论。这叫做” ID3″数据,随着您的收集量的增加,将变得越来越有用。

脱模

当编码结束时,所有的帧都保存在一起,然后可以被MP3解码器读取。MP3解码器执行一个简化的反向形式的编码过程。子带框架是”重新合成”到时域部分,并连接到一个音频流。

免责声明：本站所有文章内容,图片，视频等均是来源于用户投稿和互联网及文摘转载整编而成，不代表本站观点，不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益，请在线联系站长,一经查实,本站将立刻删除。本文来自网络,若有侵权，请联系删除，如若转载，请注明出处：https://itzsg.com/106904.html