当前位置: CNMO > 评测 > 正文

技术宅:浅谈Hi-Fi中的采样率和压缩率

CNMO 【原创】 作者:马俊杰,杨辰 2016-03-30 05:30
评论(0
分享

采样速度和量化位数

  毫不夸张地说,主宰Hi-Fi音质准确还原的核心是录音过程,如果音源本身出现了问题,即使Hi-Fi芯片如何出色,解码得到的音乐也只是受损的音质。歌手们总不可能在嘈杂不堪的背景中录音,经过Hi-Fi芯片一回放就能够达到录音室那种天籁美声吧?所以音源录制环境很重要,除非你喜欢听刘德华或者陈奕迅在菜市场唱歌,否则你不会希望背景噪声比歌手的声音还要大。而采样率和压缩率就是对音源起关键作用的另外两个指标。

  采样率又分为采样速度和量化位数,回到192kHz/32bit这个指标上,192kHz就是采样速度,32bit就是量化位数。这对组合是能够经常变化的,理论上两个数值都是越高越好。

不同Hi-Fi芯片拥有不同的采样率

技术宅:浅谈Hi-Fi中的采样率和压缩率
常见的Hi-Fi芯片

  如上图所示,笔者挑选了几款比较有代表性的Hi-Fi手机解码芯片和各位读者分享一下采样率的内容,Cirrus Logic经典的CS4398和ESS为智能手机定制的ES9018K2M两块芯片相比较,前者能够解码最高用192kHz/24bit采样率采样的歌曲,后者则能够解码最高用192kHz/32bit采样率采样的歌曲,主要区别在于量化位数上。

  关于量化位数的标准定义,各位读者可以上网自行学习一下,今天我们用一个形象一点,不是十分严谨的比喻解释一下,同样采样速度的两首歌曲,例如都是192kHz采样速度下的《小苹果》,如何进一步突显其中一首歌曲的解析力更加丰富呢?

  会不会是听到“你是我的小呀小苹果儿”的时候,拥有“金耳朵”的读者会发现其中一首歌曲在音调上多了一些变化,众所周知,普通话只有四个音调,但是在唱歌时候我们未必会准确地发出阴平、阳平、上声、去声这四个音调,所以部分“金耳朵”的大神们往往会听到好像不止四个音调的情况,如果是乐器演奏,不同乐器加起来的音调肯定不止四个。量化位数更多的音频文件就能够听到更多的音调变化。

  另一个例子,上次我们讨论过范玮琪那首“一比一”歌曲,歌曲中出现了多个“一”字,“金耳朵”的人能够或多或少听到这些“一”字部分发音是一个调,部分发音就是另一个调,“木耳”的伙伴们可能听完整首歌曲,大概都会以为这些“一”字都在一个调上吧。至于究竟有多少个调呢?这就要问创作人才知道了。

  简而言之,量化位数越多,我们能够听到的高中低三频的种类可能越多,以低音为例,量化位数少的音频文件可能只能够听到低音和中低音,但是量化位数多的音频文件,我们能够听到更多层次的低音,例如轻微低音和重低音。聊到这里,估计你们也感觉到了,量化位数影响的就是音频界常说的动态范围。

  经常使用PS绘画的伙伴们也会发现,PS对于颜色空间的管理是有一套规则的,用8bit、16bit、256bit表示的颜色空间,其实逐步提高了颜色的层次感。量化位数少一点的颜色空间可能只有红、橙、黄几种暖色,但是随着量化位数不断增加,红色和橙色之间又会衍生出深红色、浅红色,进一步增加量化位数,深红色又在划分出深一点的深红色和浅一点的深红色。所以说拍照和绘画领域的部分知识其实是能够和音频界知识相关联的。

  回到录音的环节,CS4398和ES9018K2M就是有这种能力,能够将这些细节充分还原出来,对于那些“金耳朵”的发烧友算是福音了。需要注意的是,CS4398和ES9018K2M这两块芯片并没有集成ADC模块,还是上面那张表格,AKM的AK4961则同时集成了ADC和DAC、耳放在里面,这在之前的文章中也有介绍过。所以,搭载AK4961这颗DSP的手机,不仅能够解码(回放音乐)192kHz/32bit的音源,还能够编码(录制音频)生成192kHz/32bit的音源,这就是为什么某手机品牌在宣传自家手机Hi-Fi性能时候特别强调“达到专业的录音棚品质”缘故。

技术宅:浅谈Hi-Fi中的采样率和压缩率
AK4961同时集成了ADC和DAC功能

  接着我们聊聊采样速度的问题,还是用大伙熟悉的Hi-Fi芯片举例子,ES9018K2M采样率为192kHz/32bit,小幅升级版SABRE9018C2M采样率为384kHz/32bit,区别主要在采样速度上。

  一段声音的录制,我们首先需要将其从声波转为电信号,接着就是模拟信号转为数字信号的过程,如下图所示:

技术宅:浅谈Hi-Fi中的采样率和压缩率
自然界声音波形

  自然界声音用模拟信号表示时候是一条曲线,我们以前介绍过,需要先将其转变为数字信号才能够在信道上传输,这时候就需要确定其采样速度和量化位数,之后才能够编码成数字信号。

技术宅:浅谈Hi-Fi中的采样率和压缩率
用数字信号表示模拟信号第一步(不同采样速度)

  如上图所示,将这条曲线放在直接坐标系之中,我们能够给出每一个点的x和y坐标,但是能否穷举呢?答案是不行的,无论我们如何缩小点与点之间距离,0.1和0.2之间还是有0.11、0.12......这些点,0.11和0.12之间还是有0.111、0.112......这些点。虽然对上述这段曲线上每一个点都进行标注是不可能的,但是我们能够通过不断地增加点的坐标,从而无限逼近最完美的结果,什么结果?大伙将所有坐标点连在一起之后,是不是发现红色那条折线有点像黑色那条曲线,而且随着坐标点增加,这种相似程度越来越明显,右边的那张图红色折线和黑色曲线是不是比左边那张图更加形影不离?小结,用坐标点表示模拟信号的方式称为采样,这也是模拟信号转换为数字信号的第一步。

  以前我们介绍过,数字信号是离散型数值,模拟信号则是连续型数值,上面的例子再一次印证了这一结论,那么我们应该如何采样呢?像笔者上面这种做法其实是不科学的,我们需要有一定间距去采样,否则就会出现部分信号区域采样过分密集,部分信号区域采样过分稀疏,从而导致最终的折线不够平滑,影响了录音时候的音质。

  根据物理学定义,采样速度就是指每秒钟采用多少个点记录一段音频曲线,正如上文演示那样,采用的点越多,采样速度越高,获得的折线越接近原本的曲线。如下图所示:

技术宅:浅谈Hi-Fi中的采样率和压缩率
此图片来自互联网

  如上图所示,无论是采用多少个点进行采样,均采用了一定间隔进行采样。另外,每秒44.1k(4万4千1百)个采样点其实就是指44.1kHz采样速度,每秒192k(19万2千)个采样点则是指192kHz采样速度。

  前者就是当年CD所使用的采样速度,后者则是如今Hi-Fi手机热衷于追求的采样速度。

  由于篇幅所限,关于SRC问题留待以后有机会再聊。我们继续用生动的例子帮助各位读者理解采样速度,不严谨地打个比方,张三向李四说了一句话,刚开始的时候,现场环境比较嘈杂,李四只能够听到“我爱你”这三个字,两个大男人基情四射,吓得李四一身冷汗。当现场环境开始没那么嘈杂的时候,张三重新说了那句话,这次李四听到的版本是“我其实真的很爱你,么么哒”。李四已经频临崩溃的边缘,这时候环境终于比较安静了,张三再次说了那句话,“我其实真的很爱你们家的小猫咪,样子么么哒”。

  这个例子虽然比较离谱,不过正好表达了采样速度的重要性。采样速度太低会丢失很多细节,采样速度过高浪费硬件资源。44.1kHz这个CD采样速度其实是经过了很多科学实验之后,才确立出来的,一般“木耳”的朋友听这种采样速度的音频文件就已经觉得音质不错了。

  采样速度和量化位数其实等同于拍照时候我们需要先对照片选择分辨率大小(1300万像素、800万像素)和存储画质(例如:高、标准、低),说到这里,部分读者应该恍然大悟,其实就是所谓的精度。分辨率越高,存储时候画质越高(丢掉和压缩细节越少),生成的照片解析力越高。同理,采样速度越高,量化位数越多,生成的音频文件解析力也越高,至于你听不听得到,那是人耳结构的问题,和音源无关了,哈哈!

  最后补充说明一句,vivo Xplay5旗舰版上面首次使用了两块ES9028 DAC,支持对左声道和右声道获得的数据同时处理。而之前联想乐檬X3上面那两块解码芯片并不是同时间工作的,一块用于Standard Hi-Fi模式,另一块用于Turbo Hi-Fi模式。

分享

加入收藏

网友评论 0条评论
用其他账号登录:
请稍后,数据加载中...
查看全部0条评论 >
火热围观
潮机范儿
vivo Xplay5

参考价:¥2699

0人点评

Copyright © 2007 - 北京沃德斯玛特网络科技有限责任公司.All rights reserved 发邮件给我们
京ICP证-070681号 京ICP备09081256号 京公网安备 11010502036320号