小白 2008-9-8 19:21
"迟钝的人耳"击败了最高的科技: 数码音频必须"与Jitter共舞"
欢迎大家一起在本帖中讨论和交流关于Jitter的一切事. 我们都不是数码音频专家,但还是可以一起讨论这个问题的. 也希望通过讨论纠正一些错误的想法和观念.
作为开头,我想先引入一个大家未必熟悉的时间概念: 皮可秒(Picosecond). 它的含义是百亿分之一秒. 即一秒种"滴答"的百亿分之一.
在一个皮可秒的时间内,世界上运动速度最快的光只能跑3厘米. 由此可以理解这个概念了吧? 这是科学中用到的最短的时间单位之一.
大家知道,现行的数码音频(CD格式)就是把声音的模拟波形,按照规定的采样频率和比特率进行"数码化",把模拟波形化为一系列的数字. 圆滑的声波被锯齿形的网格"量化".
当然,这种"量化"不可能做得彻底圆满,因为模拟波形本身是圆弧形的,而被数码化后,只能变成锯齿形的东西. 这个我们先不管它,因为44100赫兹的采样频率,和16比特的转换,对20-20000赫兹范围内的声波来说,已经够"精确"的了.
这个帖子先不想讨论这个. 我们讨论Jitter的问题.
所谓Jitter,你可以网上搜搜,有很多种定义描述方式. 我先不引用那些权威的定义了. 我写一个自己的定义: 所以Jitter,就是"最初把模拟声波信号数码化时的那套网格,和CD的重播过程中,根据数码信号重建模拟声波时,所用的那套网格,存在差异."
[[i] 本帖最后由 小白 于 2008-9-8 22:20 编辑 [/i]]
liuyindong2007 2008-9-8 19:28
还有飞秒。。
小白 2008-9-8 19:30
那么,首先要问的就是,两套网格可能100%重合吗? 也就是说,模拟-数码转换时所用的频率,和数码-模拟转换时所用的频率,可能100%一致,而且始终保持如此一致吗?
我们知道,在CD播放器内,是一定有一个CLOCK,以此来同步CD信号的读取和解码过程. 不仅CD信号的读取和解码必须精确同步,而且这个时钟的频率必须精确地等同于CD格式的规定标准——因为原始的模拟声波就是按照这个频率被数码化的.
CD机内的这个时钟一般是晶振时钟. 那么,晶体振荡产生的时钟信号的精确度,是否足够呢?
[[i] 本帖最后由 小白 于 2008-9-8 21:54 编辑 [/i]]
guyongsoft 2008-9-8 19:38
当然不能,世界上没有两片一模一样的树叶,可以做出一片尽量接近的树叶还是可以的
小白 2008-9-8 19:42
事实上,晶振时钟的精度,是非常之高的. 然而,有些人想当然式地认为,对于CD音频来说,晶振时钟已经足够精确 ...
然而,这是不对的. 人耳虽然有时很迟钝,比方人耳无法辨别10000赫兹的声波信号,和10010赫兹的声波信号, 在绝大多数情况下人耳也无法辨别1个分贝的强度差异,但是,人耳有一个奇特而怪异的地方——经研究发现,对CD音频而言,哪怕是皮秒级别的频率偏差(Jitter),也会造成可闻的音质区别! 也就是说,哪怕CD机内的时钟,和原始数码化时的时钟,两者之间存在百亿分之一秒级别的误差,人耳也能在最后的声音里察觉出来.
这样高的精度,是普通级别的晶振无法做到的. 所以不要再认为日本TEAC开发铷原子时钟是在发神经. 不是的.
小白 2008-9-8 19:49
有时我们不禁去想,假如 ... 假如人耳对Jitter迟钝一些,不那么超级灵敏,灵敏到"百亿分之一秒"那么夸张,该有多好? 那么CD音频早已被完美化,毫无数码声,各个转盘之间会毫无音质差异. 真是一个理想的世界.
可惜不是这样的. 人耳对数码音频流程中Jitter造成的音质差异,就是如此超级灵敏!
这使得Jitter成为一个数码音频领域里极其重要的概念. 这个概念可以解释很多发烧友搞不清的问题.
在数码音频重播过程中,要把0和1弄对,做到不误码,不漏码,简直小菜一碟. 但要做到无Jitter,难如登天!
所以我们面对的事实就是,所有CD机,甚至电脑光驱,都轻而易举地读出了CD盘上的数码信号. 但在把这些数码信号重建成原始模拟波形时,所有的设备都或多或少受到Jitter的影响,还原出来的波形,或多或少,和原始的模拟声波,有了偏差.
小白 2008-9-8 19:52
[i]我发明的"拆砖"比喻. 希望这个比喻能帮助大家理解AD,DA的流程,和Jitter对它的影响. [/i]
CD规格,按照CD Red Book(这是CD的技术规范),是两声道立体声,采样频率44100Hz(即一秒钟内对模拟声波切割44100次),比特率为16比特.
这样很容易算出,一秒钟的声音,被"数码化"后,变成多少数据: 2 X 44100 X 16比特 = 1411200比特. 141万多个二进制数据(0和1组成的数据).
一秒钟的时间内容纳的声音,滴答,一眨眼功夫,被CD这个超精密网格(每声道44100X16的网格)切分为141万多个比特的数据.
我最喜欢打比方了. 来打一个比方:
大家想象一下,假如一块砖头,被一下切分为141万个小块 ...... 注意不是随便瞎切的,而是根据一个严格的切法的,横向切44100刀,纵向切32刀 (每声道16刀,注意这还只是简化的说法,实际上应该是2的16次方,即65526刀!) . 这样切下来的141万多个小砖(如果还能叫"砖"的话),被按照一个严格的次序直线排列,放在传输带上,运送到另外一个地方去. (这就是模拟声波被数字化,然后以二进制数据传输的样子.)
然后在解码器这里,你收到了141万块小砖. 你要重新把这141万个小砖重新构建回那块砖 :L (这就是DA转换!). 注意,这个重新构建是要严格按序的! 原来在某个位置的小砖,重建完了还必须在原先的地方,不能挪动位置!(否则就是失真).
我问一下,你怎么做这件事?
我们算一下. 一秒种产生出来141万多块小砖,那么拆下每块小砖所费的时间为1/1410000秒. 拆砖必须以这个速率进行. 而且拆下的每块砖必须编上号,以避免重装时装错位置. 我们假定是这样拆的: 把一块砖横向切为44100排,每一排纵向切为32块(两个声道假定叠在一起). 那么第一块小砖为第一排的第一块,最后一块砖是第44100排的第32块砖.
那么,在收到141万块小砖后,进行原砖重建时,最精确理想的做法,就是也按照原先的1/1410000秒一块的速率,根据序号进行,放完一排,再排第二排(每排放32块小砖). 这样可以保证把传送带上的141万多块小砖重新构建回原先的大砖,一分一毫都不错. 每块小砖还在原先的位置.
那么,现在的实际困难是: 1/1410000 秒 这个速率太难精确保持了. 你怎么保证每拆一块砖都正好化1/1410000秒的时间? 装的时候也是,你怎么保证每1/1410000秒装回一块小砖?
好,如果无法控制得那么精确,会出现什么情况,是否能成功重建原砖,我们来看一下!
别的不管,呵呵,我继续说我的"拆砖装砖"的比喻. 希望通过这个比喻更多人能搞懂AD和DA的大致流程(就是拆砖装砖!). :lol
假如拆的时候无法严格保持每隔1/1410000秒种拆下一块小砖(太难了!! :Q ),那么 ... 为说明问题我讲得夸张些,在第一个1/1410000秒内拆了第一块小砖,但在下一个1/1410000秒内一下拆了30小块. 下一个1/1410000秒呢,一块都没拆下. 也就是说,限于能力,这拆砖的活干得不匀速,忽快忽慢的. 但也不得不接受这个事实!
注意这些小砖可是放在一条直线上,被传输到装砖头的那位手里的. 不是保持着原来砖头的形状过去的!
负责重新安装回砖头的那位呢? 拿着到手的直线排列的看不到尽头的"小砖列",他要按照严格的每1/1410000秒叠一快小砖的速率,去重新堆这些小砖块.
但他做得到严格匀速地每1/1410000秒叠一块小砖吗? 大家可以想象得到. 他也无法保持这个严格速度. 他也是只能叠得忽块忽慢的. 可能第一个1/1410000秒他叠了18块小砖,第二个1/1410000秒他叠了5块,然后他歇了歇 .... 歇了7/1410000秒! 等等等等.
大家可以想一下,最后叠回的砖,和原先的大砖,还是完全一致的吗?
肯定不一致了,肯定有大量的小砖被放错了地方. 应该是纵向32列,横向44100排的,最后可能很多排堆了38块小砖或27块小砖,而且也不是44100排了,也许是44211排. 等等. 141万块小砖肯定是一块不拉,都被塞回去了,但塞的位置,和原先拆的时候,是有很多不一致之处了,整块砖粗看看还是块方砖,但放在显微镜下看,是边缘不齐了,是厚薄不均匀了!
[[i] 本帖最后由 小白 于 2008-9-11 10:49 编辑 [/i]]
atrain 2008-9-8 20:05
可以简单理解为声音世界里的“拖影”现象?
zzz 2008-9-8 20:10
到目前为止
此贴依然无法从科学的角度解释为何好的转盘比差的转盘好。:lol
小白 2008-9-8 20:17
接着说Jitter的来源问题. 这也是很多发烧友存在错误观念的地方.
一个常见的观念是,Jitter只存在于DA解码部分. 按照这个理念,所有的转盘声音都是一样的,所有的数码线声音也是一样的. 因为只到了DAC才开始受Jitter的影响嘛.
那为什么有超级昂贵的高级转盘,也有便宜的转盘? 为什么不同的转盘接入同一台DAC后,音质会存在区别? 为什么数码线既有几十块的,也有几千块的?
答案就是: 这个观念完全错误,大错特错.
Jitter存在于整个数码音频重播的流程中,虽然它只是到了DA解码之后,才反映出来(被听出来). 就好象一个人得了肝癌,他不知道,最后转移到肺部成为肺癌,被诊断出来了,他还以为他的肝是好的,是肺不好 ... (抱歉这是个很糟糕的例子.)
kliujun 2008-9-8 20:35
音乐是艺术,不是科学.也无法用科学来解释.
musictigerhan 2008-9-8 20:40
偶第一次听出线材的区别时, 也是想不通. :L
小白 2008-9-8 20:41
让我们具体来指出会受到Jitter影响的环节:
首先是CD转盘.
然后是数码信号的传输界面. 通常是S/PDIF规格的传输(75欧同轴电缆或光纤).
再后面是DAC解码器的数字接收端(Digital Receiver).
最后,是DAC解码器.
这几个环节都会受到Jitter幽灵的纠缠.
CD转盘里有时钟. 这个时钟不是绝对完美的,低档转盘的时钟,可能精度很一般. CD转盘的旋转机构不是完美的,会存在速率的抖晃. 电源的变化会造成整个机械结构的不稳定. 这些都会造成CD转盘读取出的数字信号,已经包含Jitter.
数码信号的传输界面,会引入Jitter. 这是不同数码线音质不同的根源.
带有Jitter的数字信号,通过传输界面传送到DAC的数字接收部分. 数字接收芯片本身还会引入新的Jitter.
最后,DAC的解码过程,是受与数码信号一起传输过来的时钟信号的控制. 解码器依据传输过来的转盘时钟信号生成一个"解码工作时钟". 这个过程中也存在Jitter.
小白 2008-9-8 20:50
所以不同转盘的音质区别,在主要的层面上,可以归因到: 不同的转盘具有不同的"Jitter特性". 这些不同转盘的Jitter特性,包括Jitter大小,Jitter在不同频率的分布特征,被传输到同一台解码器后,造成的结果是有区别的,解码出来的模拟声波是有区别的. 这构成了"转盘音质不同"的主要原因.
高档的转盘Jitter小,大家都应该可以猜到. 是这样的. 然而有着相近Jitter量的转盘,比方同为Jitter极少的高级转盘,还是有可能音质截然不同,这个现象,在目前阶段只能用"Jitter分布特征"来解释. 就是说,Jitter从绝对意义上说,是每台转盘都有的,谁也无法彻底幸免,但不同转盘的Jitter分布是不同的,特征是不同的,这一区别会造成不同的转盘在工作时,会给纯净的数码信号沾染上一层带自身特点的Jitter.
这有点象音频线的传输. 大家知道目前阶段不存在彻底没有特性的线材. 再高级的线材总有些微"自己的声音". 这是造成高级音频线音质存在差异的原因.
恶虫 2008-9-8 21:01
此帖必火,强力占据第一页
zzz 2008-9-8 21:03
JITTER的分布啥意思?不懂。
请问抓轨抓下来的WAV有JITTER讯息在里面吗?若有,怎么大小一样。若无,是否就是一个输出数字信号的设备本身的时钟导致JITTER。
不知道垃圾转盘用超级牛时钟是什么感觉?:lol
PCFI,会跟你说来个统一时钟,你的JITTER问题就解决了。:lol
所以补充条,转盘里的电路磁场,电气特性会反过来影响转盘本身时钟的精度。个人以为这才是好转盘之所以好的关键。因为它不但时钟精度高,而且隔离措施好,伺服电路少,对时钟影响小。但如此看来,只要外置时钟统一输入转盘、解码,问题就不大了。可惜没人试验外置时钟+垃圾转盘+DAC比较外置时钟+好转盘+DAC的差异。
其实估计你想比也不可能。因为垃圾转盘没时钟输入,所以这才是关键中的关键!!!:lol :lol :lol
小白 2008-9-8 21:15
Jitter的分布,意思就是不同转盘的Jitter的"特点",以及Jitter在不同频率段的分布情况. 这个胖些,那个瘦些,:lol 这个高频Jitter可能多些,那个低频可能Jitter厉害些,就是这个意思. 貌似目前HI-FI界还没有定义出一套公认的可行的衡量不同转盘Jitter的测试指标体系. 否则的话,可以象标放大器的频响,谐波失真,功率输出,阻尼系数那个样子,给转盘Jitter定义出一套参数,大家看了就知道这台转盘的"声底". 那样就好了. 可惜还没有发展出这样的量化测试体系.
用高精度的独立时钟来同步控制转盘和解码,是一个高级的方案. 整体原则就是: 1) 转盘和解码的工作时钟最严密同步; 2) 该时钟同时与CD Red Book要求的工作频率最严密同步.
[[i] 本帖最后由 小白 于 2008-9-8 21:44 编辑 [/i]]
小白 2008-9-8 21:30
不同的转盘具有不同的Jitter,不同的数码线具有不同的Jitter. 这两个事实在国外都已有实验室测试证实(使用能测量Jitter的仪器).
Jitter可以解释为什么不同转盘音质不同,为什么好的转盘音质更好,以及为什么不同的数码音频线也音质不同.
假如人耳对Jitter迟钝一些,到一定的程度,所有的转盘和数码线就都音质一样了. 呵呵,那样挺好.
nadesicozhao 2008-9-8 21:35
木耳还是不少的 JD特别多
刻录和原版都在叫一个声
有声会叫就行了
小白 2008-9-8 21:35
[img]http://www.headphoneclub.com/bbs/attachments/forumid_4/tffV+7Tz0KEgUA==_FRhjsJeg0lxo.jpg[/img]
这是06,07年安润店聚会上不止一次现身的美国Genesis数码透镜. 它就是能直观显示转盘Jitter量,并减少Jitter的机器. 记得大家出于好奇,当时用它连接了几台不同的数码音源,观察其Jitter值.
小白 2008-9-8 21:38
结果最老卵,叫大家无体偷地的是老Mark转盘,数码透镜竟然显示"0"! 不知大家还记得否.
小白 2008-9-8 22:01
大家还记得开发出HDCD技术的美国Pacific Microsonics公司吗? 它曾经对Jitter对音质的影响进行过深入研究. 它得出的结论之一是: Jitter的频率和频谱分布,是造成一台转盘音质特点的重要原因. 比如,Jitter主要出现在这个频段,会使得转盘具有某种特定音质,而出现在另一个频段,则会使转盘具有另外一种特征. 正因为不同的CD转盘的Jitter特征都各自不同,才造成不同转盘的音色各异其趣.
以上供参考. 这些都是经过国外专业机构研究,得出可靠结论的东西.
[[i] 本帖最后由 小白 于 2008-9-8 22:02 编辑 [/i]]
小白 2008-9-8 22:06
综上所述,Jitter(时基误差)是数码音频领域内最重要的一个概念,和造成数码系统音色各异的最大原因之一. 可以说,既然Jitter是任何数码系统都无法彻底消除的,那么玩CD转盘,玩数码线,玩DAC,基本就是在"与Jitter共舞",是在玩Jitter,利用各台器材的不同Jitter特性,玩出不同的声音.
这样看来,Jitter虽是数码音频头号大敌,但这个大敌完全不可能消灭,相反却非常好玩. 如果没有它,哪来那么多玩转盘和玩数码线的乐子呢? :P
mvw 2008-9-8 22:40
应该是这样的 但理论上讲 如果信息密度足够大的话 jitter的影响是可以下降的 也就是信息量越大(参照数据越多) jitter越容易控制 换句话说 理想状态下 sacd的声音多样性的可能性是比cd小的 另外 jitter主要影响转盘声音 而解码部分声音的区别则主要来源于线路布局和dsp补偿算法 其实44.1k的采样率是不足以让人耳满足的 高端cd必须要差值运算到192k甚至更高 无中生有的这三倍数据流从哪里来?dsp算法,也就是在两个数据中平均插入(192/44.1)个数据 用以模拟更加平滑的曲线 这就是所谓的模拟味 这就是所谓的高密度 这就是所谓的信息量 从这里大家应该可以看出 即使高文把先锋的东西拿来物理上彻底原封不动 一样能造出自己的声音 其实也就是说 软件不一样 可见把先锋打磨成高文是绝对不可能的
厂家也都认识到了这一点 所以现在很多hifi厂把精力从转盘研发转移到数码技术 其实作用无非有二:去除jitter和改善算法
alavan 2008-9-8 23:00
这文章很好啊,学习了:)
GUOLIANG_82 2008-9-8 23:29
以前有过这样的问题,不知道解决没,现在再提出来问一次
如果光驱读取数据没有误码,那么把原版CD抓到硬盘里,硬盘里的WAV文件有jitter没?
我觉得是没有,因为硬盘存的只是数据,没有时钟,不管你下一个数据是在0.1秒还是0.100001秒之后读出来送给硬盘,他都把数据存在后一个格子里,和时间没关系
是不是meridian就是用这个原理,不管原来的时钟信号,就把数据存进缓存,然后从缓存出来的时候用另外一个晶振去重新对准时钟?
如果是这样,那么把音乐存进硬盘然后读出来,就像Linn的流媒体播放器那一类的机器,倒是很好的解决了音乐源的jitter问题,只要在后续的da过程注意控制jitter就ok
dark132 2008-9-8 23:31
那么小白,如果从根本上就用间隔时段的方式录音(数码形式),就是这个格子在一开始就做的很细,录到文件,到播放也是定时放出(这是电脑强项),应该可以做到很高的还原度
狂天方 2008-9-9 00:15
回白版一个问题
如果在转盘读取后的数据先预存入一个缓存区,再由缓存向外释放数字信号(类似于部分带抗震的CD随身听的工作模式)
而缓存在释放数字信号时是依靠极其精确的时钟控制
如此一来
是否在成本更低的情况下,一个劣质的转盘和一个优质的转盘出来的声音是一样的呢?
因为之前的JITTER都被缓存过滤掉了
如果是这样,那明显利用缓存所花费的成本要比一个转盘便宜得多了
mk2003 2008-9-9 00:34
缓存也是有jitter的,大小取绝于供电,晶振等等。g08,588也是dvd光区加缓存的结构,很大部分人都不会说那dvd光区“优质”(我认为dvd光区很优质)
jitter的大小标法,在声卡领域基本都是这样标的。打个比方,tc kennekt 24d 就是实际测试为:42ps rms 100-400kh 至于为什么要用100-400kh就不知道了
dark132 2008-9-9 02:08
[quote]原帖由 [i]狂天方[/i] 于 2008-9-9 00:15 发表 [url=http://bbs.headphoneclub.com/redirect.php?goto=findpost&pid=1201693&ptid=112431][img]http://bbs.headphoneclub.com/images/common/back.gif[/img][/url]
回白版一个问题
如果在转盘读取后的数据先预存入一个缓存区,再由缓存向外释放数字信号(类似于部分带抗震的CD随身听的工作模式)
而缓存在释放数字信号时是依靠极其精确的时钟控制
如此一来
是否在成本更低 ... [/quote]
这个没用,读入缓存区已经从物理到数字了,该不准的还是不准,放时精确的时钟控制无用