耳机俱乐部论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

楼主: 黄金眼

[发烧理念] PC挑战传统音源(PC-HI END系统)

  [复制链接]

32

主题

723

帖子

45

积分

中级会员

Rank: 3Rank: 3Rank: 3

积分
45
注册时间
2012-7-7
 楼主| 发表于 2013-5-5 01:06:40 | 显示全部楼层
电脑优化的技巧:
    先发几个不用翻墙的国外和台湾高手的教程,可惜都是基于XP和win7的,有心的可以先了解学习一下。 (别人的优化不一定适合你的硬件,千万别照搬,自己听优化前后的变化,一定要去与传统音源做比较。)
     http://www.cicsmemoryplayer.com/index.php?n=CMP.07Optimisations ,
       http://twhtpc.com/index.php/htpc/186-htpc,
       http://www.ap-linux.com/
前面测试过能够找到的好几个优化方案,(包括上面3个网站,台湾990,还有台湾的 JRiver Jplay JRemote 數位流、高解析與DSD群, 还有PK和T大的。。)还有audiophile_W8_Pro_x64.iso,和几个精简版和自己精简的WIN8版本,目前暂时还没有找到适合上面电脑配置的最理想的解决方案。

按照现在win8的优化已经能够安心听音乐了,后面准备有空自己先折腾win8,找出合理正确的精简方案。重新调整优化,看看电脑到底能够到什么水平。

(待。。。。。)

[ 本帖最后由 黄金眼 于 2013-5-8 22:39 编辑 ]
回复 支持 反对

使用道具 举报

7

主题

425

帖子

10

积分

中级会员

Rank: 3Rank: 3Rank: 3

积分
10
注册时间
2012-3-18
QQ
发表于 2013-5-5 02:14:52 | 显示全部楼层
谢谢楼主的回复,继续关注,希望能发在论坛里面。

[ 本帖最后由 成都看看 于 2013-5-5 02:17 编辑 ]
回复 支持 反对

使用道具 举报

26

主题

868

帖子

15

积分

中级会员

Rank: 3Rank: 3Rank: 3

积分
15
注册时间
2010-3-6
发表于 2013-5-5 10:26:10 | 显示全部楼层
热切关注
blog.sina.com.cn/s/articlelist_2085358287_0_1.html
回复 支持 反对

使用道具 举报

32

主题

723

帖子

45

积分

中级会员

Rank: 3Rank: 3Rank: 3

积分
45
注册时间
2012-7-7
 楼主| 发表于 2013-5-6 13:30:10 | 显示全部楼层
时序及相关概念
本文出自www.pceva.com.cn,作者royalk

以下我把时序分为两部分,只是为了下文介绍起来作为归类,非官方分类方法。
第一时序:CL-tRCD-tRP-tRAS-CR,就是我们常说的5个主要时序。
第二时序:(包含所有XMP时序)

在讲时序之前,我想先让大家明白一些概念。内存时钟信号是方波,DDR内存在时钟信号上升和下降时各进行一次数据传输,所以会有等效两倍传输率的关系。例如DDR3-1333的实际工作频率是666.7MHz,每秒传输数据666.7*2=1333百万次,即1333MT/s,也就是我们说的等效频率1333MHz,再由每条内存位宽是64bit,那么它的带宽就是:1333MT/s*64bit/8(8bit是一字节)=10667MB/s。所谓时序,就是内存的时钟周期数值,脉冲信号经过上升再下降,到下一次上升之前叫做一个时钟周期,随着内存频率提升,这个周期会变短。例如CL9的意思就是CL这个操作的时间是9个时钟周期。

另外还要搞清楚一些基本术语:
Cell:颗粒中的一个数据存储单元叫做一个Cell,由一个电容和一个N沟道MOSFET组成。
Bank:8bit的内存颗粒,一个颗粒叫做一个bank,4bit的颗粒,正反两个颗粒合起来叫做一个bank。一根内存是64bit,如果是单面就是8个8bit颗粒,如果是双面,那就是16个4bit的颗粒分别在两面,不算ECC颗粒。
Rank:内存PCB的一面所有颗粒叫做一个rank,目前在Unbuffered台式机内存上,通常一面是8个颗粒,所以单面内存就是1个rank,8个bank,双面内存就是2个rank,8个bank。Bank与rank的定义是SPD信息的一部分,在AIDA64中SPD一栏可以看到。
DIMM:指一条可传输64bit数据的内存PCB,也就是内存颗粒的载体,算上ECC芯片,一条DIMM PCB最多可以容纳18个芯片。

第一时序

CAS Latency(CL)
:CAS即Column Address Strobe,列地址信号,它定义了在读取命令发出后到数据读出到IO接口的间隔时间。由于CAS在几乎所有的内存读取操作中都会生效(除非是读取到同一行地址中连续的数据,4bit颗粒直接读取间隔3个地址,8bit颗粒直接读取间隔7个地址,这时候CAS不生效),因此它是对内存读取性能影响最强的。如下图,蓝色的Read表示读取命令,绿色的方块表示数据读出IO,中间间隔的时间就是CL。

  




已知CL时钟周期值CAS,我们可以使用以下公式来计算实际延迟时间tCAS:
tCAS(ns)=(CAS*2000)/内存等效频率
例如,DDR3-1333 CL9内存实际CAS延迟时间=(9*2000)/1333=13.50 ns
或者反过来算,假如已知你的内存可以在7.5ns延迟下稳定工作,并且你想要DDR3-2000的频率,那么你可以把CL值设为8T(实际上8ns,大于7.5ns即可),如果你想要DDR3-1600的频率,那么你的CL值可以设到6T(实际7.5ns)。
这个公式对于所有用时钟周期表示延迟的内存时序都可以用。

说到这个公式,我想顺便说说大家对频率和时序的纠结问题。首先来回顾一下DDR一代到三代的一些典型的JEDEC规范,并按照上边那个公式算一下它的CL延迟时间:
DDR-400 3-3-3-8:(3*2000)/400=15 ns
DDR2-800 6-6-6-18:(6*2000)/800=15 ns
DDR3-1333 9-9-9-24:刚才算了是13.5 ns

再来看看每一代的超频内存的最佳表现(平民级,非世界纪录):
DDR1 Winbond BH-5 DDR-500 CL1.5:(1.5*2000)/500=6 ns
DDR2 Micron D9GMH DDR2-1400 CL4:(4*2000)/1400=5.71 ns
DDR3 PSC A3G-A DDR3-2133 CL6:(6*2000)/2133=5.63 ns

发现什么?不管是哪一代内存,随着频率提升,CL周期也同步提升,但是最后算出来的CL延迟时间却差不多。那么到了DDR4,JEDEC规范频率去到DDR4-4266,如果按照差不多的延迟,那么按照13ns多一些来算,那么CL值将达到28T!如果按照我们的极限超频延迟来算,DDR4-4266下的延迟也将达到12T。所以到了下一代DDR4,两位数的时钟周期将不可避免。

所以,我想说的是,不要再去想什么DDR3的频率,DDR2的时序,在频宽严重过剩,IMC成为瓶颈的今天,它对性能没太多的提升。

DRAM RAS to CAS Delay(tRCD):RAS的含义与CAS类似,就是行(Row)地址信号。它定义的是在内存的一个rank(内存的一面)之中,行地址激活(Active)命令发出之后,内存对行地址的操作所需要的时间。每一个内存cell就是一个可存储数据的地址,每个地址都有对应的行号和列号,每一行包含1024个列地址,当某一行地址被激活后,多个CAS请求会被发送以进行读写操作。简单的说,已知行地址位置,在这一行中找到相应的列地址,就可以完成寻址,进行读写操作,从已知行地址到找到列地址过去的时间就是tRCD。当内存中某一行地址被激活时,我们称它为“open page”。在同一时刻,同一个rank可以打开8个行地址(8个bank,也就是8个颗粒各一个)。下图显示一个行地址激活命令发出,到寻找列地址并发出读取指令,中间间隔的时间就是tRCD。tRCD值由于是最关键的寻址时间,它对内存最大频率影响最大,一般想要上高频,在加电压和放宽CL值不奏效的时候,我们都要放宽这个延迟。

  




DRAM RAS Precharge Time(tRP):RAS预充电时间。它定义的是前一个行地址操作完成并在行地址关闭(page close)命令发出之后,准备对同一个bank中下一个行地址进行操作,tRP就是下一个行地址激活信号发出前对其进行的预充电时间。由于在行地址关闭命令发出之前,一个rank中的多个行地址可能正在被读写,tRP对内存性能影响不如CL和tRCD。虽然tRP的影响会随着多个行地址激活与关闭信号频繁操作一个bank而加大,但是它的影响会被bank interleaving(bank交叉操作)和command scheduling(命令调配)所削弱。交叉读写会交替使用不同的bank进行读写,减少对一个bank的操作频率;命令调配则是由CPU多线程访问不同的内存地址,同样是减少对一个bank的频繁操作次数。例如SNB CPU的内存控制器可以对读写操作命令进行有效地重新分配,以使得行地址激活命中率最大化(如果重复激活一个已经处于激活状态的行地址,那就是RAS激活命令未命中),所以tRP在SNB平台对性能的影响不大,并且放宽它有可能可以帮助提升稳定性。下图显示的是一个即将被激活的行地址开始预充电,到它被激活间隔的时间,就是tRP。

  




DRAM RAS Active Time(tRAS):行地址激活的时间。它其实就是从一个行地址预充电之后,从激活到寻址再到读取完成所经过的整个时间,也就是tRCD+tCL的意思。这个操作并不会频繁发生,只有在空闲的内存新建数据的时候才会使用它。太紧的tRAS值,有可能会导致数据丢失或不完整,太宽的值则会影响内存性能,尤其是在内存使用量增加的时候。所以一般为了稳定性,我们设置tRAS≥tRTP+tRCD+CL即可(tRTP不是tRP,将在第二时序中介绍),尤其是PCB不好或者跑高频的时候,多几个周期比较稳妥。

DRAM Command Mode(Command Rate,CR):首命令延迟,也就是我们平时说的1T/2T模式。是指从选定bank之后到可以发出行地址激活命令所经过的时间。CR可能对性能的影响有比较大的变数:如果CPU所需要的数据都在内存的一个行地址上,就不需要进行重复多次的bank选择,CR的影响就很小;但是如果一个rank中同时多个bank要激活行地址,或者不同的rank中不同bank需要同时激活的时候,CR对性能的影响就会提升。但是随着内存频率的提升,CR=1T/2T的时间差越短,它的影响就会越来越小,这就是我们看到DDR1的时候1T/2T对性能影响挺大,但是到了DDR3影响就很小的其中一个原因。但是为了性能最大化,我们尽量把CR设为1T,但是如果bank数很多的时候,例如插满四条内存,就有32个bank,bank选择随机性增大,1T的首命令时间可能会不稳定。

所以,内存的基本读取操作的时序角度流程就是把上面那三张图合起来:预充电-激活行地址并寻找列地址-发送读取命令-读出数据,这四步操作中间的三个延迟就分别是tRP、tRCD和CL。和我们常说的时序顺序刚好是反过来的。
第二时序——XMP

DRAM CAS Write Latency(tWCL)
:列地址写入延迟,也就是DRAM的最小写入操作时间,与CL刚好是读写对应关系,一般跟CL值设为同一个值就是可以稳定的。由于内存读取之前必须先写入,所以这个值可以说与CL一样重要。但是在BIOS里一般没得设置,可能是与CL绑定了。

DRAM Row Cycle Time(tRC):行周期时间。定义了同一bank两次行激活命令所间隔的最小时间,或者说是一个bank中完成一次行操作周期(Row Cycle)的时间,即tRP+tRAS(预充电加上激活的整个过程),tRC设得太紧可能会直接点开不了机,一般只要能进系统再多加一两个周期都是可以稳定的。下图显示的就是tRC的时间。

  




DRAM Row Refresh Cycle Time(tRFC):行地址刷新周期,定义了一个bank中行地址刷新所需要的时间。重提一下刷新的含义,由于cell中电容的电荷在MOSFET关闭之后一段时间就会失去,为了维持数据,每隔很短一段时间就需要重新充电。这里多提一句,Intel平台和AMD平台对tRFC的含义不一样,AMD平台的tRFC是DRAM刷新延迟时间,单位是ns,通常有90/110/160/300几个值可以调整,也就是说它的tRFC时钟周期会随着频率的提升而提升;而Intel平台的单位则直接是时钟周期,相反地延迟时间会随着频率的提升而降低。容量大的bank行地址和cell会更多,刷新时间也更长,因此tRFC也要更高。另外,tRFC如果太快会导致数据出错,太慢则影响性能,但可以增加稳定性。

DRAM Refresh Interval(tREFI):内存刷新时间间隔,也就是内存的刷新命令生效前要经过的时间。刷新的时间间隔一般取决于内存颗粒的容量(density),容量越大,就越需要频繁刷新,tREFI值就要越低。另外tREFI的时间也会受到内存工作温度与内存电压(Vdimm)影响,因为温度越高电容漏电越快。一般在AMD主板的BIOS里,这个值只有3.9us和7.8us可选,而在SNB平台,则是按时钟周期算,例如DDR3-1333下默认值为5199T,换算过来就是2000/1333x5199=7800ns,也就是7.8us。一般DRAM颗粒的spec中都是规定工作温度大于85度时采用3.9us。

DRAM RAS to RAS Delay(tRRD):行地址间延迟,定义的是同一rank不同bank间两个连续激活命令的最短延迟,在DDR3时代一般最小是4T。它的作用和CR有点像,不过比CR更多的时候对性能有较大的影响,所以这个时序可尽量缩小。

DRAM Write Recovery Time(tWR):内存写入恢复时间,它定义了内存从写入命令发出(从开始写入算起)到下一次预充电间隔的时间,也就是tRP的前一个操作。如果这个时间设得太短,可能会导致前一次写入未完成就开始下一次预充电,进行寻址,那么前一次写入的数据就会不完整,造成丢数据的情况。这个周期也是第二时序中比较长的,DDR3-2000一般需要10-14个周期,甚至更高。

DRAM Read to Precharge Time(tRTP):与tWR类似,定义了同一rank上内存从读取命令发出到tRP之前的间隔时间,但是它在读取完成并且行地址关闭之后才会生效。单颗128MB的内存颗粒可以在DDR3-2000下运行在4到6个时钟周期,如果bank容量增大时,这个时序有可能要放宽。

DRAM Four Active Window(tFAW):它定义了同一rank中允许同时发送大于四个行激活命令的间隔时间,因此最小值应该不小于tRRD的四倍。在DDR3上,tRRD的最小值是4T,因此tFAW的最小值就是16T。这个tFAW由于是在一个rank中大于四个bank同时激活之后才生效,因此在内存不是很繁忙的时候,它对性能的影响并不是很大。但是对一些频繁读写内存的操作(例如SuperPI 32M),tFAW对性能的影响可能会加大。由于现在内存用满的几率非常非常小,两根双面的内存更是有4个rank,配合上interleaving,一个rank中同时激活大于四个bank的几率应该不大,所以通常我们把它设为tRRD的四倍应该就不会出问题。

DRAM Write to Read Delay(tWTR):内存写-读延迟,它定义的是内存写入命令发出后到下一个读取命令之间的时间间隔,最小为4T,与tRTP类似,提升内存的频率或者容量提升时,这个值需要提高。


结语

看完以上内容,我们已经对时序有了个大致的了解,现在应该可以知道一些时序设置时要注意什么了。比如tFAW要设为tRRD的四倍,tRAS不能设太低等等。还是那句话,内存是辅助CPU超频的,时序设置只是为了放开内存更多的超频空间,时序本身对性能的影响很小,并且随着频率的提升,或者bank数的增加,这种影响可能会进一步减小。具体不同的内存颗粒也会有不同的设置情况,还请大家多关注本站的颗粒汇总以及最新内存颗粒测试报告!




[ 本帖最后由 黄金眼 于 2013-5-22 18:48 编辑 ]
回复 支持 反对

使用道具 举报

3

主题

21

帖子

0

积分

新手上路

Rank: 1

积分
0
注册时间
2012-9-5
发表于 2013-5-6 21:48:52 | 显示全部楼层
支持一下金版!等我的专机哦
回复 支持 反对

使用道具 举报

0

主题

521

帖子

7

积分

初级会员

Rank: 2Rank: 2

积分
7
注册时间
2006-9-21
发表于 2013-5-6 22:09:23 | 显示全部楼层
尚未成功,还需努力
回复 支持 反对

使用道具 举报

23

主题

465

帖子

6

积分

初级会员

Rank: 2Rank: 2

积分
6
注册时间
2012-10-31
发表于 2013-5-6 23:31:02 | 显示全部楼层
帮金版顶下
回复 支持 反对

使用道具 举报

174

主题

8191

帖子

78

积分

高级会员

Rank: 4Rank: 4Rank: 4Rank: 4

积分
78
注册时间
2001-11-21

积极参与奖

发表于 2013-5-7 00:29:49 | 显示全部楼层
很好的jriver体会,直接转帖过来吧
最爱短歌行
回复 支持 反对

使用道具 举报

144

主题

6323

帖子

118

积分

超级会员

Rank: 6Rank: 6Rank: 6Rank: 6Rank: 6Rank: 6

积分
118
注册时间
2004-11-23

积极参与奖

发表于 2013-5-7 01:47:56 | 显示全部楼层
蛮有意思的,lz能转过来吗?100楼轻轻松松  好想看系统优化部分。
一点个人意见是,硬件的选择和确定有时候光看规格,看延时未必就能反应出来,直接听是最理想的,比方仅仅主板电容品牌这一小点不同就能剧烈影响声音走向,而且未必是卖相越好的声音就越好,音频系统有特殊的调音要求,这是数据看不出来的,我想连主板厂商未必都考虑过这些。
1
1
1
1
1

n o - o n e  i s  t h e r e
1
1
1
1
1
回复 支持 反对

使用道具 举报

12

主题

948

帖子

13

积分

中级会员

Rank: 3Rank: 3Rank: 3

积分
13
注册时间
2011-9-9
发表于 2013-5-7 01:50:45 | 显示全部楼层
太深奥了……
Stille Wasser sind tief~~
回复 支持 反对

使用道具 举报

19

主题

1551

帖子

36

积分

中级会员

Rank: 3Rank: 3Rank: 3

积分
36
注册时间
2006-2-8
发表于 2013-5-7 02:21:27 | 显示全部楼层
原帖由 x-w 于 2013-5-7 01:47 发表
蛮有意思的,lz能转过来吗?100楼轻轻松松  好想看系统优化部分。
一点个人意见是,硬件的选择和确定有时候光看规格,看延时未必就能反应出来,直接听是最理想的,比方仅仅主板电容品牌这一小点不同就能剧烈影响 ...


支持

    引用台湾高手的一句话:
              當您的pc 優化到 DPC Latency 穩定的低於10 μs時,這樣的 pc 會讓您進入 凡事皆有差別的境界(人稱瘋子)
換電源線,換 sata 線,換硬碟,換ram ,調 cpu 速度 頻率等 都會影響影音表現,您要聲音寬鬆自然 , 要高解析 ,要音場前傾 ,要音場後退, 要配合您的影音系統,調整到您適合的口味 都應該不是難事.


這句話並不是真理,DPC Latency根本無法反映聲音的好壞,最多只能作為撿測問題的工具之一
我的系統不能也不可能穩定的低於10, 可是換甚麼硬件能影響聲音還是能分得一清二楚
回复 支持 反对

使用道具 举报

10

主题

821

帖子

-4

积分

乞丐

积分
-4
注册时间
2010-11-3
发表于 2013-5-7 02:33:08 | 显示全部楼层
支持支持
回复 支持 反对

使用道具 举报

32

主题

789

帖子

10

积分

中级会员

Rank: 3Rank: 3Rank: 3

积分
10
注册时间
2012-3-25
发表于 2013-5-7 06:11:25 | 显示全部楼层

标题

顶一个,期待楼主继续更新
回复 支持 反对

使用道具 举报

23

主题

465

帖子

6

积分

初级会员

Rank: 2Rank: 2

积分
6
注册时间
2012-10-31
发表于 2013-5-7 10:19:24 | 显示全部楼层
非常具有参考性的配置  顶起来
回复 支持 反对

使用道具 举报

100

主题

945

帖子

17

积分

中级会员

Rank: 3Rank: 3Rank: 3

积分
17
注册时间
2009-12-13
发表于 2013-5-7 13:00:44 | 显示全部楼层
用JRiver来挑战么?建议你买一份我的优化吧
原版的JRiver,至少达不到我的要求。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

耳机俱乐部微信
耳机俱乐部微信

联系我们|有害信息举报:010-60152166 邮箱:zx@jd-bbs.com|手机版|Archiver|黑名单|中国耳机爱好者俱乐部 ( 京ICP备09075138号 )

GMT+8, 2024-4-25 09:39 , Processed in 0.113803 second(s), 37 queries , Gzip On.

快速回复 返回顶部 返回列表