原帖由 aeondxf 于 2007-9-27 18:57 发表
32?为啥要将C1硬性分配成VS : PS=1:2呢……那好吧,我对比一下:
RSX:
VS:10 FLOP*8*550MHz=44GFLOPS
PS:16FLOP*24*500MHz=192GFLOPS
至于C1按照240G的数字来看去掉VS的44G那么还剩下196G……嗯,看着这 ...
C1统一架构当然要分,这个比例是比较合适的,当然,你可以认为C1全做VS和PS(噗!可能吗?),哦忘了说了,C1是216而不是240,为什么呢?那是因为xps_3_0的scalar根本没有mad这个指令,只有add/mul。所以计算方法是500MHz x 48 x (4x2+1) = 216GFLOPS 。这样按照你的算法,216-44=172,即便是按你算的RSX(PS)192,依然是不如啊(172:192)。