回复主题: 有GT在 同类赛车游戏永无出头之日 GC展山内一典亲自演示GT5P 每辆车多边形为20W
作者:zhangjingy

是啊,RSX的就可以无视,C1就都要看,你说的NRM_PP_Unit在204的数据里是不包括的,如果加上那就是288了。

给你找两段话:
看過Eji大的資料來源後,我知道問題出在哪了...
(這算是MS在放假數據嗎?XD)

500MHz*48*[5*2+1]=240GFLOPS是筆誤,
複製更改500MHz x 48 x (4x2+1)時忘了將+1殺掉XD
----
因為瀏覽那些資料,在下找到了下圖:
loading...

當中RSX(應該說G7x系列)的PS之浮點是0.5*24*(4+4)*2=192GFLOPS,
而後藤大叔的算法是:
http://pc.watch.impress.co.jp/docs/2005/0701/kaigai195.htm
0.5*24*[(4+1+4+1)*2+7]=324GFLOPS,
不知哪個算法才正確?

後藤老爹和PIL的的數字差距來源主要是:
1. shader除了3D+1D與2D+2D之外另有兩個SFU,所以變成3D+1D+1D & 2D+2D+1D。
2. TMU的nrm_pp有算進去(FP16 normalize,算7flops)。

這兩個數字應該都有問題。
首先,根據NVIDIA在PS3發表會上的發言指出,由於RSX是136ops x 550MHz(當時),加上CELL的3.2GHz x 8 總共是 100Gops。

136ops的算法是8VS裡面的4D+1D算成兩個 x 8 = 16,24個ps要有120個ops,所以最多5個指令發射。
這樣的話3D+1D+2D+2D是4個、後藤老大的算法會變成6個,都不對。
現在主要的疑問是SFU有沒有MAD,正常狀況應該是沒有。
這樣的話就會變成0.5x 24 x(([3+1+2+2]x2+1)+7(nrm_pp} = 0.5x24x17 or 0.5x24x24 = 204GFLOPS or 288GFLOPS。(一般用前者)

[ 本帖最后由 zhangjingy 于 2007-9-27 20:28 编辑 ]



[登录后才可回复]