TGFC俱乐部>>游戏业界综合讨论区>>
- 翻页: < ##1 ##2 (2/2页)
- 刷新/显图/登录/注册/WEB




回复列表 (66)
#51 卖哥 2020-2-16 13:15
原帖由 Nemo_theCaptain 于 2020-2-16 12:55 发表

Larrabee的技术几年前拿去做了Xeon Phi,是一张和图像无关的运算卡,本质上就是把几十上百个Atom CPU堆在一起
一开始还是走PCI-E插槽的,后来索性直接成了CPU
从这个角度来说也不算太失败,只不过Xeno Phi与图像 ...

Xeno Phi在我看来是不怎么成功的

其实同期也有一个类似Cell思想的拿小cpu核心基于本地sram计算的众核设计。
SW26010,在工艺落后2代的情况下,能效比英特尔phi更好。

Cell如果发展下去绝对要比SW强得多。
拿19级固定流水线取代8~11级动态流水线,频率起码提升60%,工艺升两级频率起码再提升30%然后核心数翻倍,用HBM取代带宽严重瓶颈的8通道DDR3。
欧美一线设计团队,拿主流水平造一个4+256的类Cell众核,能效相对于SW26010绝对有3~4倍的提升空间,而Xeon phi却连条件严重不达标的SW26010都打不过。

===================
#52 yfl2 2020-2-16 14:07
原帖由 卖哥 于 2020-2-16 12:55 发表

今非昔比了,SGI图形部门曾是opengl的灵魂,在当时算是世界上最理解3D图形学的人,到了ati手里后首作9000系就反转局面。

至于EE,EE当时其实瓶颈明显,向量单元没有能力跑复杂逻辑还只能等cpu喂活,结果1cpu拖2 ...

哦,你还知道今非昔比
说说10年内索尼设计过的cpu gpu如何

===================
#53 卖哥 2020-2-16 14:16
原帖由 yfl2 于 2020-2-16 14:07 发表

哦,你还知道今非昔比
说说10年内索尼设计过的cpu gpu如何

现在不是收个会做gpu的团队在能效这一个指标就铁定不会比amd差么

===================
#54 yfl2 2020-2-16 14:24
原帖由 卖哥 于 2020-2-16 14:16 发表

现在不是收个会做gpu的团队在能效这一个指标就铁定不会比amd差么

苹果在mac上还用amd

===================
#55 卖哥 2020-2-16 14:37
原帖由 yfl2 于 2020-2-16 14:24 发表

苹果在mac上还用amd

对苹果来说,易于控制优先级大于能效呗。
当然现在苹果有自己的gpu了,估计几年后一次性把英特尔和amd都换了



===================
#56 ppkkhh 2020-2-16 15:13
原帖由 卖哥 于 2020-2-16 14:37 发表

对苹果来说,易于控制优先级大于能效呗。
当然现在苹果有自己的gpu了,估计几年后一次性把英特尔和amd都换了

问你个问题,苹果能不经过intel的授权做x86架构的cpu嘛?
还是970那个时候,苹果收的后来踢掉的那个gpu公司的ceo记者问他为什么现在不出桌面显卡了,他回答专利壁垒太高了,已经没有办法绕过nv和amd的专利了。intel的gpu始终需要nv和amd的授权,苹果比你东家还要强嘛?更何况索尼?

===================
#57 久多良木健 2020-2-16 15:19
posted by wap, platform: iPhone
原帖由 @yfl2 于 2020-2-16 14:24 发表
苹果在mac上还用amd
这事儿有媒体说过
苹果召回一批,时间太久老黄不肯买单,于是就闹翻了

===================
#58 yfl2 2020-2-16 15:33
原帖由 久多良木健 于 2020-2-16 15:19 发表
posted by wap, platform: iPhone
这事儿有媒体说过
苹果召回一批,时间太久老黄不肯买单,于是就闹翻了

我的意思是,卖个说是个组就能比amd强,结果苹果自己有gpu,在桌面端还是用amd

===================
#59 Zico2003 2020-2-16 15:47
原帖由 u571 于 2020-2-16 13:05 发表



CPU现在跑深度学习绝大多数模型都远差于GPU,要不然老黄Q4服务器市场怎么会卖的这么好?牙膏厂为什么还要重新做GPU?

另外固定功能单元对于GPU晶体管面积占用并不高,例如RT core只占SM面积7%,看GPU电子显 ...


INTEL重新开启显卡板块为的还是更好的整合数据中心业务,搭建全家桶呗

你想啊,自己的处理器,自己的芯片组,自己的DCPMM,自己的SSD,自己的FPGA,自己的万兆网卡,就差数据中心Xe GPU这块拼图就完整了

消费级显卡这块只是拿前者的边角料技术去应付一下市场罢了,这块有N&A盘踞多年竞争已经够激烈了,而且薄利多销价格战也从来不是牙膏厂的风格。

[ 本帖最后由 Zico2003 于 2020-2-16 17:29 编辑 ]

===================
#60 linkyw 2020-2-16 16:28
posted by wap, platform: Samsung
原帖由 @achen126 于 2020-2-14 15:55 发表
老子就想卖贵点怎么了?智能手机卖那么贵你们2年一换的不是挺香吗?499刀爱买不买!!穷鬼别tm玩游戏了,搞烦了老子不做游戏机喽
游戏在欧美本来就是相对廉价的娱乐产品吧……

===================
#61 卖哥 2020-2-16 17:16
原帖由 ppkkhh 于 2020-2-16 15:13 发表

问你个问题,苹果能不经过intel的授权做x86架构的cpu嘛?
还是970那个时候,苹果收的后来踢掉的那个gpu公司的ceo记者问他为什么现在不出桌面显卡了,他回答专利壁垒太高了,已经没有办法绕过nv和amd的专利了。int ...

苹果已经转过2次指令集架构了,经验丰富

苹果有自己的图形API

===================
#62 ppkkhh 2020-2-16 17:21
原帖由 卖哥 于 2020-2-16 17:16 发表

苹果已经转过2次指令集架构了,经验丰富

苹果有自己的图形API

能读懂我说什么嘛?
算了,也懒得跟你说了。

===================
#63 lihairenwang 2020-2-16 18:23
原帖由 Nemo_theCaptain 于 2020-2-16 11:58 发表
按照Dean Takahashi的说法
PS3早期的方案是非常奇葩的
最早是把16块EE并行运算,未果
然后想的是双Cell结构,一个当CPU一个当GPU
最后发现都不行了,才找NV弄了块显卡
当然Cell本身和PS2的架构没什么关系,并联 ...

cell本身和ps2架构有关系阿,cell的spu、psp的vfpu、ps2的vu都是一个架构思路延续下来的。

===================
#64 凶残的存在 2020-2-16 18:29
posted by wap, platform: Android
原帖由 @u571 于 2020-2-16 12:16 发表
这有啥奇葩的,Larrabee不也是这种思维方式,最终Cell和Larrabee完蛋的最关键原因还是Sony和intel根本不知道光栅化渲染到底是怎么回事

拿通用SIMD单元完全取代固定光栅化功能这不是脑子有屎么,别看显卡吹什么浮点性能,拿掉tmu、ROPs等等固定单元,100T单精度跑4K孤岛危机都只有个位数帧数

到现在游戏引擎里也很少碰通用计算,关键就是比起传统光栅化固定功能流水线,GPU通用计算慢的跟便秘差不多,这也是DX12到现在吹的异步计算尴尬处境,人家有什么需求直接光栅化跑完了,谁他妈的有毛病用计算指令慢慢跑
还正好有这么个例子,我们来看看是不是个位帧
https://m.expreview.com/72917.html

===================
#65 卖哥 2020-2-16 18:38
原帖由 凶残的存在 于 2020-2-16 18:29 发表
posted by wap, platform: Android
还正好有这么个例子,我们来看看是不是个位帧
https://m.expreview.com/72917.html

4K当然个位数
当然3990跑这个慢主要是缓存瓶颈,没几个核心满载的。
如果Zen有一个全局缓存架构应该并行性还能明显改善。

===================
#66 u571 2020-2-17 18:23
原帖由 凶残的存在 于 2020-2-16 18:29 发表
posted by wap, platform: Android
还正好有这么个例子,我们来看看是不是个位帧
https://m.expreview.com/72917.html



明显是最低特效,而且你自己去看油管视频,里面说了也利用到GPU做了部分视频方面加速功能,完全靠软件模拟光栅化跑4K全特效孤岛危机不是幻灯片就有鬼了

===================
#67 Mas 2020-2-18 11:06
原帖由 卖哥 于 2020-2-16 18:38 发表

4K当然个位数
当然3990跑这个慢主要是缓存瓶颈,没几个核心满载的。
如果Zen有一个全局缓存架构应该并行性还能明显改善。

槽点太多我已经不知道从哪儿说起好了……

===================

2/2页 上页 ##1 ##2


[登录后才可回复]