SexInSex! Board » IT新闻科技最前线(关闭) » GTX480年内难产NVIDIA费米面临推倒重来[6p]

查看完整版本: GTX480年内难产NVIDIA费米面临推倒重来[6p]

ula2006 2010-3-11 21:21

GTX480年内难产NVIDIA费米面临推倒重来[6p]

[size=5]GTX480年内难产NVIDIA费米面临推倒重来（转贴）[/size]

有消息说，NVIDIA即将在3月27日再一次发布他们由来已久的费米GF100（GTX480）显卡。这个让我们等待了有半年之久的显卡究竟是什么原因不断跳票呢？现在就让我们一起来了解一下GF100的近况——虽然最新流片的GF100从台积电回来已经几个星期了，但是前景仍不容乐观。
首先，我们在今年1月底得到消息，NVIDIA开始生产A3版GF100。尽管NVIDIA开始从台积电批量接收A3芯片，但是他们没有为此高兴，原因很简单，A3版GF100芯片尽管工作频率只有600MHz，但是发热量已经达到极限的一半，并且其中为顶级产品准备的A3版GF100 SP数量只有448个。最重要的是，台积电的GF100芯片产率百分比还维持在个位数。
更为微妙的是，尽管GF100芯片已经降频并削减了流处理器数量，但是芯片良率还是无法提升。更糟糕的是，如此之低的良率有可能让GF100最终推倒重来，完全重新设计。
NVIDIA目前的首要任务就是提升GF100芯片的良率。如果你还记得，我们之前曾经说过，第一次流片的GF100发热量巨大，良率极低，一片晶圆上的416个芯片当中只能挑选出7颗正常工作的芯片，也就是说GF100的良率低于2%。
GF100出现如此巨大的问题，可以追溯到之前他们在解决问题上的所作所为。GF100目前3个步进都被称为金属层流片，比完整的基础层改进流片成本更低，速度更快，大约两个月到看到结果。一个完整的基础层重新流片时间超过一个季度，有可能超过6个月完成，费用超过100万美元。金属层流片通常以更大的数字代表流片版本，比如A1到A2，而基础层重新流片通常以字母变化代表不同版本，比如A3到B1，NVIDIA通常以A1代表芯片首次流片，因此目前A3版本是代表GF100第3次金属层流片。
金属层流片往往解决逻辑问题，比如1 + 1 = 3这类的错误，而不是解决芯片功耗或产率问题。大多产率问题往往涉及芯片采用的制造工艺，以及芯片工作频率的既定指标和设计规则等等。因此，金属层流片可以看作是芯片流片的简化版本，不牵扯到功耗或良率问题。
NVIDIA在去年9月初得到第一批流片的GF100芯片，第一批流片的GF100时钟速度为500MHz，芯片生产良率百分比徘徊在惊人的个位数，并且发热量极大。
第二次流片的A2版GF100，工作频率有所提升，但是芯片良率仍然低得吓人，并且A2版GF100流片交付日期逾期一个月左右，所以你可以确信GF100芯片生产仍旧相当困难。这让包括NVIDIA在内的任何芯片公司都无法容忍。
SemiAccurate网站在去年圣诞节已经听说NVIDIA收到A3版流片样品，A3版没有改善芯片时钟速度。这并不奇怪，因为NVIDIA使用了错误的工具，即修改金属层来修复时钟速度和功耗问题。A3版芯片工作热量也非常大。因此，在去年3月了解到GF100设计架构之后，我们一直坚持GF100“无法生产”这种观点，如果NVIDIA要让GF100可以生产，那么必须推倒现在的GF100架构，重新设计GF100。
为什么GF100境遇如此悲惨？答案很简单，NVIDIA没有为GF100生产做好准备。NVIDIA公司根本没有做生产前的充足试验和有条不紊的深谋远虑。和ATI进行对比，我们可以看ATI采用HD4770（RV740芯片）来试验台积电40纳米工艺，并且从中总结经验教训，这种学习和汲取最终反馈到Radeon HD 5000系列GPU当中，因此5000系列GPU现在的良率完全在AMD可以接受的范围之内。
NVIDIA公司在2009年第一季度计划了四款40纳米GPU产品－G212，G214，G216和G218，它们分别是55纳米G200b，G92b，G94和G96的40纳米马甲版。 G212向40纳米迈进的情况非常糟糕，已经胎死腹中。G214的情况也好不到哪里去，为了配合40纳米大规模的生产，流处理器数量不得不从128个削减到96个，并且改名为G215，并终于在2009年11月批量投产，最终上市名称改为GT240，G216最终名称改为GT220， G218上市最终名称改为G210。这些产品从规划到上市过程当中，都有无数次改名运动，其中部分产品现在居然改名为300系列，NVIDIA从没有给出过这样命名的原因。
[img]http://news.mydrivers.com/Img/20100305/09191246.jpg[/img]
NVIDIA G215，G216和G218图形芯片各自的芯片面积大约是139平方毫米，100平方毫米和57平方毫米。这些芯片面积都非常小，而高端55纳米的G200b芯片面积超过480 平方毫米，更早的65纳米G200芯片面积超过575平方毫米。
ATI早在2009年4月就开始大批量出货面积为137平方毫米的GPU芯片。NVIDIA公司在40nm工艺上遇到严重问题，因此去年8月才开始向OEM厂商出货40纳米G216和G218芯片，之后NVIDIA花费几个月时间，才开始向零售渠道出货40纳米G215图形芯片。
类似图形芯片之间有粗略的产率对比计算方法，即芯片面积之比的平方，比如200平方毫米芯片的产率是100平方毫米芯片产率的1/4，50平方毫米芯片产率是100平方毫米芯片产率的4倍。图形芯片设计公司会为每一款芯片设计冗余结构，以修复制造过程当中的某些类型的错误，但这种冗余结构设计也有限制。
每个冗余设计都增加了芯片的设计面积，因此提升芯片成本。半导体制造是一个复杂的权衡过程，需要考虑到冗余面积成本与产率问题。如果你计划得当，你可以用非常小的冗余面积得到非常高的芯片产率。
去年春天和夏天，ATI已经向外界通报，他们在Radeon HD 5000系列芯片制造上吸取了RV740芯片制造的经验教训，这是一次非常富有成效的学习经验。其中深藏不露的秘密就是吸取了40纳米工艺在RV740芯片互连金属层之间的问题。另外，他们也了解到台积电40纳米工艺，在芯片晶体管构建上差异度非常大，特别是晶体管通道长度上。
既然Anandtech网站在Radeon HD 5000系列历史文章当中谈到这两个秘密，现在继续保密也毫无意义。这两个秘密也改变了晶体管的设计和布局，以减轻台积电40纳米工艺的差异度。并且它们消耗的冗余面积也比较大，对芯片功耗也有负面影响，但是这都是向40纳米进化必须付出的代价。
一方面，NVIDIA公司在40纳米工艺上没有做足功课。SemiAccurate网站数次获悉，NVIDIA解决这些的问题的方法是向台积电相关人士“尖叫”宣泄情绪，而不是积极改变芯片设计。
当NVIDIA公司发现问题并希望在GF100上进行修补的时候，为时已晚。除非台积电制造工艺出现奇迹，否则基本上来看，GF100设计是注定要失败。
可能有人要问为什么？ GF100芯片面大约550平方毫米，比我们之前报道的略大。 NVIDIA公司在100平方毫米芯片上遇到问题，在139平方毫米芯片遇到三个月的严重延误，的产量问题，并取消任何较大面积的芯片设计。NVIDIA没有像ATI一样做足40纳米功课，现在却试图以40纳米生产550平方毫米的GF100芯片。
基本的数学计算表明，GF100面积4倍于G215，它们之间在芯片结构上有某些类似，所以你可以预料GF100产率约为G215的1/16， G215本身产率就不高，但即使G215的产率为99%，你也可以预期GF100产率百分比只有个位数。
修复这些问题需要NVIDIA公司做ATI之前做过的功课，即改变芯片设计以适应台积电40纳米工艺。这个过程需要很长的工程设计时间和基础层重新流片，并可能需要针对旗舰产品进行一次金属层重新流片。如果一切顺利，NVIDIA还需要6个月才能带来GF100的完美版。
虽然这对NVIDIA来说是一件坏事，而且有可能让让GF100胎死腹中。但以目前情况来看，GF100实际上变得更糟，该芯片现在尺寸巨大，并且发热量也很大。业内人士告诉SemiAccurate，在2010 CES上展示的GF100显卡功耗280瓦。 NVIDIA公司在GF100第一次流片之前，就知道芯片将消耗巨大的电力这一情况，但它强调作为通用计算用途，GF100显卡功耗并未超出225瓦大关。
为了解决这一问题，NVIDIA的工程师告诉 SemiAccurate，NVIDIA决定让GF100芯片运行在一个非常低的电压，即1.05v，相比之下，ATI Cypress(HD 5800系列)工作电压在1.15V，TDP功耗在188W瓦，费米GF100的既定TDP功耗为225瓦，GF100每0.01v电压提升会导致工作电流50%的提升，简而言之，NVIDIA日后如果要选择提升GF100工作电压，将带来更大的功耗和发热量。
[img]http://news.mydrivers.com/Img/20100305/09191276.jpg[/img]
我们之前已经谈到台积电40纳米工艺有很大可变性和差异度。即有电流“泄漏”问题存在，这意味着和Cypress(HD 5800系列)以及工作频率更低的样品芯片相比，GF100零售版将消耗更多电力。这种问题的传统缓解办法是提升电压，让发生问题的晶体管正常工作，但这也使得晶体管泄漏更多电流，泄漏越多，芯片的发热量也越大。
温度更高的晶体管泄漏也比温度较低的晶体管更多，所以芯片就进入1个由泄漏导致的高温循环，让泄漏问题越来越恶化。这种恶性循环的解决办法之一，就是在显卡上采用更加强悍的散热器和散热风扇，但这样将提升显卡成本，并且增加噪音。NVIDIA史上的GeForce 5800就是这种恶性循环的典型案例。
台积电40纳米这种问题，意味着有大量分散的薄弱的晶体管分布于芯片当中，并导致想当程度的漏电问题。如果NVIDIA提升电压，那么他们也同时大规模提升芯片的功耗。如果不提升电压，那么大量脆弱的晶体管基本上不工作，意味着芯片实际上是“破损”或“缺陷” 的，这两个目标相互对立，而NVIDIA现在低电压，高电流的政策只会让问题加速恶化。
如果这还不够糟糕，消息来源告诉 SemiAccurate说，台积电40nm工艺非常热敏感。晶体管漏电问题随温度提升成正比增加，激烈程度远远超过以前的工艺。如果你超过某一临界温度，漏电的快速上升令人震惊。
NVIDIA可采用的另一种方法是屏蔽那些过于脆弱的晶体管，保持电压不变。不幸的是，GF100在架构上的设计，让这个变通方法非常棘手。费米GF100架构上由16个组的32个着色单元组成，构成全部512个着色器。从各方面来看，如果你要屏蔽脆弱的晶体管，你被迫去屏蔽整个1组32个着色单元，由于脆弱晶体管分散在整个图形芯片当中，因此，屏蔽2组晶体管，把意味着你失去64个着色器，这种级别的着色器丢失，是NVIDIA无法承受的。
就当前的A3版本来说，消息来源告诉我们，NVIDIA不得不在两个方面进行“修复”，即至少关闭2组着色器，丢失64个着色器，并加大电压。这使得GPU在消耗更多电力的同时，丢失至少12.5%的预期性能。如果你在一台个人电脑当中使用这种芯片那无所谓，但是如果在超级计算机当中，成百上千大量使用这种芯片，这意味着计算性能的大量丢失。
因为GF100功耗巨大且和晶体管薄弱，费米GF100根本不会运行在高工作频率。去年3月，消息人士告诉SemiAccurate，预期的时钟频率为主频750MHz，sp频率1500MHz。既然你只能提升电压凸现奇迹，因此我们听到了 A3版GF100只有600MHz，sp频率只有1200MHz，而且是关闭2组着色器（64个着色器）之后的结果。
NVIDIA公司去年秋天声称GF100性能超过Cypress(HD 5800系列)百分之六十以上。现在声称的领先幅度迅速下降到百分之四十，在CES上，NVIDIA 公司只能挑选最适合GF100架构的游戏和基准测试来炫耀它的架构优势。这些淋漓尽致的百分之六十领先幅度，是他们认为最好的情况。
如果百分之六十的领先幅度来自512个着色器完全工作，750/1500MHz工作频率，280瓦功耗的费米GF100，那么448 个自着色器，600/1200MHz工作频率的GPU只有87.5%的着色器数量和80%的工作频率，那么领先程度就是160*0.875*0.8 = 112，即领先Cypress(HD 5800系列)大约12%，不要忘记，ATI已经有两颗Cypress(HD 5800系列)芯片的5970上市，费米 GF100性能不能指望接近5970。
费米GF100芯片面积比Cypress(HD 5800系列)大至少60%，这意味着它的成本也高出Cypress(HD 5800系列)百分之六十以上，实际情况有可能接近3倍之多。 NVIDIA公司需要GF100有显著超越Cypress(HD 5800系列)的性能标杆，以订出它可以获利的价格点，即使不考虑产率问题。相比之下，ATI已设定HD 5970上限价格。
现在谣言四起，传闻NVIDIA将只有5000到8000片GF100芯片，以GTX480型号投放市场。SemiAccurate有直接听一个不太明确的数字，即“低于1万片”。在今年3月底发布GF100之前，GF100显卡已经生产大约2个月时间。NVIDIA在去年年底从台积电购买了大约9000片“风险”晶圆，如果每片晶圆可以拿出104颗芯片候选，那么9000片晶圆意味着936K颗芯片。
[img]http://news.mydrivers.com/Img/20100305/09192940.jpg[/img]
即使NVIDIA将初始生产目标提升10倍，其产率仍然在一位数的范围内。每片晶圆成本在5,000美元，每片晶圆拿出10颗正常工作的芯片，这是一个相对非常良好的状态，这使得每颗GF100成本大约在500美元，即10倍于ATI的成本，再加上GTX480显卡其它材料成本，让其售价超越ATI HD 5970，让他GF100显卡性价比远低于HD 5970，并且其零售价格有可能接近于其它专业工作站和计算显示卡价格。
GF100真正的修复，需要重新设计电路，尽量减少台积电工艺在晶体管差异上的影响。这都需要花费时间和芯片面积，从重新投片算起时间至少需要6个月才能上市。如果你还记得，费米在去年7月下旬投片成功，在11月下旬接受少量预定。如果今天改进版的GF100开始投片，那么要到2010年第三季度才能让B1版GF100流片成功，那时竞争对手都接近于拿出下一代28纳米图形芯片，因此GF100就算改版，也不会有很长的使用寿命，它将很快被28nm下一代芯片所取代。
NVIDIA公司如果进行必要的更改，这也会带来另外两个问题。 NVIDIA公司现在遇到两个工程问题，即芯片尺寸瓶颈和功耗瓶颈。功耗瓶颈很简单，一个PCI-E卡的300W的硬性限制，超过这个限制，你不会得到的PCI-E认证，没有认证意味着法律责任问题，OEM厂商不会让他们的PC采用这种显卡。这意味着显卡已经在市场上死亡。到目前为止，GF100功耗已经达到 280W，NVIDIA公司已经在无法通过PCI-E认证的边缘。
芯片尺寸瓶颈情况类似，你只能适应台积电40纳米蚀刻工艺掩模的限制，G200已经几乎接近于这种限制，费米GF100的任何变化设计，很可能会推动芯片的尺寸，让其根本不适合台积电40纳米工艺。在这一点上，唯一的办法，是采用更加先进的28nm工艺，但第一个28nm工艺晶圆可以切割出正常工作芯片的时间，要到2010年最后几天才行。
费米GF100芯片已经比最初计划晚了6个月，即便可以批量生产，也已经无法获得利润。GF100初期产品，将有部分提供给公关用途，即提供给媒体和相关公关单位进行评测。NVIDIA每卖出一张GF100显卡都受到了巨大的损失，也就是说，最初的9000片风险晶圆切割完毕之后，NVIDIA不会再向台积电订购这些晶圆，因此即便大部分GF100显卡用作公关之用，NVIDIA也没有什么损失。
GF100芯片无法工作，无法生产，无法修复。如果NVIDIA公司在工程管理上还有作用，那么它现在应该宣布费米1代终结，集中资源进行费米2代研发，并且有可能在2010年内还有胜算。如果打算对费米1代修修补补，基本上是不可行的，除非芯片直接采用28nm生产。
此情况让NVIDIA一直到2011年，除了在公关方面继续作文章之外，没有任何希望。费米的衍生产品只存在于纸上，他们还没有投片。如果NVIDIA投片这些衍生产品，它们将在芯片尺寸、功耗和产率上遇到和费米GF100相同的问题。ATI将继续对Cypress(HD 5800系列)衍生产品降价，因此，NVIDIA公司在衍生产品上无法赚钱，也无法及时解决问题。 NVIDIA在2010年内没有任何可以获利的DX 11产品，这种情况将一直持续到2010年的最后几天。
正如我们自去年5月以来一直说，费米GF100是错误的芯片，以错误的方式制造，为了错误的原因。NVIDIA不顾一切批评竞争对手和产品，比如Intel的Larabee，却最终导致费米GF100 沉没。英特尔常识性地重新调整Larabee芯片和相关公关战略，而不是继续向注定沉没的货船继续砸入数千万美元。NVIDIA的管理技能看上去不如Intel，NVIDIA公司不仅设计了一个“Laughabee（可笑的bee）”，也违背所有意识和常识，继续建造它们的“Laughabee（可笑的bee）”。

[size=5][color=red]题外话：虽然我是A饭，但是看到此贴很震惊！说句真心话，不喜欢NV就此倒下，还是希望NV能够尽快出台可以和ATI 5系列显卡匹敌的显卡，这样作为消费者，大家才能买到性价比高产品，就像我自己，很喜欢5870，但是个人觉得这个价格确实不是很合理啊！
[/color][/size][img]http://news.mydrivers.com/Img/20100305/09192953.jpg[/img]
[img]http://news.mydrivers.com/Img/20100305/09192971.jpg[/img]
[img]http://news.mydrivers.com/Img/20100305/09192990.jpg[/img]

riskstar 2010-3-11 21:41

现阶段的产品的良品率控制是每次制程或架构更新都要面临的问题。

sex1732 2010-3-11 22:05

NV有很长一段时间战略确实有些过于激进，非要和ati拼出显卡的标杆，5870目前在D11已经是出于绝对的优势，NV却在如此长的时间里拿不出可以与之匹敌的产品，按常理来说简直是无法想象的，就算年中能出，亦早已慢了定律一年了

wangyu7878 2010-3-12 00:33

*** 作者被禁止或删除内容自动屏蔽 ***

Baihumon 2010-3-12 00:59

还是那句
费米你快出来
让我好买便宜的5850

longzl 2010-3-12 02:15

ATI做得很好，HD57XX和HD58XX系列凭借低成本（较小的晶圆面积）、低功耗（低并行处理能力）、高良品率和DX11里诸多新技术的支持，可以在目前的状况下稳住阵脚，逐步体现出其显卡的潜在价值。而NV只欲高高在上的鼓吹性能，会遭到失败的。

kaka434 2010-3-12 02:40

N卡主要是價格虛高，雖然稱有種種的技術，但是太高端，幾乎沒有支持的，功耗還大，A卡還是性價比高些，和AMD組3A平臺仍舊是高性價比！

mazi512 2010-3-12 03:51

对于一个拥有独显就心满意足的人来说，这些实在太遥远。

boluo388 2010-3-12 03:57

太先进了，这样的话游戏要做成什么样子，那成本估计不知道要多少了，所以这些新的东西还是在军事上用较好

kimg_chan 2010-3-12 09:47

NV其实有个很郁闷的地方，一再宣传自己的“费米”是多么多么的牛B，对手的产品是怎么个破烂，但是自己的产品一直都在从“火星”运送到地球的过程中，而且还要“挑战”芯片生产厂家的技术水平，不管你的设计有多么牛，性能多么好，如果在现阶段没人可以制造出来，那只能是浮云

minifish2010 2010-3-12 12:03

感觉 NV 太高调了，骂 Intel，骂 AMD，有一段时间不理睬微软，现在报应来了

heiqijuntuan 2010-3-12 12:57

楼主的评论好专业啊，不是很能看明白，还是希望英伟达能早点解决这个问题吧，一家独大可不好啊

kkcvbl 2010-3-12 13:50

這次的nv是碰到巨大危機了
著急不是解決的方法
推倒重來就推倒重來吧
熬過難關，復蘇的nv仍然可怕

88954275 2010-3-12 21:04

呵呵，与我们的生活还很遥远，汤不伤感兴趣

ting2424 2010-3-13 18:19

虽说N卡现在不济但很多游戏还是有物理加速的爽我用的a卡还总是vpu重置~

qqddsshhjj 2010-3-13 19:36

看来ATI有希望追上竞争对手了，amd+ati独领风骚的时候不远了啊。

kwkkwkkwk 2010-3-13 22:47

NV加油

费米要是不出的话ATI肯定不会降价，我想要5870啊~~~~~~~~~~~~~~~~·

超长悲伤 2010-3-14 00:19

啥都不说了，不看好ati，支持nvidia，希望nvidia一切能够好运，打败ati

lizee3839229 2010-3-14 01:30

现在的游戏对显卡的要求很高但NV的显卡我觉得不怎么样

hjtx2002 2010-3-14 01:35

我现在用的GT 240显卡感觉就是一杯具惨不忍睹 N卡一直在吹嘘自己我打算过段时间就换A卡

页: [1] 2

查看完整版本: GTX480年内难产NVIDIA费米面临推倒重来[6p]