您所在的位置:首页 >> 专题报道

真实重新定义,NVIDIA GeForce8800系列显卡

Reality Redefined,NVIDIA Geforce8800 Series

2006-11-09 16:41:38
出处: 本站
人气值:
作者: EXP Studio
精彩分页

Lumenex Engine:让画质与速度皆达极致

NVIDIA于全新一代G80图形核心绘图核心中进一步强化3D游戏画面质量,称为Lumenex引擎。

□-HDR+AA,不再让AMD独美

   G80图形核心所解放的特性中,一个比较重要的就是带MSAA的高动态范围光照(HDR)。在R5XX VS G7X的时候,闹得沸沸扬扬的HDR和MSAA冲突就源自于此。DX9没有FP格式的Backbuffer(后端缓存,用于存储一些中间运算的结果),因此从NV40到G71,NV的硬件在ROP中提供HDR功能的同时干脆一直没有做MSAA。ATI看中了这点,它们改善了自己X1000系列产品的ROP,允许程序建立一个MSAA的FP16 render target,渲染到其中,再建立一个FP16的render target texture,用stretchrect把带AA的rendertarget(rendertarget和render target texture都是渲染过程中的一些中介状态)复制到这个texture的表面中,这样最终结果就带上了AA效果。使其独特的HDR+AA成为一个出色的卖点,让NV行销宣传上吃了不少亏。


采用了HDR渲染技术在开启MSAA后拥有惊人的画面效果

   G80图形核心的FP Tex filtering Unit(浮点纹理过滤单元)和ROP(Raster Operation,光栅化输出单元)对FP32格式的HDR提供了从运算,存储,过滤到混合的原生硬件支持。G80图形核心支持一种独特的名为“Orthogonalized Frame Buffer”(直译为“正交帧缓存”)的功能,现在公开的资料还难于了解其详细情况,不过从《The art of unix programming》对于Orthogonalized的定义中我们可以窥其一二:“在纯粹的正交设计中,任何操作均无副作用;每一个动作只改变一件事,不会影响其它”。这意味着,任何对于Frame Buffer的操作都是独立的,而不会影响其他操作的进行。直接消除了FP32 HDR with MSAA在硬件上的屏障。

□-全新的抗锯齿模式

   全新的反锯齿技术将同时利用Coverage samples及Geometry Sample采样,称为Coverage Sample Anti-aliasing(CSAA) 。CSAA为单颗芯片带来四种不同的Multi-sampled Anti-aliasing 模式,包括 8x、8xQ、16x及16xQ ,其中8xQ及16xQ模式的画面质量更是进一步跃升。

  全新的CSAA 16x抗锯齿模式速度会和使用一般4x Multi-sampled Anti-aliasing(MSAA)模式相约,但画面质量将有明显加强。CSAA采用了一种全新的算法实现了几何取样和覆盖取样的结合。对于通常的超级取样抗锯齿(SSAA)来说,每一个被采样的象素都将被进行更细分的采样和计算,但对同一物体材质内部将可能得到非常相近的色彩,这毫无疑问会造成资源浪费,所以现在流行的MSAA模式将首先会对像素的位置进行检测,对于材质内部将不进行处理,只发生一次采制读取。CSAA将MSAA颜色和深度值(Color/Z)的取样点位置延伸到了被取样的Pixel之内,颜色值在被取样的Pixel点中心得到, 并且将Color和Z数据存放在缓存中,这样,我们能在保存同样的Color/Z数据下得到更多的取样点。实际上16XCSAA只需要保存4份Color和Z数据,却可以得到16个sample points(取样点)。


CSAA和MSAA存放相同取样点信息分别所占用的显存空间

  相对于通常的采样模式,CSAA的好处是,在覆盖取样点数相同的情况下,它所要保存的Z数据(深度缓冲数据)和Color数据(颜色数据)将减小50%至75%,这大大节约了宝贵的显存带宽。不过,当游戏采用大量的Stencil运算(比如容积阴影)时,CSAA模式将不会被启动而被降至4xMSAA模式。


Quincunx和2XMSAA的取样点对比

  QAA源自NVIDIA很早就有的一个名为的“五点梅花排列采样法”(Quincunx)抗锯齿算法。这个算法在上采样时对每个象素只产生两个子采样点,而下采样的时候却对5个子采样点进行了运算(通过从临近象素那里去“借用”子采样点的方法来获得多出的3个子采样点),这样以用2倍MSAA的性能损耗达到类似4AA的取样效果。NV这次在G80上改变了QAA的取样模板,将最大取样倍数提高到了16X,实现了更高的效果。


各类AA的取样信息和所占资源比较

  由于G80图形核心拥有高达64个浮点纹理过滤单元(Texture Filtering Unit),在各种纹理格式下都提供比现今任何一款G80图形核心高得多的性能,其各向异性过滤(AF)操作也变成了免费的功能。NV还特意取消了之前一直用使用的角度优化功能,来展示它的强大。

  G80图形核心的ROP(后端处理单元)也进行了重大改进,具备新型Early Z技术的GeForce 8800 GTX GPU可以相对于7900 GTX提升4倍的无用像素选择速度,最大限度的利用了带宽资源,配合高达384bit的外部存储器提供的超过80GB/S的带宽,足够免费为4倍MSAA这个级别的应用提供强力支持。

文章分页:上一页  1 2 3 4 5 6 [7] 8 9 10  下一页  下10页
关于我们 | 联系我们 | 网站记事
Copyright © 2006 Expreview.com. All rights reserved.
粤ICP备 06080755号