三款gtx295显卡盘点
对于显卡行业略有了解的朋友,一定不会对GTX295显卡感到陌生。作为曾经全球最强的显卡,GTX295获得了用户的极大关注,哪怕是今天也是显卡产品中辉煌的存在。今天,小编就为大家来盘点几款热门的GTX295显卡产品。
1.映众(Inno3D) GTX295 Platinum
该显卡所采用的是NVIDIA的P685公版,内建两颗GT200 GPU核心,共拥有480个流处理单元与160个纹理单元,其默认核心频率为600MHz。显存方面,它拥有896*2MB的GDDR3显存,最大分辨率为2560*1600像素。散热方面,该显卡的设计与公版相同,采用的是一体化散热系统,通过巨型双导热管+大型散热风扇,能够有效的排出显卡热量。接口部分,该显卡所采用的则是双DVI接口的设计,但能够通过转换接口来满足各种高端显示设备的要求。该显卡的参考价格为3999元。
2.映众(Inno3D)iChill GTX295黑金
这款显卡由映众与Bitspower联手打造,是一款散热性能极佳的液冷版GTX295显卡。该型号显卡的性能与公版相差无几,但在散热器方面拥有顶尖的设计。在水冷头上,该显卡采用了纯铜镀镍材质,采用了一体化的设计,并加以镜面抛光工艺进行加工。而在水冷头的进出水口,则设计有一个可旋转的转接座,可以实现多种灵活的用途。当然,该显卡的价格自然不菲,官方报价4999元,比较适合各位显卡发烧友们选购。
3.影驰GTX295
这款希艾娜卡采用了基于55nm工艺制程的单PCB显示核心,共拥有480个流处理单元,可以完美的支持DirectX 10、Shader Moder 4.0等显示技术。显存方面,该显卡拥有1792MB的GDDR3显存,性能十分强悍。供电方面,这款显卡则采用了核心+显存独立供电的模式,拥有6pin+8pin的供电接口,为显卡的稳定工作提供了可靠保障。散热方面,该显卡所采用的是公版的大型散热器,能够实现长期有效散热。该显卡的参考价格为3699元。
GTX 295全面评测
新旗舰GTX 295参数介绍
自2008年竞争对手AMD的RV770显示核心发布后,基于该核心的Radeon HD 4850和Radeon HD 4870显卡以出色的性能、合理的价格定位,对NVIDIA的产品线造成了较大影响。之后发布的Radeon HD 4870 X2更是拿下了性能王座;当Radeon HD 4850 X2发布,基于RV770核心的家族到齐,形成非常立体的产品线:Radeon HD 4870 X2、Radeon HD 4850 X2对GeForce GTX 280、Radeon HD 4870 1G对GeForce GTX 260。
当然,NVIDIA不会让这种局面长存,很快便推出新产品加以应对,那就是基于55nm GT200核心的显卡:新版GeForce GTX 260、GeForce GTX 285和GeForce GTX 295,分别应对竞争对手的Radeon HD 4870 1G、Radeon HD 4850 X2和Radeon HD 4870 X2。其中GeForce GTX 295就是NVIDIA新一代旗舰。
Geforce GTX 295采用双PCB和双核芯设计,由两颗55nm GT200核心组成,共有480个流处理器,核心/Shader/显存频率分别为576MHz/1242MHz/1998MHz,显卡最大功耗为289W。
Geforce GTX 295虽然采用的是GT200核心,但它的规格比较怪异,拥有240个流处理器、80个纹理单元,无疑符合完整GT200核心的规格,但ROPs却只有28个,比起完整个32个少了一组。
GT200核心架构分析
GeForce GTX 200系列带来了全新的第二代统一架构。而第二代统一架构最大的特点就是在全部继承第一代统一架构的优点后,提升各单元处理器能力的同时也提升了效率,真正意义上把同一架构发挥至极点。为了适应未来并行运算的需要,GeForce GTX 200系列显卡开创性提供了2种不同的架构——并行处理架构与图形处理器架构。
从上面的架构图可以看出,GeForce GTX 200系列可以分为四个层,最上面一层包括了图形处理器所需要的几何着色器(Geometry Shader)、顶点着色器(Vertex shader)以及像素着色器(Pixel shader)。中间一层包括了10组TPCs(计算处理器群集),每组TPC里面又包含了3组SMs(流处理器组),每组SM里面就包含了8个流处理器单元或计算单元。这样一来,GeForce GTX 200显卡就一共包含了240个流处理器单元或计算单元。在TPCs下面就是纹理单元以Atomic单元(在并行计算中负责处理冲突的单元)。在下面就是ROPs(光栅化处理器引擎)以及显存接口。
优化的shader/TF比值 适应未来的需求
在图形处理方面,GeForce GTX 200可以说有了成倍的性能增加,不仅在流处理数量方面的成倍增加,在跟图形处理器息息相关的几何着色器(Geometry Shader)及数据流输出(Stream Output)、ROPs、纹理填充率以及寄存器方面都有长足的进步。
目前,越来越多的游戏以及应用程序都需要大量的shaders,未来在shaders以及纹理单元上寻找一个最佳的平衡搭配,GeForce GTX 280显卡在每组TPC中,多添加了一次SM,然后保持TF的数量不变,这样一来shaders与TF的比值要比上代产品提高50%,非常适合目前以及未来的游戏和应用程序的需求。
提升几何着色器及数据流输出(Stream Output)的表现
随着DX10游戏的流行,在DX10规范中首次引用的几何着色器(Geometry Shader)作用用来越显著。为了提升GT200的游戏表现,顶级GeForce GTX 280内部的输出缓冲限制已显著升至上代产品的6倍,提供了更快的几何着色器(Geometry Shader)速度以及数据流输出(Stream Output)表现。
加倍的寄存器文件
在上代旗舰G80核心中,在每组流处理集(SM)里面添加了高速的本地缓存用于存放shaders之间计算完的活跃数据。但随着编程的复杂度增加,shaders的处理器能力也得到了成倍的增加,一次可完成上千条指令。寄存器的容量就成为了整个核心的瓶颈,当SM内寄存器的容量不足以保存全部处理后的活跃数据时,溢出的数据就会直接存放到显卡的显存当中,而本地显存较大的延时会严重影响性能。为了解决这个问题,适应未来更复杂的编程需求,在GT200核心的寄存器容量直接提升至上代产品的2倍,大大减少了数据溢出到本地显存的机率,使GT200的运算性能更强,运算效率更高。
升级ROPs(光栅化处理器)
最新的 GeForce GTX 200系列GPU ROPs不仅全部支持上代产品的特性,而且还实现了最大32 pixels输出每时钟,等同于八个ROP分区中每个ROP分区输出4 pixels每时钟,同时每个ROP分区在8X MSAA下支持32 色彩和Z采样每时钟。像素方面采用了U8(未签名8 bit整数)数据格式,像素的混合比率是上代产品的2倍。跟仅有6个ROP分区以及支持24 pixels输出每时钟,12 pixels混合每时钟的上代产品相比,GTX 280提升到支持32 pixels输出和混合每时钟。能给用户带来更绚丽更真实的视觉效果。
提高了纹理表现
GeForce GTX 200系列再次提升了纹理的过滤与寻址能力。在每个TPCs(流处理集组)中提供了一个双四纹理(共8个)处理单元,能够提供每时钟8 pixels的双线数寻址和过滤,FB16双向材质过滤可以实现每时钟4 pixel来操作,如果是FP2:1的各向异性过滤也可以每时钟4 pixels来完成。内部集成的10个TPCs能同时完成每时钟80 pixels的双线数寻找和过滤。除此之外,GeForce GTX 200系列还创建了一个非常高效的程序来管理,使其纹理过滤表现能达到理论最大值,性能上较上代GeForce 8800GTX显卡有不少的提升。
面向未来:CUDA并行计算的应用
随着显卡的发展,GPU越来越强大,第二代统一渲染架构的Geforce GTX 200系列拥有200多个单独的ALU,因此非常适合并行计算,而且浮点处理能力也远远优于目前的多核CPU,加上GPU为显示图像做了优化。在众多计算领域上已经超越了通用的CPU。如此强大的芯片如果只是作为显卡就太浪费了,因此NVidia推出CUDA,让显卡可以用于图像计算以外的目的。CUDA(Compute Unified Device Architecture)工具包是一种针对支持CUDA功能的GPU(图形处理器)的C语言开发环境,未来还将发布Fortran语言版本。
CUDA(Compute Unified Device Architecture)是一个新的基础架构,这个架构可以使用GPU来解决商业、工业以及科学方面的复杂计算问题。跟以往的GPGPU概念不同的是,CUDA是一个完整的解决方案,包含了API、C编译器等,能够利用显卡核心的片内L1 Cache共享数据,使数据不必经过内存-显存的反复传输,shader之间甚至可以互相通信。对数据的存储也不再约束于以往GPGPU的纹理方式,存取更加灵活,可以充分利用stream out特性。以上几点都将大大提高GPGPU应用的效率。例如,在游戏中我们可以使用CUDA来让GPU承担整个物理计算,而玩家将会获得另他们感到惊奇的性能和视觉效果。另外,用于产品开发和巨量数据分析的商业软件也可以通过它来使用一台工作站或者服务器完成以前需要大规模的计算系统才能完成的工作。这一技术突破使得客户可以任何地方进行实时分析与决策。同时,一些以前需要很先进的计算技术来达到的强大计算能力的科学应用程序,也不再受限在计算密度上;使用CUDA的计算可以在现有的空间里为平台提供更强大的计算性能。CUDA采用C语言作为编程语言提供大量的高性能计算指令开发能力,使开发者能够在GPU的强大计算能力的基础上建立起一种效率更高的密集数据计算解决方案。
CUDA工具包推出已有1年,它的推出马上受到了众多软件/游戏开发商以及科研机构和程序爱好者的欢迎,NVIDIA方面也将发布最新的CUDA 2.0版本。相信在未来,CUDA将会受到越来越多的领域的支持。目前,支持CUDA环境的GPU主要有采用统一渲染架构的显示核心。
下面是CUDA实现的GPU并行计算应用:
BadaBoom视频压缩
一直以来,视频编码的转化都是令用户非常头疼的一件事,一款顶级的处理器在转换容量巨人的视频文件的时候,慢如蜗牛的速度令人难以忍受,这也主要受目前CPU性能的制约。目前,NVIDIA与许多软件开发商在推广支持GPU加速的视频压缩软件,Badaboom就是一款支持GPU加速的视频转换软件,可以把mpeg2的视频转换为ipod或者iphone这样的所使用的H.264视频格式,据称速度方面是目前CPU转化的10倍以上,为了验证其真实性,我们就做了一次相关的评测。
由于目前这个版本仅支持GPU加速,所以我们并不能拿来与CPU进行同平台对比,考虑到目前参差不齐的编码软件,测试结果仅做主观参考,从软件显示的编码速度来看,编码帧数达到了130帧每秒,一个160M的MPEG-2文件压缩至iphone标准视频仅1分钟内就可以编码完成。这个速度相信已经超过了目前所有的CPU版本编码软件。
以上就是小编要为大家盘点的GTX295显卡,希望大家能够喜欢。