顯卡知識
前言
2000年終于到了,除了極少數(shù)的電腦出現(xiàn)千年蟲問題以外,其它的都平安過渡。隨即而來的還有微軟的世紀(jì)大作 --Windows 2000操作系統(tǒng)。它對個人電腦的配置提出了更高的要求。以往每一次微軟操作系統(tǒng)的變革,都將帶來一次個人電腦升級熱潮,再加上去年經(jīng)濟危機時許多人都暫緩了PC的購買計劃,因此今年的PC市場將出現(xiàn)極度熱銷的景象。
傳統(tǒng)認(rèn)為PC整體性能與CPU指標(biāo)成直接正比關(guān)系,但到了2000年,人們的思維恐怕要轉(zhuǎn)變一下了。
nVidia公司推出了世界上第一個GPU(圖形處理器)以后,CPU把繁重的轉(zhuǎn)換和光影計算交給了顯示卡來完成,從而騰出更多的時間來完成其它的工作。因此CPU對于3D圖形運算和游戲來說顯得不再那么重要,當(dāng)然,更快的CPU還是我們所推薦的。
2000年恐怕是3D圖形界最熱鬧的一年。大家都趕在新世紀(jì)發(fā)布新一代的顯示卡。為了爭奪這越來越大的市場,老當(dāng)益壯的S3、尊貴的Matorx、老牌勁旅Ati、游戲殺手3dfx、還有昔日的黑馬王,現(xiàn)在已儼然一幅王者姿態(tài)的nVidia,都將拿出自己的殺手锏,新一代的顯卡大戰(zhàn)蓄勢即發(fā)。
3D技術(shù)解疑
為了使大家能更清楚地知道顯示卡的工作原理,因此在介紹圖形芯片之前先簡單介紹一下一些常用的3D圖形技術(shù)術(shù)語,希望大家看完后對在3D顯示芯片以及顯示卡評測中經(jīng)常提到的一些名詞有一個充分的認(rèn)識,從本質(zhì)上區(qū)別顯示芯片和基于它的顯卡的優(yōu)劣。
什么是圖像?
許多人可能都無法很確切地回答這個問題。如果從人眼的角度去看的話,就是光照射到其它物體上,再反射到我們的眼里,經(jīng)過視網(wǎng)膜成像,再通過連接到大腦的神經(jīng),把信息傳到大腦,這就是我們看到的"像"。如果從顯示器的角度來看,通過電子槍在顯示屏上掃描,結(jié)果就成 "像"。那么這個像到底是由什么構(gòu)成的呢?
我們知道,在視網(wǎng)膜內(nèi)有成千上萬神經(jīng)元,每一個神經(jīng)元就是一個"可視信號"的接收源。它們把各自接收到的"信號"匯總,就成為了一幅完整的圖像。我們再來看看電腦用的掃描儀,它通過2^n次方個CCD元素感受反射來的光,可以說,它完全是模擬人眼的接收原理制作的。CCD元素越多,掃描出來的圖像越清晰,細(xì)節(jié)越豐富。這又是為什么呢?從微觀世界來看,任何物體都是由許許多多的原子組成的。如果我們假設(shè)這里每個原子是這個物體的一個面的話,那么由多少個原子組成的物體,就應(yīng)該有多少個反光源。如果我們提供同樣數(shù)量的"接收源"如人眼的視網(wǎng)膜和掃描儀的CCD感光單元,那么我們就能全部捕捉該物體的樣子,不會遺失任何一個細(xì)節(jié)。但由于結(jié)構(gòu)上的不同,往往"發(fā)射源"和"接收源"的數(shù)量不同,因此總會有細(xì)節(jié)上的丟失。
點、分辨率和像素Pixel
我們現(xiàn)在已經(jīng)知道,圖像是由許多細(xì)小的"點"構(gòu)成的。從事物的角度來說,像的最基本單元是點,但在顯示屏上,我們把成像的這些點叫"像素Pixel"。像素Pixel做為最基本的顯示單位,其實我們早就開始接觸了。還記得買顯示器的時候,店主對你說,這臺顯示器的最高分辨率是1600×1200。這代表什么?
原來,1600×1200分別代表顯示器的水平線和垂直線上的像素Pixel的數(shù)量。1600即表明該顯示器每行水平線上最多能表現(xiàn)1600個像素 Pixel。而垂直線上一共有1200個,那么總的來說,在分辨率為1600×1200的顯示畫面上,我們能夠看到的像素共有1600×1200= 1920 000個。然而,這臺顯示器我們也能用800×600的分辨率進行觀看,那么意思是說在使用800×600的時候顯示屏上的像素單元少了嗎?800× 600的時候一幅畫面里會有800×600=480 000個像素。我們剛才不是說過顯示器的最大分辨率時能顯示1920 000個像素嗎?少了的像素跑到那里去了?
原來,在同樣的面積里,如果像素少了,就意味著成像的點少了,但是該幅圖像仍然保持同樣大的"占地面積",然而不同的是,它變得"粗糙"了(一些細(xì)節(jié)丟失了),為什么?就是因為表現(xiàn)這些細(xì)節(jié)的點沒有了啊。也可以這樣看,就是把點的數(shù)目減少了,然后在按一定的規(guī)律把點放大使圖像大小不變,然而因為的的確確是把一些點給拿走了,因此那些點所表現(xiàn)的地方也跟著被去掉了,所以你就會覺得該圖像少了些"東西"(這就是我們說的細(xì)節(jié))。
在分辨率為1600×1200的時候,因為水平和垂直線上的像素都比800×600增加了一倍,在畫面面積沒有增大的情況下,因為點的數(shù)目多了,顯示的" 內(nèi)容"也更加豐富了。因此,更高的圖像分辨率雖然不能使我們獲得更大的圖像(因為顯示器的可視面積不變),但卻會帶來更多的畫面細(xì)節(jié)。
現(xiàn)在,我們已經(jīng)知道什么是像素,像素就是顯示屏上每幅畫的最小構(gòu)成單位。它其實是一個帶有各種顏色的小點,當(dāng)然了,如果你顯示器上的圖像是一幅黑白兩色的位圖,那么這些像素點也就只有黑白兩種顏色了。同樣的,如果你的畫面是32位色的,那么像素也應(yīng)該會是32位色。
多邊型Polygons
每一個物體其實都是由各種形狀的多邊型組成。還記得小學(xué)時候的幾何課嗎?老師把一些點和線連接成一個封閉的框,這就是一個任意形狀的多邊形,它(多邊形)就是由點和線組成的。最常見的多邊形是三角形,它幾乎是通用的。任何的多邊型都能轉(zhuǎn)換成三角型組合而成的形式,只不過是三角形數(shù)目不同罷了。眾所周知,要組成三角形也非常的容易,只要尋找三個頂點,再把它們用線連起來就可以了,如果再往上想增加另一個三角形,只須在這個三角形的外部尋找一個你需要的頂點,然后再和已存在的三角形的任意兩個頂點連接起來。4個點,5條線就可以構(gòu)成2個三角形。因為它們之間共用了一條邊。
為什么不用四邊形呢?或其它的多邊形呢?這是因為電腦必須用數(shù)據(jù)把這些點和線描繪出來。想一下,一個四邊型如果想再增加多一個,那么必須增加兩個頂點和三條邊,因此需要的儲存空間就更大,換句話來說,使用三角型作為多邊形構(gòu)成的基本單位是基于節(jié)約存儲空間和操作方便的考慮。
我們看到的3D游戲里的3D模型,就是由許許多多的2D多邊形構(gòu)成的。采用的多邊形數(shù)目越多,圖像就越平滑。是否記得小學(xué)老師給你們做過一個這樣的演示,在一個圓上取4個點,用直線把四個點連起來,得到的當(dāng)然是一個正方形,但隨著圓周上所取的點的數(shù)目的增加,原先的正方形就成了多邊形,并越來越接近圓,假設(shè)點的數(shù)目足夠多,那么連起來的線也越來越多,"圓"就越來越圓。3D模型成像原理也是這樣的。如果擁有足夠多數(shù)的多邊型來夠成一個3D模型,那么它就可以做得很真實,3D模型的邊緣也會過渡得很平滑。但因為使用更多的多邊形構(gòu)圖必將占用更多的存儲空間和處理時間,因此我們又不能盲目地增加游戲中多邊形的數(shù)目,沒有一個人喜歡玩像放幻燈片似的3D游戲,即使畫面效果非常棒。
現(xiàn)在的3D加速卡一個很重要的指標(biāo)就是三角形生成速率,如上面的一張圖,那個女主角就是由998個多邊形構(gòu)成。但在一個真實的游戲里多邊形的數(shù)目要多得多,因為還必須添加上其它場景和角色,粗略估計現(xiàn)今比較好的3D游戲(這里指畫面質(zhì)量)一個場景大概有500 -600萬個多邊形吧。TNT2 Ultra的三角型生成速率有800萬個/秒,因此現(xiàn)在的游戲?qū)λ鼇碚f應(yīng)該沒有什么大的問題。隨著越來越多更為強大的3D加速芯片的來臨,將來的游戲畫面一定會變得更真實,細(xì)膩和圓滑。
特塞爾Texels和紋理Textures
當(dāng)程序員完成對3D模型各個多邊形的構(gòu)造后,他們就開始著手往多邊形上貼紋理了。剛才我們也看到了,只完成多邊型構(gòu)造的3D模型很難看,如果游戲中的物體像剛才的那幅女Model那樣不進行貼圖處理,還有誰會來玩?假設(shè)在一個游戲里出現(xiàn)一棵樹,我們就必須在象征這棵樹的3D模型上貼上與樹皮類似的紋理,只有這樣這個3D模型才像棵樹嘛(你有見過沒有樹皮的樹嗎)。通過往3D模型上貼上紋理,我們就能構(gòu)造出一個真實的3D世界。而特塞爾是紋理(其實它也是一幅圖像嘛)的最基本構(gòu)成元素,它就是紋理(這幅圖像)的像素單元。
像上面的一幅圖,這種較大的材質(zhì)位圖如果用來貼在3D模型上,那么就被稱之做紋理了。多邊型貼上了上面這幅紋理以后,你說會不會像紅泥地呢?
大家有沒有想到,當(dāng)紋理貼到多邊型表面的時候,由于不是每個多邊型的大小都一樣,并且絕大多數(shù)的情況下它們的大小與紋理大小完全不同。因此,在兩個多邊型粘合的邊緣部分,紋理由于不規(guī)范相交而造成錯體,就是疊合不起來,圖像會存在缺陷。
于是,各大顯示芯片廠商提出了雙線性、三線性和各向異性抗混疊功能,就是為了盡可能地掩飾紋理交疊錯誤這一破綻。
我們前面說過了,如果同一面積里的圖像像素增多,那么圖像就會更加清晰。那么如果紋理使用更多像素構(gòu)成的圖像,那么我們不就能獲得更為真實和清晰的3D造型嗎?事實上真的如此,可惜的是現(xiàn)在由于硬件方面的制約,我們只能在游戲中使用不高于256×256像素大小的紋理進行貼圖。新一代的圖形加速芯片, TNT2、Savage4和ATI Rage128,當(dāng)然包括最新的顯示芯片Gefor-ce256、Savage2000和Naplam等都支持2048×2048像素大小的大型紋理,現(xiàn)在等待的就是各大游戲廠商的支持了。首先支持512×512大小紋理貼圖的是Quake3。我們發(fā)現(xiàn)使用了大紋理貼圖的Quake3畫面,特別是墻壁顯得特別得真實。
游戲支持大型紋理必將成為未來的趨勢。特別是最近我們看到的一些新興的紋理壓縮技術(shù),通過類似于JPG的壓縮算法,抽出相近的顏色,因此能大幅度減少紋理的容量,使采用更為大型的紋理而又不影響速度成為了可能。代表技術(shù)有S3的S3TC和3dfx的FXT1,它們兩者都能提供6:1以上的紋理壓縮能力。
三維像素(Voxels)
Voxels,其實就是一個立體的像素,它有一個額定的體積,因此,除了需要平面的X軸和Y軸的坐標(biāo)表示以外,它還需要一個Z軸的坐標(biāo)來確定它在三維空間中的位置。我們可以這樣看,它就是一個邊長為一個像素(Pixels)的正方體。通過把這樣許許多多的三維像素疊合起來,也可以構(gòu)成各種各樣的3D模型??晌覀兤匠S玫酶嗟倪€是多邊型拼湊方法,這又是為什么呢?
因為還要包含Z軸的數(shù)據(jù),一個三維像素占用的內(nèi)存空間明顯要比像素(這里指平面的)多得多。并且,由于使用三角形拼湊方法,除了頂點外,面通過連接各個頂點就可以了。但如果使用三維像素,必須使用大量的語句來描述三維像素疊合的方法和內(nèi)容。因此,使用三維像素來構(gòu)成真實的3D模型必將占用大量的資源,除此之外,還會大幅度降低顯示的速度,因為要處理的內(nèi)容比采用多邊形構(gòu)成方式時多了成千乃至上萬倍。
還有一個很重要的原因是,如果使用三維像素構(gòu)成一條直線,那么當(dāng)我們離得很近來觀看這條線的時候,我們就會發(fā)現(xiàn)它是一點一點的,為什么?因為你看到的就是構(gòu)成這條線段的各個三維像素啊。但如果使用頂點做圖法,系統(tǒng)會自動把兩個頂點用一條直線連接起來,無論離得多近來看,還都是直線一條。
因此,就目前來說,3D游戲的模型制作中三維像素Voxels還沒有什么用武之地,我們普遍采用的還是三角型的構(gòu)圖方式。
色彩深度(Colors and Depths)
近來玩家們爭論得最厲害的莫過于游戲中究竟要不要采用更高位數(shù)的顏色這一問題。其中之一就是Voodoo 3與TNT 2孰優(yōu)孰劣的爭論(前者支持16位色渲染,后者支持32位色渲染),那么是否就能立刻斷定TNT2的畫面質(zhì)量會比Voodoo 3要好呢?為了回答這個問題,我們必須先了解什么是顏色深度。
上面的這幅圖就是采用16位色進行渲染的,我們可以注意到,在光環(huán)處有一層層明顯的紅色向黃色過渡的色帶。這是什么呢?
我們知道,16位色能表現(xiàn)的最大顏色數(shù)為216次方=65 536種,在上面這幅圖中,因為在顏色過渡的地方使用的顏色超出了16位色所提供的范圍,因此在顏色過渡的地方就出現(xiàn)了明顯的色階。為了避免這些情況的出現(xiàn),人們提出了更高的色彩深度標(biāo)準(zhǔn),24位色,24位色能提供224=16 700 000種顏色??梢哉f,人眼能看到的顏色種類也就是那么多了,所以有人把24位色稱之為全彩色。更高的顏色深度能使圖像色彩還原更為準(zhǔn)確。因此,我們可以肯定的是,更高的色彩深度的確能提高圖像質(zhì)量。但問題是,24位色或更高的32位色有一個明顯的缺點,它所占用的存儲空間比16位色的要大--為了描述更多的色彩,必須使用更多位數(shù)的調(diào)色盤,占用的存儲空間自然就增加了。因此,16位色也并不是一無事處,至少在現(xiàn)今顯卡性能不高的情況下能大幅度提高渲染的速度。當(dāng)需要的時候,你還可以進行適當(dāng)?shù)奶幚韥慝@得更好的過渡效果,我們把這種處理稱為抖動。
那么,這個16位、24位或更高的顏色深度是怎樣生成的呢?當(dāng)我們向一個像素填上色彩的時候,我們使用的是通過按一定比例混合紅(R)、綠(G)、藍(B)三種顏色(RGB三基色)來獲得所需的色素。應(yīng)該注意到,我們只能使用僅有的3種顏色來獲得其它的色素,并且因為16位中的每一位都僅對應(yīng)一種特定的顏色。當(dāng)我們使用的是第16位顏色,也就是最后一位顏色的時候,我們發(fā)現(xiàn)并不能很清楚地把這種顏色劃分成三種顏色混合的色素。16/3會出現(xiàn)小數(shù)位啊,因此,在實際中,色盤里是這樣劃分的。紅色占了5位的空間,綠色占了6位的空間,而藍色占了5位空間。因此,如果我們認(rèn)真看看調(diào)色盤就能發(fā)現(xiàn),綠色部分占的位置要稍大。
采用了32位色的渲染后,我們發(fā)現(xiàn)色階現(xiàn)象完全消失了,色彩過渡得非常平滑,因此,我們可以確定,使用更高的顏色深度肯定能提升畫面品質(zhì)。但為什么在玩游戲時發(fā)現(xiàn)兩者之間的差別沒有那么大呢?這是因為現(xiàn)有的游戲在制作時多是用16位色的原圖,因此你在玩(重放)的時候,無論是使用16位還是32位色的渲染方式,得到的效果都差不多,但某些游戲已經(jīng)為了32位色做了充分的優(yōu)化,如果你有機會玩玩Motorhead 這個游戲,你就能很清楚的分辨出16位色和32位色的不同了。
阿爾法Alpha
32位色似乎讓人有點難以理解。照理說,32位色表示的應(yīng)該是2^32次方種顏色吧。但實際上,32位色卻只和24位色一樣擁有同等數(shù)量級的色素。什么,它只擁有2^24次方種不同的顏色?那么還有的8位顏色跑那里去了?
對于32位色來說,多出來的8位不是用來表示RGB顏色值,而是用來反映一個像素的alpha值,也可以稱為 alpha通道值。通過對像素alpha值的確定,我們能夠表示一個像素的透明、半透明、不透明或者在它們之間的那種隱隱約約的效果。也可以這樣說, alpha值是用來反映像素透明度的一個指標(biāo)。使用alpha值能夠展現(xiàn)一些特殊的畫面效果,好像玻璃,水和爆炸效果。
如果一個像素被給定一個較低的alpha值,那么這個像素我們看起來就好像是透明的。反過來,如果給它一個相當(dāng)高的alpha值,那么這個像素看上去就完全是不透明的了。在使用中間值alpha通道的時候,就可以制作出好像有色玻璃的那種效果,如果你有用 photoshop的話,應(yīng)該會經(jīng)常使用到這種效果的。
上圖是3D Mark99 Max Pro中的第二個游戲測試場景,看到圖中綠色的那部分嗎?這就是用中間值的alpha效果做的。看上去就好像被綠色光照一樣。
alpha效果被廣泛應(yīng)用到光影效果十足的游戲兵人中,許多爆炸的光影效果就是這樣實現(xiàn)的。但前提是,必須使用32位色渲染,否則驚人的alpha光影效果就不會出現(xiàn)。
抖動Dithering
抖動,是一種用來"欺騙"人眼的著色法。它通過隨意地向色彩過渡地區(qū)添加模仿周圍像素顏色的像素,從而掩飾低位數(shù)圖像因色彩深度不足造成的過渡色區(qū)一條條的色階現(xiàn)象。
為了講得更清楚點,我們假設(shè)你現(xiàn)在有兩個調(diào)開的水彩顏色,放在色盤上。兩種顏色中間空出些位置?,F(xiàn)在,你要把兩種顏色混合起來,為了使兩種顏色不要區(qū)分得那么明顯,你大力抖動色盤,這下好了,A顏色向B顏色靠了過來,B顏色也有點向A顏色端混過來,結(jié)果就在它們中間的地區(qū)混合起來形成一些由原來兩種顏色混合起來的過渡色,看起來有一種很平滑的過渡過程,沒有了那種突變的感覺。
紋理過濾
在實際應(yīng)用中,對紋理進行處理是很吃力的。雖然對固定大小的紋理,比如256*256紋理來說處理起來很簡單,然而要把它貼到各種各樣的多邊型上,卻不是那么容易的事。有沒有想過,當(dāng)經(jīng)過計算后,texel(特塞爾)要被放置到一個不能定位的地方,又或者是計算出來的X或Y軸的值不是整數(shù)?你不能把 texel放置在計算好的地方,因為你只能繪制完整的點(這是最小的繪制單位了)。
Point Sampling(點取樣)
這時你不得不把texel繪制到離計算值最近的完整點上,這就叫做點取樣。由于使用了點取樣,因此特塞爾只能取以計算值為中心最近的一些像素。然后,這個帶有相同特性的紋理就會映射到像素上。不管怎么樣,這樣就導(dǎo)致一些超出范圍的像素明顯凸了出來,畫面就出現(xiàn)了一個個"小格子"組成的情況。如果沒有采用一些特別的過濾方法,一條界乎于兩個不同紋理之間的斜線邊緣就會出現(xiàn)鋸齒的現(xiàn)象,就是因為在邊緣上的像素沒有被正確放置在原來計算好的位置上。
當(dāng)像素稍微超出自己原定位置的時候,雖然它們?nèi)匀徊捎谜_的顏色值,但我們假設(shè)它超出的位置剛好是一片深深的藍色,而這一點超出的像素剛好是白色,那么它就很容易被注意到了。另外,點取樣還有一個缺點就是像素會出現(xiàn)"微微發(fā)光"現(xiàn)象。下面是一幅3D Mark99 Max的截圖,我們可以留意到圖片遠處的像素點有些發(fā)光的現(xiàn)象,這是由于該像素的值是僅從一個特塞爾上取值造成的。這種現(xiàn)象在運動的3D環(huán)境中更是明顯。
很明顯,在實際使用中單純使用點取樣不是辦法。想一想在DF的大混戰(zhàn)中,明明我是躲在一棟建筑物后的,本應(yīng)該看不到我,但我腳的一個像素卻超出了范圍,露了出來,從而把我隱藏的位置給暴露了(這樣打法不賠機時才怪)。所以,我們需要一些特別的方法來處理這些錯誤。
Bilinear Filtering(雙線性過濾)
雙線性過濾要比點取樣做的多一點。它以需要貼紋理的那個像素點為中心,而在相對應(yīng)紋理中該點附近2*2范圍內(nèi)(即4個)特塞爾的顏色值求一個平均值,然后使用這個"平均的"顏色值做為需要貼圖像素的色值。通過使用雙線性過濾,兩個不同特塞爾之間的過渡就可以更圓滑,不會出現(xiàn)在點取樣中出現(xiàn)的"格子"現(xiàn)象,但它同時帶來一個新的問題,那就是經(jīng)過雙線性處理后的圖像會顯得有些模糊。如果你使用過photoshop就應(yīng)該知道了。其中的blur濾鏡效果就和雙線性過濾差不多。
雙線性過濾是最基本的3D技術(shù),通常3D顯示卡都會提供這種過濾效果,并且都能在一個時鐘周期內(nèi)實現(xiàn)。下圖就是雙線性過濾和點取樣的對比圖
從圖中可以看到,圖像經(jīng)過雙線性過濾后,點取樣中"格子"的現(xiàn)象都消失了,整幅圖中像素過渡都很平滑,沒有發(fā)現(xiàn)明顯的越界點。然而,雙線性過濾也帶來了一個新的問題,那就是"深度變化"錯誤。設(shè)想一下,按照正常的透視,當(dāng)圖像離我們越遠,那么圖像看起來就越小。而貼到該圖像(像素)中的紋理也越小。造成紋理被壓縮了。結(jié)果造成雙線性過濾中,離視點較遠位置出現(xiàn)了貼圖錯誤。很可惜,對于雙線性過濾來說,這是固有的錯誤,不可能避免和解決。
MIP mapping(組合式處理映射)
那么我們?nèi)绾蝸硇拚疃茸兓e誤呢?答案是引入組合式處理映射技術(shù)。組合式處理映射其實是用一組同一物品不同大小的紋理來提供給不同深度(大?。┫袼刭N圖取值時使用的。當(dāng)視點比較近的時候,像素點填充的顏色采用大塊紋理中的采樣值。當(dāng)視點越來越遠的時候,就選用越來越小的紋理來進行取值。這樣我們就能獲得沒有因視點距離變化而變形的圖像。
Level of Detail(LOD,深度等級)
深度等級的計算是用來確定哪種大小的Mipmaps(組合式位圖-紋理)要被貼到對象上。深度等級能夠控制一個像素由幾個特塞爾映射而成的。還記得我們前面說的嗎?特塞爾是組成紋理的最基本單位,當(dāng)一個紋理被用來做貼圖使用的時候,它甚至可以縮小為一個點貼在像素中,換而言知,一個像素能夠是幾個甚至無限多個特塞爾映射而成的。如果特塞爾映射到像素上的比例為1:1。那么LOD的值就為0。表示沒有等級,這時就會采用最大的紋理來進行貼圖處理。而當(dāng)4個特塞爾映射到一個像素上的時候,比率為4:1。LOD此時的值為1。系統(tǒng)就會采用小一號的紋理來進行貼圖。當(dāng)比例不斷上升,用來貼圖的紋理就越小,從而保證遠近貼圖的變化成比例。消除了由雙線性過濾造成的深度變化這一錯誤。
可見,雙線性過濾,Mip mapping和LOD是一起使用的。
Trilinear Filtering (三線性過濾)
Mip mapping雖然解決了雙線性過濾造成的深度變化錯誤,但它又帶來了一個新的錯誤,那就是"組合交疊"現(xiàn)象。組合交疊現(xiàn)象發(fā)生在當(dāng)相臨的兩個地方使用了 LOD級別不同的同一塊紋理來進行貼圖。兩塊不同大小的同一塊紋理接合的地方顯得非常不平滑以至于人們很容易就能注意到這一區(qū)別。組合交疊錯誤經(jīng)常出現(xiàn)在地板或墻壁上,因為它們通常是采用許多組大小不同的同一紋理貼圖而成的,看起來就會出現(xiàn)有的地方很清晰,但有的地方很模糊的現(xiàn)象。
三線性過濾就是用來減輕或消除不同組合等級紋理過渡時出現(xiàn)的組合交疊現(xiàn)象。它必須結(jié)合雙線性過濾和組合式處理映射一并使用。三線性過濾通過使用雙線性過濾從兩個最為相近的LOD等級紋理中取樣來獲得新的像素值,從而使兩個不同深度等級的紋理過渡能夠更為平滑。也因為如此,三線性過濾必須使用兩次的雙線性過濾,也就是必須計算2×4=8個像素的值。對于許多3D加速開來說,這會需要它們兩個時鐘周期的計算時間。也就是說,對于某些3D加速卡來說,使用三線性過濾幾乎會使性能下降一半!
各向異性過濾Anisotropic Filtering
各向異性過濾是近來才提出的新型過濾方法。各向異性過濾的實現(xiàn)方法有點"變態(tài)",它需要對映射點周圍方形8個特塞爾甚至更多的特塞爾進行取樣,然后獲得平均值映射到像素點上。對于許多3D加速卡來說,采用8個以上特塞爾取樣的各向異性過濾簡直是要了它們的命。因為它們根本不能提供足夠的像素填充率供給各向異性過濾使用。對于3D應(yīng)用,特別是3D游戲來說,各向異性過濾是很重要的一個功能。這是因為,游戲中的物體有大部分的時間不是與我們平行的。
各向異性過濾到底是做什么的呢?如果有一個多邊型,它的一個面剛好與我們的視線垂直,那么根本就不用各向異性過濾。當(dāng)視點漸遠的時候,Mip mapping就會使用更小的紋理來進行貼圖。但在大多數(shù)情況下,我們的視線卻與多邊型有一定的角度。這些有角度的多邊型就會出現(xiàn)型變,從而引起畫面失真,各向異性過濾就提供了解決方案。
每一輪的3D顯卡大戰(zhàn)的征兆都大同小異:在這段時期內(nèi)各家顯卡芯片研發(fā)大廠通常都保持神秘姿態(tài),半遮半掩地發(fā)布一些連名字也沒有確定的圖形芯片規(guī)格。很感謝這次的游戲開發(fā)者年會,我們得以掌握這些次世代顯示芯片的詳細(xì)規(guī)格:表1
規(guī)格終究是規(guī)格,在實際發(fā)布的時候,通常會使我們大失所望,不是規(guī)格縮了水,就是性能沒有達到期望的等級。我們上表中的G450現(xiàn)在還不能確定它的真實運行頻率,而是根據(jù)Matorx早前公布的G450將會使用G400 MAX核心,再加上使用.18微米工藝生產(chǎn)而成,因此估算其將會運行在200MHz。而S3&Diamond的GX4-C我們是按它沒有在 Savage2000(Viper II)上增加渲染通道估算出來的性能值。另外我們還預(yù)計,在這些新一代的顯示卡中,一種新式的顯存即將被廣泛采用,例如DDR FCDRAM,但到目前為止它究竟是什么東西我們還沒弄清楚,但我相信在將來的顯示卡中它將會被大量采用。
那么現(xiàn)在讓我們來詳細(xì)看一下這些次世代顯示卡帶來了什么新的東西,3D性能和表現(xiàn)力將會被提升到一個什么樣的新臺階。
Matrox公司
Matrox公司一直以來以生產(chǎn)專業(yè)的平面圖形工作站顯示卡而聞名于世界。他們生產(chǎn)的顯示卡通常擁有極高的畫面質(zhì)量和2D顯示速度,在3D游戲大行其道的今天,Matorx也發(fā)布了3D性能不錯的G400系列予以對抗。
根據(jù)一個可靠的消息,在2000年第一季度后,Matrox將會停產(chǎn)G400系列,包括G400 MAX。而將會用G450(芯片開發(fā)代號為CondorI)的芯片來取代現(xiàn)在G400 MAX的市場。而到了第四個季度,Matrox將會發(fā)布G800(芯片開發(fā)代號為Condor II)的新型圖形芯片,然而讓我們感到驚奇的是一直到今年第三季度為止,Matrox仍將生產(chǎn)G200系列用來滿足低端市場的需要(原來一塊顯示卡的生存周期可以這么久)。
G450技術(shù)規(guī)格:
-G400 MAX核心、整合的RGB、NTSC/PAL,還有DVI的視頻輸出功能
-64位DDR SDRAM
-支持DDR FCDRAM
-采用320引腳的PBGA封裝
-采用0.18微米6層金屬工藝生產(chǎn)
-2000年3月開始大規(guī)模量產(chǎn)
-16MB幀緩存版本采用2×(2×32位 DDR顯存)
-32MB幀緩存版本采用4×(4×16位 DDR顯存)或者是4×(2×32位 DDR顯存)
其中16MB版本將會使用166MHz的顯存工作頻率,如果使用DDR FCDRAM,那么有可能會運行在200MHz。并且所有的顯存將會使用雙重的64位總線連接到主芯片上。
G800技術(shù)規(guī)格:
-引腳兼容G450芯片
-雙倍于G450的像素填充率
-支持250MHz的DDR FCDRAM
-支持硬件T&L(轉(zhuǎn)換和光影)加速
-支持DirectX8.0的遮掩效果和完整的DirectX7.0效果
-新開發(fā)的DirectX7.0和8.0的ICD驅(qū)動
-量產(chǎn)于2000年9月
Matrox將會發(fā)布繼承了雙片G800的G800 Ultra版本顯示卡,用來提供極高的轉(zhuǎn)換和光影生成能力和像素填充率。
從以上規(guī)格可見,G450將會采用于G400 MAX相同的核心,不同的是它將會采用.18微米工藝生產(chǎn),因此其運行頻率將會得到再度提高。而根據(jù)由Matrox公布出來的消息,從G200系列開始,它們的顯示卡就支持T&L硬件加速,只不過是這個功能被認(rèn)為是"沒有必要"而被屏蔽掉了。根據(jù)這個消息,我們估計在G450顯示卡中,會有一個" 測試"性質(zhì)的驅(qū)動程序?qū)_啟這個T&L加速功能,但由于這些芯片在設(shè)計時硬件T&L并不是重點,而且業(yè)界也沒有為這個T&L核心進行優(yōu)化,因此該T&L加速功能和穩(wěn)定性實在有限,為了兼容性和穩(wěn)定性,就算是開發(fā)出了它的T&L驅(qū)動程序,也會有許多部分還是交由 CPU來完成。這就是說,在G450上期待硬件T&L加速幾乎是不可能的事了。G450真正加強的是它的視頻輸出和處理能力,新增加的(RGB/NTSC/PAL 和DVI)視頻輸入輸出端口,將會大大增強G450的視頻處理能力,通過附帶獨家制作的視頻開發(fā)軟件,相信就算是用來做視頻剪輯也沒有問題,另外就是強調(diào)把畫面輸出到電視上觀看的能力。Matrox在這方面絕對是一哥,輸出到電視廣播的畫面清晰而又穩(wěn)定,Matrox的這些舉措讓我們知道,它所要占領(lǐng)的并不是極端的游戲殺手顯卡領(lǐng)域,也不是價格低廉的普及型市場,而是面向?qū)Ω鱾€方面都有要求的主流PC、并且它們將會通過強調(diào)最高檔次的2D顯示速度和畫面質(zhì)量,不俗的3D性能、絕好的視頻解決方案來獲得市場。
就算是在年底發(fā)布的G800顯示卡也不例外,Matrox鐵定是主打這個領(lǐng)域了。G800的推出時間大概為年底圣誕節(jié)左右,恰好又在nVidia發(fā)布 NV20和3dfx發(fā)布Rampage之前。它并不是要和以上的兩塊顯卡一爭長短,事實上,根據(jù)上面的表格我們已經(jīng)知道,G800的性能頂多和NV15和 Rage6C旗鼓相當(dāng),Matrox根本就沒有想過G800要和NV20還有Rampage正面交鋒。何必拿它們一起來比較呢?但對于使用了雙芯片的 G800來說,要提供相近于NV20和Rampage的性能也不是不可能的,關(guān)鍵就是價格恐怕會讓人吃不消。
BitBoys公司
BitBoys大家恐怕很少聽說過,其實前一陣子國內(nèi)已有許多的硬件網(wǎng)站和雜志介紹過它了。下面就讓我們來看一下什么是Glaze3D顯示芯片。
Glaze3D圖形芯片的前身是Pyramid 3D,由Bitboys 公司制造,多年前曾被TriTech微電子公司選用。在開始的時候,Pyramid 3D的出現(xiàn)未能引起業(yè)界的關(guān)注,最重要的就是因為它"偏科"了,由于沒有極高的像素填充率,但卻要實現(xiàn)這個那個的高級紋理過濾功能,因此Pyramid 3D在實際使用中就好像在看很多精美畫面拼湊出來的幻燈片。即便如此,Pyramid 3D的性能和特色在那個年代還是非常超前的。當(dāng)3dfx VoodooI不可一世的時候,Pyramid 3D卻早已支持像硬件凹凸紋理貼圖這樣的高級特性。就在兩年前當(dāng)我從國外硬件站FastGraphics首次看到有關(guān)Glaze3D (Pyramid 3D改進版)的資料時,更是嚇了一大跳,Glaze3D 的規(guī)格和性能太超前了像素填充率達到4億像素每秒,并且支持四重紋理貼圖!天啊,在當(dāng)時單過程雙重貼圖也只是剛提出來的貼圖技術(shù)。到了99年底,我們還沒有見到Glaze3D的芳蹤??磥磉@枚超級圖形芯片只不過是紙上談兵而已的規(guī)格而已。但隨著最近關(guān)于該芯片一些細(xì)節(jié)的披露,以及上市時間的敲定,人們又重新對它產(chǎn)生了興趣。按Bitboys的說法,2000年第一季度將會發(fā)布第一批Glaze3D芯片,晶體管數(shù)量為150萬個,提供 1200Mpixels/sec的像素填充率,并且支持單周期單過程四重紋理貼圖,以及完整的3D圖形特性。
Glazed3D特性
-通過XBA架構(gòu)提供12GB/s內(nèi)存帶寬
-嵌入式完整幀緩存
-實用的、易于擴展的渲染架構(gòu)
-可隨時訪問幀緩存和深度緩存
-單芯片的2D和3D解決方案
-32位渲染管道、32位色幀緩存、32位色紋理貼圖
-單過程單周期三線性多級貼圖
-環(huán)境凹凸紋理映射
-分辨率高達2048*1536
-全屏幕順序無關(guān)性抗鋸齒技術(shù)
-高質(zhì)量、4:1的紋理壓縮技術(shù)
-單過程生成四個經(jīng)三線性過濾的紋理
-完整的AGP 4*支持,包括AGP紋理調(diào)用功能、快寫功能
-積架緩存效果,提供像抗鋸齒和景深效果
-多種縮放比例的視頻輸出
-支持?jǐn)?shù)字顯示輸出
-兼容GDI+
如果你還不太明白Glazed3D的性能,那么就來讓我們看看Glaze3D在SLI的時候能提供什么樣的性能體驗。通過在一張卡上安裝四顆 Glaze3D 1200芯片,由于擁有特殊的XBA架構(gòu),因此幾乎能獲得理論的4倍像素填充率,提供高達4800Mpixels/sec的像素填充率使在讓人感到恐怖。設(shè)想一下,如果在上面集成的是4片Glaze3D 2400的話,每秒高達一億像素填充率的顯示卡就出現(xiàn)了,那是一種什么樣的感覺我真的猜不到了,就是即將發(fā)布的NV15和Voodoo5也不過是剛能達到 1000Mpixels/sec的像素填充率而已。如果用來玩Q3的話,相信在1600*1200*32位色下還能有4--500FPS的幀速率,夠恐怖吧?
Glaze3D含有9MB嵌入式顯存(eDRAM,embedded DRAM),該顯存與圖形核心間通過一條512位的數(shù)據(jù)通道連接,因此能獲得9.6GB/sec的巨大帶寬,訪問紋理內(nèi)存的速度比其它圖形芯片上的高速顯存快上許多,這個架構(gòu)被稱之為XBA。或許在不久的將來,其它顯示卡廠商也會采用這個新的顯存帶寬解決方案的,Ati就在不久前宣布掌握了這個鑲?cè)胧斤@存技術(shù)。另Glaze3D還支持高達128MB的板載高速顯存,其工作頻率可達143、166或200MHz,采用128位總線連接,因此又能獲得 3.2GB/sec 的帶寬。全部加起來大概能獲得12GB/sec的顯存帶寬,而nVidia的Geforce256也只是能提供3.2GB/sec的顯存帶寬而已(128 位的顯存接口),更大的帶寬能使顯示卡發(fā)揮出幾乎等于理論值的像素填充率和紋理填充率。另外,Glaze3D還支持積架緩存,可用它來表現(xiàn)出許多精美的畫面效果,例如全屏幕以及與順序無關(guān)的抗鋸齒功能、景深效果、動態(tài)視頻補償、柔化陰影和柔化反射等效果。
Glaze3D唯一面臨的挑戰(zhàn)并不是芯片的性能和特色,而是芯片的生產(chǎn),由于BitBoys只是一個小公司,之前也沒有生產(chǎn)過類似的圖形芯片,因此這次是它們第一次生產(chǎn)圖形芯片的計劃,采用.22微米的Glaze3D成品率是多少呢?是否需要改進?這還是一個很值得關(guān)注的問題。據(jù)我所知,國內(nèi)的"奔馳 Paradise"已經(jīng)在密切留意這一產(chǎn)品的發(fā)布,準(zhǔn)備OEM了??磥砦覀儑鴥?nèi)的玩家想買到這個超級產(chǎn)品也不成什么問題。之前我就一直在懷疑國內(nèi)是否會有該產(chǎn)品出售呢。
S3&Diamond公司
S3和Diamond合并的事是那么的讓人吃驚,現(xiàn)在據(jù)說S3又要把他們的圖形技術(shù)部門賣給VIA了。轉(zhuǎn)來轉(zhuǎn)去的結(jié)果當(dāng)然是不利于玩家了。Savage 2000最氣人的就是它的T&L只能在OpenGL下提供支持,根據(jù)S3方面宣稱,Savage 2000(Diamond Viper II Z200)是不會推出基于DirectX的T&L驅(qū)動了。由于這個T&L引擎非常的不規(guī)范和錯漏百出,因此就算在OpenGL下開啟了,性能增加也是非常的有限。對于即將來到的Savage2000+,也就是Diamond Viper II Z400、Z600。S3&Diamond會做出什么改進呢?
Savage2000+技術(shù)規(guī)格
-采用Savage2000+ C版本芯片
-128MB 3ns的SDRAM顯存
-550MHz RAMDAC
-225MHz芯片工作頻率、185MHz顯存工作頻率
-完整支持AGP4*、兼容AGP1/2*
-提供S3TC、S3TL、DireceX和OpenGL支持
-在Windows2000下提供完整的OpenGL 硬件T&L加速
-數(shù)字平板顯示器和SVGA輸出端口。包括RCA/和S-VIDEO視頻輸出端子
-通過使用S3 TV-Port接口提供對HDTV高清晰度電視輸出支持
-通過TV-Port提供對數(shù)字視頻的捕抓和回放
讓人感到非常驚奇的是在Z600中竟然提供了550MHz的RAMDAC。但再想想也這也是必須的,為了配合以后的高清晰度平板顯示器和HDTV的數(shù)字視頻輸出,更高的RAMDAC將會是必須和必要的。
根據(jù)這個規(guī)格,Diamond Viper II Z600將會擁有900Mpixels/sec的像素填充率。當(dāng)然,到了正式發(fā)布的時候這個規(guī)格可能還會有變化。就好像當(dāng)年S3發(fā)布Diamond Viper II Z200時不是說芯片工作頻率為150MHz的嗎?但到了正式發(fā)布的時候芯片卻是工作在了125MHz的頻率上,因此所有的正式規(guī)格還是要到發(fā)布的一天才能確定。
nVidia公司
一個對nVidia非常有利的消息,他們和S3簽定了"內(nèi)容不詳"的技術(shù)轉(zhuǎn)讓協(xié)議,但肯定的是,S3TC技術(shù)將會順利流入nVidia下一步開發(fā)的產(chǎn)品,而正中的T&L硬件加速能力也將被S3所掌握。強強連手,就這一點,我們就不能小覷nVidia的次世代主打芯片--NV15。
NV15的主要核心仍然是沿用了Geforce256引擎,同樣是采用了四條像素渲染管道,然而NV15卻提供了兩個TMU單元,因此NV15能夠?qū)崿F(xiàn)單周期雙重貼圖能力。因此,如果我們在玩例如Quake3等支持多重紋理(暫時還只是支持雙重紋理)的游戲時。用Geforce256來玩。我們只能獲得幾乎一半的像素填充率,也就是120MHz×4(4條平行的像素渲染管道)/2(要進行雙次貼圖)= 240Mtexels/sec的像素填充率,而如果換用一塊仍然是工作在120MHz時鐘頻率下的NV15,則還能保持120MHz×4/2×2= 120MHz×4=480Mtexels/sec的像素填充率。這樣做雖然沒能提高絕對的像素填充率,然而由于NV15是采用0.18微米工藝制作,因此它的工作頻率至少在160MHz起跳,甚至我們相信有的公司還能做出運行在183MHz下的NV15。這時候,NV15就能擁有160×4= 640Mpixels/sec的像素填充能力。當(dāng)運行在183MHz下時,更是達到了183×4=733Mpixels/sec的像素填充能力。而且這個像素填充率不因為運行使用雙重貼圖機制的游戲而降低。這的確是一個令人興奮的設(shè)計。nVidia把這種技術(shù)叫做"自由紋理"。
此外,最近還有消息傳出一些有關(guān)NV15將在新架構(gòu)加入"Clipping"特效,對于NV15是否真是具備Clipping功能的顯卡,我們表示懷疑,但很顯然的是,這一項Power VR引以為榮的技術(shù)將會在今后的日子里被其它廠商所廣泛采用。
所謂Clipping,就是在一個場景中,將那些隱藏于一些特器后面,非可見對像或多邊形進行剪切處理的過程。對于高速流暢的運行游戲,Clipping 是一項非常有用的技術(shù),因為要完成一次普通的3D處理,處理器將會用大部份時間去渲染那些實際上我們并不會于屏幕上看到的對象,就好像你在一幢房子外卻要看到房子內(nèi)所有物體一樣。所以,如果采用了Clipping技術(shù)后,CPU僅需對那些可視部份進行渲染,大大提高的效率,從而使游戲達到更高的幀數(shù)。
當(dāng)然,NV15可能并不是第一個利用此功能的顯卡,在此之前,Videologic的PowerVR系列便擁有了這一出色的設(shè)計,但對于PowerVR而言,有一個不利因素就是開發(fā)者必須基于PowerVR特有的ICD進行開發(fā)。顯然,PowerVR的SGL ICD與OpenGL和D3D比起來,并不流行。這也是PowerVR在PC上無法發(fā)揮最大威力的原因。但在SEGA Dreamcast游戲機中(使用了PowerVR2芯片),這一現(xiàn)象得到很好的解決?! ?br>現(xiàn)在,OpenGL和D3D終于可以支持Clipping技術(shù)了,開發(fā)商可以在軟件中提供對該項功能的支持,或者直接于游戲引擎中加入這項技術(shù)。我們認(rèn)為,硬件的Clipping可能將是下一代GPU中最好的一項特性之一。
確實要實現(xiàn)Clipping,這是一個簡單得不再能簡單的問題了,你只需借助CPU便可完成Clipping 操作,但實際上,正如我們所知的,在3D游戲中哪些物體不被顯示,而哪些則顯示,這將由游戲者的視點來決定。所以,在一個場景中,實現(xiàn)Clipping,這可能就會對一個場景重復(fù)計算多次,這對CPU將是一個極大的考驗,可能進行Clipping處理后與渲染所有場景所消耗的CPU時間均差不多。這樣,硬件Clipping就是唯一的解決方案。硬件Clipping支持將是下一代GPU最強勁特性之一,它可以取代CPU進行Clipping操作,解放 CPU去做其它事情,這將要比現(xiàn)在單純T&L加速的GeForce GPU要強很多。由于DX7已經(jīng)提供對硬件Clipping的支持,所以nVidia新一代的GPU--NV15極有希望擁有硬件Clipping的功能,至于它的效果如何。很快,謎底就要揭曉了。
而NV11呢?
NV11是個全新的東西,雖然它只是一個NV15的簡化版。由于nVidia這次設(shè)計NV11的最大原因是想憑此進入近來大熱的移動圖型芯片領(lǐng)域。 Quadro已經(jīng)順利讓nVidia和工作站領(lǐng)域掛鉤了。NV11用有一條雙像素渲染管道和雙重材質(zhì)機構(gòu)的像素渲染引擎。由于是面對移動領(lǐng)域,我們相信為了低功毫和低發(fā)熱量的問題,NV11將會使用較低的時鐘頻率,例如100MHz。盡管是如此,一個支持T& L加速的超級移動圖形芯片也足以讓它的對手S3 SavageMX和ATi RageGL(這兩款芯片皆是兩間公司的旗艦級3D移動圖形芯片)暗然失色了。此外,擁有100MHzx2=200Mpixels/sec以上像素填充能力的NV11終于能讓筆記本電腦順暢地跑起Quake3。試想一下,帶著一臺筆記本電腦到人家家里玩Q3大戰(zhàn)會是多爽,用網(wǎng)卡連接比慢吞吞的 Internet連接快多了,我殺!
NV15和NV11最大的不同是它們的架構(gòu)。NV15由于擁有4條像素渲染管道,因此內(nèi)部帶寬為256位。4 ×(32位色渲染圖+24位Z緩存+8位模板緩存)位=256位。而NV11由于只擁有兩條并行的渲染管道,因此它是128位的(不用我再算了吧?)。而 NV11和NV15都能使用128或64位的顯存接口。當(dāng)然,做為高性能芯片的NV15是鐵定使用128位內(nèi)存接口了。而移動版本的NV11和廉價版的 NV11或許將會采用64位的顯存接口來進一步降低成本,可惜的就是性能會因此而下降許多。
另外,比較特別的是,這次NV15和NV11將會支持例如48MB、96MB這種被稱為"非對稱"顯存容量。當(dāng)然,實際使用時會分為48MB(32MB做紋理緩存+16MB做特效或幀緩存),96MB(64MB做紋理緩存+32MB做特效和幀緩存)。為什么在新一代顯示芯片中要支持這兩種以外只有在專業(yè) 3D圖形芯片才得以見到的顯存架構(gòu)呢?我們肯定不會在NV15和NV11中看到這種特別的顯示卡了。這只會在 Quadro Ⅱ中看到。由于Quadro Ⅱ是基于NV15的高端工作站級芯片,為了能實現(xiàn)更為復(fù)雜的渲染效果,必須擁有一定的獨立幀緩存,這種特殊的顯存容量就是特意為Quadro Ⅱ所制定的。我們預(yù)計Quadro Ⅱ只是在NV15的基礎(chǔ)上,提高芯片的工作頻率,另外再開啟一些在NV15上不能使用的高端3D特性,包括上面對特殊容量顯存支持等。
此外,NV15和NV11還加強了它們的視頻輸出功能-芯片內(nèi)建了HDTV(高清晰度電視)處理器。只要后期的顯示卡提供了輸出接口,你就能把HDTV當(dāng)作超大型顯示器使用了(康佳的高清晰度電視不知道能不能配?)。
而作為移動版本的NV11,則更為強化了雙重輸出功能,它有點類似于Matorx的雙頭技術(shù)。在NV11芯片內(nèi)部設(shè)立了兩條的視頻輸出通道,并建有兩個陰極射線管控制器。這樣一來支持雙重輸出就變得異常簡單了,這都要歸功于0.18微米生產(chǎn)工藝,得以把眾多的功能集成到芯片內(nèi)部??聪聢D,NV11支持多種雙重輸出組合方式:
1、CRT顯示器和電視 2、CRT顯示器和LCD顯示器 3、CRT顯示器和CRT顯示器 4、LCD顯示器和電視或者是再和另外一臺LCD顯示器。
另外,我們還獲悉NV15和NV11將會提供邊緣抗混疊功能。當(dāng)然,我們并不期望會是全屏抗混疊,對于NV15這種像素填充率來說,恐怕是心有余力而不足了。我們相信nVidia支持全屏抗混疊功能的顯示卡將會是明年初面世的NV20。
對于NV20,到目前為止,我知道這芯片將基于一種完整綜合的體系結(jié)構(gòu),由多于2千多萬只晶體管組成,將于今年年底發(fā)布。而基于NV20的顯示卡預(yù)計將會比NV15遲半年左右,到時將使用更高端的系統(tǒng),達到更好的性能。
3dfx公司
在今年美國拉斯維加斯的Comdex展覽會上,Voodoo 4和Voodoo 5的出現(xiàn)引起全場的轟動。對比起nVidia的Quadro和Geforce256、ATi的Fury MAXX、S3&Diamond的Savage 2000。Voodoo 4&5擁有傲視群雄的像素填充率,優(yōu)良的品牌效應(yīng),以及成千上萬電腦游戲迷的支持。
一度延期的Voodoo 4,甚至是揚言本世紀(jì)最偉大的圖形加速芯片的Voodoo 5也同期發(fā)布了。然而我們要知道的是,現(xiàn)在所說的Voodoo 5和Voodoo 4其實是同一樣的東西,原來所開發(fā)的Voodoo 5恐怕要被壓后而成為Voodoo 6了。為什么3dfx要一次推出兩個世代的產(chǎn)品呢?我們來看看近來3dfx面臨什么境況?
那就是3dfx的CEO辭職了,好端端的,為什么要辭職呢?這恐怕是因為3dfx公司內(nèi)部對Naplam (Voodoo 4)的開發(fā)進度極不滿意(事實上,是遇到了難題),為了解除股東們對公司的種種猜測,必然要有一個"有頭有面"的人站出來為此承擔(dān)責(zé)任。而究竟 Naplam在開發(fā)上遇到了什么困難呢?
制造工藝: Voodoo 4(Naplam)采用0.25微米工藝生產(chǎn),核心頻率為166-183MHz。芯片內(nèi)部集成了1400萬個晶體管。按照3dfx的慣例,散熱片上應(yīng)該是沒有風(fēng)扇的(或許Voodoo4將會開創(chuàng)先河吧)那么,散熱問題是十分嚴(yán)峻的,因此芯片的運行頻率還是被限定在200MHz以下。依靠Naplam的雙像素填充單元,我們最多也只能獲得400Mpixels/sec的像素填充速率。Naplam是定位于與nVidia Geforce256、S3 Savage 2000等高端游戲加速芯片競爭的,這樣看Naplam充其量是一只增加了T-Buffer和FXT1、并且支持32位全彩色渲染,2k×2k紋理大小的 Voodoo3罷了。并且,如果拋開了極高的像素填充率,全屏抗混疊和T-Buffer這兩項功能就無從施展,全屏抗混疊和T-Buffer本來就是依靠增加畫面的渲染像素(細(xì)節(jié))來提高畫面品質(zhì)的。
時間因素:因為與STB的并購,3dfx浪費了很多的時間進行內(nèi)部的重組,Naplam的開發(fā)進度也被拉了下來,面對大肆鼓吹T&L加速的 Geforce256和高像素填充能力,并且同時擁有T&L加速的Savage2000的步步進逼, 3dfx也唯有祭出Naplam的T-Buffer和全屏抗混疊技術(shù)穩(wěn)定軍心。當(dāng)時用以演示的是用了8塊的Voodoo2 SLI,為什么就不用Naplam的樣卡呢?我們說,那時候Naplam應(yīng)該還是紙面上的數(shù)據(jù)而已,就是說,3dfx拿了想像中的產(chǎn)品來實現(xiàn)想像中的優(yōu)點。或許,那時候3dfx只是想盡可能提高Naplam的運行頻率,那么高像素填充率的問題就解決了。然而由于制造工藝的問題,運行頻率一直上不去,面對 nVidia的Geforce256即將發(fā)布,為了穩(wěn)住投資者,3dfx的CEO不得不辭職,與此同時,剩下來的人心里都知道,如果再不能把Naplam 開發(fā)出來,3dfx就完了。
救命的SLI技術(shù)
或許是ATi使用SLI技術(shù)來提升ATi Rage Fury Pro 128的像素填充率的啟發(fā)吧,原本一直遙遙無期的Naplam在不久后突然宣布將會在Comdex上演示。讓我們來看看Voodoo 4到底是什么。它采用了3dfx新型的 VSA-100 3D圖形加速芯片。而Voodoo 5則是通過使用兩塊,四塊的VSA-100 SLI而成。因此它的像素填充率得以兩倍,四倍的翻升。對于在Voodoo 2年代就開始提供完美SLI執(zhí)行功能的3dfx來說,要在VSA-100上加入SLI功能可以說是輕而易舉。就這樣,Naplam必須擁有極高像素填充率這一大難題解決了(那個CEO也真是無辜)。也可以這樣說,現(xiàn)在的Voodoo 5才應(yīng)該是我們原來期待的Voodoo 4。而原本在2000年下半年才會出現(xiàn)的Voodoo 5看來被改名成為Voodoo 6了,根據(jù)我們的情報,它就和現(xiàn)在AMD的Athlon一樣,是目前為止設(shè)計得最為完善的3D圖形加速芯片,當(dāng)然,按照現(xiàn)在的情況,Voodoo 6應(yīng)該不會在2000年冬季前與我們相見了。
VSA-100
Naplam采用了3dfx新近開發(fā)的VSA-100 3D圖形加速芯片。讓我們來看看它的技術(shù)指標(biāo):
-完全支持AGP 4X和PCI2.2規(guī)范
-單芯片最大支持64MB的顯存
-支持32位的RGBA全彩色渲染,24位的Z和W緩存并且支持8位的模板渲染
-支持32位全彩色的紋理
-支持2048×2048大小的大型紋理
-350MHz的RAMDAC
-166--183MHz芯片運行頻率
-像素填充率為333-367Mpixels/sec
-使用0.25微米制程生產(chǎn),6層工藝,芯片集成了1400萬個晶體管
芯片特色:
-單過程、單周期多重貼圖
-單過程、單周期凹凸映射
-單過程、單周期的三線性映射
-逐像素的映射和阿爾法描影法
-8位的碼跺堆積紋理--無性能上的損失--更高的游戲支持度
-冪數(shù)級的霧化功能
-通過浮點運算的Z緩存避免了Z軸上的混疊現(xiàn)象-同樣適用于使用W緩存情況
-動態(tài)環(huán)境映射支持
-硬件支持平面到群集的轉(zhuǎn)換過程加速
-全速的MPEG2回放能力,消除任何幀丟失的現(xiàn)象
-支持所有的圖形API包括DircetX7.0、OpenGL1.2和Glide
從前圖中我們可以看到,VSA-100芯片優(yōu)點就在于:極高的像素填充率、突破性的抗混疊功能、電影等級的效果引擎、紋理壓縮能力、可伸縮的架構(gòu)這五點上。
現(xiàn)在先讓我們來看看VSA-100傲視群雄的像素填充能力。
由于采用了可伸縮的架構(gòu)。哦,對不起,我?guī)缀跬诉€沒介紹可伸縮架構(gòu)呢。是這樣的,VSA-100使用了新型的協(xié)同工作架構(gòu),有別于舊有的SLI技術(shù)(曾經(jīng)出現(xiàn)在非常著名的Voodoo 2身上),因為Voodoo 2只允許兩塊芯片協(xié)同工作,并使用了交錯掃描方式,也就是一塊芯片負(fù)責(zé)渲染基數(shù)行的圖像,而兩一塊芯片負(fù)責(zé)渲染偶數(shù)行的圖像,在整個過程中兩塊芯片使用同樣的幀緩存,當(dāng)整個幀被渲染完畢以后,在儲存到幀緩存中,然后才傳送到顯示器。另外,Voodoo 2 SLI有一個最大的缺點就是SLI后3D游戲的分辨率是從1024×768起跳。就是說,你不能在800×600的游戲中使用Voodoo 2 SLI?,F(xiàn)在VSA-100可以說是最完美的協(xié)同工作技術(shù),首先,它允許使用2-32塊的芯片協(xié)同工作。另外,協(xié)同工作芯片使用的是動態(tài)的行掃描技術(shù),也就是說,掃描的行數(shù)是可隨時改變的,就拿使用了四塊芯片的Voodoo5 6000來說吧。把整個幀劃為128線。那么第一塊芯片就負(fù)責(zé)1、5、9、13…第二塊芯片負(fù)責(zé)2、6、10、14…以此類推。此外,根據(jù)游戲的不同,也可以使用更為特別的掃描方式,例如讓一塊芯片負(fù)責(zé)連續(xù)的幾條線等等。為什么要這樣做呢?這是因為一些游戲的幀很特別。
例如,一個太空星戰(zhàn)的游戲,幀畫面中部有一使用了多重負(fù)責(zé)紋理渲染的星球,而畫面的上部和下部卻是黑黑的一片。這個時候,使用通用優(yōu)化方式渲染,未免使有的芯片承受過多的負(fù)荷,而有的芯片卻浪費了不少的渲染能力。這是因為這種情況有某的芯片在畫面中部渲染的行數(shù)偏多,而有的卻偏少。為此,可以進行動態(tài)改變渲染方式,例如讓本來渲染上下部分的芯片在畫面中部插入更多的渲染行數(shù),而原來在畫面上下部空出來的行數(shù)則由原本應(yīng)該掃描畫面中部的芯片調(diào)換完成。此外, VSA-100每塊芯片使用獨立的幀緩存,每個芯片完成自己的渲染的行數(shù)以后,就存儲到自己的幀緩存中,最后所有的幀緩存才合并起來,輸出到顯示器。這樣的設(shè)計幾乎能使VSA-100的像素填充率獲得倍數(shù)級的性能提升。
可以看到,在使用一塊VSA-100芯片的時候,也就是Voodoo4。它使用的是166MHz的工作頻率(3dfx的顯示卡芯片和顯存使用相同的時鐘頻率),由于VSA-100提供了兩條渲染管道,因此它的像素填充率能夠達到1662= 333Mpixels/sec。而Voodoo5 5000由于使用了兩塊的VSA-100芯片協(xié)同工作,因此它能夠提供333×2=666Mpixels/sec的像素填充率。更厲害的是, Voodoo5 6000集成了四枚的VSA-100芯片,每秒能夠輸出1470Mpixels的填充率,實在是夠恐怖的(對比現(xiàn)在的Geforce256才能有 480Mpixels/sec的像素填充率)。按照這樣的像素填充率,就算是1600×1200×32bpp的游戲,Voodoo5 6000也能輕松達到60fps以上。1470Mpixels/(1600×1200)pixels>60fps。就算NV15的像素填充率能夠比 Geforce256提高一倍(這是幾乎不可能的),在像素填充率這一項目上仍然遜色于Voodoo5-6000許多,看來3dfx強調(diào)的極高像素填充率絕對不是用來唬人的。
Voodoo4和Voodoo5有什么?
如果單單只是像素填充率方面提高了,那我們只能說它只是Voodoo3的高頻率版本而已。只有創(chuàng)新,才能有突破。因此,Voodoo4和Voodoo5帶來了革命性的全屏抗混疊功能、T-Buffer和FXT1技術(shù)。讓我們來看看它們是些什么技術(shù):
Full-Scene Anti-Aliasing(全屏抗混疊功能)
3dfx希望能通過全屏抗混疊功能的實現(xiàn)來提供給我們荷利塢等級的3D圖像品質(zhì)。抗混疊就是把3D場景中各空間的邊緣或者是實時生成的3D圖像邊緣出現(xiàn)的鋸齒現(xiàn)象進行處理,使其看起來更平滑,因此也被叫做抗鋸齒功能。
從下圖我們可以看到,抗"鋸齒"功能的實現(xiàn)在于對圖像邊緣補充過渡色像素,使其看起來更像漸變的結(jié)果,沒有一種突變的感覺,看上去就好像把鋸齒都消除了。但也正因為這樣,實現(xiàn)全屏抗混疊功能必須消耗大量的像素填充能力和帶寬,這就是為什么TNT 2當(dāng)開啟了抗混疊功能后速度急劇下降的原因,而且那還是局部抗混疊。Voodoo 5為了實現(xiàn)全屏抗混疊功能必須擁有極為強大的像素填充能力。
留意一下飛機的木柱,我們很容易可以看到一截截的,但在全屏抗混疊的修正下,可見整架飛機的邊緣都平滑了許多。
其實這種提高畫質(zhì)的方法和nVidia的T&L硬件加速有異曲同工之妙,都是利用更多的圖像單元(Geforce256利用更多的多邊型)來實現(xiàn)更為平滑的圖像,而且它們兩者為了實現(xiàn)這一功能都必須付出額外的運算量。那么到底那個方法才是最好的呢?我們看,現(xiàn)在的游戲如果要支持T&L,必須采用擁有更多多邊型的3D場景,并且有可能需要使用新的圖形引擎,這在目前來說恐怕是不可行的。但 3dfx的全屏抗混疊功能實現(xiàn)的全部是靠圖形芯片,并不需要游戲廠商為之進行任何的修改和優(yōu)化,因此,就目前來說,3dfx的全屏抗混疊技術(shù)似乎更為有效和可行。
T-Buffer
緩存技術(shù)包括了三個方面的內(nèi)容:
Motion Blur(運動模糊補償)
我們知道,如果一個物體高速運動著的時候,該物體看上去會有點模糊的效果,如果運行得足夠快的話,甚至還會出現(xiàn)圖像的重疊,這是因為人眼視覺上的延遲所造成的,為了達到荷利塢等級的圖像質(zhì)量,3dfx決定在主流PC中實現(xiàn)這一效果。它就是通過T-Buffer支持的Motion Blur功能實現(xiàn)的。
暫時的抗混疊是把運動模糊補償引入3D場景中的一個辦法。通過時有時無的"鋸齒"效果,讓人誤以為看到物件是運動的。此外,還必須模仿一個運動物體的行動路線,用類似相機快門的方式進行拍攝,得到一幀幀高速運動中的圖像。最后,把各個連續(xù)的場景都存儲起來,再輸出到屏幕上。T-Buffer支持多重幀緩存,Motion Blur實現(xiàn)起來一點也不困難。
運動模糊補償效果感覺非常的不錯,玩游戲時就好像在看電影,用在游戲上絕對是爽!
Depth of Field Effects(原野景深效果)
為了更加真實的重現(xiàn)實際中的圖像,3dfx還引入了原野景深效果,它模擬了照相機拍攝遠離焦點的景物時遠處的景物會出現(xiàn)的那種模糊的效果。通過這樣,我們就能做出一些如特寫鏡頭般的效果(看上圖),又或者是更為逼真的應(yīng)用,如游戲中被打暈了,結(jié)果遠處或部分的景物會出現(xiàn)模糊不清的情況。
Soft Shadows and Reflections(軟陰影和反射效果)
單單只是反映陰影的情況,許多顯示卡都能做到,然而,3dfx的軟陰影和反射效果則是為了反映顯示世界的光影效果而誕生的。通過對真實世界的模擬,SSAR能重現(xiàn)出代表真實世界物體衍射的光影效果。
FXT1(3dfx的紋理壓縮技術(shù))
S3在許久以前就發(fā)布了紋理壓縮規(guī)范S3TC,但并不代表先來的就是好的。3dfx也發(fā)布了自己的FXT1紋理壓縮技術(shù),不同的是FXT1是一種公開的技術(shù),因此任何一家廠商都能利用它來進行自己的產(chǎn)品進行開發(fā)和利用。拋開技術(shù)細(xì)節(jié)不說,單憑這一點S3TC就已經(jīng)不是FXT1的對手。
使用紋理壓縮技術(shù)絕對會是未來圖形加速芯片的標(biāo)準(zhǔn)"功能"。通過紋理壓縮,我們能在游戲中使用更為精細(xì)的紋理貼圖,使畫面質(zhì)量更為精美。壓縮了的紋理貼圖能減少圖形加速卡帶寬的占用,減少需要的幀緩存數(shù)量,從而加速圖像的渲染和貼圖過程。
那么FXT1是如何工作的呢?
首先,在壓縮過程,紋理先被分成了多重的4*4或4*8大小的特塞爾(texel)塊。然后,按照四種不同的算法對這些特賽爾塊(texel blocks)進行編碼。最后,把它們按照每特塞爾(texel)占用4個位進行存儲。而在解壓縮過程,壓縮的特賽爾塊被讀進系統(tǒng)內(nèi)存或幀緩存,然后根據(jù)渲染場景的需要而讀取壓縮的特賽爾單元,通過對每個特賽爾單元中兩個預(yù)定位的讀取獲取該特塞爾塊采用何種壓縮算法,最后就是通過3D圖形芯片的引擎對其進行還原。
FXT1還是S3TC?
那么到底我們應(yīng)該選用FXT1(3dfx的產(chǎn)品)還是S3TC(S3的產(chǎn)品)呢?雖然這牽涉到產(chǎn)品本身的其它因素,但如果就壓縮算法來說,我個人認(rèn)為 3dfx的FXT1更為優(yōu)秀。通過開放的使用授權(quán),免費的開發(fā)軟件,更多系統(tǒng)的支持,包括Windwos、 MAC、liunx和beOS,另外,在壓縮效率方面FXT1也較S3TC更為優(yōu)勝。
以上是FXT1對比其它壓縮技術(shù)的數(shù)據(jù)圖,由于FXT1有四種壓縮規(guī)格,因此其表現(xiàn)要比S3TC要好許多。
此外,最近3DFX在美國舉行的GDC(Game Developers Conference)2000上透露一些關(guān)于Voodoo之后的次代3dfx圖形芯片Rampage。
-128--256MB DDR
-像素填充率為1.5-2.5G/S
-4渲染管道
-采用0.18微米處理制造
-核心頻率為200--250MHZ
-RAMDAC為360--450MHZ
-支持Haedware T&L(生成25個光源)
-三維像素單元
-75M Triangle/S
-支持T-Buffer
-支持M-Buffer
對于這芯片,3dfx非常有信心,因為它已經(jīng)可以用到三維像素單元的功能,可以說是顯示芯片的一個飛躍。不過為了保持這芯片的神秘,3Dfx并沒有很詳細(xì)地透露更多資料。Rampage預(yù)計將在12月發(fā)布,其主要對手很可能是nVidia的NV20。
Ati公司
顯示芯片巨頭ATI是加拿大的一家顯卡芯片制造公司,也是目前世界上最大的3D芯片制造業(yè)公司,他同時也擁有一個極為龐大的中級顯示芯片OEM市場。 ATI依靠Rage 128GL、Rage 128VR芯片(64位顯存帶寬,性能遠不如Rage 128GL,但是它有兩個好處:一是芯片的針腳與上一代芯片Rage Pro Turbo兼容,因此顯卡制造容易,升級方便。二是Rage 128VR價格十分低廉,比Rage Pro Turbo高不了幾美元,因此備受OEM廠商歡迎。)和Rage Fury MAXX("曙光女神",支持AGP4*和S3TC,相當(dāng)于把兩顆Rage 128 Pro并聯(lián)在一起工作,性能也相當(dāng)于Rage 128 Pro的兩倍,像素填充率為500M像素/s,每秒可生成1600萬個多邊形)在高端和游戲市場中同時占據(jù)領(lǐng)導(dǎo)地位。此外,ATI在不久前發(fā)布了新的 Rage6圖形芯片,目的是要對付nVidia和3dfx的次代芯片,更鞏固市場的領(lǐng)導(dǎo)地位。
上面提到的Voodoo5被設(shè)計成擁有極高的像素填充率,為的就是實現(xiàn)極為復(fù)雜的FSAA(全屏幕抗鋸齒效果)。還有就是T-Buffer效果(能夠合成一些特殊的視覺效果,例如運動模糊補償?shù)龋4蠹乙仓?,實現(xiàn)這些效果的前提是處理更多的細(xì)節(jié),也就是畫面像素。這就是說,顯示卡必須運算和傳輸更多的數(shù)據(jù),比前一代顯示卡增加的效能就因為提高了畫質(zhì)而抵消掉了。最不好的情況甚至是在實現(xiàn)了全部效果后,還不如其上一代顯示卡提供的效能。而nVidia它們的Geforce256顯示卡現(xiàn)在可謂是一朝得志了。在所有的電腦賣場中都是高檔品種中的搶手貨。 Gefroce256內(nèi)建了T&L引擎。它能硬件處理轉(zhuǎn)換和光照效果。于是,人們就會在游戲中加入更多更復(fù)雜的光影效果。結(jié)果又導(dǎo)致增加的效能被抵消掉了。從表面上看,大家會認(rèn)為這些顯示卡提高了效能,但實際上是,它們都是用效能來換畫面質(zhì)量。說得更貼切些,就是用更多的細(xì)節(jié)來換取更好的畫面質(zhì)量。有沒有兩全其美的方法,有能有性能上的提升,并且能夠在畫面質(zhì)量上有質(zhì)的改變?Ati不久前再次向我們展示了新時代的思路。畫面質(zhì)量已經(jīng)從本質(zhì)上提升,而不單是靠細(xì)節(jié)的增多。3D顯示卡的發(fā)展并不是靠犧牲速度來換取畫質(zhì),也不是犧牲畫質(zhì)來獲得速度。必須協(xié)同發(fā)展,才是正確之道。
Ati Rage6就是為了這個目的而誕生的。
芯片普通特性:
-256位圖形核心
-0.18微米工藝生產(chǎn),不久將轉(zhuǎn)向0.15微米工藝
-100平方毫米芯片面積
-芯片集成2500萬個電晶體
-兩條帶有3重紋理貼圖單元的像素渲染管道
-200--400MHz的芯片工作頻率
-200MHz+的顯存工作頻率
-特塞爾填充速率
1、一重貼圖400--800M特塞爾每秒
2、二重貼圖800--1600M特塞爾每秒
3、三重貼圖1200--2400M特塞爾每秒
-芯片內(nèi)建材質(zhì)、像素和Z坐標(biāo)緩存
-支持SDRAM SGRAM、DDR SGRAM和更多更新的顯存
-8-128M板載緩存
-200MHz DDR SGRAM能提供高達6.4GB/sec的顯存帶寬
-芯片擁有兩個獨立的視頻通道并且擁有連個CRT控制器
-芯片將會集成350--400MHz的RAMDAC
-最大分辨率支持2048×1536(此時屏幕刷新頻率為75Hz)
-芯片整合TMDS轉(zhuǎn)換電路直接支持DFP數(shù)字顯示器
-MAXX技術(shù)支持,Rage6支持多芯片協(xié)同工作方案
-完整的AGP4*支持(包括FastWrite功能)
3D圖像特性:
-引入具有革命性意義的情感引擎:包括支持T&L硬件加速、剪輯、頂點蒙皮、關(guān)鍵幀插補、透視分離和獨立的三角形生成引擎。
-織錦式像素渲染引擎(能夠?qū)σ粋€像素點三重貼圖)
-支持4頂點混合
-每秒20萬個多邊型生成能力
-8光源的硬件實現(xiàn)能力
-全面的OpenGL和DirectX7.0支持。包括T&L加速、立方體環(huán)境映射、投射式材質(zhì)和紋理壓縮功能
-支持立方體、球形、雙拋物面形式的貼圖方法
-硬件凹凸映射支持,包括浮雕式、點乘積式和環(huán)境凹凸紋理映射方式
-可編程的紋理混合模式
-支持3D紋理技術(shù),從而實現(xiàn)特殊的霧化和動態(tài)光影效果
-8位模板緩存支持
-16/24/32位的Z和W緩存
-支持: 通過軟件支持DXTC和S3TC紋理壓縮模式、單過程雙重貼圖、單過程三線性過濾、單過程各向異性過濾、全場景的抗鋸齒功能、逐像素的多級貼圖、高洛德渲染和鏡面效果、鏡面高光效果和漫射式陰影效果
-完整的OpenGL ICD驅(qū)動
情感引擎Charisma Engine
Ati為我們帶來了一個全新的圖形引擎--"Charisma Engine(情感引擎)",就好像它的名字那樣,該圖形芯片能表現(xiàn)出真實的"人物情感"效果,那么我們就來看看它里面都有些什么?
在Ati開發(fā)的三代3D圖形加速芯片,我們可以看到,在第一代的RageⅠ(Ⅱ)時期,3D圖形加速卡只負(fù)責(zé)圖像渲染的任務(wù),而到了第二代的Rage PRO和Rage128、3D圖形加速卡增加了硬件三角型生成的功能,進一步解放了CPU的計算。而到了第三代,也就是Rage6、ATI引入了被稱之為 "情感引擎"的新型圖形內(nèi)核。它增加了一大堆的硬件生成能力,包括畫面可見部分的轉(zhuǎn)換、透視劃分、剪輯、關(guān)鍵幀插補、頂點蒙皮、轉(zhuǎn)換和光影的硬件生成能力。
情感引擎包括如下新特色:
轉(zhuǎn)換、剪輯和光影的硬件加速能力(TCL)
在nVidia的Geforce256中整合了T&L(轉(zhuǎn)換和光影硬件加速能力),而在Ati Rage6C中更是提供了更為高級的TCL(轉(zhuǎn)換、剪輯和光影加速能力)。
左面的猩猩運用了900個多邊型生成,而右面那只則使用了十倍,也就是9000個多邊型拼接而成,我們可以看到,右邊的那只猩猩各個部分都圓滑了許多,并且畫面更加細(xì)致。留意它臉的面部輪廓和眼。當(dāng)然,在以往這是不能想象的,由于需要進行光影和渲染的計算還有紋理的過濾,因此一個3D場景通常只能有4-- 5萬個多邊型,當(dāng)然就不可能在一個部分就使用了9000個多邊形了吧?但現(xiàn)在由于有了Ati Rage6C的情感引擎支持,用硬件來實現(xiàn)轉(zhuǎn)換、剪輯和光影的計算,從而使一個場景中的多邊型數(shù)量上升十倍,更為精細(xì)和真實的3D游戲即將出現(xiàn)。
運動骨骼
一般來說,一個3D人物造型是由一系列符合肌肉連接的骨骼來構(gòu)建的。當(dāng)一系列的"骨骼"運動的時候,這些骨骼的頂點將會按照所受重力的多少重新分布。動畫的完成基本上是由骨骼的移動來實現(xiàn)的,而皮膚的產(chǎn)生則是后來才計算出來的。采用骨骼動畫,不僅可以簡化動畫的處理,而且還可以降低對內(nèi)存的需求--這對于今天寶貴的內(nèi)存帶寬來說,是一個重要的特性。
我們就開發(fā)人員對骨架動畫的支持的意向一事向Unreal Tournament的幕后編程人員--Tim Sweeny提問,我們得到的答復(fù)是:
"提出運動骨骼這一思路是偉大的。在我們的下一代的游戲場景中,將有超過60%的多邊形將會用于實現(xiàn)運動骨骼模型的構(gòu)造,而剩下的多邊形則將用于靜態(tài)場景的構(gòu)建"。
讓人遺憾的是,這種構(gòu)造人物模型的方式有它自身的弱點。當(dāng)物體由于骨骼結(jié)合處的的彎曲而出現(xiàn)變形的時候,人物模型將會因為接合處的裂縫而顯得不真實。而克服此問題的方法則被稱之為:蒙皮。在蒙皮過程中,骨骼最高點的位置將會被微調(diào),從而制造出可柔韌運動的關(guān)節(jié)出來,使人物模型顯得更為真實。
四基點蒙皮
Direct3D 支持2-3個基點蒙皮(骨骼補充)。一般來說,基于兩個基點的蒙皮已經(jīng)足夠了。但對于把一條脖子和兩支胳膊連到一個軀干這種情況,基于四個排列成鉅陣的基點進行蒙皮就顯得更為真實。看下面的3D人物模型,你就會發(fā)現(xiàn)圖象質(zhì)量有重大改進。NVidia Geforce256只支持基于兩個基點的蒙皮,而Rage6C將能支持三到四個基點的蒙皮效果。
關(guān)鍵幀插值技術(shù)
這種技術(shù)能根據(jù)初始和結(jié)束的圖像來改變物體的外貌,自動生成中間的過渡圖象,換句話來說,情感引擎能在關(guān)鍵幀之間插入必要數(shù)目的過渡幀,從而造就逼真細(xì)膩的人物表情效果。(例如在下圖中,你就可以看到人物的面貌通過關(guān)鍵幀插值技術(shù)得到了非常平滑過渡效果,通過自插值技術(shù),能省去龐大的紋理內(nèi)存空間和紋理帶寬的占用,從而提高3D場景的執(zhí)行速度。)
像素織錦引擎
除了情感引擎以外,Rage6C還有其它一些重要的特性如像素織錦引擎,它的最大特點是:在一個渲染管道中含有三個獨立的紋理單元。不要忘了, Geforce256 和VSA100 也僅有一個紋理單元,就算在NV11和NV15中,nVidia也只是提供了雙紋理單元的渲染管道而已。
Rage6C擁有兩個渲染管道,每條渲染管道里有三個獨立的紋理單元,因此它可以實現(xiàn):
* 在每個象素中映射并過濾最多至三個紋理
* 支持硬件級的通用紋理轉(zhuǎn)換方法(立方體環(huán)境貼圖,投影紋理等)
* 執(zhí)行環(huán)境凹凸紋理映射效果
* 精確模擬出材質(zhì)的特點(如水、金屬、木頭等)
除此之外,像素織錦引擎還提供了如下的硬件支持:
按優(yōu)先級排序的紋理緩存器
這是一個用來產(chǎn)生更好的陰影效果的新型技術(shù)。Rage6C支持一種特殊的按優(yōu)先級排序的緩存器,用來儲存與該場景有關(guān)的物體和光源等信息,并按照優(yōu)先級對它給每個場景中的物體都分配一個優(yōu)先級,如果物體的位置相對我們的視角有所變化,那么優(yōu)先級就會改變。優(yōu)先級緩存器再配合投影紋理一起運用,就能產(chǎn)生非常逼真的陰影效果。陰影是通過以下的方法來生成的,整個場景的渲染會根據(jù)不同的視角而從優(yōu)先級緩存器中得到不同的優(yōu)先級,越近的物體越先被渲染,因為它們被賦予更高級的優(yōu)先級別,而陰影的紋理是通過渲染每個物體的輪廓來實現(xiàn)的,然后我們用準(zhǔn)備好的紋理來填充陰影,這種方法比用傳統(tǒng)的模板緩存更直接和有效。而 3D紋理則是利用動態(tài)幾何學(xué)對物體進行簡單處理并產(chǎn)生復(fù)雜的動態(tài)光線影射效果,如煙、霧、流體等。另外, Rage6C還支持支持DirectX 7.0中的立方體環(huán)境貼圖效果 (Cubic Environment Mapping)。此外,RAGE 6還支持球形貼圖(單紋理)和雙拋物面貼圖效果(雙紋理)。
Rage6C支持Range-Based Fog, 霧的密度取決于玩家在游戲中的視角位置和物體之間的距離。在以往的霧化效果中(左圖),再對比一下右圖,可見新式的Range-Based Fog更符合人眼的視覺特點,顯得更為真實。
Ati Rage6C擁有眾多嶄新的特性,而基于Rage6的圖形卡可望在五月能夠面市:一塊帶有32MB DDR SGRAM的RAGE 6圖形卡,售價應(yīng)該在$199左右。芯片可能工作在250MHz,而顯存則工作在200MHz。在高端領(lǐng)域,Ati或許會推出128MB使用DDR SGRAM的Rage6C加強版,芯片工作頻率會達到400MHz!?。《@存由于使用了DDR SGRAM也將達到366-400MHz。在這個時候,Rage6C將能釋放出超越NV15的性能,這是目前為止最為看好的顯示卡了。
Gigapixel公司
近日Gigapixel公司發(fā)布了其最新的3D加速芯片--Giga3D GP3。與Gigapixel早前發(fā)布的GP1和GP2不同的是,GP3將擁有完整的轉(zhuǎn)換和光影處理單元(T&L),在使用T&L加速時將能達到3300萬到6600萬多邊形/秒的幾何處理能力。(幾乎是GeForce 256的4倍?。?。同時,擁有極高的像素填充率仍然是GP3的賣點之一,GP3將擁有四條雙紋理的像素渲染管道,這將使GP3擁有單遍單周期處理8個經(jīng)過濾紋理的能力。GP3還支持一些新型的3D特性,包括DXTC紋理壓縮和EMBM環(huán)境凹凸紋理映射。
顯存總線設(shè)計
由于顯存的帶寬一直是制約圖形卡性能的一大瓶頸,所以Gigapixel在GP3中使用了鑲?cè)胧絻?nèi)存技術(shù),通過在GP3主芯片內(nèi)鑲?cè)?0K的高速SRAM 作為幀緩存,從而實現(xiàn)極高的紋理平鋪速率。與G400一樣,GP3也采用雙重總線的設(shè)計,一條總線負(fù)責(zé)讀,另一條則負(fù)責(zé)寫。
Giga3D渲染體系
與PowerVR一樣,Giga3D的渲染體系允許GP3在處理3D場景時僅處理場景中可見的部分。這樣,就算是處理一個復(fù)雜的場景,由于仍能節(jié)省部分的渲染和處理,因此GP3將能獲得更高游戲幀速率或?qū)崿F(xiàn)更多的3D特效。在Quake3中,可見部分只占一個完整場景的1/3左右,如果全部都加以渲染和處理,那么無疑是一種巨大的浪費。GP3獨特的渲染體系,不但加快了游戲速度,還節(jié)省了大量的顯存帶寬和幀緩存數(shù)量,從而使畫面不再出現(xiàn)破裂的3D畫面。
Giga3D GP3特色:
-完全支持Direct3D 7.0和OpenGL 1.2
-支持全屏,全速的抗鋸齒功能
-內(nèi)建轉(zhuǎn)換和光影幾何加速單元(T&L)
-4像素,雙重紋理的像素渲染管道
-支持各向異性過濾
-支持透視糾正
-內(nèi)建浮點設(shè)置引擎
-場景可視部分輸出
-芯片工作頻率:200--250MHz
-紋理填充率:25.6Gtexel/s(場景復(fù)雜度為4時), 12.8Gtexel/s(標(biāo)準(zhǔn)場景)-像素填充率:800Mpixel/s(1.6Gtexel/s)場景復(fù)雜度為4時: 3.2Gpixel/s(6.4Gtexel/s)
-多邊形處理能力:3300萬-6600萬/秒
-陰影
-斑點式光源
-非矩形紋理支持
-紋理合成
-DXT-1紋理壓縮
-紋理過濾:點,雙線,三線及各向異性過濾
-紋理混合;DX6及DX7
-單遍單周期雙重紋理
GP3的像素填充率只有800Mpixels/sec。可別小看了它,由于GP3只需要處理畫面中可見的部分,而在普通的游戲中這個部分只占整個場景的 1/3左右,因此,對于普通需要計算整個場景的顯示卡來說,GP3可以看成是擁有 2.4Gpixels/sec像素填充能力的超級顯示卡。并且不像PowerVR,需要特殊的游戲和驅(qū)動程序的支持,現(xiàn)在GP3所提供的可見部分渲染能力適用于DirectX和OpenGL,只要你的游戲使用了以上的兩個API,那么就肯定支持它的可視部分渲染功能。
終于把在2000年要發(fā)布的顯示卡都介紹完了。我們總結(jié)一下。2000年的發(fā)展趨勢不外呼是:
1、提高芯片的頻率,或是使用類似于SLI的方法讓幾塊芯片協(xié)同工作
2、提高顯存的頻率,增加顯存帶寬,增大顯存容量
3、提供T&L加速,更進一步解放CPU的運算,從而加快幀速率
4、采用了紋理壓縮技術(shù)或可見部分渲染技術(shù),減低運算量
大家有沒有發(fā)覺,這些技術(shù)都是為了提高顯示卡的速度,而沒有為畫質(zhì)著想?或許有的人會說,有啊,這里的 T&L加速和紋理壓縮技術(shù)能增加畫面的三角型數(shù)量和高清晰度紋理的數(shù)量。對,你說得很對,這些技術(shù)就是用犧牲速度的前提下來提高畫質(zhì)。我們需要的是實質(zhì)性的畫面質(zhì)量改變,通過硬件實現(xiàn),所以不需要或性能只下降一點。我們很高興能在Ati Rage6C上看到這個影子,方向,現(xiàn)在顯示卡發(fā)展也漸漸步入了怪圈,看到了CPU發(fā)展那么多年,進步了什么了嗎?不外就是增加了內(nèi)部帶寬、提高了工作頻率、使用了更精細(xì)的制程?在未來的一天,人們將使用3D的操作系統(tǒng)。3D的office 2000、3D的……我也不敢那么快奢望虛擬技術(shù)的到來了。然而在3D世界普及的那天,我們得到和需要的決不是速度,而是更真實的畫面,畢竟,人眼也只能是30fps/sec。你能看得更多嗎?