mboost-dp1

AMD
- Forside
- ⟨
- Forum
- ⟨
- Nyheder
#100:
Jeg kan forklare det for dig, men ikke forstå det for dig.
Alt hvad du har brug for at vide om hvorfor AMD's implemenation fejler er på den side.
Jeg gider ikke holde dig i hånden og langsomt og smertefuldt prøve at forklare dig hvad hvad AMD's tessellation:
vertex shaders -> tessellator -> triangle rasterizer setup -> pixelshaders
Betyder, i forhold til NVIDIA's
vertex shaders -> tessellator ->
-> triangle rasterizer setup 1 -> pixelshaders
-> triangle rasterizer setup 2 -> pixelshaders
-> triangle rasterizer setup 3 -> pixelshaders
-> triangle rasterizer setup 4 -> pixelshaders
-> triangle rasterizer setup 5 -> pixelshaders
-> triangle rasterizer setup 6 -> pixelshaders
-> triangle rasterizer setup 7 -> pixelshaders
-> triangle rasterizer setup 8 -> pixelshaders
-> triangle rasterizer setup 9 -> pixelshaders
-> triangle rasterizer setup 10 -> pixelshaders
-> triangle rasterizer setup 11 -> pixelshaders
-> triangle rasterizer setup 12 -> pixelshaders
-> triangle rasterizer setup 13 -> pixelshaders
-> triangle rasterizer setup 14 -> pixelshaders
-> triangle rasterizer setup 15 -> pixelshaders
Hvis du ikke kan forstå forskellen på seriel og parallel, så kan jeg slæbe dig til truget fra fra og så til rum-tiden ophøre ruden du ville forstå emnet.
Hvilket også er forklaringen på at 5770 og 5870 yder ens i tessellation....de har samme flaskehals.
Og her er årsagen til at tessellation er fremtiden:
Se, lyt og FORSTÅ n00b...
(HVis dette skulle renderes uden tessellation ville 1,3 milliarder triangles kræve ~124 GB RAM....
Vi kan så sammenholde det med en AMD demo...bare på en langt lavere skala:
Terra - At du ikke forstår er DIT problem...
Jeg kan forklare det for dig, men ikke forstå det for dig.
Alt hvad du har brug for at vide om hvorfor AMD's implemenation fejler er på den side.
Jeg gider ikke holde dig i hånden og langsomt og smertefuldt prøve at forklare dig hvad hvad AMD's tessellation:
vertex shaders -> tessellator -> triangle rasterizer setup -> pixelshaders
Betyder, i forhold til NVIDIA's
vertex shaders -> tessellator ->
-> triangle rasterizer setup 1 -> pixelshaders
-> triangle rasterizer setup 2 -> pixelshaders
-> triangle rasterizer setup 3 -> pixelshaders
-> triangle rasterizer setup 4 -> pixelshaders
-> triangle rasterizer setup 5 -> pixelshaders
-> triangle rasterizer setup 6 -> pixelshaders
-> triangle rasterizer setup 7 -> pixelshaders
-> triangle rasterizer setup 8 -> pixelshaders
-> triangle rasterizer setup 9 -> pixelshaders
-> triangle rasterizer setup 10 -> pixelshaders
-> triangle rasterizer setup 11 -> pixelshaders
-> triangle rasterizer setup 12 -> pixelshaders
-> triangle rasterizer setup 13 -> pixelshaders
-> triangle rasterizer setup 14 -> pixelshaders
-> triangle rasterizer setup 15 -> pixelshaders
Hvis du ikke kan forstå forskellen på seriel og parallel, så kan jeg slæbe dig til truget fra fra og så til rum-tiden ophøre ruden du ville forstå emnet.
Hvilket også er forklaringen på at 5770 og 5870 yder ens i tessellation....de har samme flaskehals.
Og her er årsagen til at tessellation er fremtiden:
Se, lyt og FORSTÅ n00b...
(HVis dette skulle renderes uden tessellation ville 1,3 milliarder triangles kræve ~124 GB RAM....
Vi kan så sammenholde det med en AMD demo...bare på en langt lavere skala:
Terra - At du ikke forstår er DIT problem...
#101
Terracide. Sæt den høje stol fra dig, og forstå at det er dit ordvalg (igen) der giver misforståelsen. Du kalder ATis implementering 'forfejlet', når det rigtige ord er langsom(mere).
Jeg ved du har problemer med at gradbøje og nuancere, det har du vist igennem flere år, men der er en helvedes stor forskel.
Man skal lige huske i dit eksempet, at ATIs ene tesselator engine er væsentlig hurtigere end 1 Nvidia tesselator pipeline (Nvidias tesselation er ikke 16x hurtigere), men selvfølgelig er maks outputtet bedre på Nvidias model, fordi de arbejder parallelt. Jeg er enig i, at det er dér flaskehalsen er på ATIs arkitektur, men konsekvenserne synes jeg du overdriver - især med den type spil vi formentlig kommer til at se de næste par år.
Spørgsmålet er nok, når tesselation bliver relevant i udpræget grad, så leger vi med Kepler+/HD7xxx+ GPUer. Og så skal man ikke glemme Cayman GPU'erne, ATI kommer med i løbet af november - de kan også have nogle overraskelser, eftersom de har fået flere ændringer i arkitekturen ifht. Barts.
Tesselation er fremtiden - pt. er Barts et fremragende mid-end kort. Var det ikke dem, diskussionen handlede om? Istedet for PR materiale om Nvidias produkter?
Terracide. Sæt den høje stol fra dig, og forstå at det er dit ordvalg (igen) der giver misforståelsen. Du kalder ATis implementering 'forfejlet', når det rigtige ord er langsom(mere).
Jeg ved du har problemer med at gradbøje og nuancere, det har du vist igennem flere år, men der er en helvedes stor forskel.
Man skal lige huske i dit eksempet, at ATIs ene tesselator engine er væsentlig hurtigere end 1 Nvidia tesselator pipeline (Nvidias tesselation er ikke 16x hurtigere), men selvfølgelig er maks outputtet bedre på Nvidias model, fordi de arbejder parallelt. Jeg er enig i, at det er dér flaskehalsen er på ATIs arkitektur, men konsekvenserne synes jeg du overdriver - især med den type spil vi formentlig kommer til at se de næste par år.
Spørgsmålet er nok, når tesselation bliver relevant i udpræget grad, så leger vi med Kepler+/HD7xxx+ GPUer. Og så skal man ikke glemme Cayman GPU'erne, ATI kommer med i løbet af november - de kan også have nogle overraskelser, eftersom de har fået flere ændringer i arkitekturen ifht. Barts.
Tesselation er fremtiden - pt. er Barts et fremragende mid-end kort. Var det ikke dem, diskussionen handlede om? Istedet for PR materiale om Nvidias produkter?
AenimA (102) skrev:#101
Terracide. Sæt den høje stol fra dig, og forstå at det er dit ordvalg (igen) der giver misforståelsen. Du kalder ATis implementering 'forfejlet', når det rigtige ord er langsom(mere).
Jeg ved du har problemer med at gradbøje og nuancere, det har du vist igennem flere år, men der er en helvedes stor forskel.
Man skal lige huske i dit eksempet, at ATIs ene tesselator engine er væsentlig hurtigere end 1 Nvidia tesselator pipeline (Nvidias tesselation er ikke 16x hurtigere), men selvfølgelig er maks outputtet bedre på Nvidias model, fordi de arbejder parallelt. Jeg er enig i, at det er dér flaskehalsen er på ATIs arkitektur, men konsekvenserne synes jeg du overdriver - især med den type spil vi formentlig kommer til at se de næste par år.
Spørgsmålet er nok, når tesselation bliver relevant i udpræget grad, så leger vi med Kepler+/HD7xxx+ GPUer. Og så skal man ikke glemme Cayman GPU'erne, ATI kommer med i løbet af november - de kan også have nogle overraskelser, eftersom de har fået flere ændringer i arkitekturen ifht. Barts.
Tesselation er fremtiden - pt. er Barts et fremragende mid-end kort. Var det ikke dem, diskussionen handlede om? Istedet for PR materiale om Nvidias produkter?
Hvis du ikke en gang ved hvad NVIDIA's polymorph engine er, så ser jeg ingen grund til at forsætte med dig...
Hvis du ikke en gang ved hvad NVIDIA's polymorph engine er, så ser jeg ingen grund til at forsætte med dig...
Det er præcis hvad jeg beskrev, jeg brugte bare ikke Nvidias PR terminologi for det.. Sorry, du lugter langt væk af bias, og leder efter undskyldninger for ikke at diskutere substans. Slå de ord op, de er mere relevante.
AenimA (104) skrev:Det er præcis hvad jeg beskrev, jeg brugte bare ikke Nvidias PR terminologi for det.. Sorry, du lugter langt væk af bias, og leder efter undskyldninger for ikke at diskutere substans. Slå de ord op, de er mere relevante.
Lyder meget flot hvis det ikke lige var garp som for dette:
AenimA (102) skrev:Man skal lige huske i dit eksempet, at ATIs ene tesselator engine er væsentlig hurtigere end 1 Nvidia tesselator pipeline
Du er nødt til at bruge det store billede, vi kan tage udklip fra Beyond3D:
http://www.beyond3d.com/content/reviews/55/8
Really, there are two levels of parallelism involved: all work up to rasterisation is parallelised across SMs, and rasterisation is parallelised across GPCs. The first part is not necessarily novel (remember though that the GTE works to balance out this work too), albeit it significantly differs from ATI's solution in that it parallelises the fixed function tessellator stage (TS) too, whereas on Cypress there's a single hardware block for it, which implicitly means another serialisation/choke point.
OG
Even so, larger triangle sizes are impacted by it as the bottleneck moves towards that end of the process, and no buffering is infinite (also, triangles start crossing screen tiles, thus inducing further inefficiencies as work gets replicated). Cypress handles itself decently by comparison, but it's quite interesting to look at how the two architectures handle interpolating progressively more attributes: Slimer has no preference with regards to either interpolating 4 Float attributes or using the system value mechanism, namely SV_Position (also 4 Floats), whereas Cypress dislikes it.
OG
ATI's problem is primarily one of data-flow: they try to keep some data in shared memory (as far as we can see, they try to keep HS-DS pairs resident on the same SIMD, with hull shaders being significantly more expensive then domain shaders) but data to and from the tessellator needs to go through the GDS. There's also the need to serialise access to the tessellator, since it's an unique resource, coupled with a final aspect we'll deal with when looking at math throughput.
#105
Du digter.
Læs hvad jeg skriver én gang til og citér det fulde stykke.
Cherry picking much, Terra?
Jeg har læst stykket fra Beyond3D, tak.
Du digter.
Læs hvad jeg skriver én gang til og citér det fulde stykke.
Man skal lige huske i dit eksempet, at ATIs ene tesselator engine er væsentlig hurtigere end 1 Nvidia tesselator pipeline (Nvidias tesselation er ikke 16x hurtigere), men selvfølgelig er maks outputtet bedre på Nvidias model, fordi de arbejder parallelt. Jeg er enig i, at det er dér flaskehalsen er på ATIs arkitektur, men konsekvenserne synes jeg du overdriver - især med den type spil vi formentlig kommer til at se de næste par år.
Cherry picking much, Terra?
Jeg har læst stykket fra Beyond3D, tak.
#106:
Du ved tydeligt vis ikke hvad der forgår, det er ikke bare et spørgsmål om at gøre ting parallelt, som Anandtech skriver:
http://www.anandtech.com/show/2918/2
While the PolyMoprh Engine may sound simple in its description, don’t let it fool you. NVIDIA didn’t just move their geometry hardware to a different place, clone it 15 times, and call it a day. This was previously fixed-function hardware where a single unit sat in a pipeline and did its share of the work. By splitting up the fixed-function pipeline like this, NVIDIA in actuality created a lot of work for themselves. Why? Out of order execution.
OoO is something we usually reserve for CPUs, where high-end CPUs are built to execute instructions out of order in order to extract more performance out of them through instruction level parallelism. OoO is very hard to accomplish, because you can only execute certain instructions ahead of other ones while maintaining the correct result for your data. Execute an add instruction that relies on a previous operation before that’s done, and you have problems.
Du ved tydeligt vis ikke hvad der forgår, det er ikke bare et spørgsmål om at gøre ting parallelt, som Anandtech skriver:
http://www.anandtech.com/show/2918/2
While the PolyMoprh Engine may sound simple in its description, don’t let it fool you. NVIDIA didn’t just move their geometry hardware to a different place, clone it 15 times, and call it a day. This was previously fixed-function hardware where a single unit sat in a pipeline and did its share of the work. By splitting up the fixed-function pipeline like this, NVIDIA in actuality created a lot of work for themselves. Why? Out of order execution.
OoO is something we usually reserve for CPUs, where high-end CPUs are built to execute instructions out of order in order to extract more performance out of them through instruction level parallelism. OoO is very hard to accomplish, because you can only execute certain instructions ahead of other ones while maintaining the correct result for your data. Execute an add instruction that relies on a previous operation before that’s done, and you have problems.
#107
Du render i cirkler uden formål, vi har for længst diskuteret ydelsen af Nvidias tesselation løsning (og været stort set enige, hvis du ikke har bemærket det) - jeg har fornemmelsen af at du kan flytte kommaer de næste 50 indlæg, hvis det betyder at du kan understrege tesselation flere gange.
For at citere mig selv:
Nok tid er spildt på Nvidias tesselation ydelse i en nyhed om HD6850/6870 kortene - det er ikke en tilfældighed - du afleder konstant diskussionen i den retning.
Så hvad med mit spørgsmål i #86?
Jeg har interesseret mig for hardware i nok år til at vide, at så enkelt er det ikke.. Derfor - medmindre du har er godt svar til mit spørgsmål - er der ikke nogen grund til at fortsætte.
Du render i cirkler uden formål, vi har for længst diskuteret ydelsen af Nvidias tesselation løsning (og været stort set enige, hvis du ikke har bemærket det) - jeg har fornemmelsen af at du kan flytte kommaer de næste 50 indlæg, hvis det betyder at du kan understrege tesselation flere gange.
For at citere mig selv:
Tesselation er fremtiden - pt. er Barts et fremragende mid-end kort. Var det ikke dem, diskussionen handlede om? Istedet for PR materiale om Nvidias produkter?
Nok tid er spildt på Nvidias tesselation ydelse i en nyhed om HD6850/6870 kortene - det er ikke en tilfældighed - du afleder konstant diskussionen i den retning.
Så hvad med mit spørgsmål i #86?
Min pointe er, at din kritik altid kun går én vej. Vil du benægte det?
Jeg har interesseret mig for hardware i nok år til at vide, at så enkelt er det ikke.. Derfor - medmindre du har er godt svar til mit spørgsmål - er der ikke nogen grund til at fortsætte.
#108:
Nej det handler netop om arkitekturen.
Hvorfor tror du AMD whiner over HAWX2?
Fordi 69xx koretne vil have samme tessellation enigne...og dermed samme flaskehals.
Derfor AMD whiner for skal de gøre som NVIDIA kræver det et redsign...et redesign som ikke lige er noget man bare lige gør.
Og jeg var lige så kritisk overfor GeforeFX og SM20.0
Ting der holder udviklenigen tilbage er ikke min kop te og pt. er det AMD der slæber sine fødder i GPGPU, 3D, GPU fysik...og tesselation.
Alt sammen fordi de gerne vil have en så lille core som muligt.
Nej det handler netop om arkitekturen.
Hvorfor tror du AMD whiner over HAWX2?
Fordi 69xx koretne vil have samme tessellation enigne...og dermed samme flaskehals.
Derfor AMD whiner for skal de gøre som NVIDIA kræver det et redsign...et redesign som ikke lige er noget man bare lige gør.
Og jeg var lige så kritisk overfor GeforeFX og SM20.0
Ting der holder udviklenigen tilbage er ikke min kop te og pt. er det AMD der slæber sine fødder i GPGPU, 3D, GPU fysik...og tesselation.
Alt sammen fordi de gerne vil have en så lille core som muligt.
Hold nu op Terra, arkitekturen er der og den virker. Den kunne uden tvivl være langt bedre, men det er langt fra det samme som at sige det er fejl implementeret eller ikke duer.
Skal vi da ikke lige have AMDs "whine".
Så kan man så selv vælge at tro om det er driver issue or not.
Kilde: hothardware.com HAWX 2
Skal vi da ikke lige have AMDs "whine".
Så kan man så selv vælge at tro om det er driver issue or not.
It has come to our attention that you may have received an early build of a benchmark based on the upcoming Ubisoft title H.A.W.X. 2. I'm sure you are fully aware that the timing of this benchmark is not coincidental and is an attempt by our competitor to negatively influence your reviews of the AMD Radeon HD6800 series products. We suggest you do not use this benchmark at present as it has known issues with its implementation of DirectX 11 tessellation and does not serve as a useful indicator of performance for the HD 6800 series. A quick comparison of the performance data in H.A.W.X. 2, with tessellation on, and that of other games/benchmarks will demonstrate how unrepresentative H.A.W.X. 2 performance is of real world performance.
AMD has demonstrated to Ubisoft tessellation performance improvements that benefit all GPUs, but the developer has chosen not to implement them in the preview benchmark. For that reason, we are working on a driver-based solution in time for the final release of the game that improves performance without sacrificing image quality. In the meantime we recommend you hold off using the benchmark as it will not provide a useful measure of performance relative to other DirectX 11 games using tessellation.
Kilde: hothardware.com HAWX 2
#111:
Tessellation i DX11 er en standard.
AMD's ydelsen efter standarden halter, allerede ved 11x tessellation, derfor vil de gerne lavemindre tessellation.
Og det er rent grinagtigt da ATi havde TruForm(tessellation) allerede i Radeon 8500.
De sov i timen...eller også bider deres small die size dem i røven nu.
Det var det samme med NVIDIA, GeforceFXHalflife 2 (SM2.0)...begge tilfælde var fordi ydelsen bare ikke var der.
Tessellation i DX11 er en standard.
AMD's ydelsen efter standarden halter, allerede ved 11x tessellation, derfor vil de gerne lavemindre tessellation.
Og det er rent grinagtigt da ATi havde TruForm(tessellation) allerede i Radeon 8500.
De sov i timen...eller også bider deres small die size dem i røven nu.
Det var det samme med NVIDIA, GeforceFXHalflife 2 (SM2.0)...begge tilfælde var fordi ydelsen bare ikke var der.
Jeg er sku bange for du har demens, men hæng i, vi skal nok prøve at hjælpe dig..
Nvidia pusher en Pro Nvidia bench, AMD svare den bench har kendte problemer med DX11 tessellation, derfor vil de forsøg fixe noget via drivere.
Om nvidia har fusket bench eller AMD prøver debunke selv er umuligt at sige.
Ergo må man da som minimum se ny bench an før man kan call it.
Og nej du behøver ikke google en tilfældig anden test frem der køre pre card eller alpha soft.
Nvidia pusher en Pro Nvidia bench, AMD svare den bench har kendte problemer med DX11 tessellation, derfor vil de forsøg fixe noget via drivere.
Om nvidia har fusket bench eller AMD prøver debunke selv er umuligt at sige.
Ergo må man da som minimum se ny bench an før man kan call it.
Og nej du behøver ikke google en tilfældig anden test frem der køre pre card eller alpha soft.
#108, #112 og resten af det fornuftige folk, dvs. ikke terracide
Jeg tror at vi må give op, terracide er fanget i et loop hvor han ikke vil svare på de fleste af vores spørgsmål, sviner folk til og linker til tilfældige benchmarks, som han mener beviser hans pointe uanset om dem han svarer er enige eller uenige med ham.
/back to topic
Jeg er glad for denne lancering af 6k serien, den minder mig om dengang AMD lancerede 4k serien, første kort ude af døren rammer perfekt i mainstream markedet. Efterfølgende kort viser så hvad serien kan byde high-end markedet, og til sidst får vi de billige low-end kort.
Kortene rammer efter min mening lige hvor de skal, og de giver rigtig god ydelse i nutidens spil, de vil ikke være de hurtigste på markdet, men de leverer bedre ydelse til prisen end forgængeren og det er vel hvad der er vigtigt for forbrugerne. Det er jo ikke længe siden at radeon 4770 blev anbefalet frem for prismæssigt tilsvarende kort i 5k serien, simpelthen fordi den var et bedre køb end 5k kort til tilsvarende pris.
Da mainstream markedet er så stort vil flere early adopters, som godt ved der kan være små bugs i driveren, være i stand til at teste varen. Når AMD så lancerer resten af serien til high- og low-end markedet, er driverne modnet det ekstra, så de seriøse gamere får et mere stabilt produkt og forældrenes PC kører som den skal.
#terracide
Jeg håber at du er voksen nok til at du ved at man ikke svarer, når folk ikke taler til en.
Jeg tror at vi må give op, terracide er fanget i et loop hvor han ikke vil svare på de fleste af vores spørgsmål, sviner folk til og linker til tilfældige benchmarks, som han mener beviser hans pointe uanset om dem han svarer er enige eller uenige med ham.
/back to topic
Jeg er glad for denne lancering af 6k serien, den minder mig om dengang AMD lancerede 4k serien, første kort ude af døren rammer perfekt i mainstream markedet. Efterfølgende kort viser så hvad serien kan byde high-end markedet, og til sidst får vi de billige low-end kort.
Kortene rammer efter min mening lige hvor de skal, og de giver rigtig god ydelse i nutidens spil, de vil ikke være de hurtigste på markdet, men de leverer bedre ydelse til prisen end forgængeren og det er vel hvad der er vigtigt for forbrugerne. Det er jo ikke længe siden at radeon 4770 blev anbefalet frem for prismæssigt tilsvarende kort i 5k serien, simpelthen fordi den var et bedre køb end 5k kort til tilsvarende pris.
Da mainstream markedet er så stort vil flere early adopters, som godt ved der kan være små bugs i driveren, være i stand til at teste varen. Når AMD så lancerer resten af serien til high- og low-end markedet, er driverne modnet det ekstra, så de seriøse gamere får et mere stabilt produkt og forældrenes PC kører som den skal.
#terracide
Jeg håber at du er voksen nok til at du ved at man ikke svarer, når folk ikke taler til en.
Opret dig som bruger i dag
Det er gratis, og du binder dig ikke til noget.
Når du er oprettet som bruger, får du adgang til en lang række af sidens andre muligheder, såsom at udforme siden efter eget ønske og deltage i diskussionerne.