Současné procesory řady 86 a jejich konkurenti
Pentium 4
36b adresa, data 64b externě, 32b registry, !architektura IA-32, rychlost μP od 1400Mhz výše, rychlost sběrnice 400 MHz, 42 mil. tranzistorů celkem, soket 423
hlavní rozdíly proti předchozím typům PentiumII a III:
– v technologii výroby je použitá 0,18 a později 0,13 μm CMOS, která dovoluje dodat vyšší výkon,
– v návrhu architektury je novinkou architektura NetBurst, vyrovnávací paměť (IVP) s výrazně zkrácenou čekací dobou,
– v instrukčním souboru je 144 nových instrukcí SSE2 (též MMX2).
Toto Pentium4 je vyrobeno na jádře Willamette, použitá mikroarchitektura NetBurst označuje technologii, která přeuspořádává způsob zpracování dat v čipu a využívá pro to náběžnou i sestupnou hranu hodin:
- technologie hyperpipeline zdvojuje hloubku zřetězení procesoru (až na 20 stupňů) a zvyšuje dosažitelnou frekvenci jádra a jeho výkon (dnes až 3 GHz)
- rychlá výkonná jednotka („rapid execution engine”) dovoluje, aby dvě integrované ALU v procesoru běžely na dvojnásobné frekvenci než jádro – mnoho instrukcí lze vykonat během ½ hodinového cyklu
- 400 MHz systémová sběrnice (s novým protokolem) vychází z 100 MHz systémových hodin
- „execution trace cache” je další L1 cache (instrukční), která uschovává přibližně 12 K dekódovaných mikroinstrukcí, což odstraňuje dekodér z hlavní vykonávací cesty (dále je v P L1 datová cache 8 KB s 4cestným 64bitovým propojením s jádrem; cache L2 je 8cestná 256 KB)
- „aggregate cache latency“ (?úplně skrytá cache): zatímco Pentium III prohledává nejdříve L1, v případě neúspěchu L2, pak operační paměť, Pentium 4 prohledává všechny vyrovnávací paměti zároveň
Pentium 4 je ve 423pinovém pouzdře a pracuje na frekvencích 1,3, 1,4 a 1,5 GHz.
SSE2 (Streaming SIMD Extension 2) dále rozšiřuje technologii MMX (všechny registry 128bitové, 144 nových instrukcí).
Obsahuje 42 milionů tranzistorů, je navrženo technologií 0,18 µm (už existuje technologie 0,13 µm), má novou patici Socket 423.
Sběrnice Pentia 4 může mít data invertována tak, aby počet změn logických úrovní signálů byl co nejmenší při změně dat (k tomu je pro každé slovo informační signál).
Pentium 4 má tzv. tepelný monitor, díky němuž nemusel být procesor navrhován pro nejhorší případ tepelného namáhání. Integrovaný rozvod tepla IHS (Integrated Heat Spreader) je povrch, který zabezpečuje kontakt mezi chladičem a procesorem. OLGA (Organic Land Grid Array) pouzdření používá převrácený čip (flip chip), kdy je procesor připevněn k substrátu vrškem dolů pro dosažení účinnějšího odvádění tepla a nižší indukčnosti.
Nový protokol systémové sběrnice používá rozdělenou (split) transakci (provádění), odložený (deferred) protokol odpovědi (podobný protokolu systémové sběrnice rodiny P6, ale není s ním slučitelný) a SST (Source-Synchronous Transfer přenos synchronizovaný zdrojem) adresy a dat. Zatímco rodina P6 přenášela data jednou za hodinový cyklus, Pentium 4 je přenáší čtyřikrát za hodinový cyklus (4násobný poměr datového přenosu, jako v AGP‑4X). Spolu s 4X datovou sběrnicí může adresová sběrnice dodávat adresy dvakrát za hodinový cyklus a říká se jí „dvojhodinová“ nebo 2X adresová sběrnice. Tato kombinace poskytuje šíři pásma datové sběrnice až 3,2 GB/s. Navíc „Request Phase“ kompletuje v jednom hodinovém cyklu. Nakonec: systémová sběrnice také uvádí přenosy, které se užívají k dodání přerušení. In addition, the Request Phase completes in one clock cycle. Finally, the system bus also introduces transactions that are used to deliver interrupts.
AMD K7 Athlon – poprvé
Když se AMD přece jen nakonec rozhodlo ukončit svoji velmi povedenou řadu K6, nastala otázka co dál. Intel vládl na trhu a poslední typ K6-III se přece jen neprodával nijak zvlášť dobře. Novou vlajkovou lodí se stal právě procesor, typově označený jako K7 Athlon. Athlon je procesor vyvinutý pro novou AMD sběrnici nazvanou slotA (velmi originálně). Tato sběrnice je slot1 (u procesorů Intel) podobná, avšak typově zcela odlišná. Původní jádro Athlonu bylo konstruováno 0.25mikro technologií, novější modely (700 MHz a výš) měli již progresivní 0.18mikro (stejně jako jádro coppermine). Superskalární křemíkový substrát (22 mil. tranzistorů) a difuzní technologie měděných polovodičových můstků, staví jádro Athlonu mezi absolutní špičku.. Navíc ještě vylepšené instrukce 3DNow! a masivní L2 cache 512 Kb (tentokrát není cache integrována on-die, ale podobně jako u klasických PII nebo „Katmai“ PIII „vedle“ chipu na procesorové desce. Ve speciálních verzích Athlonu pro serverové stanice byla velikost L2 cache až 8MB!). Celé toto je zapouzdřeno v neprodyšném obalu (viz. obrázek). Frekvence L2 cache běží na 1/2 frekvence procesoru, u rychlejších typů pak na 1/3 a 1/4.. To všechno dohromady s FSB 200 MHz Double pumped (efektivní hodnota je 100MHz, je však zdvojnásobena – princip DDR) sběrnicí činí Athlona vysoce výkonným.. Všechno má i své mouchy..
Tak v první řadě byl Athlon dost omezen právě externí L2 cache (přece jenom přináší metoda on-die umístění vyšší výkon a rychlejší přístup k paměti než externí provedení). Také ve vysokých frekvencích brzdí Athlona v rozletu nízká hodnota kmitočtu L2 cache (Což se projeví tím, že výkonnostní rozdíl mezi 750 a 850 Mhz Athlonem neni taky velký jako mezi 750 a 850 MHz PIII. Stejně tak výkonnostní rozdíl mezi 900 a 1GHz Athlonem je téměř nulový, zde se začíná už trochu projevovat silná PIII coppermine a ThunderBird jádra, u nichž běží frekvenci L2 cache stejně s frekvencí jádra). V druhé řadě byli velmi drahé chipsety, které pro normálního smrtelníka nebyli k mání . A neposlední řadě měl Athlon docela zlý příkon (až 65W) a příšerně „topil“ a to ho tudíž vyřazovalo ze hry pro náruživé overclockery. Nicméňě vše bylo vyváženo obrovským výkonem a Athlon ve vysokých frekvencích směle konkuroval i PIII coppermine. AMD brzy pochopilo, že platforma slotA nemá velkou budoucnost, rozhodlo se tedy přejí k paticovým procesorům.
AMD Athlon – podruhé (ThunderBird)
Když se AMD (zcela správně) přešel zpět na paticové procesory, vyvstaly další otázky ? Jak zaručit zpětný vysoký výkon Athlona ? Jak udržet cenu pod hranicí PIII coppermine ? A jak přinutit uživatele aby opustili zaběhanou platformu levných a středních strojů s procesory Celeron a levnými PIII ? Nová patice pro novou řadu K7 procesorů typu Duron a ThunderBird dostala název socketA.. Jádro ThunderBird (až 31mil. tranzistorů, 0.18µm) je vlastně Athlonem v paticovém balení a s on-die integrovanou 256 Kb L2 cache (princip odkládání dat do cache je pak trochu matematicky upraven. cache je tzv „exkluzivní“, nechápu však proč její šířka je „pouze“ 64-bit. Širší 256-bit by rozhodně ještě přidala na výkonnosti a mohla by ThunderBirdy definitivně oddělit od coppermine). Zásadní rozdíl oproti klasickému Athlonu spočívá také v synchronizaci kmitočtu procesoru s kmitočtem L2 cache a to také ThunderBirda (Athlona) torpéduje vzhůru směrem k PIII a ve ve frekvencích nad 1 GHz drží prim ! To všechno ještě podtrhuje dvojnásobná (double pumped) velikost FSB (FSB je sice, jak se na první pohled může zdát, standardní 100 MHz Efektivní hodnota je však dvojnásobná, takže skutečná FSB je 200 MHz).. ThunderBird je stále cenově velmi příznivý (skoro o 50% levnější než PIII na stejné frekvenci) a výkonově se PIII vyrovná, něřknu-li v mnoha případech ho i předčí !! Po vydání VIA KT133 chipsetu se situace na poli chipových sad velmi zpříjemnila a K7 ThunderBird i Duron je přístupný i středně majetným a chudším uživatelům. A zápory ? ThunderBird, stejně jako Duron a Athlon hodně hřeje a dost „zbaští“ na příkonu (stále až 55W). Nevýhodou pořád zůstává fakt, že většina programů (a her) je optimalizovaná pro Intelovské SSE (či ATC) funkce a AMD funkce 3DNow! jsou stále jaksi opomíjeny.
AMD Duron
Tady stojí na místě uvést, že se AMD podařil s Duronem skvělý tah a tímto útočí nejen na pozice hi-end procesorů (ThunderBirdem), ale i na procesory určené pro běžné a „lehčí“ využití. Duron je tedy přímým konkurentem Celeronu. Stejně jako Celeron (coppermine verze) je vykastrovanou verzí PIII, tak i Duron je levnější verzí ThunderBirda.. Nutno však podotknout, že Celeron byl vykastrován oproti Duronu velmi hrubě (zejména snížením na 66 MHz FSB).. Duron tak vyšel pouze z lehkým škrábancem v podobě snížení L2 cache na 64 Kb (což je teda opravdu málo), jinak je koncepčně shodný s ThunderBirdem (včetně skvělé efektní hodnoty 200 MHz FSB a stejné frekvenci cache/jádro). L2 cache je stejně jako u ThunderBirda exkluzivní, a jelikož její velikost je „pouhých“ 64 Kb tak celý procesor tak příšerně netopí (Rozhodně topí teda víc než Celeron). Ale zamýšleno jako levná varianta je to více než dobré. A když říkám levná, tak levná. To, že Duronu nemůže Celeron v nepřetaktovaném stavu ani v nejmenším výkonnostně konkurovat je snad jasné. Pokud je Celeron vyhnán na 100 MHz tak se pomalu přibližuje, a až tak možná výkon přetaktovaného Celeronu 566 na 100Mhz x 8.5 = 850 MHz je asi tak roven výkonu Duronu 750 (Duron drží díky 200 MHz FSB, Celeron zase ždímá z větší velikosti cache paměti a širší velikosti její sběrnice). A cenově ? PHE !! Za cenu 100MHz Celerona 800 si dle aktuálního ceníku pořídíte Durona 900 !!! Koumák si pak pohráváním s vodivými můstky Durona získá snadno z 900 MHz Durona minimálně 1 GHz a to mluvíme o procesoru, který šlape na paty ThunderBirdům a PIII coppermine. Nevýhodou zůstává stejně jako u ThunderBirda větší emise tepla (a tudíž to chce lepší chlazení), spotřeba a neúplná softwarová podpora instrukcí AMD procesorů.. Také desky s podporou DDR paměťových modulů se jaksi k Duronů a Athlonům nehodí. Poměrný nárůst výkonu je daleko pozorovatelnější u Intel procesorů ? Čím to je ??
AMD Athlon – potřetí
Nové verze Athlona na jádře ThunderBird běží se zvýšenou 266MHz double pumped sběrnicí. Výkonový nárůst oproti Athlonu na stejné frekvenci, avšak s 200MHz FSB, je asi 10%. Nová strategie AMD hovoří zcela jasně – Athlony se musí oddělit od Duronů vyšší hodnotou FSB. S touto změnou vyvstal i problém pro majitele desek s chipsetem VIA KT133. Ne každá základní deska „uměla“ 266MHz double pumped. I když VIA brzy dodala opravený čipset VIA KT133A, přece jen majitelé těch prvních a noname desek pro AMD socketA procesory zaplakali. A jak si vedl ThunderBird 266MHz cenově ? Cenový rozdíl není prakticky žádný. 200MHz Athlony (1 GHz – 1.4 Ghz) se pomalu a jistě stahují a budoucnost bude jednoznačně patřit 266MHz.
AMD Duron – podruhé
Od 1Ghz se představuje nové jádro Duronů – Morgan (0.18µm, 25.1 mil. tranzistorů). Mezi drobnůstkami typu tepelné čidlo, inteligentnější uspořádání polovodičových „plástů“ uvnitř CPU, nižší emitované teplo, nižší spotřeba, atd., kraluje jen jedna podstatná změna : Rozšíření instrukční sady 3D Now! o intelácké SSE instrukce (50 kousků). Konečná instr. sada se pak hezky jmenuje 3D Now! Professional. To sebou nese velmi sofistikované předpovídání a vyhodnocení cílů (užíváné u P4). Matematická logika zase velmi pokročila (Athlon byl prvním CPU, který nejefektivněji seřadil metodiku předpovídání a řazení dat do logických větví) a díky ní, se doba zpracování a vyhodnocení informace zkracuje. Zkrátka, procesor pracuje rychleji :). Jinak se jedná stále o ten stejný Duron, tedy s 64Kb L2 cache a 200MHz double pumped FSB. Morgan užívá vyšší napětí jádra (1.75V), novější desky s VIA KT133A, KT266, KT266A, SiS735 nebo AMD761 však nemají problémy, je však třeba provést upgrade BIOSu pro implementaci nových SSE instrukcí.