Jste zde

Multijádrové komunikační procesory Freescale QorIQ - vše v jednom

V nabídce Freescalu lze najít nové multijádrové komunikační procesory po docela neobvyklým označením QorIQ. Tato platforma momentálně zahrnuje 6 typů obsahující 1 až 8 CPU (jader), až 3úrovňovou cache, rozhraní pro 32 nebo 64bit. DDR3 SDRAM taktování 400 MHz až 1.5 GHz a mnoho vysokorychlostních rozhraní jako například 10 Gb/s Ethernet, až 3x PCI Express. Zajímavé např. je, že na u více jádrových provedení může na každém jádru běžet jiný OS.

Pod pro někoho záhadným odznačením QorIQ se skrývá nová multiprocesorová platforma společnosti Freescale určená pro realizaci stále náročnějších datových komunikačních sítí a s tím spojených služeb. Jde o další generaci komunikačních procesorů Freescale PowerQUICC. Platforma je speciálně navržená jako systém na čipu SoC (System on Chip), který se vyznačuje použitím koherentního multijádrového řešení vystavěného na výkonné procesorové technologii Freescale e500 Power Architecture. Jádra Power Architecture®, která byla také základem předchozí rodiny výkonových procesorů PowerQUICC, se využívají nejen jednotlivě, ale sdružují se i do dvojice a až osmice pro zvýšení výpočetního výkonu a paralelního velmi rychlého zpracování příchozích a odchozích dat a informací.

Základem celé platformy QorIQ jsou řady P1 a P2, které jsou navzájem kompatibilní pouzdrem, rozmístěním vývodů i softwarem pro snadný přechod z jednodušší a pomalejší řady P1 na rychleji taktovanou a periferně o něco lépe vybavenou řadou P2. Výjimkou je pak řada obvodů QorIQ P4, která v sobě integruje 8 rozšířených jader Power Architecture®, tříúrovňovou hierarchii cache paměti, netradiční pokrokový koherenční směrovač CoreNet™ coherency fabric a blok pro akceleraci datového přenosu (datapath acceleration). Všechny řady jsou již vyráběny 45 nm technologií a jsou vybaveny podporou programování od ecosystem partnerů Freescalu pro usnadnění vývoje a odladění nových algoritmů, procesů a aplikací.

Řada procesorů QorIQ P10xx

Nejnižší řada komunikačních procesorů QorIQ obsahuje 3 zástupce: P1020, P1011 a P1010. Ty obsahují jedno nebo dvoujádrovou 45 nm architekturu taktovanou frekvencí v rozsahu 400 až 800 MHz. Svojí strukturou se tato platforma dobře hodí pro realizaci komunikačních bran s mnoha různými službami (multi-service gateways), přepínacích řadičů Ethernetu (Ethernet switchcontrollers), bezdrátových přístupových bodů (wireless LAN access points) nebo jen aplikace vyžadující výkonné víceúčelové řízení s omezeným zahříváním a tedy vyžadující jednodušší chlazení. Zajímavostí i praktickou výhodou je vzájemná kompatibilita umístění a provedení vývodů s obvody řady QorIQ P2, což umožňuje vzájemně v patici zaměnit až 5 různých čipů s odlišným výkonem a vlastnostmi a tak snadno upgradovat aplikaci. Například lze bez hardwarového zásahu do zařízení upgradovat z jednojádrového 400 MHz systému s obvodem P1010 na dvoujádrový 1.2 GHz systém s obvodem P2020. Obě řady a obvody nejsou kompatibilní jen z pohledu hardwarového, ale i softwarového, když sdílejí architekturu jádra e500 Power Architecture a hlavní periferie. Navíc jsou plně softwarově kompatibilní s již existujícími procesory PowerQUICC. To umožňuje vytvořit produkt s různými výkonnostními parametry z jedné navržené desky. Zatímco obvod P1010 je jednojádrový, obvod P1020 má již jádra dvě a podporuje jak symetrické, tak nesymetrické zpracování. To umožňuje navrhnout aplikace, kde běží stejný program na obou jádrech nebo serializovat běh aplikace s využitím jader pro rozdílné úlohy zpracování, tedy případ, kdy na každém jádře běží jiný algoritmus.

Tabulka typů procesorů QorIQ v řadě P1 a P2 a jejich základní vlastnosti (pro zvětšení klikněte na obrázek)

Všechny obvody platformy QorIQ P1 mají rozšířenou sadu funkcí pro jejich snadnější použití. Každé jádro má svoji 32 KB L1 instrukční a datovou cache, přičemž obvody P1011 a P1020 obsahují i 256 KB L2 cache paměť, kterou lze provozovat i jako SRAM nebo stashing memory. V případě dvoujádrové verze (P1020) je sice L2 cache sdílená, ale modul koherence systému (coherency module) poskytuje rozšířené možnosti jejího rozdělení mezi obě jádra. Integrovaný bezpečnostní blok podporuje všechny běžné bezpečnostní algoritmy (SNOW, ARC4, 3DES, AES, RSA/ECC, RNG, SSL/TLS, Kasumi) využívané v aplikacích drátových i bezdrátových sítí. Tak lze zajistit zabezpečený přenos pro vzdálený přístup například pomocí VPN. Řadič paměti podporuje připojení 32bitových SDRAM jak ve verzi DDR2, tak i DDR3. Také podporuje chybové opravné kódy, což je základní požadavek pro realizaci spolehlivého systému. Bez povšimnutí rozhodně nelze nechat neobvykle velký rozsah pracovních teplot -40 až 125°C, což umožňuje bezproblémové nasazení i v oblasti průmyslu, ve vnitřních i venkovních aplikacích. Navíc není nutné se tolik zabývat chlazením.

Blokové schéma multijádrových komunikačních procesorů QorIQ P10xx (pro zvětšení klikněte na obrázek)

Z pohledu periferií podporují obvody řady QorIQ P1 širokou sadu rozhraní. Mezi ty nejzajímavější z pohledu komunikace patří SerDes, Gigabitový Ethernet, PCI Express a USB 2.0, které jsou připojeny k jádrům prostřednictvím vnitřní sběrnice. Navíc tři 10/100/1000 Ethernetové porty podporují pokročilou extrakci dat z hlaviček paketů (advanced packet parsing), řízení toku a služby QoS stejně jako časového označování souborů (razítkování) IEEE® 1588 timestamping. To je ideální pro ovládání a řízení datového toku mezi LAN a WAN sítěmi. TDM rozhraní může podporovat telefonní aplikace s voice for legacy. Čtyři SerDes linky mohou být rozděleny napříč dva PCI Express a SGMII porty. PCI Express porty poskytují i propojitelnost s bezdrátovými radiovými kartami IEEE 802.11n. Jedno USB nebo SD/MMC rozhraní lze použít jako lokální úložiště dat. Druhé USB rozhraní je možné například využít pro připojení tiskárny nebo jako konzolový port. K dispozici jsou i vícenásobné porty pro připojení externích pamětí včetně 16bitové lokální sběrnice, dvou USB řadičů, SD/MMC, SPI, dvou I2C řadičů a duálního klasického sériového rozhraní UART (DUART).

Platforma P1 je vhodná pro nasazení v širokém rozsahu aplikací, pro různé kombinace zpracování dat a řízení komunikace v oblasti datových sítí a telekomunikace. Hlavní cílovou skupinou aplikací jsou tak různé datové a telekomunikační karty.

První příklad použití procesoru QorIQ v řady P1 - kancelářský router (pro zvětšení klikněte na obrázek)

Druhý příklad použití procesoru QorIQ v řady P1 - WLAN access point (pro zvětšení klikněte na obrázek)

Řada QorIQ P20xx

Jak již bylo zmíněno výše, řada komunikačních procesorů QorIQ P2, tedy konkrétně obvody P2020 a P2010, jsou vývodově i softwarově kompatibilní s řadou P1. Přitom svojí 45 nm jedno- nebo dvoujádrovou nízkopříkonovou architekturou a 1.2 GHz taktováním poskytují vyšší výpočetní výkon (vyšší výkon na Watt). Proti P1 pak poskytuje trošku odlišný soubor komunikačních rozhraní. Hlavně jde o sériovou technologii přenosu dat RapidIO®. Naopak chybí I2C a DUART. Čtyři SerDes linky tak mohou být rozděleny napříč dvěma Serial RapidIO porty, tři PCI Express rozhraní a dva SGMII porty. Opět nechybí Gigabitový Etherent, USB 2.0 a samozřejmě univerzální vstupy/výstupy. Tato výbava se velmi dobře hodí pro realizaci síťových karet, které vyžadují optimální kombinaci výkonu pro řízení vyváženého datového provozu při nízké spotřebě el. energie a ceně. Hlavně to platí u aplikací s LTE (Long Term Evolution) a WiMAX kanály. Dva Serial RapidIO porty navíc umožňují přímé připojení DSP procesorů, jako například Freescale MSC8144 DSP, pro realizaci zpracování první vrstvy komunikačního modelu nebo připojení na propojovací sběrnici (backplane).

Blokové schéma multijádrových komunikačních procesorů QorIQ P20xx (pro zvětšení klikněte na obrázek)

Příklad použití procesoru QorIQ řady P2 - aplikace kanálové karty (pro zvětšení klikněte na obrázek)

Řada QorIQ P4080

V platformě QorlQ lze za prémiovou řadu označit obvody QorIQ P4. Přesněji řečeno obvod. Protože v současné době je zatím k dispozici jen jeden typ QorIQ P4080. Ten však představuje jeden z nejvýkonnějších procesorů na trhu s příkon pod 30 W. Opět využívá Power Architecture e500mc jádra, která zde pracují na hodinové frekvenci 1.5 GHz a na čipu jejich je hned 8. To představuje již slušnou výpočetní sílu a schopnost paralelního zpracování dat, kdy každý procesor může vykonávat jinou funkci. Procesor byl vývojáři navržen pro potřeby současného řízené procesů a zpracování dat, což umožňuje v rámci jedné součástky realizovat zpracování 2 až 7 hladin komunikačního modelu (OSI modelu). Tím se například výrazně zjednoduší provedení a velikost desky plošných spojů (DPS), protože co obvykle musí provádět "sada" signálových procesorů (DSP) a mikrokontrolérů (MCU), zde vykonává pouze jedna, i když složitá součástka. Zároveň se také QorIQ P4080 hodí pro aplikace náročné na rychlost a množství výpočtů a rychlé načítání dat a předávání výsledků prostřednictvím rychlých komunikačních rozhraní. Ideálními aplikaci jsou tedy routery, přepínače (switches), media gateways, základní desky, přístupové brány, rádiové síťové řadiče RNC (radio network controllers), přístupové brány pro LTE (Long Term Evolution), různé po síti komunikující multimediální zařízení a řídící jednotky v oblasti zábavy, datové komunikace, telekomunikačním průmyslu, letectví a vojenství.

Příklad použití komunikačního procesoru QorIQ P4080 - router s VPN/IP službami (pro zvětšení klikněte na obrázek)

Proti výše uvedeným kolegům řady P1 a P2 se odlišuje nejen větším počet jader, ale i propracovanější strukturou cache pamětí. Každé jádro totiž má nejen vlastní integrovanou 32 KB oddělenou instrukční a datovou L1 (Level 1) cache, ale i 128 KB L2 (Level 2) pevně mezi jádra rozdělenou cache paměť druhé úrovně, což výrazně zrychluje přístup k nejčastěji potřebným datům a tím i zvyšuje výkon procesoru. Na konec je tu 2 MB sdílená L3 (Level 3) CoreNet platform cache, která se využívá pro náročné úlohy a operace s velkými bloky dat, kde je nutné si je předpřipravit z hlavní 64bitové SDRAM DDR2 nebo DDR3 paměti. Mimo jádra je na čipu klíčová i další komponenta, kterou je 800 Gb/s CoreNet™ koherenční směrovač (coherency fabric). Ten sám řídí plnou koherenci dat v cache pamětech a umožňuje přizpůsobování čipu aplikaci, komunikaci bod-bod podporující paralelní tok dat do a z mnoha zdrojů připojených na směrovač, čímž se eliminuje efekt hrdla lahve více soupeřících zdrojů. To eliminuje sběrnicové soupeření a čekací doby, kterou jsou obvykle součástí sdílených sběrnic a pamětí jiných podobných vícejádrových struktur. Tento princip je velmi flexibilní.

Samozřejmostí je pak přítomnost velkého počtu všech běžných rozhraní a výstupů, které by se v aplikacích datové komunikace mohly "hodit". Mezi ty nejvýznamnější patří patří 18 linek vysokorychlostní sériové komunikace SerDes, která využívá ne stále u procesorů obvyklý dvojitý 10 Gb/s ethernetový (XAUI) řadič doplněný osmi 1Gb/s ethernetovými (SGMII) řadiči, třemi PCI Express® V2.0 a dvěma Serial RapidIO® 1.2 porty, které mohou z paketů extrahovaná data pomocí 4kanálového DMA přesouvat přímo do 64bitové DDR2/DDR3 SDRAM paměti s ECC. Komunikační periferie jsou vzájemně propojeny vnitřní sběrnicí. Nemohou chybět běžná připojovací rozhraní pro komunikaci s externími MCU, příp. senzory (SPI, 4x I2C) a pro připojení externí Flash pamětí/karet a ovládacích nebo periferních prvků a zařízení (2x USB 2.0 s ULPI a SD/MMC rozhraní pro připojení slotu pro SD karty). Vyvedená je i vnitřní sběrnice eLBC (Enhanced local bus controller).

Datapath Acceleration architektura pak výrazně šetří práci procesorovým jádrům, protože obsahuje bloky pro extrakci dat z paketů, jejich klasifikaci a distribuci, řízení fronty, sekvencování paketů a řízení vyčerpání kapacity fronty, řízení hardwarového bufferu, kódovací modul (SEC 4.0) a modul pro rozeznávání vzorů RegEx Pattern Matching (PME 2.0).

Blokové schéma multijádrového komunikačního procesoru QorIQ P4080 (pro zvětšení klikněte na obrázek)

Struktura s 8 oddělenými výpočetními jádry může pracovat jako 8 symetrických multiprocesorových jader (SMP) nebo 8 kompletně asymetrických multiprocesorových jader (AMP), nebo mohou být provozovány s různým proměnným stupněm nezávislosti s různě velikými skupinami pracujícími jako SMP a AMP. Nezávislost jader není jen hardwarová, ale jednotlivá jádra mohou i nezávisle na sobě bootovat, což umožňuje, aby jádra pracovala klidně s odlišnými operačními systémy. To uživateli umožňuje flexibilně rozdělovat procesory pro potřeby řízení, komunikace a analýzu a zpracování dat. Co dřív muselo provádět více diskrétních procesorů, je teď tedy integrováno je jedné součástky při zachování všech hlavních výhod diskrétních realizace, navíc však dovoluje vývojáři softwaru běžícím na každém z CPU určit stupeň přístupu do paměti, k periferiím apod.

Vývojové prostředí Ecosystem a Developer Environment umožňuje dobře realizovat a na jednotlivých jádrech zprovoznit operační systémy a stacky různých komunikačních protokolů. Freescale společně se společností Virtutech poskytuje hybridní simulační a ladící prostředí právě pro vícejádrové procesory.

Závěr

Vícejádrové komunikační procesory QorIQ patří ke špičce v nabídce Freescalu co se z pohledu výpočetního výkonu týče. Pokud vám tedy nestačí svými parametry 32bitové MCU ColdFire a potřebujete nasadit větší kalibr pro potřeby zpracování velkých objemů dat nebo složitých výpočetních algoritmů, jsou procesory QorIQ jednou z možností. Cílem tohoto článku bylo upozornit na tento druh platformy v nabídce Freescalu, kde se většina pozornosti točí hlavně okolo ColdFirů. Více informací, včetně detailního popisu jednotlivých obvodů v několika set stránkových datasheetech, najdete na stránkách Freescalu - www.freescale.com, konkrétně na odkazu
http://www.freescale.com/webapp/sps/site/overview.jsp.

Antonín Vojáček

DOWNLOAD & Odkazy

Hodnocení článku: