MEMS mikrofony - známé také jako křemíkové mikrofony - jsou běžnou součástí chytrých telefonů, hodinek, bezdrátových sluchátkách, automobilů i chytrých televizí. Je to dáno tím, že se rozšířili osobní hlasoví asistenti, jako je Amazon Alexa, Google Assistant a Apple Siri. Tito asistenti poslouchají okolní zvuk a rozlišují konkrétní hlasové příkazy pomocí speciálních algoritmů. Právě tuto část systému rozpoznávání hlasu lze zdokonalit, a tím zvýšit spolehlivost, přesnost ovládání i přes okolní hluk.
Tento článek popisuje klíčové vlastnosti mikrofonu MEMS, které jsou vhodné pro rozpoznání hlasu. Mezi ně patří vysoká hodnota poměru signálu k šumu (SNR), dynamický rozsah, vysoká citlivost a krátká doba probuzení. Dále si představí hardwarová a softwarová řešení od společností TDK InvenSense , CUI Devices , STMicroelectronics a Vesper Technologies.
Jak fungují mikrofony MEMS
Obecně lze říci, že existují dva typy MEMS mikrofonů, které se liší v umístění vstupního portu mikrofonu. Bud je vstupní port umístěn na horní (top-port) nebo na spodní (bottom-port) straně mikrofonu. Vstupní port na spodní straně vyžaduje vyvrtaný otvor v desce plošného spoje. Tloušťka desky ovlivňuje objem přední komory. To má za následek degradaci odezvy mikrofonu. Mikrofony s dolními porty navíc mají kolem otvoru prstencovou kovovou podložku. Je zapotřebí velmi pečlivý proces pájení, aby se zabránilo vnikání prachu nebo pájecí pasty do zvukového portu a poškození MEMS membrány. Zda má být použit horní nebo dolní portový mikrofon se obvykle rozhoduje dle umístění mikrofonu v zařízení. Dalším faktorem může být také výkon, jelikož mikrofony s horním portem dosahují obvykle nižší citlivosti.
Obrázek 1: Základní konstrukce mikrofonu MEMS: převodník MEMS a řetězec zpracování signálu (v ASIC). (Zdroj obrázku: Zařízení CUI)
Membrána MEMS tvoří kondenzátor a vlny akustického tlaku způsobují pohyb membrány. Mikrofony MEMS obecně obsahují druhou polovodičovou matrici, která funguje jako předzesilovač zvuku a převádí měnící se kapacitu MEMS na elektrický signál. Tam, kde je preferován analogový výstupní signál, může být výstup audio předzesilovače poskytován přímo uživateli. Pokud je však vyžadován digitální výstupní signál, je na analogový výstup připojen analogově-digitální převodník (ADC). Modulace pulzní hustoty (PDM) je konvenční formát používaný pro digitální kódování v mikrofonech MEMS a umožňuje komunikaci po jedné signální cestě a hodinami. Dekódování digitálního signálu v přijímači je usnadněno díky jedno-bitovému kódování dat.
Klíčové vlastnosti mikrofonu MEMS, které jsou vhodné pro rozpoznání hlasu:
- Poměr signál-šum (SNR): Jedná se o poměr referenční úrovně signálu k hladině šumu výstupního signálu. Měření SNR zahrnuje šum způsobený mikrofonním prvkem a integrovanými obvody, které jsou uvnitř pouzdra mikrofonu MEMS.
- Citlivost: Hodnota analogového nebo digitálního výstupu při sinusovém signálu o frekvenci 1 kHz s hladinou akustického tlaku (SPL) 94 dB nebo 1 Pascal.
- Tolerance citlivosti: Pevná tolerance citlivosti zajišťuje konzistenci při použití více mikrofonů najednou.
- Dynamický rozsah: Míra rozdílu mezi nejhlasitějšími a nejtiššími hladinami akustického tlaku (SPL), na které mikrofon lineárně reaguje.
- Frekvenční charakteristika: Frekvenční rozsah zvuku, přes který může mikrofon pracovat.
- Čas spuštění: Jak rychle se mikrofon probudí a vydá platný signál v reakci na spouštěcí událost.
Televizory a inteligentní reproduktory mají integrované funkce pro ovládání hlasem. Tyto zařízení se nachází v místnosti, kde se vyskytuje vysoký okolní hluk. Další překážkou bývá to, že uživatel může být vzdálen od zařízení až 10 m. Za těchto okolností vyniknou právě vlastnosti mikrofonů MEMS, a to zejména dynamický rozsah, citlivost a SNR. V aplikacích, kde se v poli používá více mikrofonů je tolerance citlivosti klíčovou vlastností. Mikrofony MEMS se vyvíjejí pomocí přísně kontrolovaných výrobních procesů, a proto nabízejí sladěné tolerance citlivosti potřebné pro efektivní zpracování signálu (obrázek 2).
Obrázek 2: Mikrofony používané v poli musí být pevně sladěny, aby bylo dosaženo požadovaného zpracování signálu. (Zdroj obrázku: Zařízení CUI)
V mikrofonním poli se ke snímání zvuku používají dva nebo více mikrofonů. Signál z každého mikrofonu se zpracovává jednotlivě. Každý signál se samostatně zesílí, zpozdí nebo filtruje a pak se signály spojí a vytvoří výsledný signál. V mikrofonních polích lze použít více vstupů k vytvoření směrové odezvy, známé také jako tvarování paprsku (beamforming). Díky tomu lze odfiltrovat nežádoucí šum a zaostřit na zvuk z požadovaného směru. Více informací o této technologii naleznete v článku „Beamforming s MEMS mikrofony.
Rychlý čas spuštění mikrofonu MEMS je také rozhodující vlastností pro zachycení celých klíčových slov. Z důvodu úspory energie jsou zařízení podporující ovládání hlasem udržována ve spánku a čeká se na rozpoznání klíčového slova, které celý systém probudí.
Analogové vs digitální mikrofony MEMS
Analogové mikrofony MEMS používají interní zesilovač k řízení výstupního signálu mikrofonu na přiměřeně vysokou úroveň s nízkou výstupní impedancí. Tento signál se přivede přímo k procesoru, a proto je nutné zajistit, aby přidružený procesor měl zabudovaný ADC převodník.
Výstup digitálního mikrofonu MEMS lze přímo připojit k procesoru nebo DSP kontroléru. Digitální výstupní signály mají větší odolnost proti šumu ve srovnání s analogovými výstupními signály. Digitální MEMS mikrofony běžně používají modulaci pulsu (PDM) pro převod napětí analogového signálu na jednobitový digitální proud. To poskytuje další odolnost vůči vysokofrekvenčnímu rušení (RFI) a elektromagnetickému rušení (EMI). To je obzvláště důležité ve velkých mikrofonních polích a ve fyzicky velkých systémech, jako jsou hlasové informační systémy vozidel.
S ohledem na citlivost se pro analogové mikrofony měří hladina akustického tlaku v decibelech vztažených na 1 volt (dB / V). U digitálních mikrofonů se obvykle měří decibely vztažené k plnému měřítku (dB FS).
Mikrofony MEMS pro hlasové ovládání
Analogový MEMS mikrofon ICS-40740 od TDK InvenSense obsahuje impedanční převodník a diferenciální výstupní zesilovač. Vše v miniaturním SMD pouzdře o velikosti 4,00 x 3,00 x 1,20 mm. Vstupní napájecí napětí je 1,5 V a jeho spotřeba činí pouhých 165 µA (obrázek 3).
Obrázek 3: Analogový mikrofon MEMS ICS-40740 se svou velikostí hodí do chytrých reproduktorů a nositelných zařízení, jako jsou Head sety potlačující šum. (Zdroj obrázku: TDK InvenSense)
Tento analogový mikrofon vykazuje SNR 70 dBA a nabízí široký dynamický rozsah 108,5 dB. To umožňuje detekovat hlasy i přes vysoký okolní hluk a z velké vzdálenosti. Jeho provozní frekvence se pohybuje v rozsahu od 80 Hz do 20 kHz. Lineární odezva je 132,5 dB a tolerance citlivosti je ± 1 dB. Díky těmto vlastnostem se hodí pro aplikace pole s více MEMS mikrofony. Díky malé ploše a nízké spotřebě je ICS-40740 vhodný pro nositelná zařízení, jako jsou Head sety.
Všesměrový digitální piezoelektrický mikrofon MEMS VM3000 od Vesper Technologies je vybaven velmi rychlou spouštěcí dobou kratší než 200 µs. Tento čas je důležitý pro správné zachycení klíčových slov (obrázek 4).
Obrázek 4: Piezoelektrický digitální MEMS mikrofon VM3000 se vyznačuje ultrarychlým časem spuštění menším než 200 µs. To mu umožňuje probudit se dostatečně rychle, aby zachytil kompletní první slova. (Zdroj obrázku: Vesper Technologies)
Když v piezoelektrickém mikrofonu MEMS narazí zvuková vlna na piezoelektrickou část, dochází k posunu této miniaturní části, a tím se vytvoří příslušné napětí. Toto napětí je snímáno obvodem komparátoru, který vysílá zvukový signál dále do audio systému ke zpracování.
Vzhledem k tomu, že piezoelektrické mikrofony MEMS nevyžadují předpětí, VM3000 nespotřebovává prakticky žádnou energii, dokud se nezapne příkazem wake-word. Rovněž může zůstat v režimu spánku při spotřebě pouze 0,35 µA. Do provozního režimu je schopen se přepnout za méně než 100 µs. Režim spánku v kombinaci s rychlým přepínáním režimu zajišťují, že při probuzení nedochází ke ztrátě důležitých dat (zvuků).
Digitální mikrofon VM3000 lze spárovat s prakticky jakýmkoli audio čipem a jeho výstup lze jednoduše multiplexovat na jediné datové lince. Dosahuje typického SNR 63 dB při signálu 1 kHz a nabízí akustický bod přetížení (AOP) 122 dB SPL. VM3000 je dodáván v pouzdře o rozměrech 3,5 x 2,65 x 1,3 mm a díky integraci ADC se ušetří na kusovníku (BOM).
VM3000 používá jednovrstvý piezoelektrický krystal, díky kterému je mikrofon imunní vůči posunům citlivosti a chrání jej před prachem, vodou, vlhkostí a dalšími částicemi z prostředí. Piezoelektrické mikrofony MEMS zjednodušují design koncového produktu, jelikož nepotřebují dodatečnou ochranu membrány. Taková ochrana je typicky připojena k akustickému portu jako ochranný prvek proti vniknutí nečistot z okolního prostředí a může vést ke snížení citlivosti mikrofonu MEMS.
VM3000 se jednoduše implementuje, jelikož ho lze připojit přímo k hlavnímu systému ( CODEC ) nebo jinému procesoru (obrázek 5). Hlavní systém poskytuje hodinový signál CLK, který definuje rychlost, jakou jsou bity přenášeny přes datovou linku (DATA).
Obrázek 5: VM3000 se může připojit přímo k externímu procesoru a je schopen sdílet datovou linku DATA s jiným mikrofonem. (Zdroj obrázku: Vesper Technologies)
Zajímavou vlastností je možnost připojit dva mikrofony přes jednu DATA linku. Důvodem je to, že data jsou přenášena při náběžné nebo sestupné hraně hodin (CLK). Toto se definuje pomocí pinu L / R Select.
- L / R Select = GND - přenos dat při sestupné hraně
- L / R Select = VDD – přenos dat při náběžné hraně
CODEC nebo procesor pak mohou oddělit jednotlivé bitové toky na základě jejich zarovnání s hranami hodin CLK.
Vývojové sady pro mikrofony MEMS
Dodavatelé poskytují referenční desky a soupravy pro vývoj softwaru s mikrofony MEMS. Například Vesper nabízí vývojovou desku S-VM3000-C, která obsahuje digitální mikrofon MEMS VM3000 a filtrační kondenzátor napájení 0,1 µF.
Stejně tak pro své analogové MEMS senzory ICS-40740 poskytuje TDK InvenSense vývojovou desku EV_ICS-40740-FX, která umožňuje návrhářům rychle a efektivně analyzovat výkon diferenciálních analogových mikrofonů. Kromě mikrofonu MEMS je jedinou další komponentou, kterou má tato vývojová souprava, napájecí filtrační kondenzátor 0,1 µF.
Společnost CUI Devices, která nabízí analogové i digitální MEMS mikrofony, poskytuje vývojovou sadu DEVKIT-MEMS-001 pro prototypování a testování (obrázek 6). Tato sada obsahuje čtyři nezávislé obvody pro vyhodnocení mikrofonu.
Obrázek 6: DEVKIT-MEMS-001 obsahuje čtyři oddělitelné vyhodnocovací obvody mikrofonu: dva pro analogové výstupy a dva pro digitální výstupy. (Zdroj obrázku: Zařízení CUI)
Sada obsahuje dva analogové mikrofony MEMS CMM-2718AB-38308-TR a CMM-2718AT-42308-TR a dva digitální mikrofony MEMS CMM-4030DB-26354-TR a CMM-4030DT-26354-TR.
Analogový mikrofon CMM-2718AB-38308-TR má citlivost -38 dB a SNR 65 dBA. CM-2718AT-43208-TR má citlivost -42 dB a SNR 60 dBA. Oba mají frekvenční rozsah 100 Hz až 10 kHz a spotřebu proudu 80 µA při napájecím napětí 2 V.
Digitální mikrofon CMM-4030DB-26354-TR má citlivost -26 dB FS a SNR 64 dBA. CMM-4030DT-26354-TR má citlivost -26 dB FS a SNR 65 dBA. Oba používají 1-bitový datový formát PDM, pracují v kmitočtovém rozsahu 100 Hz až 10 kHz a jejich spotřeba je 0,54 mA při napájecím napětí 2 V.
Závěr
Bližší pohled na analogové i digitální mikrofony MEMS ukazuje jejich výhody pro zařízení ovládané hlasem. Nejnovější mikrofony MEMS využívají nové technologie, které prodlužují životnost baterie, zlepšují kvalitu zvuku a odolávají znečištění z okolního prostředí. Zlepšení přesnosti klíčových slov je důležitým aspektem, který úzce souvisí s parametry, jako je SNR, tolerance citlivosti a doba spuštění. Všechny tyto vlastnosti MEMS mikrofonů zlepšují kvalitu a přesnost rozpoznání klíčových slov v systémech ovládané hlasem.
Článek vyšel v originále "How MEMS Microphones Aid Sound Detection and Keyword Recognition in Voice-Activated Designs" na webu DigiKey.com, autorem je Majeed Ahmad.