Jste zde

Počítačová syntéza zvuku 1

V naší literatuře doposud neexistuje publikace, která by se zabývalapočítačovou syntézou zvuku na úrovni spíše technické, než uživatelské.Na druhé straně v dosti úzkém oboru MusicalInstrumentDigitalInterfacetoho bylo napsáno tolik, že tuto problematiku z následujících článků vypustíma odkazuji na publikace prof. D. Forró, které jsou zhruba na úrovni publikacízahraničních (D.M.Huber) .
Následující sérií článků bych chtěl zaplnit zřetelnou mezeru a hlavněpodnítit ty, kteří v dané oblasti pracují, aby publikovali také v češtině.

V úvodem se zmíním o historii a o základních metodách syntézy. Potomzavedu syntax MPEG4 – SAOL –u  a Csound –u , Dále budu probírat možnostisyntézy povětšinou na příkladech v Csound-u. Nakonec se zmíním o některýchmetodách modifikace signálu a remasteringu. 

Z historie do současnosti

Koncem padesátých let začala být aktuální myšlenka syntézy zvuku pomocípočítače. Teorie analogových syntezátorů byla rozpracována ve třicátýchletech /1,2,3/ a v polovině padesátých let zdokonalena H.F.Olsonem /4/,který postavil v Princetonu pětikanálový syntezátor řízený (úměrně širokou)děrnou páskou. Vrchol analogových syntezátorů však přišel až v 70. letech,kdy R. Moog /5/ sestrojil napěťově řízený filtr (VCF) přeladitelný přesněkolik oktáv.

Max Mathews v Bellových laboratořích /6/ přišel na myšlenku data, kterápočítač zapisuje na magnetickou pásku, reprodukovat pomocí D/A převodníku.Protože rychlost i kapacita počítačů na přelomu padesátých a  šedesátýchlet byla malá, naprogramoval kompilátor, který kompiloval informace naděrných štítcích, jež v podstatě představovaly partituru (SCORE), na magnetickoupásku do podoby zvukové nahrávky.
K tomu samozřejmě potřeboval definice, jak jsou „nástroje“ sestaveny(ORCHESTRA) a jisté vzorky signálů, které nástroje budou hrát (FUNCTION).Pro definice orchestru vytvořil zvláštní jazyk asi na úrovni assembleru.Tento jazyk zdokonaloval až do podoby MUSIC V (1963), jež se používá vrozšířené formě jako Csound dodnes.

Akustické signály mají jednu zvláštnost. Spektrum se relativně pomalumění s časem. To umožňuje použít například okénkovanou Fourierovu transformacipro analýzu (a resyntézu) zvuku a také třeba provádět změnu intonace (Pitch-shifting). 
Je to veskrze příjemná vlastnost, která může uspořit drahocenný počítačovýčas. V principu počítačem ovládáme přes D/A převodník klasický  analogovýsyntezátor (VoltageControlledOscillator  – VCAmplifier – VCFilter).Pokud máme jednotek více, jsme schopni syntetizovat polyfonní zvuk. 
S touto myšlenkou přišel  v 50. letech  Lejaren Hiller nauniversitě v Illinois./7/ Systém se nazýval Illiac. Počítač řídil relativněpomalu klasický syntezátor a podařilo se vytvářet hudbu v reálném čase. Pro malé nároky na výpočetní výkon se uvedené syntézy začalo užívat v televizníchhrách (SAA 1099 (1984) –2 x 3kan. ) a pro efekty v počítačových hrách (OPL3)a to i dnes!!!

Slangově se tato metoda nazývá FM  syntéza (řízení kmitočtuoscilátoru je v podstatě ekvivalentní   kmitočtové  modulaci  a  rozmítání rychlejší, než 4Hz  je  nerozlišitelné od sboru). Pro vážnější tvorbu je možné této metody použít k syntéze napřHammondových varhan. Pro připomínku bylo i u nás v 80. letech ve Výzkumnémústavu  rozhlasu a  televize v Praze podobné zařízení postaveno.Pro představu jenom analogová část zabrala dva stojany.

Je zde ještě jedna možnost syntézy zvuku, jíž doposud nebyla věnovánavelká pozornost. Jde o   použití digitálních filtrů s jednotkovýmpřenosem ve zpětnovazební smyčce .Filtry druhého řádu můžeme generovatharmonické kmity s exponenciální změnou amplitudy. Pomocí filtrů vyššíchřádů můžeme generovat složené kmity, například řeč /8/. Takto generovanýzvuk je subjektivně velmi dobře hodnocen, existují i multiprocesorové systémyna bázi DSP, které dokáží syntézu v reálném čase. 

Trochu více o MUSIC V

Systém MUSIC V byl již dosti vyspělý. Vylíčíme si jej podrobněji. Skladba byla representována posloupností  děrných štítků,  každýštítek obsahoval v podstatě jednu notu (podobně jako v partituře, která se řekne anglicky score). Zvláštním programem přiřadil každé „notě“vzorek akustického signálu, který do programu importoval jako funkci. 
Funkce (které obsahovaly i vyšší harmonické) vytvářel pomocí procedurve Fortranu a to jako tabulky velikosti 2**n . V původní práci používalfunkce velké pouze 512 vzorků, takže bylo možno akustický signál určitprocedurou: 

Kde S je pomocná proměnná, I je řídící proměnná kmitočtu, M je řídícíproměnná amplitudy a Fj je konkrétní funkce. 

Je patrné, že výraz ve složené závorce může nabývat jakýchkoliv reálnýchhodnot. Funkce je ale tabelována pouze v konečném počtu bodů. Čtenář, znalýzákladů MIDI bude jistě vědět, že se vezme buď nejbližší hodnota (neinterpolovanáwave-table syntéza), nebo se spočítá mezihodnota (interpolovaná wave-tablesyntéza).
Je zřejmé, že řídící proměnné můžou být počítány pomaleji, než vzorkyakustického signálu. Čím je tento poměr vyšší, tím je syntéza rychlejšía horší. V praxi je optimum 10. 

Mathews ve svém programu definoval ještě generátor náhodných čísel asumátor. Jeho kompilátor se dále rozvíjel a možná i u nás byla k disposiciverze pro dosti rozšířený počítač IBM 360, kterou však naprogramoval jižB. Vercoe . Jako každý programovací jazyk z počátků výpočetní technikyměl i MUSIC V své vývojové diagramy, které se samozřejmě dále používají.Jeden takový na ukázku přikládám: (detail)

Klikni pro detailni obrazek

Metody syntézy zvuku:

Cesta od představy skladatele ke konečnému snímku je složitá. Z čistětechnického jedinou skladbu tvoří tři faktory, které můžeme názorně separovatzkoumáme-li  výsledný signál v časové rovině:

 >0.1 s   Skladatel
 >0.01 s  Interpret
 <0.02 s  Nástroj

Skladatel řeší základní problémy skladby: melodiku, rytmiku, harmonizaci. I  výpočetní technika může na tomto poli pomoci. Rozvíjí se zde celýobor:  Algoritmická kompozice.

Interpret  tvoří tón. Má k disposici hudební nástroj (generátor)a mění (zčásti i náhodně) jeho parametry. Měnit je může jen tak rychle,jak mu to umožňuje technika hry a jeho fyzické schopnosti. 

Nástroj tvoří tón, tedy v podstatě zvukový signál. Protože tón budevnímán sluchem,
jsou některé jeho vlastnosti (třeba vzájemný fázový vztah harmonických)méně podstatné, čehož lze výhodně využít.

Algoritmickou komposicí se zabývat nebudeme. Je to složitý problém,jehož řešení vyžaduje odpovídající matematický aparát.

Interpetem  můžeme nazvat všechno, co mění průběh tónu. Třeba generátorobálky (AttackDecaySustainRelease) a generátory vibráta a tremola (LowFrequencyOscillator).
V obr. 1 kupříkladu E2 tvoří obálku vibráta, O1 generuje rozmítacísignál pro vibrato, E1 tvoří obálku všem tónovým generátorům a E3 dodatečněobálkuje první skupinu generátorů.

Zbytek lze bez váhání nazvat „nástrojem“. Použitá technika je aditivní syntéza.  Termín aditivní syntéza značí syntézu komplexního tónupřidáváním dalších tónů. Typickým nástrojem, kde se jí využívá jsou varhany. Z organologie byla převzata i příslušná terminologie a dá se říci, že sevžila. Vycházíme z faktu, že otevřená píšťala, hrající tón C2 má délku8``.  Chceme-li přidat druhou harmonickou, přidáme píšťalu 4``, třetí2 2/3 ``, čtvrtou  2`` .  Používají se též subharmonické (16``,u největších varhan i 32``). Aditivní syntéza umožní přidávat nejen harmonické,ale též další tóny ( u varhan jsou to i  celé skupiny píšťal - mixtury), vždy však v harmonické relaci se základním tónem. Existujívšak nástroje, jejichž spektrum není v harmonické relaci, například zvony.

Chceme-li je syntetizovat, nemůžeme aditivní syntézu provést na úrovnifunkce. Musíme použít více oscilátorů tak,  jak je to naznačeno naobr 1 pro O2-O7. Syntéza je ještě komplikována tím, že  obálkujemeO2-O4 a tím se harmonický obsah mění v průběhu trvání  tónu. U klasických varhan nelze z fyzikálních důvodů aditivní syntézu provéstv celém rozsahu nástroje, proto se provádí tzv. repetice (opakování délekpíšťal v nejvyšších tónech rejstříku).Subjektivně je repetice hodnocenakladně, a proto se  používá i v oblasti počítačové.

U aditivní syntézy nezávisí principielně intensita jednotlivých harmonickýchna výšce tónu.  U většiny hudebních nástrojů (včetně lidského hlasu)tomu tak není. Pro takové případy je vhodná subtraktivní syntéza. Ztónu o dostatečně bohatém harmonickém obsahu vybereme pomocí filtrů jistákmitočtová pásma (formanty). Většinou  hodnota formantů zůstává stejnái když se  základní tón mění. U mnoha nástrojů (povětšinou smyčcových)uvedené platí, u lidského hlasu však s určitým omezením.  Existujíještě jiné, náročnější, typy syntézy, které využívají digitálních modelůvedení. Za všechny jmenuji Karplus-Strongovu syntézu, která velmirealisticky simuluje brnknutí struny.
 

Pokračování..
 

Hodnocení článku: