Protože hostitelský počítač má dosti velkou paměť, lze
do ní uložit dostatečně dlouhý úsek digitalizovaného zvukového
záznamu a využít ji pro opakovanou reprodukci menších
úseků, u kterých lze na rozdíl od Voiceprintu volit délku
i odlišně od hodnoty 2,4 s. Tuto opakovanou reprodukci
zvoleného úseku je pak možno „posouvat“ po celém záznamu,
takže tímto způsobem můžeme nahradit funkci rotační snímací
hlavy. Kromě
toho je možné pomocí subsystému ASL (analýza - syntéza)
v určitých mezích (tak, aby nedošlo ke ztrátě srozumitelnosti
vlivem narušení kompaktnosti nahrávky) měnit rychlost
řeči či výšku hlasu a tak srozumitelnost zvýšit. Navíc
má systém CSL vestavěnou funkci digitální filtrace, takže
můžeme vytvořit filtr potřebného tvaru, aby se jeho pomocí
odstranily nežádoucí kmitočty, popř. naopak užitečné zdůraznily.
Digitální
filtraci je možné využít opakovaně u jedné nahrávky. Sonogramy
jsou dvou druhů - úzkopásmové (podle šířky propustného
filtru při spektrální analýze, v tomto případě 50 Hz),
které mají poměrně dobrou rozlišovací schopnost
v oblasti kmitočtů, takže dokáží odlišit a znázornit jednotlivé
násobky základního kmitočtu, který produkují hlasivky.
Hlasivky
totiž nekmitají jako struna, ale jejich kmity mají pilovitý
charakter, čímž vzniká řada násobků základního kmitočtu
(základního formantu označeného F0). Ze
vzdálenosti jednotlivých násobků (protože samotný základní
kmitočet nemusí být zobrazen - např. u nahrávky telefonního
rozhovoru, který má podle normy pásmo 300-3000 Hz, zatímco
mužský hlas se pohybuje kolem 100-150 Hz) lze pak vypočítat
průběh základního tónu - a v podstatě i intonace.
Širokopásmové sonogramy mají šířku
propustného pásma při kmitočtové analýze 300 Hz. Jednotlivé
násobky základního hlasivkového tónu tudíž tyto sonogramy
nedokáží odlišit, ale znázorňují oblasti, v nichž jsou
tyto násobky zdůrazněny průchodem základního hlasu hlasovým
ústrojím, zejména různými dutinami - hrdelní, ústní,
nosní.
Tyto
oblasti se nazývají vyšší formanty, z nichž první a druhý
vlastně určují, jaká samohláska se vyslovuje, další pak
jsou pro každého mluvčího poněkud odlišné, čímž přispívají
k individuální identifikaci.
Tyto sonogramy je nový digitální systém schopen rovněž
zobrazit. Navíc však umožňuje volit z většího množství
hodnot šířky propustného pásma tu nejvhodnější pro právě
probíhající analýzu, znázornit přímo i průběh základního
tónu v samostatném grafu, do sonogramů vložit barevně
odlišenou čáru znázorňující průběh jednotlivých
formantů, vypsat základní statistické údaje o zobrazených
průbězích (průměr, standardní odchylku, maximum, minimum),
a to jak u základního tónu, tak u vyšších formantů.
|
 |
 |
Systém dokáže na jediné obrazovce
trojrozměrně znázornit frekvenční charakteristiku zvuku
v různých frekvenčních pásmech ( tzv. sonogramy) a také
průběh výšky základního tónu lidského hlasu. |
 Systém
umožňuje také znázornění dalších vlastností. Jde např.
o tzv. MDVP - MultiDimensional
Voice Parameters. Tento doplňkový program
znázorňuje v paprskovitém vyjádření různé vlastnosti
řeči - chvění hlasu, a to kmitočtové i amplitudové,
statistika základního tónu a další vlastnosti. Uvedené
hodnoty může vytisknout i v číselné podobě v tabulce.
Další subsystém analyzuje VRP - Voice
Range Profile, což je opět trojrozměrný graf,
kde kmitočty jsou na jedné ose, intenzita na druhé ose
a ztmavnutí udává hustotu výskytu dané kombinace.
 Hlas
mluvčího pak vytvoří oblast s uvedenými třemi parametry.
Subsystém SNM - Sona-Match umísťuje
hlásky tvořené určitým mluvčím do mapy, jejíž jedna
souřadnice je první formant (F1) a druhá souřadnice
druhý formant (F2). Poloha bodu daná těmito souřadnicemi
současně udává, jaká je nejbližší samohláska příslušející
dané kombinaci.
Nové
způsoby analýzy hlasu umožnily rozšíření počet kritérií
používaných při identifikaci mluvčího
|
<<ZPĚT
Text Ing. Jan Málek
Foto archiv KÚP.
|