Įvairių kalbų kalbos signalų kodavimo analizė ir gerinimas

Mohamad Itani

Daktaro disertacija

Disertacijos neparduodamos

Kiekis

Aprašymas

Disertacijoje tiriamas balso kodekų taikančių tiesinės prognozės mechanizmą našumas koduojant skirtingų kalbų kalbos signalus. Anglų kalba nuo seno dominavo ir darė didžiausią įtaką telekomunikacijų technikos raidai. Tai lėmė faktai, kad dauguma atradimų ir patobulinimų buvo padaryta angliškai kalbančiose šalyse. Taigi, yra labai tikėtina, kad šie patobulinimai yra lingvistiškai nepagrįsti. Yra pastebėta, kad balso kodekais atkurto kalbos signalo kokybė yra dažniausiai vertinama anglų kalbai. Tyrimai rodo, kad mažos duomenų spartos kodavime kitų, ne anglų kabos, kalbos signalai yra labiau sugadinami.

Pagrindinis disertacijos tikslas yra ištirti CELP balso kodekų našumą koduojant skirtingų kalbų signalus ir pasiūlyti būdus kodavimo pagerinimui. Siekiant šio tikslo reikia išspręsti šiuos uždavinius: atlikti analitinę CELP balso kodavimo koduojant skirtingų kalbų signalus analizę; sukurti lietuvių kalbos įrašų duomenų bazę pagal to ITU-T P.50 rekomendacijos 1 priedo analogą, kuri būtų tinkama balso kodekų testavimui; ištirti AMR ir Speex našumą dekoduoto balso kokybės prasme koduojant ne anglų kalbos signalus.

Pirmame disertacijos skyriuje yra atliekama kalbos įtakos balso kodavimo teorijoje apžvalga, apžvelgiamas balso kodekų veikimo principas, formuluojami disertacijos uždaviniai.

Antrame skyriuje pateikiamos kalbos signalo kokybės samprata, jos vertinimo būdai. Atliekami pirminiai kodekų kodavimo gerumo įvairioms kalboms tyrimai.

Trečias skyrius skirtas sukurtos lietuvių kalbos įrašų duomenų bazės aprašymui ir jos tinkamumo kodekų testavimui vertinimui.

Ketvirtame skyriuje aprašomi AMR ir Speex kodekų kokybės tyrimai koduojant anglų, lietuvių ir arabų kalbų signalus.

Penktame skyriuje pateikiamas kodekų kodavimo pritaikymo konkrečiai kalbai būdas – fiksuotos kodų lentelės adaptavimas konkrečiai kalbai. Parodoma, kad tai leidžia pagerinti Speex kodeko kokybę koduojant lietuvių ir arabų kalbų kalbos signalus.

Disertacijos tematika yra paskelbtos trys publikacijos recenzuojamuose mokslo leidiniuose: du straipsniai ISI Web of Science žurnaluose ir vienas tarptautinės konferencijos medžiagoje indeksuojamoje IEEE Xplore duomenų bazėje. Disertacijos rezultatai viešinti keturiuose mokslinėse konferencijose.

Skaityti leidinio elektroninį variantą:

DOI: https://doi.org/10.20334/1858-M

Detaliau
VGTU leidykla "Technika"

Charakteristikos

Metai:
2011
ISBN:
978-9955-28-815-2
Leidyklos nr.:
1858-M
Matmenys:
160×240
Puslapių skaičius:
102 p.
Viršelis:
minkštas
Kalba:
anglų
16 kitos knygos toje pačioje kategorijoje:

Sekite mus Facebook'e