Projekty a granty
Databáze všech projektů a grantů od roku 2010
Kvantitativní analýza textů žákovského korpusu CzeSL-SGT | |
---|---|
Id projektu | SGS06/FF/2022 |
Hlavní řešitel | Mgr. Miroslav Kubát, Ph.D. |
Období | 1/2022 - 12/2022 |
Poskytovatel | Specifický VŠ výzkum |
Stav | ukončený |
Anotace | V rámci projektu se zaměříme na kvantitativní analýzu textů žákovského korpusu CzeSL-SGT s cílem získat základní data o textech jednotlivých jazykových úrovní, modelovat vývoj těchto textů a sledovat tak proces učení se češtiny jako cizího jazyka. Tento korpus obsahuje přes 8000 textů psaných studenty češtiny jako cizího jazyka na všech jazykových úrovních. Texty budeme analyzovat pomocí softwarů QuitaUP či UDPipe, které umožňují sledovat různé vlastnosti textů. Bude nás zajímat zejména průměrná délka tokenů, deskriptivita textu, vzdálenost mezi slovesy, délka vět, slovní bohatství, počet klauzí ve větě, syntaktické vlastnosti dependenčních stromů. Tento projekt je první fází výzkumu k dizertační práci M. Hanuškové zaměřené na analýzu textů nerodilých mluvčích češtiny. Zároveň budou aplikovány metody uplatněné v diplomových pracích M. Nogolové a M. Guńkové. Výsledky výzkumu budou prezentovány na lingvistických konferencích a v odborných článcích. |