У межах створення Нацкорпусу кримськотатарської мови опрацьовано понад 700 матеріалів

0

Під час роботи над створенням Національного корпусу кримськотатарської мови, яке ініціювало Міністерство з питань реінтеграції тимчасово окупованих територій, фахівці вже опрацювали понад 700 матеріалів.

Про це повідомляє пресслужба Мінреінтеграції, передає Укрінформ.

«Збір друкованих та електронних текстів кримськотатарською мовою для їх подальшого імпорту на платформу Sketch Engine розпочався із жовтня 2022 року. За майже пів року були опрацьовані та внесені до каталогу понад 700 матеріалів. Серед них – твори кримськотатарських авторів, журнали, газети, підручники, документи міжнародних організацій, субтитри фільмів тощо», — йдеться у повідомленні.

Зазначається, що за цей час також розроблено словник лематизації — ідеться про створення реєстру (бази даних) слів з позначенням їх початкової форми та мовних характеристик, що потрібно для запуску модуля з пошуку слів на онлайн-платформі.

Розробка відповідного програмного забезпечення триває.

Як повідомлялося, Мінреінтеграції ініціювало створення Національного корпусу кримськотатарської мови (НККМ) у межах реалізації Стратегії розвитку кримськотатарської мови на 2022-2032 роки. НККМ – це онлайн-платформа для дослідження мови, що працюватиме на даних із текстових матеріалів кримськотатарською.

Поєкт реалізується за підтримки швейцарсько-української Програми EGAP, що виконується Фондом Східна Європа, та Київського національного університету імені Тараса Шевченка.

ukrinform.ua

Прокоментуєте?

ЗАЛИШИТИ ВІДПОВІДЬ

Прокоментуйте!
Напишіть Ваше ім'я