Image

Двонаправлені мовні моделі в аналізі освітніх матеріалів

Навчальний заклад: Ірпінський ліцей інноваційних технологій Ірпінської міської ради Бучанського району Київської області

Автор: Ковтун Анна Олександрівна

Відділення: Інформаційні технології

Секція: Системи та технології штучного інтелекту

Область: Київська

Опис:

Метою мого дослідження було підвищити ефективність роботи штучного інтелекту з українськомовними освітніми матеріалами. Для підтвердження актуальності було проведено опитування серед вчителів, у якому вони оцінювали тестові завдання, які згенерував штучний інтелект. Їх оцінки виявились незадовільними, що підтверджує актуальність дослідження. Для того, аби підвищити ефективність роботи мовних моделей з освітніми матеріалами було розглянуто принципи роботи NLP. Протягом виконання цього етапу було виявлено, що кращу роботу в аналітичних завданнях (які часто зустрічаються у сфері освіти) виконуватимуть двонаправлені мовні моделі, а не однонаправлені. Прикладом двонаправлених моделей є BERT, а прикладом однонаправлених - GPT. Також важливим висновком стало те, що для якісної роботи мовних моделей із українськомовними даними має бути проведено окреме налаштування алгоритмів стемінгу. Це пояснюється особливістю будови слів та речень в українській мові. У якості практичної частини роботи було створено програму, що заснована на моделі BERT. Програма аналізує задачу та визначає те, до якого розділу дисципліни належить ця задача. Отже, у результаті моєї роботи було обрано тип мовних моделей, що найкраще підійде для роботи з освітніми матеріалами, визначено рекомендації щодо покращення їх роботи з українськомовними даними, а також створено програму з їх практичним використанням.