Image

Статистичний аналіз факторів, що впливають на захворюваність цукровим діабетом

Навчальний заклад: Природничо-науковий ліцей № 145 м. Києва

Автор: Литвин Мирослава Юріївна

Відділення: Математика

Секція: Статистика

Область: м. Київ

Опис:

У моїй науковій роботі було розглянуто та досліджено метаболічну хворобу, цукровий діабет II типу. У першому розділі розглянуто захворювання на ЦД у м. Києві за 1995-2015 рр. За допомогою ARIMA процесів та регресійній моделі спрогнозовано захворюваність цукрового діабету у м. Києві у короткостроковому періоді. У другому розділі досліджено та описано інший датасет, який складався з однієї категоріальної змінної (наявність захворювання на ЦД) та 8 числових. Аби глибше дослідити дані, було використано графічні методи візуалізації: гістограми та коробочку з вусиками. Це дозволило оцінити розподіл значень кожної змінної та виявити можливі викиди. Для виявлення взаємозв’язків між змінними та їх залежності від наявності діабету, було побудовано матрицю кореляції. Далі, щоб перевірити, чи відрізняються середні значення показників у хворих на діабет та здорових людей, було проведено статистичний тест – t-критерій Стьюдента. Для класифікації пацієнтів на групи було застосовано три методи машинного навчання: k-найближчих сусідів, логістична регресія та випадковий ліс. Найбільшу точність класифікації показав метод логістичної регресії (0.78). Метод, який забезпечує найбільшу чутливість - це Random forest (0.88). Логістична регресія забезпечує найбільшу специфічність (0.89).