Аналіз даних мовою Python

Освітня програма: Інженерія комп’ютерних систем і мереж

Структурний підрозділ: Факультет радіофізики, електроніки та комп’ютерних систем

Назва дисципліни
Аналіз даних мовою Python
Код дисципліни
ОК 30
Тип модуля
Обов’язкова дисципліна для ОП
Цикл вищої освіти
Перший
Рік навчання
2023/2024
Семестр / Триместр
3 Семестр
Кількість кредитів ЕСТS
5
Результати навчання
Студент повинен знати: стандартну методологію аналізу даних CRISP-DM, об’єкти Python для представлення наборів даних, основні типи діаграм для візуалізації даних, методи кореляційного аналізу даних, принципи машинного навчання. Студент повинен вміти: працювати у середовищах інтерактивної розробки програм Jupyter Notebook і Google Colab, оцінювати час обчислень виразів, використовувати програмні бібліотеки NumPy, Matplotlib, pandas, seaborn для проведення розвідувального аналізу даних, понижувати розмірність і проводити декореляцію даних методом головних компонентів (PCA), генерувати випадкові величини для заданої функції густини ймовірності (PDF), оцінювати PDF для кількісних ознак набору даних методом ядрової оцінки густини (KDE), виявляти викиди у наборі даних, проводити обробку пропусків даних.
Форма навчання
Очна форма
Попередні умови та додаткові вимоги
Навчальна дисципліна «Аналіз даних мовою Python» базується на дисциплінах «Програмування» (Python), «Вища математика», «Теорія ймовірності та математична статистика», «Алгоритми і методи обчислень», «Дискретна математика».
Зміст навчальної дисципліни
У курсі «Аналіз даних мовою Python» розглядаються методи і програмний інструментарій мови Python, які використовуються під час проведення аналізу даних, зокрема: стандартна методологія аналізу даних CRISP-DM, середовища інтерактивної розробки програм Jupyter Notebook і Google Colab, оцінювання часу обчислень виразів, об’єкти Python для представлення наборів даних, основні типи діаграм для візуалізації даних, програмні засоби бібліотек NumPy, Matplotlib, pandas, seaborn для проведення розвідувального аналізу даних, методи кореляційного аналізу даних, методи декореляції і пониження розмірності даних, генерація випадкових величин для заданої функції густини ймовірності (PDF), оцінювання PDF для кількісних ознак набору даних методом ядрової оцінки густини (KDE), виявлення викидів у наборі даних, обробка пропусків даних, робота з множинами, початкові відомості про машинне навчання.
Рекомендована та необхідна література
1. Wes McKinney. Python for Data Analysis. 3rd Edition. O'Reilly Media, 2022. 989 pages. 2. Jake VanderPlas. Python Data Science Handbook: Essential Tools for Working with Data.O'Reilly Media, 2017. 546 pages. 3. Michael Heydt. Learning pandas - Second Edition: High performance data manipulation and analysis using Python. 2nd Edition. Packt Publishing, 2017. 703 pages. 4. J. Brownlee. Data Preparation for Machine Learning: Data Cleaning, Feature Selection, and Data Transforms in Python. Machine Learning Mastery, 2020. – 398 pages.
Заплановані освітні заходи та методи викладання
Лекції, лабораторні роботи, самостійна робота
Методи та критерії оцінювання
Семестрове оцінювання: Навчальний семестр має три змістовні модулі. Перші два змістовних модуля оцінюються після завершення лекційних тем №7 та №13 шляхом проведення електронних тестувань. Третій змістовний модуль оцінюється за результатами складання (захисту) 6 лабораторних робіт. Підсумкове оцінювання (у формі заліку): форма заліку – електронне тестування. Всього за залік можна отримати від 0 до 40 балів. Умовою досягнення позитивної оцінки за дисципліну є складання (захист) всіх 6 лабораторних робіт і отримання не менш ніж 60 балів підсумкової оцінки. Умови допуску до заліку: умовою допуску до заліку є отримання студентом сумарно не менше, ніж критично-розрахунковий мінімум за семестр, рівний 20 балів.
Мова викладання
Українська

Кафедри

Наступні кафедри задіяні у викладанні наведеної дисципліни

Кафедра комп'ютерної інженерії
Факультет радіофізики, електроніки та комп’ютерних систем