Інфопошук та отримання інформації з тексту (Text-mining)

Освітня програма: «Прикладна лінгвістика (редакторсько-перекладацька та експертна діяльність)»

Структурний підрозділ: Навчально-науковий інститут філології

Назва дисципліни
Інфопошук та отримання інформації з тексту (Text-mining)
Код дисципліни
ДВС.1.02
Тип модуля
Вибіркова дисципліна для ОП
Цикл вищої освіти
Другий
Рік навчання
2021/2022
Семестр / Триместр
3 Семестр
Кількість кредитів ЕСТS
3
Результати навчання
ПРН 3. Застосовувати сучасні методики і технології, зокрема інформаційні, для успішного й ефективного здійснення професійної діяльності та забезпечення якості дослідження у галузі прикладної лінгвістики. ПРН 19. Професійно застосовувати методики і технології створення веб-сторінки та веб-дизайну, пошукової оптимізації сайту, копірайтингу, рерайтингу, компресії тексту. ПРН 21.1. Професійно застосовувати в автоматичному обробленні природної мови знання основних методів та принципів добування даних (Data Mining), інтелектуального аналізу текстових даних (Text Mining), організації та типів штучних нейронних мереж, типів задач машинного навчання. ПРН 22.1. Знати і системно застосовувати методи аналізу та моделювання прикладної (лінгвістичної) галузі, визначати інформаційні потреби і збір вихідних даних для проєктування програмного забезпечення. ПРН 27.1 Повний перелік результатів навчання за освітньою програмою подано у пункті «Профіль програми».
Форма навчання
Очна форма
Попередні умови та додаткові вимоги
Володіти елементарними навичками роботи в будь-якому інструментальному середовищі програмування (Python), розробляти програми мовами високого рівня для реалізації поставленої задачі.
Зміст навчальної дисципліни
Дисципліна вибіркового блоку "Автоматичне оброблення природної мови (АОПМ)". Метою дисципліни є формування у здобувачів освіти фахових компетентностей, необхідних для моделювання та структурування інформаційного змісту текстових джерел, що набуло особливої актуальності для сучасного етапу розвитку у сферах бізнесу, політики, соціальних процесів та загальногуманітарних досліджень. Курс передбачає вивчення теоретичних основ автоматичного інфопошуку на основі аналізу текстових даних; вироблення практичних умінь з автоматизації інтелектуальної обробки текстових джерел із застосуванням методів машинного навчання та обробки природної мови (Natural Language Processing); формування навичок аналізу соціальних медіа (Facebook, Twitter, Google тощо) за допомогою мови програмування Python.
Рекомендована та необхідна література
1. Петрасова С.В., Хайрова Н.Ф. Сучасні інформаційні технології в лінгвістиці: навчаль-ний посібник. Харків : ФОП Панов А.М. 2020. 124с 2. Рогушина Ю.В. Засоби та методи аналізу неструктурованих даних. Проблеми програму-вання. 2019. №1. С.57-77. https://doi.org/10.15407/pp2019.01.057 3. Марченко О.О., Россада Т.В., Актуальні проблеми Data Mining: навчальний посібник. Київ: КНУ, 2017. 150с.
Заплановані освітні заходи та методи викладання
Лекції, практичні заняття, самостійна робота студентів.
Методи та критерії оцінювання
Форми оцінювання студентів: - семестрове оцінювання: 1. Письмові самостійні роботи (на практичних заняттях) РН2.1, РН2.2, РН2.3, РН2.4, РН2.5 – оцінюється 4 роботи по 15 балів, всього 60 балів – максимальна кількість балів для позитивної оцінки. 2. Модульна контрольна робота: РН1.1, РН1.2, РН1.3, РН1.4, РН1.5. Оцінюються дві контрольні роботи: МКР1 – 20 балів, МКР2 – 20 балів; всього 40 балів – максимальна кількість балів для позитивної оцінки. Підсумкове оцінювання у формі заліку. Залік виставляється за результатами роботи студента впродовж усього семестру і не передбачає додаткових заходів оцінювання. Студенти, які набрали мінімально позитивну кількість балів – 60, отримують – “зараховано”. Студенти, які не набрали мінімально позитивну кількість балів – 60, отримують – “незараховано”.
Мова викладання
Українська, англійська

Кафедри

Наступні кафедри задіяні у викладанні наведеної дисципліни

Кафедра прикладних інформаційних систем
Факультет інформаційних технологій