Извличане на информация и откриване на знания

В програмата са привлечени водещи български учени от различни области на извличането на информация (технологии за разработване на търсачки) и методите за обработка на естествен език. Магистърската програма се реализира в сътрудничество с европейския проект по програмата COST: Action: IC1002: Multilingual and Multifaceted Interactive Information Access (MUMIA).

Професионално направление: 
4.6. Информатика и компютърни науки
Степен: 
ОКС "магистър"
Специалност: 
MII392113 Информатика
Магистърска програма: 
Извличане на информация и откриване на знания
Форма на обучение: 
редовно
Продължителност на редовна форма на обучение (брой семестри): 
3
Професионална квалификация: 
Магистър по информатика – Извличане на информация и откриване на знания (Information Retrieval and Knowledge Discovery)
Език на преподаване: 
Български
Ръководител на магистърска програма: 
проф. д-р Иван Койчев

Насоченост, образователни цели

“Извличането на информация” (Information Retrieval or Search Engine Technologies) и „откриването на знания” (Knowledge Discovery in Data/Text aka Data/Text Mining) са бързо развиващи се област през последното десетилетие. Основна предпоставка за това е експлозивното развитие на уеб, цифровите библиотеки и други електронни хранилища на информация и данни. Това поражда необходимостта от разработване на методи и алгоритми за лесно и бързо намираме полезна информация в тях. В момента представената в електронен вид неструктурираната информация (текст) значително надхвърля по обем структурираната информация (данни). Системите за търсене и извличане на полезна информация в океана от неструктурирана (полу-структурирана) информация са със значително по-голям пазарен дял в настоящето. Заедно с това нараства и необходимостта от автоматичен анализа на тези големи корпуси от текст и данни за откриване на знания от тях. В момента това един от най-бързо растящите пазари в ИТ сектора, което предопределя и търсенето на специалисти, които добре да познават съответните алгоритми и софтуерни технологии.

Програмата е ориентирана към студенти, завършили бакалавърски програми от областите на информатиката, компютърните науки и математиката.

Магистърската програма си поставя за цел да запознае студентите с основните методи и алгоритми на извличането на информация, които се опитват да отидат по-далече от търсене по ключова дума, като добавят и степен на интелигентност в разработваните системи. Студентите ще се запознаят с основните подходи за обработка на естествен език и автоматичен анализ на данни и текст. Ще развият умения за решаване на конкретни задачи, като комбинират успешно необходимите последователности от стъпки и преценяват ролята на необходимите ресурси и технологии за успешна реализации.

Обучение

МЕТОД НА ПРЕПОДАВАНЕ:

  • Обучението по дисциплините в програмата се осъществява чрез комбиниране/допълване на лекции + семинарни + дискусии + индивидуални задачи. Основният материал се поднася на студентите по време на лекции, като се използва също и формата на дискусия. Студентите подготвят сами задачите за самостоятелна работа.
  • Семинарните занятия включват решаване на допълнителни задачи по темата, разглеждане на варианти на задачата за самостоятелна работа с цел да се илюстрират специфични алгоритми и методи.
  • Необходимите ресурси за обучение са следните: компютър и мултимедия за презентация на слайдове.

ПРОГРАМАТА ЩЕ ДАДЕ НА СТУДЕНТИТЕ:

  • Знания за основните алгоритми и методите зад уеб-търсачките, сайтовете за е-търговия, препоръчващите системи, филтрирането на имейл спам, корекцията на правописа, машинния превод, автоматична класификация и групиране и др. Методи за проектиране и разработване на софтуерни системи и услуги.
  • Уменията, придобити от опита при разработване курсови проекти на реални приложения, като например: обработка на текст; създаване на машини за търсене; интелигентни инструменти за подобряване на точността на търсене; системи за филтриране на спам, категоризация и групиране на документи; подходи за автоматичен анализ на данни и текст цел откриване в тях на неявно представени зависимости и образци.
  • Отворени врати към възможности за работа в компании за търсене на информация и електронна търговия.

Професионални компетенции

Завършилите обучението по учебна програма ще придобият следните основни компетенции:

  • Познания и умения за прилагане на алгоритми и методи, необходими за изграждане на системи за търсене и извличане на информация от колекции от текстови документи и уеб.
  • Умения за прилагане на подходи за обработка на естествен език и реализиране на системи, подпомагащи на потребителя в анализа и обработката на текст.
  • Умения за използване на методи, необходими за анализ на големи масиви от данни и текст с цел и отриване на неизвестни знания за тях, включително и „горещите” приложения като автоматичен анализ на мнения по дадени теми и бизнес разузнаване.
  • Познаване на софтуерните технологии и умения за проектиране и разработване на разпределени софтуерни системи и услуги.

Професионална реализация

Магистрите ще могат да намерят реализация в сферата на: информационните технологии, като разработчици на програми за анализ на текстове и програми за извличане на информация; като създатели на платформи за обработки на големи масиви от данни; като изследователи и преподаватели в академичните институции; като експерти по ИТ към държавни или международни институции, както и към фирми за специализирани услуги, издателства, библиотеки и др. 

Завършилите тази магистърска програма също ще бъдат достатъчно добре квалифициран, за да продължат своето образование по докторска програма в Софийския или други университети.

Учебен план

Презентация

За информация и контакти

Ръководител: проф. д-р Иван Койчев
ФМИ, бул. Дж. Баучър 5, София 1164
тел.: +359 2 971 04 00
е-mail: koychev@fmi.uni-sofia.bg