Information Extraction and Knowledge Discovery

В програмата са привлечени водещи български учени от различни области на извличането на информация (технологии за разработване на търсачки) и методите за обработка на естествен език. Магистърската програма се реализира в сътрудничество с европейския проект по програмата COST: Action: IC1002: Multilingual and Multifaceted Interactive Information Access (MUMIA).

Professional area: 
4.6. Informatics and Computer Science
Degree: 
Master of Science
Speciality: 
MII392113 Informatics
Master's programme: 
Information Extraction and Knowledge Discovery
Form of education: 
Full-time
Duration of full-time training (in semesters): 
3
Professional qualification: 
MSC in Informatics - Information Extraction and Knowledge Discovery
Language of Instruction: 
Bulgarian
Master's programme director: 
Prof. Ivan Koichev, PhD

Focus, educational goals

“Извличането на информация” (Information Retrieval or Search Engine Technologies) и „откриването на знания” (Knowledge Discovery in Data/Text aka Data/Text Mining) са бързо развиващи се област през последното десетилетие. Основна предпоставка за това е експлозивното развитие на уеб, цифровите библиотеки и други електронни хранилища на информация и данни. Това поражда необходимостта от разработване на методи и алгоритми за лесно и бързо намираме полезна информация в тях. В момента представената в електронен вид неструктурираната информация (текст) значително надхвърля по обем структурираната информация (данни). Системите за търсене и извличане на полезна информация в океана от неструктурирана (полу-структурирана) информация са със значително по-голям пазарен дял в настоящето. Заедно с това нараства и необходимостта от автоматичен анализа на тези големи корпуси от текст и данни за откриване на знания от тях. В момента това един от най-бързо растящите пазари в ИТ сектора, което предопределя и търсенето на специалисти, които добре да познават съответните алгоритми и софтуерни технологии.

Програмата е ориентирана към студенти, завършили бакалавърски програми от областите на информатиката, компютърните науки и математиката.

Магистърската програма си поставя за цел да запознае студентите с основните методи и алгоритми на извличането на информация, които се опитват да отидат по-далече от търсене по ключова дума, като добавят и степен на интелигентност в разработваните системи. Студентите ще се запознаят с основните подходи за обработка на естествен език и автоматичен анализ на данни и текст. Ще развият умения за решаване на конкретни задачи, като комбинират успешно необходимите последователности от стъпки и преценяват ролята на необходимите ресурси и технологии за успешна реализации.

Training (knowledge and skills)

МЕТОД НА ПРЕПОДАВАНЕ:

  • Обучението по дисциплините в програмата се осъществява чрез комбиниране/допълване на лекции + семинарни + дискусии + индивидуални задачи. Основният материал се поднася на студентите по време на лекции, като се използва също и формата на дискусия. Студентите подготвят сами задачите за самостоятелна работа.
  • Семинарните занятия включват решаване на допълнителни задачи по темата, разглеждане на варианти на задачата за самостоятелна работа с цел да се илюстрират специфични алгоритми и методи.
  • Необходимите ресурси за обучение са следните: компютър и мултимедия за презентация на слайдове.

ПРОГРАМАТА ЩЕ ДАДЕ НА СТУДЕНТИТЕ:

  • Знания за основните алгоритми и методите зад уеб-търсачките, сайтовете за е-търговия, препоръчващите системи, филтрирането на имейл спам, корекцията на правописа, машинния превод, автоматична класификация и групиране и др. Методи за проектиране и разработване на софтуерни системи и услуги.
  • Уменията, придобити от опита при разработване курсови проекти на реални приложения, като например: обработка на текст; създаване на машини за търсене; интелигентни инструменти за подобряване на точността на търсене; системи за филтриране на спам, категоризация и групиране на документи; подходи за автоматичен анализ на данни и текст цел откриване в тях на неявно представени зависимости и образци.
  • Отворени врати към възможности за работа в компании за търсене на информация и електронна търговия.

Professional competence

Завършилите обучението по учебна програма ще придобият следните основни компетенции:

  • Познания и умения за прилагане на алгоритми и методи, необходими за изграждане на системи за търсене и извличане на информация от колекции от текстови документи и уеб.
  • Умения за прилагане на подходи за обработка на естествен език и реализиране на системи, подпомагащи на потребителя в анализа и обработката на текст.
  • Умения за използване на методи, необходими за анализ на големи масиви от данни и текст с цел и отриване на неизвестни знания за тях, включително и „горещите” приложения като автоматичен анализ на мнения по дадени теми и бизнес разузнаване.
  • Познаване на софтуерните технологии и умения за проектиране и разработване на разпределени софтуерни системи и услуги.

Professional realization

Магистрите ще могат да намерят реализация в сферата на: информационните технологии, като разработчици на програми за анализ на текстове и програми за извличане на информация; като създатели на платформи за обработки на големи масиви от данни; като изследователи и преподаватели в академичните институции; като експерти по ИТ към държавни или международни институции, както и към фирми за специализирани услуги, издателства, библиотеки и др. 

Завършилите тази магистърска програма също ще бъдат достатъчно добре квалифициран, за да продължат своето образование по докторска програма в Софийския или други университети.

Contact information