DIPteam news

Летна школа за мултимедиски технологии 2024 - Диоген.

Back to News...

Теми што се изучуваат на школата

LSMT2025 poster

На летната школа студентите ќе имаат можност да се стекнат со нови знаења во следните области:

  1. Основна обработка на слика: колор и сиви слики, зголемување/намалување на слика, подобрување на контраст, филтрирање на шум, сегментирање со праг.
  2. Геометриски трансформации на слика: интерполација (по најблизок сосед, билинеарна, бикубична), потсемплирање, натсемплирање, афини трансформации во 2Д и 3Д.
  3. Основна обработка на звук.
  4. Основи на невронски мрежи за анализа на слика.
  5. Конволуциски невронски мрежи за класификација: VGG, GoogleNet, ResNet, ….
  6. Конволуциски невронски мрежи за детекција: FasterRCNN, YOLO, …
  7. Сијамски невронски мрежи за процена на сличност на слики.
  8. Детекција на аудионастани: детекција на настани во сообраќај.
  9. Сегментација на медицински слики: сегментација на CT-слики од `рбетен столб.
Погледнете ја деталната програма на школата овде.

Задача за натпревар

Летната школа Мултимедиски технологии, Диоген 4.0" има за цел да им овозможи на студентите од завршните години проширени теоретски и практични знаења во областа на мултимедиските технологии. Таа е организирана од Институтот за електроника и традиционално се одржува пред почетокот на зимскиот семестар, оваа година од 24.09.2025 до 01.10.2025.

Целта на натпреварот е да се дизајнира и тренира модел (сијамска невронска мрежа - SNN) за препознавање на луѓе врз база на фотографија од лицето. Во натпреварот учествуваат екипи од по најмногу три студенти. Сите екипи снимаат множество фотографии од лице на луѓе (учесниците на натпреварот) во затворен простор (во ходниците и лабораториите на ФЕИТ) и снименото множество се анотира со подготвена алатка. Се започнува со дадена преттренирана SNN за препознавање на луѓе. Дадената SNN не може да постигне високи перформанси, очекувано, на необработени фотографии, поради што потребно е да се модифицира структурата на SNN и да се дотренира за препознавање на луѓе. Модификацијата може да содржи нов код додаден во кодот добиен на почетокот од летната школа. Не е дозволено користење на готови мрежи од други извори. Дотренирањето се прави со секвенциите снимени и анотирани во претходните чекори, како и со било кои множества на слики од интернет. На крајот од периодот за адаптирање на моделот, моделот и изворниот код за тренирање се предаваат на комисијата.

Во натпреварот тестирањето се прави со нови фотографии снимени од учесниците на натпреварот. Фотографиите снимени од сите тимови го сочинуваат множеството за тестирање. Тимовите ја имаат слободата да снимат фотографии со било кој израз на лицето или додатоци (очила, капа и сл.). Снимањето на множеството за тестирање се извршува со истата статична камера во истиот простор за сите тимови. Се очекува дека тимовите ќе снимат креативни фотографии во коишто нивниот модел добро ќе ги препознава луѓето, а противничките модели лошо. Дизајнираните модели ќе бидат применети врз тест секвенциите за пресметка на перформансите. Победува моделот со најдобри перформанси.