Schválené projekty 2017

Rozdělení přidělené dotace z MŠMT na specifický vysokoškolský výzkum po fakultách se zohledněním celoškolských pracovišť na rok 2017

Celková přidělená částka z MŠMT na specifický vysokoškolský výzkum na VŠB-TUO - 54 573 242 Kč

Z toho 2.5% - 1 364 331 Kč - úhrada způsobilých nákladů spojených s organizací SGS

fakulta přidělená částka v Kč
FBI  1 210 137
EKF  3 929 534
FAST  2 465 732
FS  9 344 630
FEI 13 996 004
HGF  5 272 251
FMMI  7 123 785
VC  8 743 333
CP  1 123 505
CELKEM 53 208 911

KódSP2017/177
Název projektuOptimalizace algoritmů strojového učení pro platformu HPC
ŘešitelSlaninová Kateřina Ing., Ph.D.
Školitel projektu
Období řešení projektu01.01.2017 - 31.12.2017
Předmět výzkumuProjekt je zaměřen na využití algoritmů neřízeného strojového učení pro předzpracování dat pro algoritmy řízeného strojového učení. Takto předzpracovaná data mohou vést k rychlejší konvergenci daných metod případě ke zpřesnění jejich výsledku. Druhotným cílem projektu je implementace zmíněného přístupu za účelem zpracování rozsáhlých datových kolekcí na HPC infrastruktuře. Mezi použité metody neřízeného učení budou zahrnuty např. shlukovací algoritmy (k-means, spectral clustering). Vliv takto zpracovaných vstupních dat bude následně otestován na algoritmech Support Vector Machine (SVM) a Flexible Neural Tree. Kromě standardních euklidovských datových kolekcí se tento projekt bude zabývat rovněž porovnáváním vícerozměrných dat nebo časových řad.

Složení řešitelského týmu

Odborný garant: Ing. Kateřina Slaninová, Ph.D.

Členové týmu:
Ing. Martin Golasowski
Ing. Vojtěch Cima
Ing. Jiří Hanzelka
Ing. Martin Rusek
Georg Zitzelsberger
2 x Mgr. Student
1 x Ph.D. Student

Reference týmu:
[1] Golasowski, M., Tomis, R., Martinovič, J., Slaninová, K., & Rapant, L. (2016, September). Performance evaluation of probabilistic time-dependent travel time computation. In IFIP International Conference on Computer Information Systems and Industrial Management (pp. 377-388). Springer International Publishing.
[2] Golasowski, M., Litschmannova, M., Kuchar, S., Podhoranyi, M., & Martinovic, J. (2015). Uncertainty modelling in Rainfall-Runoff simulations based on parallel Monte Carlo method. Neural Network World, 25(3), 267.
[3] Hanzelka, J. Neuronová síť typu Flexible Neural Tree. Diplomová práce, Katedra informatiky, Fakulta Elektrotechniky a Informatiky VŠB – TU Ostrava, 2015.
[4] Cima, V. Segmentace obrazu metodou spektrálního shlukování a difuzního spektrálního shlukování. 2015.
Členové řešitelského týmuIng. Vojtěch Cima
Ing. Martin Golasowski
Ing. Jiří Hanzelka
Ing. Martin Rusek
Ing. Kateřina Slaninová, Ph.D.
Ing. Martin Šurkovský
Ing. Radim Vavřík
Georg Zitzlsberger, M.Sc.
Specifikace výstupů projektu (cíl projektu)1. Cíle projektu a očekávané výstupy

Cílem projektu je ověřit možnosti propojení algoritmů z oblasti řízeného a neřízeného strojového učení v kontextu rozsáhlých datových kolekcí zpracovávaných na HPC infrastruktuře. Algoritmy řízeného strojového učení [1,2] mohou poskytovat lepší výsledky pokud jsou jejich vstupní data předzpracovány přístupy z oblasti neřízeného strojového učení. Například trénovací množina dat pro algoritmus Support Vector Machine (SVM), který je založen na neuronových sítích, může být vybrána s pomocí algoritmu k-means [3]. Tento algoritmus na výstupu poskytuje informaci o možných shlucích (vzorcích) [4] ve vstupním datovém souboru, trénovací množina dat [5] může být diverzifikována tak, aby v ní byly zastoupeny body ze všech shluků. Síť trénovaná nad takovými daty může klasifikovat přesněji, protože lépe vystihne možnou variabilitu ve vstupním datovém souboru. Podobným způsobem mohou být testovány i jiné kombinace algoritmů.

V průběhu projektu budou vytvořeny implementace jednotlivých algoritmů optimalizované na cílovou infrastrukturu a návrh jejich možných propojení. Pro jednotlivé algoritmy bude stanovena testovací sada dat, tzv. benchmark, která bude sloužit pro verifikaci jednotlivých implementací. Dále bude definována testovací sada dat, pomocí které se bude ověřovat použitelnost dané kombinace algortimů.

2. Impakt navrhovaného projektu

Algoritmy strojového učení tvoří významnou část výzkumných aktivit laboratoře pro pokročilé datové analýzy a simulace. Jejich implementace budou např. součástí přístupu k datové fůzi, která je implementována v rámci experimentálního navigačního systému využívaného v projektu ANTAREX. V rámci projektu Floreon+ tyto algoritmy mohou být použity pro simulace hypotetických scénářů z oblasti hydrologie nebo monitorování dopravy. Přesnější klasifikace dat může významným způsobem přispět ke zkvalitnění výstupu těchto systémů.

3. Postup řešení projektu

Plánovaná doba trvání projektu je jeden kalendářní rok. V prvním čtvrtletí bude vypracována rešerše v oblasti řízeného a neřízeného strojového učení a jejich kombinací. Nejvhodnější vybrané metody budou následně v dalších dvou čtvrtletích implementovány a otestovány. Implementace bude provedena s ohledem na jeho další integraci do jiných projektů. Po otestování kódu bude následovat jeho optimalizace pro HPC infrastrukturu IT4Innovations. Náplní posledního čtvrtletí bude verifikace navrhovaného přístupu pomocí testovacích dat a měření efektivity optimalizace. Po celou dobu trvání projektu bude probíhat průběžné publikování dosažených výsledků.

Reference:

[1] CHEN, Yuehui; ABRAHAM, Ajith; YANG, Bo. Feature selection and classification using flexible neural tree. Neurocomputing, 2006, 70.1: 305-313.
[2] CAMPBELL, Colin; YING, Yiming. Learning with support vector machines. Synthesis lectures on artificial intelligence and machine learning, 2011, 5.1: 1-95.
[3] CELEBI, M. Emre; KINGRAVI, Hassan A.; VELA, Patricio A. A comparative study of efficient initialization methods for the k-means clustering algorithm. Expert Systems with Applications, 2013, 40.1: 200-210.
[4] JAIN, Anil K. Data clustering: 50 years beyond K-means. Pattern recognition letters, 2010, 31.8: 651-666.
[5] SCHMIDHUBER, Jürgen. Deep learning in neural networks: An overview. Neural Networks, 2015, 61: 85-117.

Rozpočet projektu - uznané náklady

NávrhSkutečnost
1. Osobní náklady
Z toho
0,-0,-
1.1. Mzdy (včetně pohyblivých složek)0,-0,-
1.2. Odvody pojistného na veřejné zdravotně pojištění a pojistného na sociální zabezpečení a příspěvku na státní politiku zaměstnanosti0,-0,-
2. Stipendia144000,-144000,-
3. Materiálové náklady0,-0,-
4. Drobný hmotný a nehmotný majetek0,-0,-
5. Služby0,-0,-
6. Cestovní náhrady152000,-152000,-
7. Doplňkové (režijní) náklady max. do výše 10% poskytnuté podpory0,-0,-
8. Konference pořádané VŠB-TUO k prezentaci výsledků studentského grantu (max. do výše 10% poskytnuté podpory)0,-0,-
9. Pořízení investic0,-0,-
Plánované náklady296000,-
Uznané náklady296000,-
Celkem běžné finanční prostředky296000,-296000,-