Schválené projekty 2015

Rozdělení přidělené dotace z MŠMT na specifický vysokoškolský výzkum po fakultách se zohledněním celoškolských pracovišť na rok 2015

Celková přidělená částka z MŠMT na specifický vysokoškolský výzkum na VŠB-TUO - 52 908 039 Kč

Z toho 2.5% - 1 320 739 Kč - úhrada způsobilých nákladů spojených s organizací SGS

fakultapřidělená částka v Kč
FBI  1 172 500
EKF  4 962 700
FAST  3 070 000
FS  8 256 000
FEI 12 282 100
HGF  5 433 000
FMMI  6 188 000
VC 10 223 000
CELKEM 51 587 300
KódSP2015/114
Název projektuVyužití HPC pro analýzu časových řad zatížených neurčitostí
ŘešitelSlaninová Kateřina Ing., Ph.D.
Školitel projektu
Období řešení projektu01.01.2015 - 31.12.2015
Předmět výzkumuPři řešení rozsáhlých úloh (například u analýzy dopravy či meteorologických dat) vzniká velké množství časových řad zatížených neurčitostí. Tato neurčitost se může dynamicky měnit v čase a tvořit druhou paralelní časovou řadu, která obsahuje informaci o proměnlivé neurčitosti řady hlavní. Tato vlastnost však komplikuje použití běžných metod pro práci s časovými řadami a jejich porovnávání. Proto je třeba nalézt vhodné metody, které s touto vlastností budou schopny efektivně pracovat. Jako řešení tohoto problému se nabízí využití metod vycházejících z problematiky sequence alignment a pokročilých statistických metod. Cílem těchto metod je časové řady porovnat a identifikovat v nich důležité sekvence. Výstupy pak lze následně použít ke shlukování těchto sekvencí s cílem identifikace vzorů a pro jejich využití v krátkodobých predikcích. Mezi tyto metody patří například Dynamic Time Warping, Bayesovké metody, Markovské modely nebo modely Gaussovských směsí. Některé z těchto metod jsou však samy o sobě výpočetně náročné, přičemž se dále jeví jako přínosné současné využití simulačního přístupu Monte Carlo. Proto se nabízí také prozkoumání možnosti paralelizace těchto metod s cílem urychlení jejich běhu i v případě porovnávání velkého množství časových řad zatížených časově proměnlivou neurčitostí. Cílem tohoto projetu je nalézt algoritmy, které by umožňovaly efektivní porovnávání, shlukování a predikci v neurčitých časových řadách s využitím paralelizace pro urychlení výpočtu.

Impakt navrhovaného projektu:

Z hlediska problémů řešených v rámci VP1 IT4I je toto téma velice aktuální. V rámci řešení projektů jako je RODOS či FLOREON vyvstává velké množství časových řad zatížených nejistotou, které je potřeba analyzovat a vyhledávat charakteristické vzory. Například v rámci projektu RODOS je třeba porovnávat velké množství časových řad se známou a časově proměnlivou nejistotou. V případě nalezení podobnosti je možné tuto informaci využít pro krátkodobé predikce. Proto je z hlediska projektů řešených v rámci VP1 IT4I důležité nastudovat a implementovat metody, které pomocí pokročilých statistických přístupů a jejich případné následné paralelizace umožní s těmito neurčitými časovými řadami efektivně pracovat.

Aktuálnost tématu lze doložit tím, že bylo v poslední době publikováno několik článků, které se zabývaly různými metodami pro práci s časovými řadami zatíženými neurčitostí. Například Barajaras a Cristán [1] používají k porovnávání neurčitých časových řad Bayesovský neparametrický přístup. V článku napsaném Zuem a dalšími [2] je zase použita probabilistická metoda nazvaná Similarity Matching Algorithm. Pulido, Castillo a Melin [3] používají pro práci s neurčitou časovou řadou ansámbl neuronových sítí. V oblasti paralelizace bylo v poslední době také prezentováno množství článků. Jako příklad lze vybrat článek napsaný Cinarem a Principem [4], který se zabývá možnostmi paralelizace hierarchického lineárního dynamického systému. Tyto a jiné články představují dobrý základ pro budoucí práci a lze na ně ve výzkumu dále navázat. Vypracování projektu bude vyžadovat znalosti v oblasti Bayesovské statistiky, modelování dynamických systémů, statistické indukce, sequence alignment a metod pro shlukování.

[1] Luis E. Nieto-Barajas a Alberto Contreras-Cristán, „A Bayesian Nonparametric Approach for Time Series Clustering“, Bayesian Analysis 9, Number 1, pp. 147–170, 2014.

[2] Yanfei Zuo, Guohua Liu , Xiaoli Yue, Wei Wang a Honghua Wu, „Similarity Matching over Uncertain Time Series“, Proceedings of Seventh International Conference on Computational Intelligence and Security, Hainan, pp. 1357-1361, 2011.

[3] Martha Pulido, Oscar Castillo and Patricia Melin, „Genetic Optimization of Eensemble Neural Networks for Complex Time Series Prediction of the Mexican Exchange“, International Journal of Innovative Computing, Information and Control, Volume 9, Number 10, pp. 4151–4166, 2013.

[4] Goktug T. Cinar and Jose C. Principe, „Clustering of Time Series Using a Hierarchical Linear Dynamic System, Proceedings of IEEE International Conference on Acoustic, Speech and Signal Processing (ICASSP), Florence, pp. 6741-6745, 2014.

Členové řešitelského týmuIng. Martin Golasowski, Ph.D.
Ing. Tomáš Martinovič, Ph.D.
Ing. Žaneta Vaníčková
Ing. Lukáš Rapant, Ph.D.
Ing. Robert Skopal
Ing. Kateřina Slaninová, Ph.D.
Ing. Lukáš Vojáček, Ph.D.
Specifikace výstupů projektu (cíl projektu)Řešitelský tým a jeho výstupy:

Ing. Kateřina Slaninová, Ph.D. - garant
Ing. Lukáš Rapant
Ing. Žaneta Miklová
Ing. Robert Skopal
Ing. Martin Golasowski
Ing. Lukáš Vojáček

Golasowski M., Litschmannová M., Kuchař Š., Podhorányi M., Martinovič J.: „Uncertainty modelling in Rainfall-Runoff simulations based on parallel Monte Carlo method“, Neural Network World, Czech Republic. (accepted)

Vavrik R., Theuer M., Golasowski M., Kuchar S., Podhoranyi M., Vondrak V.: „Automatic Calibration of Rainfall-Runoff Models and its Parallelization Strategies“, 12th International Conference of Numerical Analysis and Applied Mathematics, ICNAAM'2014, Rhodes , 2014.

Dubec P., Plucar J., Rapant L., „Case Study of Evolutionary Process Visualization Using Complex Networks“, Proceedings of Nostradamus 2013, Ostrava, Advances in Intelligent Systems and Computing 210, pp. 125-135, 2013, ISSN 2197-5357.

Martinovič J., Slaninová K., Vojáček L., Dráždilová P., Dvorský J., Vondrák I., „Effective Clustering Algorithm for High-Dimensional Sparse Data Based on SOM“, Neural Network World, Vol. 23, no. 2, pp. 131-147, Czech Republic, 2013, ISSN 1210-0552.

Kocyan T., Martinovič J., Dráždilová P., Slaninová K., „Recognizing Characteristic Patterns in Distorted Data Collections“, In 25th European Modeling and Simulation Symposium, EMSS 2013, Brusel, Elsevier, pp. 238-243, 2013, ISBN 978-88-97999-22-5

Cíle projektu a očekávané výstupy:

Cílem projektu je nalézt vhodné algoritmy pro porovnávání, shlukování a predikci v časových řadách zatížených proměnlivou neurčitostí a prozkoumat možnosti jejich paralelizace. V rámci řešení budou nastudovány výše zmíněné metody, přičemž vybrané metody budou implementovány se zaměřením na jejich paralelizaci pro urychlení výpočtů. Výsledky této analýzy a implementované algoritmy budou prezentovány prostřednictvím příspěvků na konferencích a v časopisech indexovaných v databázích Web of Sceince a Scopus. Cílem je publikace dvou až tří takovýchto příspěvků. Dále budou tyto algoritmy začleňovány do existujících řešení v rámci VP1 IT4I. Výstupy analýzy by měly také sloužit k vylepšení tvorby rychlostních profilů nad historickými daty zatíženými neurčitostí v rámci projektu RODOS.

Postup řešení:

Postup vypracování projektu lze shrnout do následujících dílčích cílů. Prvním krokem je vypracování podrobného state of the art v oblasti práce s časovými řadami zatíženými nejistotou. Tento dílčí cíl bude splněn do konce března. Po splnění tohoto dílčího cíle bude následovat nastudování a základní implementace metod vybraných na základě zpracovaného state of the art. Splnění tohoto cíle je naplánováno na červen. Na tuto práci naváže zpracování analýzy možností paralelizace těchto vybraných metod s cílem urychlení jejich výpočtu. Metody, které se ukáží jako vhodné k paralelizaci, budou následně paralelně implementovány. Tohoto cíle bude dosaženo v září. Od října do prosince pak bude probíhat práce na publikování dosažených výsledků s případným rozšířením pro časopis. Předpokládá se, že v případě získání zajímavých dílčích výsledků dojde k jejich publikaci již před tímto termínem v průběhu roku.

Rozpočet projektu - uznané náklady

NávrhSkutečnost
1. Osobní náklady
Z toho
20100,-20100,-
1.1. Mzdy (včetně pohyblivých složek)15000,-15000,-
1.2. Odvody pojistného na veřejné zdravotně pojištění a pojistného na sociální zabezpečení a příspěvku na státní politiku zaměstnanosti5100,-5100,-
2. Stipendia96000,-96000,-
3. Materiálové náklady10600,-19934,-
4. Drobný hmotný a nehmotný majetek0,-36,-
5. Služby0,-0,-
6. Cestovní náhrady110000,-100630,-
7. Doplňkové (režijní) náklady max. do výše 10% poskytnuté podpory26300,-26300,-
8. Konference pořádané VŠB-TUO k prezentaci výsledků studentského grantu (max. do výše 10% poskytnuté podpory)0,-0,-
9. Pořízení investic0,-0,-
Plánované náklady263000,-
Uznané náklady263000,-
Celkem běžné finanční prostředky263000,-263000,-