Schválené projekty 2018

Rozdělení přidělené dotace z MŠMT na specifický vysokoškolský výzkum po fakultách se zohledněním celoškolských pracovišť na rok 2018

Celková přidělená částka z MŠMT na specifický vysokoškolský výzkum na VŠB-TUO - 55 008 271 Kč

Z toho 2.5% - 1 375 200 Kč - úhrada způsobilých nákladů spojených s organizací SGS

fakulta přidělená částka v Kč
FBI  1 169 170
EKF  3 711 750
FAST  2 600 000
FS  8 523 694
FEI 14 727 528
HGF  6 164 359
FMT  7 136 570
VC  9 600 000
CELKEM 53 633 071

KódSP2018/159
Název projektuHardwarová akcelerace sestavovače matic a vývoj GUI knihovny ESPRESO
ŘešitelVavřík Radim Ing.
Školitel projektuIng. Tomáš Brzobohatý, Ph.D.<br />
Období řešení projektu01.01.2018 - 31.12.2018
Předmět výzkumu1. Anotace projektu:

Nezanedbatelnou součástí řešení úloh pomocí metody konečných prvků (MKP) z hlediska výpočetní náročnosti je fáze preprocesingu, ve které probíhá sestavování objektů v tzv. sestavovači matic. Náplní projektu bude optimalizace této části kódu v MKP knihovně ESPRESO pro architektury x86 (primárně Intel Xeon, případně Xeon Phi generace KNL) a GPU akcelerátory podporující technologii CUDA. Optimalizace se bude soustředit na efektivní vektorizaci kritických částí sestavovače a práci s pamětí. V případě GPU akcelerace se dále bude implementovat technika pro překrývání přenosu dat mezi pamětmi CPU/GPU a výpočtů. Další součástí projektu bude vývoj grafického uživatelského rozhraní (GUI) pro konfiguraci úloh řešených pomocí knihovny ESPRESO.

2. Složení týmu:

Odborný garant:
Ing. Tomáš Brzobohatý, Ph.D. - Ph.D. obdržel v oboru aplikované mechaniky. Je výzkumníkem v národním superpočítačovém centru IT4Innovations. Jeho pracovní zkušenosti zahrnují: pracovní pobyty z zahraničí - Stanford University - Department of Aeronautics & Astronautics (prof. Farhat Research Group), DAAD stipendium na Leibniz Universität Hannover, Germany (prof. Wriggers group). Jeho výzkumné aktivity zahrnují vývoj škálovatelných algoritmů pro rozsáhlé úlohy v řadech miliard neznámých, výzkum v oblasti doménových dekompozic, strukturální mechaniky, nelineárních problémů, dynamiky tekutin nebo FSI. Je autorem nebo spoluautorem více než 30 publikací, zahrnujících články v časopisech s IF. Podílí se rovněž na vývoji software (MatSol, ESPRESO). Věnuje se také zlepšení HPC metodik v existujících open source knihovnách, jako je například OpenFOAM, poskytuje podporu průmyslovým partnerům IT4Innovations v této oblasti.

Řešitelský tým:
i. Ing. Radim Vavřík – student prezenčního doktorského Univerzitního studijního programu VŠB-TUO, obor Výpočetní vědy. V roce 2014 obhájil diplomovou práci na téma Vývoj srážko-odtokového modelu Math1D pro spouštění na HPC. Tématem jeho disertační práce je Paralelní řešení inverzních úloh. Aktivně se podílel na vývoji systému Floreon+ a na řešení mezinárodního projektu Harpa. V současné době se věnuje zejména využití efektivních řešičů v knihovně ESPRESO, její paměťové optimalizaci a GPU akceleraci.

ii. Ing. Ondřej Meca - aktuálně dokončuje disertační práci na téma verifikace paralelních aplikací. Má zkušenosti s jazyky C/C++ a knihovnou MPI. Hlavní pracovní náplní v IT4I je vývoj knihovny ESPRESO.

iii. Bc. Tomáš Panoc - student prezenčního magisterského programu Informatika a výpočetní technika na FEI VŠB-TUO. V roce 2016 obhájil bakalářskou práci na téma Synchronizace tracelogů v nástroji Kaira vyvíjeném skupinou Verif na Katedře informatiky FEI VŠB-TUO. V současné době pracuje na diplomové práci, v rámci které vyvíjí konfigurační grafické rozhraní pro paralelní řešič ESPRESO.

Publikace:

[1] Riha L., Merta M., Vavrik R., Brzobohaty T., Markopoulos A., Meca O., Kozubek T. and Vondrak V. (2017) Massively parallel and memory efficient FEM toolbox with Hybrid Total FETI solver with accelerator support. (Journal Article Q2) Submitted to International Journal of High Performance Computing Applications.

[2] Meca O., Riha L., Markopoulos A., Brzobohaty T. and Kozubek T. (2017) Using ESPRESO as Linear Solver Library for Third Party FEM Tools for Solving Large Scale Problems. (Conference) HPCSE 2017. Submitted.

[3] Merta M., Riha L., Meca O., Markopoulos A., Brzobohaty T. and Kozubek T. (2016) Intel Xeon Phi Acceleration of Hybrid Total FETI Solver. (Journal Article Q1) Advances in Engineering Software, 2016.

[4] Riha L., Brzobohaty T., Markopoulos A., Meca O. and Kozubek T. (2016) Massively parallel hybrid total FETI (HTFETI) solver. (Conference) Platform for Advanced Scientific Computing Conference, PASC. ACM. ISBN 978-1-4503-4126-4/16/06, DOI: http://dx.doi.org/10.1145/2929908.2929909.

[5] Riha L., Brzobohaty T., Markopoulos A., Meca O., Kozubek T., Schenk O. and Vanroose W. (2016) Efficient Implementation of Total FETI Solver for Graphic Processing Units Using Schur Complement. (Conference) HPCSE 2015, LNCS 9611 2016.

[6] Riha L., Brzobohaty T. and Markopoulos A. (2016) Hybrid parallelization of the Total FETI solver. (Journal Article Q1) Advances in Engineering Software, 2016, ISSN: 0965-9978.

[7] Riha L., Brzobohaty T., Markopoulos A., Jarosova M., Kozubek T., Horak D. and Hapla V. (2016) Implementation of the Efficient Communication Layer for the Highly Parallel Total FETI and Hybrid Total FETI Solvers. (Journal Article Q2) Parallel Computing, 2016, ISSN: 0167-8191.

[8] Riha L., Brzobohaty T. and Markopoulos A. (2015) Highly Scalable FETI Methods in ESPRESO. (Conference) Proceedings of the Fourth International Conference on Parallel, Distributed, Grid and Cloud Computing for Engineering, Civil-Comp Press, Stirlingshire, UK, 2015, ISBN: 1759-3433.

[9] Riha L., Brzobohaty T., Markopoulos A., Jarosova M. and Kozubek T. (2015) Implementation of hybrid total FETI (HTFETI) solver for multi-core architectures. (Conference) International Conference on Numerical Analysis and Applied Mathematics 2014, vol. 1648, DOI: 10.1063/1.4913028.
Členové řešitelského týmuIng. Tomáš Brzobohatý, Ph.D.
Ing. Ondřej Meca
Ing. Tomáš Panoc
Ing. Radim Vavřík
Specifikace výstupů projektu (cíl projektu)3. Cíle projektu a očekávané výstupy:

Knihovna ESPRESO se skládá z několika logických celků pro jednotlivé fáze zpracování a řešení specifikované úlohy. Těmito fázemi jsou prepocessing vstupních dat, zpracování výpočetní sítě, sestavení objektů MKP, řešení úlohy pomocí TFETI/HTFETI řešiče a nakonec zpracování výstupních dat pro vizualizaci výsledků v rámci postprocessingu. Hlavním objektem efektivní paralelní implementace, akcelerace a optimalizací v rámci vývoje knihovny ESPRESO byl doposud především zmíněný TFETI/HTFETI řešič. Při řešení komplexních inženýrských úloh se vedle samotného iteračního řešiče stává výpočetně náročnou i fáze sestavování objektů MKP, zejména pokud jde o úlohu transientní, během které k sestavování dochází opakovaně. Projekt Hardwarová akcelerace sestavovače matic a vývoj GUI knihovny ESPRESO si klade za cíl:

1) Upravit a vylepšit algoritmy využívané ve fázi sestavování objektů MKP, umožnit vektorizaci a akceleraci kritických částí kódu, a tím výrazně zvýšit výkonnost této části knihovny ESPRESO a zkrátit tak celkový čas běhu spouštěných úloh.
2) Vyvinout a otestovat dynamické GUI, které umožní uživatelsky přívětivou editaci vstupních parametrů řešené úlohy i nastavení vlastností a možností běhu samotného řešiče.

Výstupem projektu bude vylepšený kód knihovny ESPRESO s vyšší výkonností při řešení reálných inženýrských úloh, rozšířený o modul GUI. Dosažené výsledky budou publikovány a prezentovány na vybrané zahraniční konferenci. Plánován je 1 výstup typu D s případným rozšířením na Jimp/Jsc.

4. Impakt navrhovaného projektu:

Technologický pokrok v oblasti výpočetní techniky zapříčinil výraznou změnu koncepce navrhování nových produktů, řízení výroby nebo autonomních systémů. V posledních několika letech jsme svědky výrazného přechodu na tzv. virtuální prototypování a stupňujícího se tlaku na zapojení velké části spektra průmyslového sektoru do tzv. čtvrté průmyslové revoluce. Hlavním cílem týmu vyvíjejícího knihovnu ESPRESO je vytvoření uceleného open source balíku, který bude možné aplikovat na široké spektrum komplexních inženýrských simulací z oblastí jako je strojírenství, stavitelství a energetika. Bezplatná licence vyvíjeného balíku umožňuje vytvářet nad knihovnou ESPRESO automatizované simulační řetězce, jako například automatizované systémy pro tvarovou optimalizaci. Přidanou hodnotou tohoto balíku je vysoce škálovatelný řešič založený na metodách doménové dekompozice, který umožňuje plně saturovat výpočetní kapacity nejvýkonnějších superpočítačů dneška a řešit tak úlohy o miliardách neznámých, a jednoduché rozhraní pro konfiguraci implementovaných řešičů. Možné budoucí napojení na cloudová centra v rámci H2020 projektu CloudiFacturing a na službu HPC as a service, vyvíjenou našimi kolegy, usnadní externím partnerům primárně z malých a středních podniků využívat moderní technologie v kontextu virtuálního prototypování. Vektorizace sestavovače matic, jež využívá již optimalizovaný vysoce paralelní řešič, je nutnou podmínkou pro efektivní řešení rozsáhlých úloh jako jsou například časově závislé nelineární úlohy, či úlohy tvarové optimalizace.

5. Postup řešení a časový harmonogram:

Vývoj a testování funkcionality bude probíhat především s využitím infrastruktury IT4Innovations, konkrétně superpočítače Salomon pro vývoj a testování CPU vektorizace, popř. akcelerace pomocí akcelerátorů Intel Xeon Phi, a superpočítače Anselm pro vývoj a testování GPU akcelerace pomocí akcelerátorů NVIDIA Tesla Kepler K20.

Q1 2018:
• Identifikace kritických částí kódu a objektů sestavovače matic z pohledu výpočetní náročnosti pro jednotlivé typy úloh
• Stanovení testovacích kritérií a měření výchozích hodnot (časy běhu, využití paměti) primárně pro modul simulace vedení tepla
• Studium možností optimalizace a akcelerace sestavovače matic
• Analýza požadavků na funkcionalitu GUI
• Rešerše dostupných knihoven a frameworků pro tvorbu GUI

Q2 2018:
• Paralelizace a akcelerace identifikovaných kritických částí sestavovače matic pomocí vysokoúrovových paralelních programovacích modelů (např. OpenMP, OpenACC, apod.)
• Testování a měření hodnot po první fázi optimalizace s využitím infrastruktury IT4I, vyhodnocení dosažených výsledků
• Návrh grafického zpracování a architektury modulu GUI s využitím zvolených knihoven a frameworků pro tvorbu GUI

Q3 2018:
• Návrh a implementace datových struktur a algoritmů pro vektorizaci a akceleraci se zaměřením na komplexní úlohy (reálné inženýrské úlohy, transientní úlohy)
• Optimalizace pro efektivní využití paměti, např. opakované využití alkokované paměti, sparsity patternu matic apod.
• Testování a měření hodnot a vyhodnocení výsledků po aktuální fázi optimalizace
• Implementace GUI dle návrhu a průběžné testování

Q4 2018:
• Návrh a implementace efektivního přenosu dat mezi hlavní pamětí CPU a pamětí GPU akcelerátoru s překrýváním výpočtů.
• Studium možné akcelerace sestavovače matic pomocí koprocesorů Intel Xeon Phi
• Závěřečné testování, měření hodnot a vyhodnocení finálních výsledků, porovnání s výchozími hodnotami
• Testování GUI, tvorba nápovědy a uživatelské příručky

Rozpočet projektu - uznané náklady

NávrhSkutečnost
1. Osobní náklady
Z toho
0,-0,-
1.1. Mzdy (včetně pohyblivých složek)0,-0,-
1.2. Odvody pojistného na veřejné zdravotně pojištění a pojistného na sociální zabezpečení a příspěvku na státní politiku zaměstnanosti0,-0,-
2. Stipendia66000,-66000,-
3. Materiálové náklady0,-7141,-
4. Drobný hmotný a nehmotný majetek15000,-11199,-
5. Služby0,-64319,-
6. Cestovní náhrady117000,-49341,-
7. Doplňkové (režijní) náklady max. do výše 10% poskytnuté podpory22000,-22000,-
8. Konference pořádané VŠB-TUO k prezentaci výsledků studentského grantu (max. do výše 10% poskytnuté podpory)0,-0,-
9. Pořízení investic0,-0,-
Plánované náklady220000,-
Uznané náklady220000,-
Celkem běžné finanční prostředky220000,-220000,-