Schválené projekty 2017

Rozdělení přidělené dotace z MŠMT na specifický vysokoškolský výzkum po fakultách se zohledněním celoškolských pracovišť na rok 2017

Celková přidělená částka z MŠMT na specifický vysokoškolský výzkum na VŠB-TUO - 54 573 242 Kč

Z toho 2.5% - 1 364 331 Kč - úhrada způsobilých nákladů spojených s organizací SGS

fakulta přidělená částka v Kč
FBI  1 210 137
EKF  3 929 534
FAST  2 465 732
FS  9 344 630
FEI 13 996 004
HGF  5 272 251
FMMI  7 123 785
VC  8 743 333
CP  1 123 505
CELKEM 53 208 911

KódSP2017/165
Název projektuEfektivní implementace metody hraničních prvků III
ŘešitelMerta Michal Ing., Ph.D.
Školitel projektu
Období řešení projektu01.01.2017 - 31.12.2017
Předmět výzkumu1. Anotace

Projekt navazuje na projekty SGS SP2016/113 a SP2015/160 a jeho cílem je dále rozvíjet existující knihovnu paralelních řešičů založených na metodě hraničních prvků BEM4I. V rámci předchozích projektů byla knihovna úspěšně optimalizována pro moderní serverové procesory Intel Xeon a many-core architekturu Intel Xeon Phi (Knights Corner i Knights Landing). Kód byl vektorizován a paralelizován ve sdílené paměti pomocí moderních přenositelných direktiv standardu OpenMP 4.5, část je rovněž paralelizována v distribuované paměti pomocí MPI. Škálovatelnost paralelní implementace a efektivita SIMD vektorizace byly testovány na superpočítači Salomon (Haswell a Knights Corner), ale i na experimentálním clusteru Endeavor firmy Intel (Knights Landing). Výsledky byly prezentovány na mezinárodních konferencích a workshopech (včetně Intel Xeon Phi User Group meetingu v Chicagu a poster sekce konference Supercomputing 16) a ve sbornících a časopisech s IF. Cílem současného projektu je navázat na tyto výstupy a pokračovat v optimalizaci hraničně-prvkového kódu. Důraz bude kladen na optimalizaci sestavovače matic zředěných pomocí metody ACA (adaptive cross approximation) pro Helmholtzovu metodu. Paralelizace v distribuované paměti založená na dekompozici grafů bude rozšířena na úlohy lineární elasticity. Dále bude v rámci projektu kladen důraz na měřené energetické náročnosti kódu (v návaznosti na H2020 projekt READEX, jehož jsou někteří členové týmu součástí).

2. Složení týmu

Odborný garant: Ing. Michal Merta, Ph.D.
Členové týmu: Ing. Jan Zapletal, Ing. Lukáš Malý, Ing. Michal Kravčenko, Ing. Simona Domesová, Ing. Michal Béreš, Bc. David Ulčák, Bc. Martin Beseda, Ing. Ondřej Vysocký, Bc. Ivo Peterek

Odborný garant a členové týmu se v uplynulých třech letech podíleli na řešení několika národních a mezinárodních projektů včetně projektu SPOMECH, mezinárodních projektů PRACE, projektu Intel Parallel Computing Center na IT4Innovations, grantu TAČR a grantu Moravskoslezského kraje a mezinárodního projektu Evropské unie CASOPT ve spolupráci s firmou ABB a TU Graz. V období 2017 až 2018 se budou podílet také na řešení bilaterálního projektu s TU Graz, zaměřeného na efektivní paralelní implementaci metody hraničních prvků. Podíleli se také na řešení několika SGS zaměřených na paralelní řešení náročných inženýrských úloh (SP2014/204, SP2013/191, SP2012/187, SP2015/160, SP2015/100, SP2016/113) a jsou úspěšnými žadateli o výpočetní čas v interních i otevřených soutěžích IT4Innovations.

Členové týmu mají zkušenosti s vývojem paralelních aplikací a jejich provozem na nejvýkonnějších evropských superpočítačích (včetně Tier-0 a Tier-1 systémů, např. HECToR a CURIE). Mají rovněž zkušenosti s nejmodernějšími architekturami společnosti Intel (Knights Landing). Zúčastnili se několika stáží (např. TU Graz, TU Vídeň, EPCC) či sezonních škol na zahraničních institucích (např. PRACE Spring School 2011, EPCC, Skotsko; PRACE Autumn School 2013, Lublaň, Slovinsko). Garant a členové týmu jsou spoluautory několika impaktovaných publikací zabývajících se paralelním počítáním nebo metodou hraničních prvků přijatých k publikaci během posledních tří roků a publikací ve sbornících ze zahraničních konferencí indexovaných v databázi SCOPUS:

[1] Veit, A., Merta, M., Zapletal, J., Lukas, D. Efficient solution of time-domain boundary integral equations arising in sound-hard scattering, (2016) International Journal for Numerical Methods in Engineering, Volume 107, Issue 5, pp.430-449. (Q1)
[2] Bandara, K., Cirak, F., Of, G., Steinbach, O., Zapletal, J. Boundary element based multiresolution shape optimisation in electrostatics. Journal of Computational Physics 297, Elsevier 2015, IF 2,434 (Q1)
[3] Merta, M., Zapletal, J. Acceleration of boundary element method by explicit vectorization. Advances in Engineering Software 86, Elsevier 2015, IF 1,402 (Q2)
[4] Lukáš, D., Kovář, P., Kovářová, T., Merta, M. A parallel fast boundary element method using cyclic graph decompositions. Numerical Algorithms 70, Springer 2015. IF 1,417 (Q1)
[5] Čermák, M., Hapla, V., Horák, D., Merta, M., Markopoulos, A. Total-FETI domain decomposition method for solution of elasto-plastic problems. Advances in Engineering Software 84, Elsevier 2015. IF 1,402 (Q2)
[6] Merta, M., Zapletal, J., Jaros, J. Many Core Acceleration of the Boundary Element Method. In: Proceedings of High Performance Computing in Science and Engineering. Basel: Springer International Publishing, 2016, s. 116-125. ISBN 978-3-319-40360-1.
[7] Zapletal, J., Merta, M., Maly, L.: Boundary element quadrature schemes for multi- and many-core architectures, Computers & Mathematics with Applications. Under revision. (Q1)
[8] Čermák, M.; Merta, M.; Zapletal, J. A novel boundary element library with applications. AIP Conf. Proc. 1648, 830010, 2015.
[9] Merta, M., Vašatová, A., Hapla, V., Horák, D. Parallel implementation of Total-FETI DDM with application to medical image registration. Lecture Notes in Computer Science and Engineering 98, Springer 2014.
[10] Zapletal, J., Bouchala, J. Effective semi-analytic integration for hypersingular Galerkin boundary integral equations for the Helmholtz equation in 3D. Applications of Mathematics 59, ASCR 2014. IF 0,147 (Q4)
[11] Zapletal, J., Merta, M., Cermak, M. BEM4I applied to shape optimization problems. AIP Conf. Proc. 1738, 360012, 2016.

Členové týmu jsou autory registrovaného software BEMGen. Odborný garant je držitelem Ceny Josepha Fouriera za rok 2015 a jedním z oceněných v soutěži o cenu prof. Babušky v roce 2016.

3. Cíle projektu a očekávané výstupy

Metoda hraničních prvků (BEM) je jednou z numerických metod pro řešení parciálních diferenciálních rovnic. Její hlavní výhodou je redukce problému na hranici výpočetní oblasti. Protože je třeba diskretizovat pouze hranici oblasti, je metoda vhodná zejména pro modelování problémů na neomezených doménách (odrazy akustického či elektromagnetického vlnění) či tvarovou optimalizaci. Nevýhodou metody je její kvadratická výpočetní a paměťová náročnost. Pro řešení reálných úloh je třeba využít některou z tzv. fast BEM metod, které aproximují systémové matice maticemi nižších řádů. V knihovně BEM4I v současnosti používáme aproximaci pomocí metody ACA (pro Laplaceovu a Helmholtzovu rovnici) a FMM (pro Laplaceovu rovnici). K dalšímu urychlení výpočtu využíváme v případě Laplaceovy a Helmholtzovy rovnice explicitní vektorizaci numerické kvadratury a paralelizaci pomocí OpenMP. Diskretizace hraničních operátorů pro časově závislou vlnovou rovnici je hybridně paralelizována pomocí OpenMP a MPI (škálovatelnost byla na clusteru Anselm testována do 1024 procesorů). V rámci projektu plánujeme rozšířit metodu prezentovanou ve článku Lukáš, Kovář, Kovářová, Merta: A parallel fast boundary element method using cyclic graph decompositions (Numerical Algorithms, 2015) na řešení problémů lineární elasticity. Dojde rovněž k rozšíření funkcionality a optimalizaci řešiče pro Helmholtzovu rovnici. Část kódu bude rovněž experimentále vektorizována a optimalizována pomoci intrinsic funkcí namísto v současnosti použitých OpenMP direktiv. Projekt se bude rovněž prolínat s výzkumnými aktivitami plánovanými v rámci schváleného společného česko-rakouského mobility projektu s dobou řešení 2017-2018, jehož jsou někteří řešitelé součástí (podpořen MŠMT).

Někteří členové týmu se budou věnovat měření energetické náročnosti software vyvíjeného na IT4Innovations, včetně knihovny BEM4I.

Hlavními cíli projektu jsou tedy následující rozšíření funkcionality knihovny BEM4I:
- Rozšíření paralelizace založené na dekompozici grafů na problémy lineární elasticity
- Optimalizace metody ACA pro paralelní řešení Helmholtzovy rovnice
- Využití intrinsic funkcí k optimalizaci částí kódu a následné porovnání s původní optimalizací pomocí OpenMP direktiv
- Měření energetické náročnosti knihovny

Očekávané publikace
- 2 články v časopisech s impakt faktorem
- články ve sbornících mezinárodních a tuzemských konferencí
Členové řešitelského týmuIng. Michal Béreš
Ing. Martin Beseda
Ing. Simona Domesová
Ing. Michal Kravčenko
Ing. Lukáš Malý
Ing. Michal Merta, Ph.D.
Ing. Ivo Peterek
Ing. David Ulčák
Ing. Ondřej Vysocký
Ing. Jan Zapletal, Ph.D.
Specifikace výstupů projektu (cíl projektu)4. Impakt projektu

Význam navrhovaného projektu zasahuje jak do teoretické, tak aplikační sféry. V knihovně BEM4I jsou implementovány nové metody diskretizace a paralelizace časově závislé vlnové rovnice. Díky akceleraci a paralelizaci hraničně-prvkových výpočtů bude možné využít tyto nové metody při řešení reálných inženýrských problémů z oblasti šíření zvuku či úloh tvarové optimalizace. Další možnosti paralelizace nabízí propojení s knihovnou ESPRESO, které umožní řešit rozsáhlé inženýrské problémy zejména z oblasti elasticity pomocí metody rozložení oblastí. Rovněž paralelizace řešiče lineární elasticity pomocí dekompozice grafů umožní řešit rozsáhlé systémy. Práce na optimalizaci kódu pro nejmodernější architektury rovněž obohatí členy týmu o důležité zkušenosti, které mohou být následně uplatněny při implementaci jiných projektů, např. IPCC (Intel Parallel Computing Center). Vývoj knihovny rovněž umožní nabídnout její využití zahraničním partnerům a prohloubit tak vzájemnou spolupráci.

5. Postup řešení a časový harmonogram

Knihovna BEM4I je založena na C++ a využívá moderních prostředků objektově orientovaného programování. Díky tomu je relativně snadno rozšiřitelná o další funkcionalitu. Během její další optimalizace jsme se na základě dosavadní zkušenosti s výkonem rozhodli využít zejména Intel Compiler. Vektorizace a akcelerace na koprocesorech tedy bude implementována pomocí jeho prostředků (pragma simd, pragma offload, intrinsic funkce atd.). K optimalizaci bude použit mj. nástroj Intel VTune Amplifier a Intel Advisor 2017.

Časový harmonogram:
Q1 2017 – Paralelizace pomocí dekompozice grafů pro úlohy lineární elasticity
Q2 2017 – Implementace vektorizace pomocí intrinsic funkcí
Q3 2017 – optimalizace ACA řešiče pro Helmholzovu rovnici, publikace výsledků paralelizace řešiče lineární elasticity v časopise s IF, měření energetické náročnosti knihovny
Q4 2017 – Publikace výsledků optimalizace pomocí intrinsic funkcí v časopise s IF

Rozpočet projektu - uznané náklady

NávrhSkutečnost
1. Osobní náklady
Z toho
0,-0,-
1.1. Mzdy (včetně pohyblivých složek)0,-0,-
1.2. Odvody pojistného na veřejné zdravotně pojištění a pojistného na sociální zabezpečení a příspěvku na státní politiku zaměstnanosti0,-0,-
2. Stipendia88000,-88000,-
3. Materiálové náklady0,-0,-
4. Drobný hmotný a nehmotný majetek0,-0,-
5. Služby0,-0,-
6. Cestovní náhrady177000,-177000,-
7. Doplňkové (režijní) náklady max. do výše 10% poskytnuté podpory0,-0,-
8. Konference pořádané VŠB-TUO k prezentaci výsledků studentského grantu (max. do výše 10% poskytnuté podpory)0,-0,-
9. Pořízení investic0,-0,-
Plánované náklady265000,-
Uznané náklady265000,-
Celkem běžné finanční prostředky265000,-265000,-