Schválené projekty 2015

Rozdělení přidělené dotace z MŠMT na specifický vysokoškolský výzkum po fakultách se zohledněním celoškolských pracovišť na rok 2015

Celková přidělená částka z MŠMT na specifický vysokoškolský výzkum na VŠB-TUO - 52 908 039 Kč

Z toho 2.5% - 1 320 739 Kč - úhrada způsobilých nákladů spojených s organizací SGS

fakultapřidělená částka v Kč
FBI  1 172 500
EKF  4 962 700
FAST  3 070 000
FS  8 256 000
FEI 12 282 100
HGF  5 433 000
FMMI  6 188 000
VC 10 223 000
CELKEM 51 587 300
KódSP2015/75
Název projektuAplikace zobecněných lineárních modelů v pojišťovnictví a ve financích
ŘešitelNovotná Martina Ing., Ph.D.
Školitel projektu
Období řešení projektu01.01.2015 - 31.12.2015
Předmět výzkumuZákladními problémy při řízení individuálních rizik ve finančních institucích je jednak identifikace klíčových faktorů ovlivňujících úpadek (default) dlužníka či výskyt pojistné události a posléze měření intenzity těchto vlivů. Tyto činnosti jsou prováděny za účelem identifikace rizikových skupin klientů. Problematický je rovněž odhad a posléze předpověď okamžiku vzniku možného nežádoucího stavu (pojistná událost, default firmy aj.). Jsou-li však nalezeny vhodné individuální faktory, lze na základě vhodných ekonometrických modelů stanovit nejen adekvátní cenu produktu (úvěrového či pojistného), ale rovněž modelovat očekávanou ztrátu a v návaznosti na to kalkulovat kapitálový požadavek ke krytí ztrát vyplývajících z úvěrových či pojistných smluv.

Projekt je sice zaměřen do dvou aplikačních oblastí, avšak obě využívají stejná teoretická východiska a stejnou metodologii. Proto bude v projektu řešeno modelování defaultu firmy a modelování velkých ztrát v rámci pojišťovnictví.



Aplikace v pojišťovnictví

V pojišťovnictví je možné využít koncept zobecněných lineárních modelů (GLM) při modelování pojistných nároků u jednotlivých pojistných smluv, a to na bázi individuálních charakteristik (rating factors), přičemž je zde možné rozdělit takový model na model četnosti pojistných událostí (claim frequency) a na modely výše pojistné události spojené s danou smlouvou (claim severity). A právě druhé části je věnován tento projekt. Pro modelování výše pojistné škody lze použít regresní model z konceptu GLM za předpokladu gamma rozdělení (gamma model). Ovšem na dosavadních studiích již bylo prokázáno, že toto rozdělení není vhodné, neboť nejsou jimi buď v dostatečné míře zohledněny extrémní ztráty, nebo naopak nedostatečně zohledněny ztráty malé. Tento nedostatek byl již částečně vyřešen využitím teorie velkých ztrát, konkrétně přístupem „Peak over the threshold“. Byla určena prahová proměnná, jíž byly ztráty rozděleny na malé (střední) a velké (extrémní). Pro malé ztráty byl na bázi individuálních charakterisik odhadnut gamma model zachycující malé pravděpodobnosti malých ztrát a pro velké ztráty byly na bázi kolektivního rizika odhadnuty parametry Paretovského rozdělení. Jak bylo dosavadní studií prokázáno, jakkoliv je toto řešení lepší než předchozí, toto smíšené rozdělení pravděpodobnosti není zcela vyhovující, a to především z důvodu subjektivně stanovené prahové proměnné a právě kolektivního modelu velkých ztrát společného pro všechny smlouvy bez ohledu na skutečnost, že každá smlouva přispívá k velkým ztrátám rozdílně.

Cílem projektu je tedy odhadnout regresní model pro velké ztráty, jehož parametry by byly určeny právě individuálními charakteristikami jednotlivých pojistných smluv a zjistit, zda takovýto přístup umožňuje přesnější odhady než smíšený model kombinující individuální a kolektivní rozdělení pravděpodobnosti. V rámci příprav projektu se počítá s experimentováním především na regresním modelu na bázi exponenciálního a paretovského rozdělení, přičemž oba přístupy budou porovnány na reálných datech pojistného portfolia havarijního pojištění v České republice.



Aplikace ve financích

Jedním z problémů, na které budou nové přístupy aplikovány, bude predikce úpadku (defaultu). V rámci projektu bychom se rádi zaměřili na dva problémy, které jsou víceméně opomíjeny. Zatímco je ve financích pozornost zaměřena spíše na pravděpodobnost defaultu pomocí diskriminační analýzy a logistické regrese, pohled na odhad okamžiku, ke kterému dojde k defaultu je spíše opomíjen. Čas od uzavření smlouvy či založení podniku není obvykle respektován. V navrhovaném projektu budou použity méně používané přístupy, ve kterých budeme pracovat s časovou proměnnou, což umožňuje modelovat např. dobu do defaultu u úvěru nebo dobu do předčasného splacení úvěru či hypotéky, což lze následně využít při plánování ztrát nebo kapitálových požadavků v čase. Chceme se podívat na default z jiného pohledu, z pohledu časového, a aplikovat tzv. modely doby trvání (duration modely), jež jsou postaveny např. na exponenciálním rozdělení pravděpodobnosti. Jedním z přístupů, které budou na daný problém aplikovány, bude analýza přežití (survival analysis). Jedná se o alternativní přístup k tradičním metodám, jejichž hlavním východiskem je Altmanův Z-score model (1968) a které využívají zejména logistickou regresi, diskriminační analýzu nebo umělé neuronové sítě. Analýza přežití k modelování kreditního rizika je přístupem, který byl poprvé publikován Narainem (1992). Pomocí této analýzy je možné modelovat dobu do defaultu dlužníka, např. od okamžiku poskytnutí úvěru. K odhadu pravděpodobnosti defaultu (PD) lze vyžít parametrické či semiparametrické modely, běžně používanými přístupy jsou Coxův proporcionální hazardní model, zobecněný lineární model a neparametrický regresní model.

Cílem projektu je zaměřit se na aplikaci zobecněných lineárních modelů a pomocí analýzy přežití odhadnout model k predikci defaultu. Při aplikaci analýzy přežití předpokládáme, že se v určitém okamžiku v budoucnosti dostane každý subjekt (klient, firma) do defaultu. Obvykle ovšem o subjektu nemáme k dispozici kompletní informace, a to z toho důvodu, že jej můžeme pozorovat jen během určitého časového okamžiku. Během této doby může nebo nemusí nastat default, popřípadě subjekt dále nebude součástí uvažovaného souboru dat (např. ukončí úvěrovou smlouvu), proto je nutné pracovat s cenzorovanými daty. Při modelování pravděpodobnosti defaultu vycházíme jak z informací o subjektech (endogenní proměnné), tak můžeme použít různé indikátory ekonomického cyklu (exogenní proměnné).

Jsme si vědomi případné heterogenity jednotlivých pozorování, proto má tato být rozšířena na Pareto regresi. U defaultu bude muset dojít nejdříve k identifikaci klíčových faktorů, u pojišťovnictví jsou víceméně známy a tyto budou pouze ověřeny, viz vstupní data.



Postup řešení:

Vzhledem k tomu, že dostupný ekonometrický či matematický software neumožňuje odhad Paretovské regrese, případně exponenciální, bude v první části projektu nutné vyřešit odhad parametrů těchto modelů metodou maximální věrohodnosti, a to pomocí iteračního postupu (pravděpodobně Newton-Raphson algoritmus či EM). Pro tento účel se počítá s napsáním vlastní funkce v prostředí Matlab, a to augmentací již dříve napsaných funkcí použitých na jiných projektech.

V druhé části projektu budou identifikovány faktory ovlivňující default či pojistnou událost. V případě finanční aplikace budou identifikovány ukazatele finanční analýzy statisticky významných pro modelování a predikci defaultu, v rámci pojišťovnictví bude statistická významnost faktorů pouze ověřena, tj. zda mohou být použity i v rámci těchto regresní modelů.
K modelování defaultu bude použita tzv. analýza historie události, která patří mezi metody statistického hodnocení rozdělení časů specifikovaných událostí. Jak uvádí Hendl (2009), jedná se o oblast zabývající se studiem pohybu subjektů v čase mezi určitými stavy. Častěji se tento přístup označuje jako analýza přežití, popř. přežívání (survival analysis), což pramení z původního využití této metody v oboru medicíny. Dnes se tento přístup používá v mnoha oborech včetně ekonomie, přičemž v oblasti financí se tento přístup aplikuje zejména na analýzu defaultu (bankrotu). Významnou roli zde hraje cenzorování, což znamená, že některé události nastanou až po okamžiku skončení sledování jedince (studie skončila nebo jedinec přestal být sledován). K popisu rozdělení náhodného chování časů přežití použijeme funkci přežití (survival function), která udává pro čas t pravděpodobnost přežití jedince. Predikce doby přežití na základě vstupních proměnných je analogické použití logistické regrese, hlavním rozdílem je použití cenzorovaných dat. Dalším rozdílem je, že na rozdíl od logistické regrese budeme analyzovat dobu mezi danými událostmi (Tabachnik, Fidell, 2007).
Dále bude v obou aplikačních oblastech experimentováno s vhodností použití exponenciální regrese, nebo zda je dosahováno lepších výsledků s modelem na bázi Paretova rozdělení. Modely budou především vnitřně validovány pomocí bootstrappingu. V rámci pojišťovnictví bude tedy na reálných datech modelována velikost škody (gamma-exp nebo gamma-pareto modelem), přesnost obou modelů bude porovnána a vyhodnocena vzhledem k výsledkům původních modelů (gamma model a smíšený gamma-pareto model). Rovněž bude vyhodnocen vliv modelů na očekávané rozdělení pravděpodobnosti pojistných nároků u každé smlouvy.

V rámci poslední části projektu budou jednotlivé pojistné škody simulovány v čase za účelem konstrukce rozdělení pravděpodobnosti celkové ztráty (škody) celého pojistného portfolia a propočítány kapitálové požadavky odpovídající jednotlivým modelům. Rozsah simulace pro finanční aplikace bude provedena v dostatečném rozsahu s důrazem na minimalizaci simulační chyby (minimálně 100,000 scénářů), u pojistné aplikace bude nezbytné pro zkrácení strojového času použit techniky na snížení rozptylu simulací (např. latin hypercube sampling). Získané výsledky budou porovnány a vyhodnoceny.
Tvorba vlastní funkce pro odhad parametrů exponenciální a paretovské regrese bude provedena v programu Matlab. Dále budeme využívat program Stata, popř. PASW Statistics (Survival Analysis).










Základní literatura:

ALTMAN, E. I. Financial Ratios, discriminant analysis and the prediction of corporate bankruptcy. In Journal of Finance, 1968. Vol. XXIII, No. 4. P. 589-609.
CLEVES, M., GUITIERREZ, R. G., GOULD, W. and Y. V. MARCHENKO. An Introduction to Survival Analysis Using Stata. College Station: Stata Press, 2010. ISBN 978-1-59718-074-0.
FREES, E.W. Regression Modeling with Actuarial and Financial Applications. New York: Cambridge University Press, 2010. ISBN 978-0-521-13596-2.
NARAIN, B. Survival Analysis and the Credit Granting Decision. In: Thomas, L. C. – Crook, J. N. – Edelman, D. B. (eds): Credit Scoring and Credit Control. Oxford, Oxford University Press, 1992, pp. 109-122.
HENDL, J. Přehled statistických metod. Analýza a metaanalýza dat. Praha: Portál, 2009. ISBN 978-80-7367-482-3.
JONG, P. de and HELLER, G.Z. Generalized Linear Models for Insurance Data. Cambridge: Cambridge University Press, 2008. ISBN 978-0-521-87914-9.
OHLSSON, E. and JOHANSSON, B. Non-Life Insurance Pricing with Generalized Linear Models, EAA Series. Springer, Berlin, 2010. ISBN 978-3-642-10790-0.
TABACHNIK, B. G. And FIDELL, L. S. Using Multivariate Statistics. Boston: Pearson Education, 2009. ISBN 0-205-45938-2.


Vstupní data:

Pro odhad vybraných modelů byla v oblasti neživotního pojištění vybrána oblast havarijního pojištění, u něhož byly vybrány faktory, které lze rozdělit do následujících skupin, a to (1) charakteristiky pojištěného vozu; (2) charakteristiky řidiče (pojistníka); (3) charakteristiky prostředí provozování vozidla. Dále je známa četnost havárií u jednotlivých smluv a velikost jednotlivých škod. Datový vzorek zahrnuje informace o jednotlivých pojistných smlouvách a pojistných událostech a obsahuje asi 220.000 smluv z let 2005-2010.
Pro odhad defaultu společnosti bude použita databáze firem, které během vybraného pozorovaného období vyhlásily úpadek a firem, které v daném období neměly existenční potíže do té míry, aby na ně byl podán návrh na konkurz či zahájení insolvenčního řízení. Při vytvoření databáze budeme vycházet z již dostupných dat z minulých let, z databáze Magnusweb a dalších zdrojů.


Úloha studentů v projektu:

Úloha studentů magisterského programu je zde především podpůrná. Jejich hlavním úkolem je příprava a zpracování poskytnutých dat a řešení diplomového tématu na dílčí problematiku, jde zejména o odhad využitím vytvořených funkcí a o následnou aplikaci odhadnutých modelů na různé datové vzorky a napomoci tak k jejich validaci.



Časový harmonogram:

Leden – březen: Tvorba vlastní funkce v prostředí Matlab pro odhad parametrů exponenciální a paretovské regrese. Testování vytvořené funkce na malém vzorku. Sběr a příprava dat k modelování kreditního rizika.

Duben – červen: Identifikace/ověření faktorů pro model (publikace), ověření modelů na reálných datech (publikace). Odhad modelu pomocí analýzy přežití (publikace). Aktivní účast na konferenci Evropské finanční systémy.

Červenec – září: Odhad mixed modelu gam-exp a gam-par, ověření a simulace (publikace). Validace modelů. V září aktivní účast na konferenci Matematické metody v ekonomii a Finanční řízení podniků a finančních institucí.

Říjen – prosinec: Aktivní účast na konferenci Aktuárska veda v teórii a praxi, Conference on Finance and Banking. Ukončení projektu.

Členové řešitelského týmuBc. Vojtěch Klimek
prof. Ing. Lumír Kulhánek, CSc.
Bc. Ester Lysková
Bc. Šárka Marčíková
Ing. Martina Novotná, Ph.D.
Ing. Jiří Valecký, Ph.D.
Bc. Veronika Volková
Bc. Jin Zeng
Specifikace výstupů projektu (cíl projektu)Cílem projektu je aplikovat relativně nové přístupy a porovnat jejich přínos s dosavadní metodologií. V pojišťovnictví půjde hlavně o zjištění změny KP na upisovací neživotní riziko. V oblasti zaměřené na finance je cílem použití alternativních přístupů k modelování kreditního rizika. Aplikací nových metod k řešení vybraných problémů zároveň dojde k inovaci a rozšíření nabídky diplomových témat.

Projekt je zaměřen na aplikaci zobecněných lineárních regresních modelů (Generalized linear models – dále GLM) na vybrané problémy ve financích a pojišťovnictví. I když je projekt zaměřen do dvou aplikačních oblastí, obě tyto oblasti využívají stejná teoretická východiska a stejný typ modelů. Projekt je rovněž pokračováním a rozšíření projektu SGS z roku 2011 „Odhad a predikce individuálních rizik ve finančních institucích“. Novost nově navrhovaného projektu spočívá ve zcela novém pohledu na predikci defaultu ve financích a přesnější modelování extrémních (tentokrát individuálních) pojistných ztrát ve srovnání se stávajícími a běžně používanými přístupy.

V oblasti financí bude aplikace nových přístupů k modelování kreditního rizika zaměřena na odhad pravděpodobnosti defaultu (PD) pomocí analýzy přežití (survival analysis). Přínosem projektu bude aplikace alternativních přístupů ve srovnání s tradičními (logistická regrese, diskriminační analýza). V rámci analýzy přežití budou použity informace o jednotlivých firmách a vybrané indikátory hospodářského cyklu. Ve srovnání s tradičními přístupy budeme pracovat s cenzorovanými daty a analyzovat dobu mezi danými událostmi.

V rámci aplikace v oblasti pojišťovnictví bude metodologie aplikována za účelem přesnějšího odhadu očekávané ztráty na jednotlivé smlouvy nejen za účelem stanovení přesnější a spravedlivější ceny pojistného, ale také přesnějšího odhadu očekávaného pojistného plnění (tzn. s nižší volatilitou) a následně kalkulace kapitálového požadavku na neživotní upisovací riziko dle Solvency II. V rámci projektu bude tedy ověřeno, zda nový model umožňuje snížení kapitálového požadavku na tento druh pojistného rizika.

















Výstupy projektu:

Předpokládáme, že odhadnuté modely a jejich ověření budou publikovány v recenzovaných časopisech, např. Ekonomická revue, ECON, Acta academica karviniensia (4 body dle metodiky RVVI) a dále v podobě článků ve sbornících v databázi Conference Proceedings Citation Index (4 body dle RVVI). Dále je plánována publikace v recenzovaném časopise světově uznávaných databází SCOPUS (10 bodů dle RVVI, 2016).

Konkrétními výstupy projektu budou aktivní příspěvky na těchto mezinárodních konferencích:
• Matematické metody v ekonomii (září 2015) - ČR
• Evropské finanční systémy (červen 2015) - ČR
• Finanční řízení podniků a finančních institucí (září 2015) - ČR
• Conference on Finance and Banking (říjen 2015) - ČR
• Aktuárska veda v teórii a praxi (říjen/listopad, 2015) - SR

Další výstupy projektu plánujeme publikovat v recenzovaných časopisech:
• Ekonomická revue, ECON, Acta academica karviniensia (2015, 2016)


Ambicí projektu je získat až 32 bodů dle metodiky RVVI, přičemž závazný minimální počet bodů, které budou v rámci projektu SGS získány v roce 2015, je stanoven ve výši 20 bodů.

Rozpočet projektu - uznané náklady

NávrhSkutečnost
1. Osobní náklady
Z toho
46900,-46900,-
1.1. Mzdy (včetně pohyblivých složek)35000,-35000,-
1.2. Odvody pojistného na veřejné zdravotně pojištění a pojistného na sociální zabezpečení a příspěvku na státní politiku zaměstnanosti11900,-11900,-
2. Stipendia72000,-73600,-
3. Materiálové náklady62000,-70737,-
4. Drobný hmotný a nehmotný majetek57000,-65459,-
5. Služby53200,-49546,-
6. Cestovní náhrady23900,-8758,-
7. Doplňkové (režijní) náklady max. do výše 10% poskytnuté podpory35000,-35000,-
8. Konference pořádané VŠB-TUO k prezentaci výsledků studentského grantu (max. do výše 10% poskytnuté podpory)0,-0,-
9. Pořízení investic0,-0,-
Plánované náklady350000,-
Uznané náklady350000,-
Celkem běžné finanční prostředky350000,-350000,-