Konstrukce jednoduchého modelu pro predikci insolvence

Zkusme sestrojit jednoduchý rozhodovací strom (záměrně velmi omezujeme jeho složitost), který bude predikovat insolvence na základě neupravených hodnot finančních ukazatelů.

Data, která použijeme k vytvoření modelu, obsahují celkem 78 585 účetních výkazů, z nichž je 2 015 v insolvenci.

Nejprve si data rozdělíme na trénovací množinu, kterou použijeme k vytvoření rozhodovacího stromu, a na menší testovací množinu, na které budeme ověřovat přesnost modelu.

Na obrázku je vidět vytvořený rozhodovací strom. Modrá barva reprezentuje insolvence, oranžová zdravé firmy.

Můžeme si všimnout, že bylo vybráno jen několik finančních ukazatelů k rozhodování. Konkrétně (seřazeno podle důležitosti):

- zr63: podíl krátkodobých závazků na celkových aktivech

- zr1: rentabilita aktiv

- zr64: (cizí zdroje - rezervy) / aktiva celkem

- zr50: doba návratnosti úvěru

- zr22: poměr dlouhodobých závazků k majetku

GINI modelu vůči validační množině je jen lehce nad 40 %. To je poměrně špatný výsledek. Náš model kreditního rizika dosahuje GINI 76 %. Na druhou stranu jsme použili velmi slabý model - rozhodovací strom - a ještě jsme významně omezili jeho složitost. Nelze tedy očekávat nějaké zázraky.

Přesto je výsledek zajímavý, protože ukazuje volbu některých skutečně důležitých ukazatelů, které mají vliv na insolvenci.