Analýza přežití

Analýza přežití se pokouší odpovědět na otázky jako: jaký je zlomek populace, která přežije po určité době? Z těch, které přežijí, jakou rychlostí zemřou nebo selžou? Lze vzít v úvahu více příčin smrti nebo selhání? Jak určité okolnosti nebo charakteristiky zvyšují nebo snižují šance na přežití?

Pro zodpovězení těchto otázek je nutné definovat „životnost“. V případě biologického přežití je smrt jednoznačná, ale pro mechanickou spolehlivost nemusí být porucha dobře definována, protože mohou existovat mechanické systémy, ve kterých je porucha částečná, otázkou míry nebo není jinak časově lokalizovaná. Dokonce i v biologických problémech mohou mít některé události (například infarkt nebo jiné selhání orgánů) stejnou nejednoznačnost. Teorie nastíněná níže předpokládá přesně definované události v určitých časech; jiné případy mohou být lépe ošetřeny modely, které výslovně počítají s nejednoznačnými událostmi.

Teorie přežití, která je zde prezentována, také předpokládá, že smrt nebo selhání se stane jen jednou pro každý subjekt. Modely opakujících se událostí tento předpoklad zmírňují. Studium opakujících se událostí je relevantní v oblasti spolehlivosti systémů a v mnoha oblastech společenských věd a lékařského výzkumu.

Tento článek je formulován především z hlediska biologického přežití, ale to je jen pro zjednodušení. Ekvivalentní formulace z hlediska mechanického selhání může být vytvořena nahrazením každého výskytu úmrtí selháním.

Předmětem primárního zájmu je funkce přežití, konvenčně označovaná S, která je definována jako

kde t je nějaký čas, T je náhodná proměnná označující čas smrti a „Pr“ znamená pravděpodobnost. To znamená, že funkce přežití je pravděpodobnost, že čas smrti je pozdější než nějaký specifikovaný čas t.
Funkce přežití se také nazývá funkce přežití nebo funkce přežití v problémech biologického přežití a funkce spolehlivosti v mechanických problémech přežití. V druhém případě se funkce spolehlivosti označuje jako R(t).

Obvykle se předpokládá S(0) = 1, i když by to mohlo být méně než 1, pokud existuje možnost okamžité smrti nebo selhání.

Funkce přežití musí být nezáporná: S(u) ≤ S(t), pokud u ≥ t. Tato vlastnost vyplývá přímo z F(t) = 1 – S (t), která je integrálem nezáporné funkce. To odráží představu, že přežití do pozdějšího věku je možné pouze tehdy, pokud jsou dosaženy všechny mladší věkové kategorie. Vzhledem k této vlastnosti jsou funkce distribuce života a hustota událostí (F a f níže) dobře definovány.

Doporučujeme:  Sultán (opice)

Předpokládá se, že funkce přežití se obvykle blíží nule s přibývajícím věkem bez vázanosti, tj. S(t) → 0 jako t → ∞, i když limit by mohl být větší než nula, pokud je možný věčný život. Například bychom mohli aplikovat analýzu přežití na směs stabilních a nestabilních izotopů uhlíku; nestabilní izotopy by se dříve nebo později rozpadly, ale stabilní izotopy by vydržely neomezeně dlouho.

Doživotní distribuční funkce a hustota událostí

Související veličiny jsou definovány z hlediska funkce přežití.

Životní distribuční funkce, konvenčně označovaná F, je definována jako doplněk funkce přežití,

a derivace F, což je hustotní funkce doživotního rozdělení, se konvenčně označuje jako f,

Funkce f se někdy nazývá hustota událostí; je to rychlost úmrtí nebo selhání událostí za jednotku času.

Funkce přežití je často definována z hlediska distribučních a hustotních funkcí

Podobně lze definovat funkci hustoty události přežití jako

Funkce nebezpečnosti a kumulativní funkce nebezpečnosti

Funkce nebezpečnosti, konvenčně označovaná , je definována jako míra událostí v čase t podmíněná přežitím do času t nebo později (tj. T ≥ t),

Síla úmrtnosti je synonymem pro funkci nebezpečnosti, která se používá zejména v demografii a pojistně-matematické vědě, kde je označována . Dalším synonymem je termín míra nebezpečnosti.

Funkce nebezpečnosti musí být nezáporná, λ(t) ≥ 0, a její integrál nad musí být nekonečný, ale není jinak omezen; může se zvětšovat nebo zmenšovat, nesmí být monotónní nebo nespojitá.
Příkladem je funkce nebezpečnosti vanové křivky, která je velká pro malé hodnoty t, snižuje se na nějaké minimum a poté se opět zvětšuje; to může modelovat vlastnost některých mechanických systémů tak, že buď selžou brzy po uvedení do provozu, nebo mnohem později, jak systém stárne.

Funkce nebezpečnosti může být alternativně vyjádřena ve smyslu kumulativní funkce nebezpečnosti, konvenčně označené :

tak transpoziční znaky a exponenciální

nebo diferencování (s řetězovým pravidlem)

Název „funkce kumulativního nebezpečí“ je odvozen od skutečnosti, že

což je „akumulace“ nebezpečí v čase.

Z definice , Vidíme, že se zvyšuje bez vázanosti, protože t má tendenci k nekonečnu (za předpokladu, že S (t) má tendenci k nule). Z toho vyplývá, že se nesmí snižovat příliš rychle, protože podle definice se kumulativní nebezpečí musí rozcházet. Například není funkcí nebezpečnosti žádné distribuce přežití, protože její integrál konverguje k 1.

Doporučujeme:  Teorie sebediskrétnosti

Množství odvozená z rozdělení přežití

Budoucí životnost v daném čase je čas zbývající do smrti, vzhledem k přežití do věku . Tedy, to je v současné notaci. Očekávaná budoucí životnost je očekávaná hodnota budoucího života. Pravděpodobnost smrti v nebo před věkem , vzhledem k přežití do věku , je jen

Proto hustota pravděpodobnosti budoucí životnosti je

a očekávaná budoucí životnost je

kde druhý výraz se získá integrací po částech.

Pro , To znamená, že při narození, to snižuje na očekávanou životnost.

Při problémech se spolehlivostí se očekávaná životnost nazývá střední doba do selhání a očekávaná budoucí životnost se nazývá střední zbytková životnost.

Vzhledem k tomu, že pravděpodobnost přežití jedince do věku t nebo později je S(t), je podle definice očekávaný počet přeživších ve věku t z původní populace n novorozenců n × S(t), za předpokladu stejné funkce přežití pro všechny jedince. Očekávaný podíl přeživších je tedy S(t).
Pokud je přežití různých jedinců nezávislé, má počet přeživších ve věku t binomické rozdělení s parametry n a S(t) a rozptyl podílu přeživších je S(t) × (1-S(t)/n.

Věk, ve kterém setrvává specifikovaná část přeživších, lze zjistit vyřešením rovnice S(t) = q pro t, kde q je dotyčný kvantil. Typicky se člověk zajímá o střední dobu života, pro kterou q = 1/2, nebo jiné kvantily jako q = 0,90 nebo q = 0,99.

Z rozdělení přežití lze také vyvodit složitější závěry. Při problémech s mechanickou spolehlivostí lze vzít v úvahu náklady (nebo obecněji užitečnost), a řešit tak problémy týkající se opravy nebo výměny. To vede ke studiu teorie obnovy a teorie spolehlivosti stárnutí a dlouhověkosti.

Cenzura je forma problému s chybějícími daty, který je běžný v analýze přežití. Ideální je znát datum narození i úmrtí subjektu, v takovém případě je znám jeho život.

Je-li známo pouze to, že datum úmrtí je po nějakém datu, nazývá se to cenzura práva. K cenzuře práva dojde u těch subjektů, jejichž datum narození je známo, ale které jsou stále naživu, když jsou ztraceny pro sledování nebo když studie skončí.

Je-li známo, že délka života subjektu je kratší než určitá doba, je tato délka života údajně levě cenzurována. Levě zkrácená data jsou běžná v pojistně-matematické práci pro životní pojištění a důchody (Richards, 2010).

Doporučujeme:  Axodendritické synapse

Může se také stát, že subjekty s životností nižší, než je nějaká prahová hodnota, nemusí být vůbec pozorovány: tomu se říká zkrácení. Všimněte si, že zkrácení je odlišné od levého cenzurování, protože u levého cenzurovaného data víme, že subjekt existuje, ale u zkráceného data o subjektu vůbec nevíme. Časté je také zkrácení. V takzvané studii opožděného vstupu nejsou subjekty vůbec pozorovány, dokud nedosáhnou určitého věku. Například lidé nemusí být pozorováni, dokud nedosáhnou věku pro vstup do školy. Jakékoli zemřelé subjekty v předškolní věkové skupině by byly neznámé.

Přizpůsobení parametrů datům

Pro necenzurované datum, se rovná věku při smrti, máme

Pro levé cenzurované datum, taková, že věk při smrti je známo, že je menší než , Máme

Pro právo cenzurované datum, taková, že věk při smrti je známo, že je větší než , Máme

Pro interval cenzurované datum, taková, že věk při smrti je známo, že je menší než a větší než , Máme

Důležitou aplikací, kde vznikají intervalově cenzurovaná data, jsou aktuální stavová data, kde skutečný výskyt události je znám pouze do té míry, že je známo, že nenastala před dobou pozorování a že nastala před další.

Nelsonův–Aalenův odhad lze použít k neparametrickému odhadu funkce kumulativní míry rizika.

Distribuce použité v analýze přežití

Průměr (Aritmetika, Geometrie) – Medián – Režim – Výkon – Odchylka – Směrodatná odchylka

Testování hypotéz – Význam – Nullova hypotéza/Alternativní hypotéza – Chyba – Z-test – Studentův t-test – Maximální pravděpodobnost – Standardní skóre/Z skóre – P-hodnota – Analýza rozptylu

Funkce přežití – Kaplan-Meier – Logrank test – Četnost selhání – Proporcionální modely nebezpečnosti

Normal (zvonová křivka) – Poisson – Bernoulli

Matoucí veličina – Pearsonův korelační koeficient produktového momentu – Rank korelace (Spearmanův korelační koeficient hodnosti, Kendall tau korelační koeficient hodnosti)

Lineární regrese – Nelineární regrese – Logistická regrese