Výběrové modelování

Výběrové modelování se pokouší modelovat rozhodovací proces jednotlivce nebo segmentu v určitém kontextu. Výběrové modelování lze také použít k odhadu netržních environmentálních přínosů a nákladů.

Dobře specifikované výběrové modely jsou někdy schopny s určitou přesností předpovědět, jak by jednotlivci reagovali v konkrétní situaci. Na rozdíl od ankety nebo průzkumu jsou predikce schopny provádět velké množství scénářů v rámci kontextu v řádu mnoha bilionů možných scénářů.

Modelování výběru je některými považováno za nejpřesnější a nejobecnější nástroj, který je v současnosti k dispozici pro vytváření některých pravděpodobnostních předpovědí o určitém lidském rozhodovacím chování.[citace nutná] V ekonometrii, marketingu, sociometrii a dalších oblastech existuje mnoho alternativ, včetně maximalizace užitkovosti, optimalizace aplikované na spotřebitelskou teorii a nepřeberné množství dalších identifikačních strategií, které mohou být více či méně přesné v závislosti na datech, vzorku, hypotéze a konkrétním rozhodnutí, které je modelováno. Modelování výběru je navíc považováno za nejvhodnější metodu pro odhad ochoty spotřebitelů platit za zlepšení kvality ve více dimenzích. Nobelova cena za ekonomii byla udělena hlavnímu představiteli teorie modelování výběru Danielu McFaddenovi.

Související podmínky pro výběr modelování

Existuje řada termínů, které jsou buď podmnožinou, součástí procesu nebo definicí, nebo se překrývají s jinými oblastmi ekonometrie, které lze obecně nazvat Choice Modelling. Stejně jako u každé nově vznikající technologie existují různé nároky na správný slovník.

Modelování bylo vyvíjeno paralelně ekonomy a kognitivními psychology. Počátky modelování výběru lze vystopovat k Thurstonovu výzkumu preferencí potravin ve dvacátých letech a k teorii náhodného užitku.

Každé rozhodnutí do určité míry zahrnuje volbu. Jednotlivci si vybírají mezi různými alternativami; dojíždějící si vybírají mezi alternativními trasami a způsoby dopravy, nakupující si vybírají mezi konkurenčními výrobky pro jejich atributy, jako je cena, kvalita a množství.

Modelování výběru předpokládá, že s lidskou volbou existuje základní racionální rozhodovací proces a že tento proces má funkční formu. V závislosti na behaviorálním kontextu může být vybrána konkrétní funkční forma jako kandidát pro modelování tohoto chování. Forma multinomiálního logitu nebo MNL modelu se běžně používá, protože je dobrým přiblížením k ekonomickému principu maximalizace užitkovosti. To znamená, že lidské bytosti se snaží maximalizovat svou celkovou užitkovost. Forma multinomiálního logitu popisuje celkovou užitkovost jako lineární sčítání (nebo odčítání) komponentových utilit v kontextu. Jakmile je funkční forma rozhodovacího procesu stanovena, mohou být parametry konkrétního modelu odhadnuty z dostupných údajů pomocí mnohonásobné regrese, v případě MNL. Mohou být použity nebo kombinovány jiné funkční formy, jako binární logit, probit nebo EBA s příslušnými statistickými testy pro určení, zda je model vhodný pro sadu podržte dat.

Doporučujeme:  Paul E. Meehl

Metody používané při modelování výběru

Výběrové modelování zahrnuje řadu specifických technik, které přispívají k jeho síle. Některé nebo všechny z nich mohou být použity při konstrukci výběrového modelu.

Pro konvergenci modelů, a tedy pro odhad parametrů, je často nutné, aby data měla malou nebo žádnou kolineárnost. Důvody pro to mají více co do činění s teorií informací než s čímkoli jiným. Abychom pochopili, proč tomu tak je, vezměme si následující příklad:

Představte si autosalon, který prodává jak luxusní auta, tak ojetá vozidla nižší třídy. S využitím principu maximalizace užitkovosti a modelové formy MNL předpokládáme, že rozhodnutí o koupi vozu u tohoto autosalonu je součtem individuálního příspěvku každého z následujících k celkové užitkovosti.

Použití multinomiální regrese na prodejních datech nám však neřekne to, co chceme vědět. Důvodem je, že velká část dat je kolineární, protože auta na tomto autosalonu jsou buď:

Tyto typy dat, údaje o prodeji, jsou známy jako údaje o odhalených preferencích, neboli údaje o RP, protože data „odhalují“ základní preference pro automobily. Můžeme odvodit něčí preference prostřednictvím jejich jednání, tj. auta, které si skutečně koupil. Veškeré dolování dat využívá data o RP. Data o RP jsou náchylná ke kolinearitě, protože data jsou fakticky z divokého světa reality. Přítomnost kolinearity znamená, že chybí informace, protože jeden nebo více kolineárních faktorů je nadbytečných a nepřidává žádné nové informace. Tato slabina dolování dat spočívá v tom, že kritická chybějící data, která mohou vysvětlovat volby, nejsou jednoduše nikdy pozorována.

Zajistit, aby sledované atributy byly ortogonální, můžeme filtrováním dat RP za účelem odstranění korelací. To nemusí být vždy možné, nicméně při použití metod uvedených preferencí lze ortogonálnost zajistit vhodnou konstrukcí experimentálního návrhu.

Za účelem maximalizace informací shromážděných v rámci Stated Preference Experiments je použit experimentální návrh (níže). Experimentální návrh v rámci Choice Experiment je striktní schéma pro kontrolu a prezentaci hypotetických scénářů, neboli výběrových sad pro respondenty. Pro stejný experiment mohou být použity různé návrhy, každý s jinými vlastnostmi. Nejlepší návrh závisí na cílech cvičení.

Je to experimentální design, který řídí experiment a konečné schopnosti modelu. Ve veřejné sféře existuje mnoho velmi efektivních designů, které umožňují provádět téměř optimální experimenty.

Například latinský čtverec 1617 umožňuje odhadnout všechny hlavní efekty výrobku, který by mohl mít až 1617 (přibližně 295 následovaných osmnácti nulami) konfigurací. Toho by navíc mohlo být dosaženo v rámci vzorku pouze přibližně 256 respondentů.

Níže je příklad mnohem menšího designu. Jedná se o 34 hlavních efektů.

Doporučujeme:  Fetus

Tato konstrukce by umožnila odhadnout hlavní efekty utilit z 81 (34) možných konfigurací produktů. Vzorek přibližně 20 respondentů by mohl modelovat hlavní efekty všech 81 možných konfigurací produktů se statisticky významnými výsledky.

Několik příkladů dalších běžně používaných experimentálních návrhů:

Více informací o experimentálních návrzích naleznete zde.

Významným pokrokem v modelování výběru bylo využití dat Stated Preference. S daty RP jsme v rozmaru vzájemně propojené povahy reálného světa. S daty SP, protože se přímo ptáme lidí na jejich preference pro produkty a služby, máme také volnost konstruovat samotné produkty tak, jak si přejeme, aby je hodnotili.

To umožňuje velkou volnost v tvůrčí konstrukci mnoha nepravděpodobných, ale věrohodných hypotetických produktů. Také to umožňuje úplnou ochranu proti kolinearitě prostřednictvím experimentálního designu.

Kdybychom místo použití údajů o prodeji RP jako v předchozím příkladu ukazovali respondentům různá auta a ptali se
„Koupili byste si toto auto?“, mohli bychom modelovat stejná data. Nicméně místo prostého použití aut, která jsme skutečně prodali, jsme si dovolili svobodu vytvářet hypotetická auta, mohli bychom uniknout problémům kolinearity a objevit skutečné užitné vlastnosti pro atributy značky, původu a výkonu. To je známé jako experiment volby.

Lze například vytvořit následující nepravděpodobné, jakkoli věrohodné scénáře.

Teorie informací nám říká, že soubor dat vytvořený z tohoto cvičení by přinejmenším umožnil diskriminaci mezi „původem“ jako faktorem výběru.

Formálnější odvození vhodného experimentálního návrhu by následně zajistilo, že žádné atributy nejsou kolineární, a tudíž by zaručilo, že ve shromážděných údajích je dostatek informací pro identifikaci všech atributových efektů.

Vzhledem k tomu, že jednotlivci nemusejí při odpovědích na průzkum podepírat své volby skutečnými závazky, chovali by se do jisté míry nedůsledně, pokud by se situace skutečně stala, což je společný problém všech metod SP.

Protože jsou však modely výběru Scale Invariant, je tento efekt ekvivalentní pro všechny odhady a žádný individuální odhad není zkreslený vzhledem k jinému.

Modely SP mohou být proto přesně škálovány se zavedením Scale Parameters z pozorování reálného světa, což přináší poměrně přesné prediktivní modely.

Preference jako volitelné kompromisy

Je již dlouho známo, že prosté požádání lidských bytostí, aby ohodnotily nebo vybraly svou preferovanou položku ze skalárního seznamu, obecně nepřinese více informací než fakt, že lidské bytosti chtějí všechny výhody a žádné náklady. Výše uvedené cvičení, pokud by bylo provedeno jako kvantitativní průzkum, by nám řeklo, že lidé by preferovali vysoce výkonná auta bez nákladů. Teorie informací nám opět říká, že zde nejsou žádné informace specifické pro daný kontext.

Doporučujeme:  Bayesovo pravidlo

Místo toho experiment s výběrem vyžaduje, aby jednotlivci byli nuceni učinit kompromis mezi dvěma nebo více možnostmi, někdy také umožňuje jako platnou odpověď „žádné nebo ani jedno“. Tato prezentace alternativ vyžaduje, aby alespoň někteří respondenti porovnávali: levnější automobil s nižším výkonem oproti dražšímu vozu s vyšším výkonem. Tento údaj poskytuje klíčové chybějící informace nezbytné k oddělení a nezávislému měření užitečnosti výkonu a ceny.

Odběr vzorků a přidělování bloků

Typické výstupy z výběrového modelu jsou:

Výběrové modelování v praxi

Experiment výběru se na první pohled podobá průzkumu trhu; respondenti jsou najímáni k vyplnění průzkumu, data jsou shromažďována a data jsou analyzována. Experiment výběru však od dotazníku odlišují dva kritické kroky:

Samotný Choice Experiment může být proveden pomocí papíru a pera, nicméně stále více je používáno on-line médium, protože má oproti manuálnímu procesu mnoho výhod, včetně nákladů, rychlosti, přesnosti a schopnosti provádět složitější studie, jako jsou ty, které zahrnují multimediální nebo dynamickou zpětnou vazbu.

Silné stránky výběru modelování

Výběrové modelování versus tradiční kvantitativní průzkum trhu

Výběr Experimenty mohou být použity téměř ve všech případech, kdy je třeba stanovit přesný odhad současných a budoucích lidských preferencí.

Mnoho dalších technik průzkumu trhu se pokouší využít hodnocení a žebříčků k získání informací o preferencích.

Hlavní problémy s hodnocením otázky, které se nevyskytují u Choice Models jsou:

Žebříček zavádí do odpovědi prvek kompromisu, protože žádné dvě položky nemohou zaujímat stejné pořadí. Přednost pořadí je zachycena; relativní význam však nikoli.

Výběrové modely však těmito problémy netrpí a navíc jsou schopny poskytnout přímé numerické předpovědi o pravděpodobnosti, že se jedinec rozhodne pro konkrétní volbu.

Maximální škálování rozdílu

Maximum Difference Preference Scaling (nebo MaxDiff, jak je obecně známo) je dobře hodnocenou alternativou k hodnocení a hodnocení. Žádá lidi, aby si z řady alternativ vybrali nejvíce a nejméně preferované možnosti. Integrací napříč pravděpodobnostmi výběru lze skóre užitečnosti pro každou alternativu odhadnout na intervalové stupnici.

Výběrové modelování je užitečné zejména pro:

Výběrové modelování je standardní technikou v modelování poptávky po cestování. Klasickým odkazem jsou Ben Akiva a Lerman (1989) , a Cascetta (2009)  ; novější metodický vývoj je popsán ve Vlaku (2003) .

Rané aplikace teorie diskrétní volby do marketingu jsou popsány v Anderson et. al. (1992)

Poslední vývoj zahrnuje bayesovský přístup k modelování diskrétní volby, jak je uvedeno v Rossi, Allenby a McCulloch (2009)