Bildning, Vetenskap

Logistisk regression: modeller och metoder

и дискриминантного анализа используются тогда, когда необходимо четко дифференцировать респондентов по целевым категориям. Logistisk regression och diskriminantanalys används när det är nödvändigt att tydligt skilja de tillfrågade riktade kategorier. Dessutom är dessa grupper är en enda univariata parameternivåer. а также выясним, для чего она нужна. Överväga ytterligare detalj logistisk regressionsmodell, samt ta reda på vad det var för.

översikt

, может выступать классификация респондентов по группам покупающих и не покупающих горчицу. Ett exempel på problemet, i lösningen som används logistisk regression, kan vara en klassificering av de svarande från gruppen köper och inte köpa senap. Differentieringen utförs enligt socio demografiska egenskaper. Hit hör bland annat ålder, kön, antal familjemedlemmar, inkomst och så vidare. Det finns kriterier för att differentiera och variabeln i verksamheten. Den senare kodar målkategori som i själva verket behöver dela svarande.

nyanser

, значительно уже, чем для дискриминантного анализа. Det måste sägas att de olika fall där de tillämpade regressions logistik, mycket smalare än den diskriminantanalys. I detta avseende är användningen av den senare som en universell metod för differentiering anses mer föredraget. Dessutom rekommenderar experter börjar med en klassificering studie diskriminerande analys. Och ifall osäkerhet för resultaten kan användas logistisk regression. Denna nödvändighet beror på flera faktorer. используется при наличии четкого представления о типе независимых и зависимых переменных. Logistisk regression används när det finns en klar uppfattning om vilken typ av oberoende och beroende variabler. Följaktligen den valda av de 3 möjliga förfaranden. När diskriminantanalys är forskaren alltid att göra med en statisk operation. Det involverade en beroende och flera oberoende kategoriska variabler med omfattningen av något slag.

typer

, состоит в определении вероятности того, что определенный респондент будет отнесен к той или иной группе. Mål statistisk forskning, som använder en logistisk regression, är att bestämma sannolikheten att en viss respondent kommer att tilldelas en viss grupp. Differentieringen utförs enligt vissa parametrar. I praktiken, i enlighet med de värden av en eller flera oberoende faktorer kan klassificeras i två grupper av svarande. . I det här fallet finns det en binär logistisk regression. Även specificerade parametrar kan användas vid fördelningen till gruppen är större än två. I en sådan situation finns det en multinomial logistisk regression. Den resulterande gruppen uttryckte nivåer av något variabel.

exempel

Antag att det finns respondenternas svar på frågan om de är intresserade av ett erbjudande att förvärva mark i en förort till Moskva. I detta fall, alternativen är "nej" och "ja". Vi måste ta reda på vilka faktorer som har en dominerande inflytande på beslut av potentiella köpare. För denna respondent frågor ställs om infrastrukturen i området, avståndet till huvudstaden, landareal, närvaro / frånvaro av bostadshus och så vidare. Med hjälp av binära regression, kan fördelas i två grupper av svarande. Den första kommer att omfatta dem som är intresserade av att köpa - potentiella köpare, och den andra, respektive de som inte är intresserade av ett sådant erbjudande. För varje respondent, dessutom kommer det att beräknas sannolikheten för uppdraget att en eller annan kategori.

jämförande egenskaper

Till skillnad från de två utföringsformerna ovan består i ett annat antal och typ av grupper som är beroende och oberoende variabler. I en binär regression, till exempel, studerade beroendet dichotomous faktorn från en eller flera oberoende villkor. I detta fall kan de senare vara av någon typ av skalan. Multinomial regression anses vara en sorts version av klassificeringen. Den hänför sig till den beroende variabeln i mer än 2 grupper. Oberoende faktorer måste ha antingen en ordnings eller nominell skala.

Logistisk regression i SPSS

Den statistiska paket 11-12, infört en ny version av analysen - sekvensen. Denna metod används när det är beroende faktorn hänför sig till samma namn (ordinal) skala. I detta fall väljs de oberoende variablerna en viss typ. De måste vara antingen ordnings eller nominellt. Klassificering i flera kategorier anses vara den mest mångsidiga. Denna metod kan användas i alla studier som använde logistisk regression. , однако, можно только с помощью всех трех приемов. Förbättra kvaliteten på modellen är dock endast möjligt genom att använda alla tre metoderna.

ordnings klassificering

Det sägs att tidigare i det statistiska paketet inte ges möjlighet att utföra en typisk specialiserad analys för beroende faktorer med en ordningsskala. För alla variabler, med antalet grupper på mer än 2 används multinomial alternativ. Infördes relativt nyligen sekvensanalys har ett antal funktioner. De tar hänsyn till detaljerna i skalan det. часто не рассматривается как отдельный прием. Under tiden i de metodologiska manualer ordinal logistisk regression ofta inte behandlas som en separat mottagning. Anledningen är enligt följande: serieanalys har inte några betydande fördelar jämfört multinomial. Forskaren kan mycket väl använda den senare i närvaro och ordnings, och nominell beroende variabeln. På så sätt, klassificeringsprocessen är nästan omöjlig att skilja från varandra. Detta innebär att innehavet för analysen inte kommer att orsaka några problem.

analys av alternativ

Betrakta det enkla fallet - en binär regression. Till exempel i processen för marknadsundersökningar beräknas efterfrågan på akademiker av vissa Metropolitan University. I enkäten fick de svarande frågor, bland annat:

Arbetar du? (Ql).
Ange år examen (q 21).
Vad är den genomsnittliga poängen för utloppet (aver).
Kön (q22).

позволит оценить воздействие независимых факторов aver, q 21 и q 22 на переменную ql. Logistisk regression kommer att utvärdera effekterna av oberoende faktorer aver, q 21 och q 22 vid variabel ql. Enkelt uttryckt, är syftet med analys för att fastställa den sannolika anställning av utexaminerade på grundval av uppgifter på fältet, i slutet av året, och den genomsnittliga poängen.

logistisk regression

För att ställa in parametrar med binär regression använder Analyze►Regression►Binary Logistic menyn. I Logistic Regression att välja i den vänstra listan över tillgängliga variabler beroende faktor. De är ql. Denna variabel måste placeras i den beroende fält. Efter det måste du ange webbplatsen Covariates oberoende faktorer - q 21 q 22, aver. Då måste du välja ett sätt att inkludera dem i analysen. Om antalet oberoende faktorer på mer än två, inte använda metoden för samtidig administrering av alla variabler, som installeras som standard, och steg för steg. De mest populära sättet anses bakåt: LR. Med hjälp av Select knappen kan du inte inkludera i studien av alla svarande, och endast ett specifikt mål kategori.

Definiera kategoriska variabler

Kategorisk för att använda i fallet när en av variablerna har fått betyget antalet kategorier av mer än två. I denna situation, Definiera kategoriska variabler fönster i det kategoriska Covariates station placeras just en sådan möjlighet. I detta exempel, är en sådan variabel saknas. Efter att listrutan väljer posten Contrast Avvikelse och klicka på knappen Ändra. Som ett resultat, kommer en del av de beroende variablerna alstras från var och en av märk faktor. Deras antal motsvarar antalet av de ursprungliga villkoren för kategorierna.

Spara nya variabler

Använd knappen Spara i huvudstudien är inställd på att skapa nya inställningar dialogrutan. De kommer att innehålla siffror beräknas i processen för regression. I synnerhet är det möjligt att skapa variabler som avgör:

Att tillhöra en viss kategori av klassificering (Groupmembership).
Sannolikheten för att klassificera de svarande i varje studiegrupp (Sannolikheter).

Vid användning av knappen Alternativ forskaren inte får några betydande möjligheter. Således kan den ignoreras. När du trycker på "OK" -knappen i huvudfönstret visas analysresultat.

Kvalitetskontroll av logistisk regression tillräcklighet

Tänk på tabell Omnibus Testsof Modell koefficienter. Det visar resultatet av analysen av kvaliteten på tillnärmning modell. På grund av det faktum att den inkrementella alternativet, måste du titta på resultaten av den sista etappen (Steg 2) har ställts in. Skulle anses vara ett positivt resultat, i vilket den detekterade ökningen Chi-index i övergången till nästa steg i hög grad av signifikans (Sig. <0,05). Kvaliteten på modellen beräknas i Model linje. Om du får ett negativt värde, men det är inte anses vara betydande om den totala hög materiamodellen, den sista kan vara praktiskt användbar.

tabeller

Modell Sammanfattning ger en uppskattning av den totala spridningsindex, som beskriver den konstruerade modellen (figur R Square). Det rekommenderas att tillämpa värdet Nagelker. Positiv indikator kan betraktas som en parameter Nagelkerke R Square, om den är högre än 0,50. Efter som utvärderade resultaten av klassificeringen i vilken de verkliga indikatorerna på tillhör en eller en annan kategori av studien jämförs med de som förutsägs av regressionsmodellen. För detta ändamål tabellen Klassificering tabell. Det gör också att du kan dra slutsatser om riktigheten av differentiering för var och en av den aktuella gruppen. . Nedanstående tabell gör det möjligt att hitta statistiskt signifikanta oberoende faktorer ingått analysen samt en icke-standardiserad faktor logistisk regression. På grundval av dessa indikatorer kan förutsäga tillhörighet för varje respondent i provet till en specifik grupp. Nya variabler kan anges med knappen Spara. De kommer att innehålla information om tillhörighet till en viss klassificering kategori (Predictedcategory) och sannolikheten för att ingå i dessa grupper (Predicted sannolikheter medlemskap). När du trycker på "OK" -knappen i huvudfönstret visas Multinomial logistisk regressionsberäkningsresultat.

Den första tabellen, som innehåller viktiga indikatorer för forskaren, - Model Fitting information. En hög nivå av statistisk signifikans kommer att peka på den höga kvaliteten och lämpligheten att använda modeller för att lösa praktiska problem. En annan viktig tabellen är Pseudo R-Square. Den tillåter dig att uppskatta hur stor andel av den totala variansen i den beroende faktorn, som orsakas av de oberoende variablerna som valts ut för analys. Enligt tabell sannolikhetsförhållandet Tester kan dra slutsatser om den statistiska signifikansen av den senare. Parametern Uppskattningar speglar icke-standardiserade koefficienter. De används i konstruktionen av ekvationen. Dessutom, för varje kombination av variabler bestäms den statistiska signifikansen av deras inverkan på den beroende faktor. Samtidigt är marknadsundersökningar ofta nödvändigt att skilja de kategorier av svarande inte separat, utan som en del av målgruppen. För detta ändamål tabellen Observedand Förväntade frekvenser.

praktisk tillämpning

Anses analysmetod används i stor utsträckning i arbetet med handlare. År 1991 var sigmoid logistisk regression indikatorn utvecklas. Han är en enkel att använda och effektivt verktyg som kan användas för att förutsäga de sannolika priser till deras "överhettning". Indikator presenteras på ett diagram i form av en kanal som bildas av två linjer som sträcker sig parallellt. De bort lika avstånd från trenden. Bredden på korridoren beror enbart på tidsram. Indikatorn används när man arbetar med nästan alla tillgången - från valutapar till ädelmetaller.

I praktiken producerade 2 viktiga strategier för användning av instrumentet: sammanbrott och en omsvängning. I det senare fallet att näringsidkaren kommer att fokusera på dynamiken i prisändringar i kanalen. På är sannolikheten att rörelsen börjar i motsatt riktning när den närmar sig kostnaden för ett stöd eller motstånd linje hastighet. Om priset är tätt passar till den övre gränsen, då tillgången kan elimineras. Om det är på den nedre gränsen, bör du tänka på att köpa. Strategi uppdelning innebär användning av teckningsoptioner. De installeras utanför gränserna för den relativt korta avstånd. Med hänsyn till att priset i vissa fall bryta mot dem för en kort tid, bör du spela säkert och ställa in stop-loss. Samtidigt, naturligtvis, oavsett den valda strategin kräver näringsidkaren att maximera kyligt uppfatta och bedöma den situation som har uppstått på marknaden.

slutsats

Således användningen av logistisk regression kan du snabbt och enkelt kategorisera de svarande i kategorier i enlighet med de angivna parametrarna. Vid analys av den möjliga användningen av ett visst sätt. I synnerhet mångsidigheten hos olika multinomial regression. Men experter rekommenderar användningen av alla de ovan beskrivna metoderna i komplexet. Detta beror på det faktum att kvaliteten på modellen i detta fall kommer att vara betydligt högre. Detta i sin tur öka utbudet av dess tillämpning.

Bildning, Vetenskap

Logistisk regression: modeller och metoder

översikt

nyanser

typer

exempel

jämförande egenskaper

Logistisk regression i SPSS

ordnings klassificering

analys av alternativ

logistisk regression

Definiera kategoriska variabler

Spara nya variabler

Kvalitetskontroll av logistisk regression tillräcklighet

tabeller

praktisk tillämpning

slutsats

Similar articles

Bildning

Bildning

Bildning

Bildning

Bildning

Bildning

Trending Now

Mat och dryck

Traveling

Lag

Hälsa

Hem och familj

Konst och underhållning

Newest

Hälsa

Nyheter och Samhälle

Hälsa

Sport och Fitness

Mat och dryck

Hem och familj