muzruno.com

Логистична регресия: модел и методи

Методи на логистична регресия

и дискриминационен анализ се използват, когато е необходимо ясно да се разграничат респондентите по целеви категории. В този случай самите групи са представени от нивата на един единствен непроменлив параметър. Нека разгледаме подробно модел на логистична регресия, и да разберете защо е необходимо.регресия логистика

Обща информация

Пример за проблем, в чието решение регресия логистика, може да бъде класификация на респондентите по групи, които купуват и не купуват горчица. Диференцирането се извършва в съответствие със социално-демографските характеристики. Сред тях, по-специално, включват възраст, пол, брой роднини, доходи и др. В операциите има критерии за диференциация и променливост. Последният кодира целевите категории, които всъщност трябва да разделят респондентите.

нюанси

Трябва да се отбележи, че обхватът на случаите, в които регресия логистика, много по-тесен, отколкото за дискриминационния анализ. В това отношение използването на последния като универсален метод на диференциация се счита за предпочитано. Освен това експертите препоръчват да се започнат класификационни проучвания с дискриминационен анализ. И само в случай на несигурност за резултатите можем да използваме логистична регресия. Тази необходимост се дължи на някои фактори. Логистична регресия Той се използва, когато има ясна представа за вида независими и зависими променливи. В съответствие с това се избира една от трите възможни процедури. С дискриминационния анализ изследователят винаги се занимава с една статична операция. Тя включва една зависима и няколко независими категорични променливи с мащаб от всякакъв вид.

видове

Задачата на статистическите изследвания, която използва регресия логистика, е да се определи вероятността определен респондент да бъде определен за определена група. Диференцирането се извършва съгласно определени параметри. На практика, според стойностите на един или няколко независими фактора, е възможно да се класифицират респондентите в две групи. В този случай, двойна логистична регресия. Също така, посочените параметри могат да се използват за разпределяне на групи, които са повече от две. В тази ситуация съществува многонационална логистична регресия. Получените групи се изразяват чрез нивата на единична променлива. логистична регресия

пример

Да предположим, че има отговори на анкетираните на въпроса дали се интересувате от предложение за придобиване на земя в покрайнините на Москва. Опциите са "не" и "да". Необходимо е да се разбере кои фактори оказват основно влияние върху решението на потенциалните купувачи. За тази респондент се задават въпроси за инфраструктурата на територията, разстоянието до столицата, площ земя, наличие / отсъствие на жилищни сгради и др. Използването на двоичен регресия, могат да бъдат разпределени в две групи респонденти. Първият ще включват тези, които се интересуват от закупуване - потенциални купувачи, а втората, съответно, тези, които не се интересуват от такава оферта. Освен това за всеки от респондентите се изчислява вероятността да бъдат определени в дадена категория.

Сравнителни характеристики

Разликата от споменатите по-горе два варианта се състои в различен брой групи и вида зависими и независими променливи. При двойната регресия например се изследва зависимостта на дихотомния фактор от едно или повече независими условия. Последният може да има някакъв тип мащаб. Multinomial regression се счита за вариация на тази опция за класификация. В нея към зависимата променлива има повече от 2 групи. Независимите фактори трябва да имат равен или номинален обхват.

Логистична регресия в spss

В статистическия пакет 11-12 беше въведена нова версия на анализа: последователна. Този метод се използва в случаите, когато зависимият фактор се отнася до същата (поредна) скала. В този случай се избират независими променливи от един специфичен тип. Те трябва да бъдат комендарни или номинални. Класификацията по няколко категории се счита за най-универсална. Този метод може да се използва във всички проучвания, в които е направена логистична регресия. Подобрете качеството на модела, Това обаче е възможно само с помощта на трите техники. качествен контрол на адекватността и логистичната регресия

Класификация по ред

Струва си да се отбележи, че по-рано в статистическия пакет не е била предоставена типична възможност за извършване на специализиран анализ за зависими фактори с нормален мащаб. За всички променливи с броя на групите, по-големи от 2, е използван многоинтомният вариант. Представеният сравнително наскоро координатен анализ има редица характеристики. Те отчитат спецификата на скалата. Междувременно в методологическите наръчници, наредбата логистична регресия често не се разглежда като отделно устройство. Това се дължи на следното: системният анализ няма значителни предимства пред многоиндустрията. Изследователят може да използва последния, ако има както нормална, така и номинална зависима променлива. В същото време, самите класификационни процеси не се различават много от всеки друг. Това означава, че извършването на системен анализ няма да причини никакви трудности.

Възможност за анализ

Помислете за един прост случай - двоична регресия. Да предположим, че в процеса на маркетингови изследвания се оценява релевантността на завършилите определен университет в столицата. В анкетата на запитаните бяха зададени въпроси, сред които:

  1. Работите ли? (Ql).
  2. Посочете годината на завършване (р 21).
  3. Каква е средната стойност на дипломирането (средно).
  4. Секс (q22).

Логистична регресия ще ни позволи да оценим ефекта на независимите фактори aver, q 21 и q 22 върху променливата ql. Просто казано, целта на анализа ще бъде да се определи вероятната заетост на завършилите въз основа на информация за областта, годината на завършване и средния резултат. логистичен сигмоиден регресионен индикатор

Логистична регресия

За да зададете параметри чрез двоична регресия, използвайте менюто Analyze►Regression►Binary Logistic. В прозореца Логистична регресия трябва да изберете зависимия фактор в левия списък с наличните променливи. Той е QL. Тази променлива трябва да бъде поставена в полето "Зависимо". След това трябва да се въведат независими фактори на територията на Ковариатите - q 21, q 22, aver. След това трябва да изберете начин да ги включите в анализа. Ако броят на независимите фактори е по-голям от 2, тогава методът за едновременно въвеждане на всички променливи, който е инсталиран по подразбиране, но не е използван стъпка по стъпка. Най-популярният начин се счита за Назад: LR. С помощта на бутона Избор не можете да включите всички участници в проучването, а само определена целева категория.

Определете категорични променливи



Бутонът "Категоричен" трябва да се използва, когато една от независимите променливи е номинална и броят на категориите е по-голям от 2. В тази ситуация, в прозореца Дефиниране на категорични променливи, този параметър се поставя в раздела Категорични ковариати. В този пример няма такава променлива. След това в падащия списък на контраста изберете Отклонение и натиснете бутона Промяна. В резултат на това от всеки номинален фактор ще се формират няколко зависими променливи. Техният брой отговаря на броя на категориите на първоначалното състояние.

Запазване на нови променливи

С помощта на бутона "Запазване" създавате нови параметри в главния диалогов прозорец за изследване. Те ще съдържат показатели, изчислени в процеса на регресия. По-специално, можете да създадете променливи, които дефинират:

  1. Принадлежащи към определена категория класификация (Groupmemshy-bership).
  2. Вероятността да се отдава респондент на всяка група от проучвания (вероятности).

Когато използвате бутона "Опции", изследователят не получава никакви съществени функции. Съответно, тя може да бъде игнорирана. След като кликнете върху бутона "OK", резултатите от анализа ще бъдат показани в главния прозорец. логистичен регресионен коефициент

Контрол на качеството на адекватността и логистичната регресия

Обърнете внимание на таблицата "Омнибус тестови модели на коефициенти". Показва резултатите от анализа на качеството на приблизителното моделиране. Във връзка с факта, че е зададена поетапна версия, е необходимо да се погледнат резултатите от последния етап (стъпка 2). Положителният резултат ще бъде считан за такъв, че се установява увеличение на индикатора Chi-square по време на прехода към следващия етап с висока степен на значимост (Sig. < 0.05). Качеството на модела се оценява в моделната линия. Ако се получи отрицателна стойност, но не се счита за значима при общата важност на модела, тя може да се счита за практически полезна.

маси

Обобщението на модела дава възможност да се оцени индексът на агрегираната вариация, описан от конструирания модел (индикаторът R Square). Препоръчва се да се използва стойността на Nagelker. Положителният индикатор е параметърът Nagelkerke R Square, ако е над 0.50. След това се оценяват резултатите от класификацията, при които реалните индекси на принадлежност към една или друга от изследваните категории се сравняват с тези, прогнозирани въз основа на регресионния модел. За тази цел използвайте таблицата за класификация. Той също така позволява да се правят изводи за правилността на диференциацията за всяка разглеждана група. логистичен модел на регресия Следващата таблица дава възможност да се изясни статистическата значимост на независимите фактори, въведени в анализа, както и всяка нестандартизирана логистичен регресионен коефициент. Въз основа на тези показатели е възможно да се предскаже принадлежността на всеки от респондентите в извадката към определена група. С помощта на бутона "Запазване" можете да въведете нови променливи. Те ще съдържат информация за принадлежност към определена категория класификация (Preshy-dictedcategory) и вероятността за включване в тези групи (Изчислена членство вероятности). След като кликнете върху "OK", резултатите от изчисленията се показват в главния прозорец на Multinomial Logistic Regression.

Първата таблица, в която съществуват важни показатели за изследователя, е Моделът за монтаж на информация. Високото ниво на статистическа значимост ще покаже високото качество и пригодността за използване на модела при решаване на практически проблеми. Друга важна маса е Pseudo R-Square. Това ни позволява да изчислим дела на общата вариация в зависимия фактор, който се определя от независимите променливи, избрани за анализа. Съгласно таблицата Тестове за вероятността, можете да направите изводи за статистическата значимост на последните. В параметърните оценки се отразяват нестандартизирани коефициенти. Те се използват в конструкцията на уравнението. Освен това за всяка комбинация от променливи е определена статистическата значимост на техния ефект върху зависимия фактор. Междувременно при маркетинговите проучвания често е необходимо да се прави разлика по категории от респондентите, не поотделно, а като част от целевата група. За тази цел използвайте таблицата Observedand Predicted Frequencies.

Практическо приложение

Този метод на анализ се използва широко в работата на търговците. През 1991 г. беше разработен индикатор за логистична сигмоидна регресия. Това е лесен за използване и ефективен инструмент, с който можете да предскажете вероятните цени, преди те да "прегреят". Индикаторът е представен на графиката под формата на канал, образуван от две успоредни линии. Те са еднакво отдалечени от тенденцията. Ширината на коридора ще зависи единствено от времевата рамка. Индикаторът се използва при работа с почти всички активи - от валутни двойки до благородни метали.

логистична регресия в spss

На практика бяха разработени две ключови стратегии за прилагането на инструмента: по разбивка и на търна. В последния случай търговецът ще се ръководи от динамиката на промяната на цените в канала. Тъй като цената се приближава до линията на подкрепа или съпротива, залогът се прави въз основа на вероятността движението да започне в обратна посока. Ако цената се приближи към горната граница, активът може да бъде изхвърлен. Ако е в долната граница, тогава си заслужава да се замислим за придобиването. Стратегията за разбивка включва използването на поръчки. Те са разположени извън границите на относително малко разстояние. Като се има предвид, че цената в много случаи ги нарушава за кратко време, трябва да бъдете презастраховани и да инсталирате стоп-загуба. В същото време, разбира се, независимо от избраната стратегия, търговецът трябва да бъде възможно най-хладен и хладен, за да възприеме и оцени ситуацията, която е възникнала на пазара.

заключение

По този начин използването на логистична регресия ви позволява бързо и лесно да класифицирате респондентите в категории в съответствие с определени параметри. В анализа можете да използвате всеки конкретен метод. По-специално, многоиндиалната регресия е гъвкава. Експертите обаче препоръчват използването на всички гореописани методи в комплекса. Това се дължи на факта, че в този случай качеството на модела ще бъде много по-високо. Това от своя страна ще разшири обхвата на приложението си.

Споделяне в социалните мрежи:

сроден