Метод на корелационния анализ: пример. Анализът на корелацията е ...
Изследването, често е необходимо да се намери връзката между продуктивни и факторни променливи (добив всяка култура и валежи, височината и теглото на човек в хомогенни групи в зависимост от пола, възрастта, сърдечната честота и телесната температура и т.н.).
съдържание
- Концепцията за корелационен анализ
- Концепцията за фалшивост на корелацията
- Проблемите на корелационния анализ
- Корелацията между корелационния анализ и регресията
- Условия за ползване
- Правила за избиране на коефициентите на корелационен анализ
- Показване на резултатите
- Триизмерно представяне на схемата за разсейване (разсейване)
- Оценка на плътността на комуникацията
- Пример за прилагането на метода на корелационния анализ
- Използване на софтуер за провеждане на корелационен анализ
- В заключение
Втората са признаците, които допринасят за промяната на свързаните с тях (първата).
Концепцията за корелационен анализ
Има много определения на термина. Изхождайки от гореизложеното, може да се каже, че корелационният анализ е метод, използван за тестване на хипотезата за статистическата значимост на две или повече променливи, ако изследователят може да ги измери, но не и да ги промени.
Съществуват и други дефиниции на разглежданото понятие. Анализът на корелацията е метод за обработка на статистически данни, който се състои в изследване на корелационните коефициенти между променливите. Това сравнява корелационните коефициенти между една двойка или набор от двойки от характеристики, за да се установят статистически взаимоотношения между тях. Корелационният анализ е метод за изследване на статистическата зависимост между случайни променливи с незадължително присъствие на строг функционален характер, при който динамиката на една произволна променлива води до динамиката на математическото очакване на другата.
Концепцията за фалшивост на корелацията
При извършването на корелационния анализ е необходимо да се има предвид, че това може да се извърши по отношение на всеки набор от характеристики, често абсурдни един спрямо друг. Понякога нямат причинно-следствена връзка помежду си.
В този случай те говорят за фалшива връзка.
Проблемите на корелационния анализ
Изхождайки от горните определения, можем да формулираме следните проблеми на описания метод: да получим информация за една от неизвестните променливи с помощта на друга, за да определим тежестта на връзката между изследваните променливи.
Анализът на корелацията включва определяне на връзката между изследваните признаци и следователно задачите на корелационния анализ могат да бъдат допълнени със следното:
- идентифициране на факторите, които оказват най-голямо влияние върху резултата;
- идентифициране на неизяснени преди това причини за връзки;
- изграждането на модел на корелация с неговия параметричен анализ;
- изследване на значението на комуникационните параметри и тяхното интервално изчисление.
Корелацията между корелационния анализ и регресията
Методът на корелационния анализ често не се ограничава до откриването на стягането на връзката между изследваните количества. Понякога се допълва чрез изтегляне на регресия уравнения са получени чрез анализиране на същото име и описание представлява връзка между функцията (ите) на получения и фактор (фактор). Този метод, заедно с разглеждания анализ, е методът на корелационно-регресионен анализ.
Условия за ползване
Ефективните фактори зависят от един до няколко фактора. Методът на корелационния анализ може да бъде използван, ако има голям брой наблюдения относно мащаба на производствените и факторите (факторите), докато изследваните фактори трябва да бъдат количествени и отразени в конкретни източници. Първият може да бъде определен от нормалния закон - в този случай корелационните коефициенти на Pearson са резултат от корелационния анализ или, ако знаците не се подчиняват на този закон, се използва корелационният коефициент Spearman.
Правила за избиране на коефициентите на корелационен анализ
При прилагането на този метод е необходимо да се определят факторите, които влияят на показателите за ефективност. Те се избират, като се вземе предвид фактът, че между индикаторите трябва да има причинно-следствена връзка. В случай на модел мулти-фактор корелация избран тези, които имат значително въздействие върху получената показател взаимозависими фактори сдвоени с корелационен коефициент на повече от 0.85 в модел на съответствието не включва предпочитани, както и тези, в които комуникация с ефективно параметър не е прав или функционален характер.
Показване на резултатите
Резултатите от корелационния анализ могат да бъдат представени в текстови и графични форми. В първия случай те се представят като корелационен коефициент, а във втория - под формата на скатерна диаграма.
При липса на корелация между параметрите, точките на диаграмата се разпределят на случаен принцип, средната степен на комуникация се характеризира с по-висока степен на подреждане и се характеризира с повече или по-малко еднаква отдалеченост на маркираните марки от медианата. Силната връзка има тенденция към права линия, а за r = 1 точковата диаграма е равна. Обратната корелация е различна от посоката на графиката от горния ляв до долния десен, права линия от долния ляв ъгъл до горния десен ъгъл.
Триизмерно представяне на схемата за разсейване (разсейване)
В допълнение към традиционното 2D представяне на скатерната диаграма, в момента се използва 3D картиране на графичното представяне на корелационния анализ.
Също така се използва матрица на скатерната диаграма, която показва всички двойки графики на една фигура в матричния формат. За n променливи, матрицата съдържа n редове и n колони. Диаграмата, разположена в пресечната точка на i-тата редица и й-тата колона, е графика на променливите Xi в сравнение с Xj. По този начин всеки ред и колона е едно измерение, една клетка показва диаграма на разсейване на две измерения.
Оценка на плътността на комуникацията
Стягане на корелация определя от коефициента на корелация (г): силна - R = ± 0.7 ± 1, средната - R = ± 0.3 до ± 0,699, слабо - г = 0 до ± 0,299. Тази класификация не е строга. Фигурата показва малко по-различна схема.
Пример за прилагането на метода на корелационния анализ
Във Великобритания беше направено любопитно изследване. Тя е посветена на връзката на тютюнопушенето с рак на белия дроб и се извършва чрез корелационен анализ. Това наблюдение е представено по-долу.
Професионална група | пушене | смъртност |
Земеделски стопани, лесовъди и рибари | 77 | 84 |
Миньори и кариери | 137 | 116 |
Производители на газ, кокс и химикали | 117 | 123 |
Производители на стъкло и керамика | 94 | 128 |
Работници на пещи, ковачни, леярни и валцови мелници | 116 | 155 |
Работници по електротехника и електроника | 102 | 101 |
Инженерни и свързани професии | 111 | 118 |
Дървообработваща продукция | 93 | 113 |
Кожени изделия | 88 | 104 |
Текстилни работници | 102 | 88 |
Производители на работно облекло | 91 | 104 |
Храни, напитки и тютюневи работници | 104 | 129 |
Производители на хартия и печат | 107 | 86 |
Производители на други продукти | 112 | 96 |
строители | 113 | 144 |
Художници и декоратори | 110 | 139 |
Драйвери на стационарни двигатели, кранове и др. | 125 | 113 |
Работници, които не са включени другаде | 133 | 146 |
Транспортни и комуникационни работници | 115 | 128 |
Складодържатели, складодържатели, пакетиращи и работници на машини за пълнене | 105 | 115 |
Офис работници | 87 | 79 |
продавачи | 91 | 85 |
Служители на спортната и развлекателна служба | 100 | 120 |
Администратори и мениджъри | 76 | 60 |
Професионалисти, техници и художници | 66 | 51 |
Започваме анализа на корелацията. Решението е по-добре да започнем за яснота с графичния метод, за който конструираме разсейваща диаграма (разпространение).
Показва директна връзка. Въпреки това, въз основа само на графичния метод, е трудно да се направи недвусмислено заключение. Ето защо ние продължаваме да извършваме корелационния анализ. Пример за изчисляване на коефициента на корелация е представен по-долу.
С софтуер (MS Excel например, ще бъде описано по-долу) определя коефициент на корелация, който е 0.716, което означава силна връзка между изследваните параметри. Определяне на статистическата валидността на получените стойности на съответната таблица, тогава трябва да се изважда 25 от две двойки стойности, като по този начин се получи 23 и този ред на таблицата, за да се намери критична г р = 0,01 (както този медицински данни се използват по-строги в останалите случаи, p = 0,05), което е 0,51 за даден съответен анализ. Примерът показа, че r е по-голямо от r критично, стойността на корелационния коефициент се счита за статистически надеждна.
Използване на софтуер за провеждане на корелационен анализ
Описаният вид обработка на статистически данни може да се извърши с помощта на софтуер, по-специално MS Excel. корелация анализ в Excel Следните параметри се изчисляват, като се използват следните функции:
1. Коефициентът на корелация се определя с помощта на функцията CORREL (array1-array2). Array1,2 е клетка от диапазона от стойности на производствените и факторни променливи.
Линейният корелационен коефициент също се нарича коефициент на корелация Pearson и затова, започвайки с Excel 2007, можете да използвате функцията PEARSON със същите масиви.
Графичното представяне на корелационния анализ в Excel се извършва с помощта на панела "Диаграми" със селекцията "Spot chart".
След като посочим първоначалните данни, получаваме графика.
2. Оценка на значението на двойния корелационен коефициент, използвайки Student`s t-test. Изчислената стойност на t-теста се сравнява с табличната (критична) стойност на този индикатор от съответната таблица на стойностите на разглеждания параметър, като се отчита определеното ниво на значимост и броят на степените на свобода. Тази прогноза се извършва с помощта на функцията TIRE (вероятност-степен на свобода).
3. Матрица на коефициентите на двойка корелация. Анализът се извършва с помощта на инструмента "Анализ на данните", в който е избран "Корелация". Статистическата оценка на коефициентите на корелация на двойката се извършва, когато се сравнява нейната абсолютна стойност с табличната (критична) стойност. Ако изчисленият коефициент на двойка корелация е превишен над този критичен, можем да кажем с определена степен на вероятност, че нулевата хипотеза за значението на линейната връзка не е отхвърлена.
В заключение
Използването на метода на корелационния анализ в научните изследвания дава възможност да се определи връзката между различните фактори и показателите за изпълнение. В този случай е необходимо да се има предвид, че висок корелационен коефициент може да бъде получен от абсурдна двойка или набор от данни и този вид анализ трябва да се извърши на достатъчно голям набор от данни.
След получаване на изчислената стойност на r, е желателно да се сравни с r критичен, за да се потвърди статистическата надеждност на определена стойност. Анализът на корелацията може да се извърши ръчно, използвайки формули или с помощта на софтуерни инструменти, по-специално MS Excel. Тук също е възможно да се създаде диаграма на разсейване (разсейване) с цел визуализиране на връзката между изследваните коалационни анализни фактори и произтичащата черта.
- Финансов анализ: какво е и какво е необходимо
- Коефициентът на корелация на Spearman. Коефициент на ранг корелация на Spearman
- Коефициент на корелация - характеристика на модела на корелация
- Анализ на риска
- Анализ и синтез в икономиката
- Анализ на клъстера. Научен подход към изучаването на сложни явления
- Методи на икономически анализ на предприятието - теоретични аспекти
- Анализ на корелацията като инструмент за икономически и статистически изследвания
- Корелационно-регресионен анализ и широкото му приложение в икономиката
- Методи на математическата статистика. Регресионен анализ
- Съответствие на валутните двойки един с друг
- Уравнението на регресията
- Математически методи в психологията
- Емпирични методи на изследване в съвременната наука.
- Линейна регресия
- Метод на основните компоненти
- Маргинален анализ и неговата роля за получаване на максимална печалба от предприятието
- Как да се реши система от уравнения от линеен тип
- Статистическа обработка на данните и техните характеристики
- Корелацията е един от начините за работа по Forex
- Принципи на икономическия анализ на поведението на разходите в управленското счетоводство