muzruno.com

Метод на корелационния анализ: пример. Анализът на корелацията е ...

Изследването, често е необходимо да се намери връзката между продуктивни и факторни променливи (добив всяка култура и валежи, височината и теглото на човек в хомогенни групи в зависимост от пола, възрастта, сърдечната честота и телесната температура и т.н.).

Втората са признаците, които допринасят за промяната на свързаните с тях (първата).

Концепцията за корелационен анализ

Има много определения на термина. Изхождайки от гореизложеното, може да се каже, че корелационният анализ е метод, използван за тестване на хипотезата за статистическата значимост на две или повече променливи, ако изследователят може да ги измери, но не и да ги промени.

Съществуват и други дефиниции на разглежданото понятие. Анализът на корелацията е метод за обработка на статистически данни, който се състои в изследване на корелационните коефициенти между променливите. Това сравнява корелационните коефициенти между една двойка или набор от двойки от характеристики, за да се установят статистически взаимоотношения между тях. Корелационният анализ е метод за изследване на статистическата зависимост между случайни променливи с незадължително присъствие на строг функционален характер, при който динамиката на една произволна променлива води до динамиката на математическото очакване на другата.

Концепцията за фалшивост на корелацията

При извършването на корелационния анализ е необходимо да се има предвид, че това може да се извърши по отношение на всеки набор от характеристики, често абсурдни един спрямо друг. Понякога нямат причинно-следствена връзка помежду си.

В този случай те говорят за фалшива връзка.

Проблемите на корелационния анализ

Изхождайки от горните определения, можем да формулираме следните проблеми на описания метод: да получим информация за една от неизвестните променливи с помощта на друга, за да определим тежестта на връзката между изследваните променливи.

Анализът на корелацията включва определяне на връзката между изследваните признаци и следователно задачите на корелационния анализ могат да бъдат допълнени със следното:

  • идентифициране на факторите, които оказват най-голямо влияние върху резултата;
  • идентифициране на неизяснени преди това причини за връзки;
  • изграждането на модел на корелация с неговия параметричен анализ;
  • изследване на значението на комуникационните параметри и тяхното интервално изчисление.

Корелацията между корелационния анализ и регресията

Метод за корелация-регресионен анализМетодът на корелационния анализ често не се ограничава до откриването на стягането на връзката между изследваните количества. Понякога се допълва чрез изтегляне на регресия уравнения са получени чрез анализиране на същото име и описание представлява връзка между функцията (ите) на получения и фактор (фактор). Този метод, заедно с разглеждания анализ, е методът на корелационно-регресионен анализ.

Условия за ползване

Ефективните фактори зависят от един до няколко фактора. Методът на корелационния анализ може да бъде използван, ако има голям брой наблюдения относно мащаба на производствените и факторите (факторите), докато изследваните фактори трябва да бъдат количествени и отразени в конкретни източници. Първият може да бъде определен от нормалния закон - в този случай корелационните коефициенти на Pearson са резултат от корелационния анализ или, ако знаците не се подчиняват на този закон, се използва корелационният коефициент Spearman.

Съответният анализ е

Правила за избиране на коефициентите на корелационен анализ

При прилагането на този метод е необходимо да се определят факторите, които влияят на показателите за ефективност. Те се избират, като се вземе предвид фактът, че между индикаторите трябва да има причинно-следствена връзка. В случай на модел мулти-фактор корелация избран тези, които имат значително въздействие върху получената показател взаимозависими фактори сдвоени с корелационен коефициент на повече от 0.85 в модел на съответствието не включва предпочитани, както и тези, в които комуникация с ефективно параметър не е прав или функционален характер.

Показване на резултатите

Резултатите от корелационния анализ могат да бъдат представени в текстови и графични форми. В първия случай те се представят като корелационен коефициент, а във втория - под формата на скатерна диаграма.

Резултатите от корелационния анализ

При липса на корелация между параметрите, точките на диаграмата се разпределят на случаен принцип, средната степен на комуникация се характеризира с по-висока степен на подреждане и се характеризира с повече или по-малко еднаква отдалеченост на маркираните марки от медианата. Силната връзка има тенденция към права линия, а за r = 1 точковата диаграма е равна. Обратната корелация е различна от посоката на графиката от горния ляв до долния десен, права линия от долния ляв ъгъл до горния десен ъгъл.

Триизмерно представяне на схемата за разсейване (разсейване)

В допълнение към традиционното 2D представяне на скатерната диаграма, в момента се използва 3D картиране на графичното представяне на корелационния анализ.

Коефициенти на анализа на корелацията

Също така се използва матрица на скатерната диаграма, която показва всички двойки графики на една фигура в матричния формат. За n променливи, матрицата съдържа n редове и n колони. Диаграмата, разположена в пресечната точка на i-тата редица и й-тата колона, е графика на променливите Xi в сравнение с Xj. По този начин всеки ред и колона е едно измерение, една клетка показва диаграма на разсейване на две измерения.

Разтвор за анализ на корелацията

Оценка на плътността на комуникацията

Стягане на корелация определя от коефициента на корелация (г): силна - R = ± 0.7 ± 1, средната - R = ± 0.3 до ± 0,699, слабо - г = 0 до ± 0,299. Тази класификация не е строга. Фигурата показва малко по-различна схема.

Метод на корелационния анализ

Пример за прилагането на метода на корелационния анализ

Във Великобритания беше направено любопитно изследване. Тя е посветена на връзката на тютюнопушенето с рак на белия дроб и се извършва чрез корелационен анализ. Това наблюдение е представено по-долу.

Първоначални данни за корелационния анализ

Професионална група

пушене

смъртност

Земеделски стопани, лесовъди и рибари

77

84

Миньори и кариери

137

116

Производители на газ, кокс и химикали

117

123

Производители на стъкло и керамика

94

128

Работници на пещи, ковачни, леярни и валцови мелници

116

155

Работници по електротехника и електроника

102

101

Инженерни и свързани професии

111

118

Дървообработваща продукция

93

113

Кожени изделия

88

104

Текстилни работници

102

88

Производители на работно облекло

91



104

Храни, напитки и тютюневи работници

104

129

Производители на хартия и печат

107

86

Производители на други продукти

112

96

строители

113

144

Художници и декоратори

110

139

Драйвери на стационарни двигатели, кранове и др.

125

113

Работници, които не са включени другаде

133

146

Транспортни и комуникационни работници

115

128

Складодържатели, складодържатели, пакетиращи и работници на машини за пълнене

105

115

Офис работници

87

79

продавачи

91

85

Служители на спортната и развлекателна служба

100

120

Администратори и мениджъри

76

60

Професионалисти, техници и художници

66

51

Започваме анализа на корелацията. Решението е по-добре да започнем за яснота с графичния метод, за който конструираме разсейваща диаграма (разпространение).

Пример за анализ на корелацията

Показва директна връзка. Въпреки това, въз основа само на графичния метод, е трудно да се направи недвусмислено заключение. Ето защо ние продължаваме да извършваме корелационния анализ. Пример за изчисляване на коефициента на корелация е представен по-долу.

С софтуер (MS Excel например, ще бъде описано по-долу) определя коефициент на корелация, който е 0.716, което означава силна връзка между изследваните параметри. Определяне на статистическата валидността на получените стойности на съответната таблица, тогава трябва да се изважда 25 от две двойки стойности, като по този начин се получи 23 и този ред на таблицата, за да се намери критична г р = 0,01 (както този медицински данни се използват по-строги в останалите случаи, p = 0,05), което е 0,51 за даден съответен анализ. Примерът показа, че r е по-голямо от r критично, стойността на корелационния коефициент се счита за статистически надеждна.

Използване на софтуер за провеждане на корелационен анализ

Описаният вид обработка на статистически данни може да се извърши с помощта на софтуер, по-специално MS Excel. корелация анализ в Excel Следните параметри се изчисляват, като се използват следните функции:

1. Коефициентът на корелация се определя с помощта на функцията CORREL (array1-array2). Array1,2 е клетка от диапазона от стойности на производствените и факторни променливи.

Линейният корелационен коефициент също се нарича коефициент на корелация Pearson и затова, започвайки с Excel 2007, можете да използвате функцията PEARSON със същите масиви.

Графичното представяне на корелационния анализ в Excel се извършва с помощта на панела "Диаграми" със селекцията "Spot chart".

След като посочим първоначалните данни, получаваме графика.

2. Оценка на значението на двойния корелационен коефициент, използвайки Student`s t-test. Изчислената стойност на t-теста се сравнява с табличната (критична) стойност на този индикатор от съответната таблица на стойностите на разглеждания параметър, като се отчита определеното ниво на значимост и броят на степените на свобода. Тази прогноза се извършва с помощта на функцията TIRE (вероятност-степен на свобода).

3. Матрица на коефициентите на двойка корелация. Анализът се извършва с помощта на инструмента "Анализ на данните", в който е избран "Корелация". Статистическата оценка на коефициентите на корелация на двойката се извършва, когато се сравнява нейната абсолютна стойност с табличната (критична) стойност. Ако изчисленият коефициент на двойка корелация е превишен над този критичен, можем да кажем с определена степен на вероятност, че нулевата хипотеза за значението на линейната връзка не е отхвърлена.

В заключение

Използването на метода на корелационния анализ в научните изследвания дава възможност да се определи връзката между различните фактори и показателите за изпълнение. В този случай е необходимо да се има предвид, че висок корелационен коефициент може да бъде получен от абсурдна двойка или набор от данни и този вид анализ трябва да се извърши на достатъчно голям набор от данни.

След получаване на изчислената стойност на r, е желателно да се сравни с r критичен, за да се потвърди статистическата надеждност на определена стойност. Анализът на корелацията може да се извърши ръчно, използвайки формули или с помощта на софтуерни инструменти, по-специално MS Excel. Тук също е възможно да се създаде диаграма на разсейване (разсейване) с цел визуализиране на връзката между изследваните коалационни анализни фактори и произтичащата черта.

Споделяне в социалните мрежи:

сроден