muzruno.com

Интервал на доверието. Какво представлява и как може да се използва?

Интервалът на доверието ни дойде от областта на статистиката. Това е определен обхват, който служи за оценка на неизвестен параметър с висока степен на надеждност. Най-лесният начин да обясните това е с пример.

Да предположим, че искате да проучите някаква случайна стойност, например, степента на отговор на сървъра по искане на клиента. Всеки път, когато потребител набира адрес на конкретен сайт, сървърът реагира на това при различни скорости. По този начин времето за реакция, подложено на проучването, е случайно. Така че доверителният интервал ви позволява да определите границите на този параметър и след това можете да твърдите, че с вероятност от 95% скорост на реакция сървърът ще бъде в диапазона, който изчислихме.

Или трябва да разберете колко хора знаят за марката на компанията. Когато се изчислява доверителният интервал, ще бъде възможно, например, да се каже, че с 95% от вероятността за дял на потребителите, които знаят за това марка, е в диапазона от 27% до 34%.

Този термин е тясно свързан с такава стойност, каквато е вероятността за доверие. Това е вероятността желаният параметър да влезе в интервала на достоверност. От тази стойност зависи колко голям ще бъде диапазонът ни. Колкото по-голямо значение има, толкова по-тесен е доверителният интервал и обратно. Обикновено се определя на 90%, 95% или 99%. Стойността на 95% е най-популярна.

Този показател също е повлиян от отклонението на наблюденията и размера на извадката. Неговото определение се основава на предположението, че предметът на теста е обект на нормалното разпределително право. Това твърдение е известно още като Гаусовия закон. Според него разпределението на всички вероятности на непрекъсната случайна променлива се нарича нормално, което може да бъде описано от вероятната плътност. Ако предположението за нормално разпределение се окаже грешно, оценката може да е неправилна.

Първо, нека да разгледаме как да изчислим интервала на доверието за математическо очакване. Има два възможни случая. Различието (степента на разпространение на произволна променлива) може да бъде известно или не. Ако е известно, тогава доверителният ни интервал се изчислява, като се използва следната формула:

xsr - t * sigma- / (sqrt (n)) <= алфа- <= xcp + t * sigma- / (sqrt (n)), където

алфа- е знак,

t е параметър от таблицата за разпределение на Laplace,

sqrt (n) е квадратен корен на общата сума размера на извадката,

sigma- е квадратният корен на вариацията.

Ако разликата е неизвестна, тогава може да се изчисли, ако знаем всички стойности на желаната характеристика. За тази цел се използва следната формула:

sigma-2 = x2cp - (xsr) 2, където

x2cp е средната стойност на квадратите на тестовата характеристика,

(хср) 2 - квадрат средната стойност от тази характеристика.



Формулата за изчисляване на доверителния интервал в този случай варира леко:

xsr - t * s / (sqrt (н)) <= алфа- <= xcp + t * s / (sqrt (n)), където

xsr е средната проба,

алфа- е знак,

t е параметър, който се установява чрез таблицата за разпределение на Student t = t (ɣ-n-1),

sqrt (n) е квадратен корен на общия размер на извадката,

s е квадратният корен на отклонението.

Помислете за този пример. Да предположим, че резултатите от 7 измервания са определени средна стойност от тестовата характеристика е равна на 30 и вариацията на пробата е равна на 36. Необходимо е да се намери с вероятност от 99% доверителен интервал, който да съдържа истинската стойност на измерения параметър.

Първо, ние определяме това, което е равно на t: t = t (0.99-7-1) = 3.71. Използваме горната формула, получаваме:

xsr - t * s / (sqrt (н)) <= алфа- <= xcp + t * s / (sqrt (н))

30 - 3.71 * 36 / (sqrt (7)) <= алфа- <= 30 + 3.71 * 36 / (sqrt (7))

21587 <= алфа- <= 38.413

Интервалът на достоверност за вариацията се изчислява както в случая на известната средна стойност, така и когато няма данни за математическото очакване, и само стойността на оценката на точката безпристрастна дисперсия е известна. Тук няма да дадем формулите за изчисляването му, тъй като те са доста сложни и ако се желае, те винаги могат да бъдат намерени в мрежата.

Отбелязваме само, че е удобно да се определи интервалът на доверието чрез използване на програма Excel или мрежова услуга, която се нарича така.

Споделяне в социалните мрежи:

сроден