![]() ![]() ![]() ![]() ![]()
Раздел: Документация
0 ... 123 124 125 126 127 128 129 ... 162 смешанной выборочной долей w =-«0.527. Итак, выборочное значение Р105 + 140V статистики приближенно равно , ]-j-j- .571-0.493) / ; 0.527(1-0.527)(-+ -) «1.21 V VTOS" 140 Поскольку квантиль уровня 1-- - 0.95 стандартного распределения равен 1.645 и 1.21 < 1.645, то нулевая гипотеза принимается, т. е. полученные данные не противоречат гипотезе об одинаковом отношении студентов к курению. Глава 48 ![]() Двумерная модель корреляционного анализа Задача корреляционного анализа заключается в выявлении связи между случайными величинами (генеральными совокупностями) X, У посредством точечной и интервальной оценки коэффициентов корреляции и проверки их значимости. При этом основными характеристиками зависимости между с. в. Хи К являются регрессии Упох и Хпоу. Основное допущение корреляционного анализа: двумерная с. в. (X, Y) распределена по нормальному закону с параметрамир, где ипараметры нормальных законов распределения одномерных составляющих X и Y, р - их коэффициент корреляции (теорема 44.1). При таких допущениях, согласно теореме 44.3, регрессии имеют следующий вид: Если в этих уравнениях параметры ах, а,,, ах, стгр заменить соответствующими выборочными характеристиками !c,~y,srtsр, то получим выборочные регрессии здесь г- выборочный коэффициент корреляции, s2.. sj- выборочные дисперсии, Г, у-выборочные средние (см. гл. 46), Исходная статистическая информация может быть сгруппирована на основе интервальных рядов выборочных данных и представлена в следующем виде. Возможные области значений с. в. X и Уразбиты соответственно на да и и интервалов равной длины. Через а„ bk обозначены соответственно середины этих интервалов i=\,...,m, к= !,..., п, а через /- объем парной выборки, состоящей из пар (х„уЛ) частных значений двумерной св. (X, У). Через fa обозначено число всех пар (хЛ,уЛ) таких, что х,. содержится в интервале для значений X,в интервале для значений с. в. У. В случае сгруппированных данных формулы для выборочных средней, дисперсии и коэффициента корреляции, определенные в гл. 46, будут иметь следующий вид: M(Y\x) = а, + р~(х -а,), М(Х\у) = ах+ р-(у - а ). vr(x) = у+r-{x-x), vr(y)= х~+ г (у - v) ; ст(. х -- ftГ7Т В силу теоремы 44.2 независимость с. в. Л" и Yравносильна равенству нулю их коэффициента корреляции р. Напомним также, что в качестве точечной оценки коэффициента корреляции берется случайная величина nSsS}, В теории статистики доказывается следующее утверждение. Теорема 48.1. Если коэффициент корреляции р с. в. Xи Yравен нулю (нулевая гипотеза), то статистика ~- имеет /-распределение с п-2 степенями свободы. Если в качестве альтернативной берется гипотеза j =" 0 то согласно общему принципу определения критической области, сформулированному в гл. 47, нулевая гипо- 1Д V/J - 2 теза отвергается, если статистика -=- превосходит квантиль t a уровня л/l - р1I-.» - 2 i~Y~/-распределения с п-2 степенями свободы. Таким образом, гипотеза о равенстве нулю коэффициента корреляции (и следовательно о независимости с. в. X и отвергается, если для выборочного коэффициента корреляции г верно неравенство: jV«-2/Vl-r- >/ a ] - -, я - 2 2 В случае отказа от гипотезы о равенстве нулю коэффициента корреляции р есть смысл построить доверительный интервал для него. Однако плотность с. в. R имеет сложный вид. Поэтому воспользуемся следующим утверждением из теории статистики. 1 1 + R Теорема 48.2. Случайная величина Z= - In 1~ уже при небольших п имеет распределение, достаточно близкое к нормальному распределению с параметрами iin+iH-----p--. , ! iiiU-p , 2{п-\), V~. 0 ... 123 124 125 126 127 128 129 ... 162 |