Раздел: Документация
0 ... 26 27 28 29 30 31 32 ... 36 х2 г: 4т где ft - частоты, количество измерений, находящихся в пределах данного интервала вариационного ряда; /, - теоретические частоты классов, определяемые по формуле f,=F{x)mM, 123ц; 9П Известно множество теоретических законов распределения: нормальное, биноминальное, полиномиальное, гипергеометрическое распределения, распределение Пауссона и др. При решении задач ГИС наиболее часто встречается нормальное распределение (распределение Гаусса), при котором варианты располагаются симметрично относительно средней величины. Основная формула нормального закона распределения где F(x)- вероятность появления случайной величины х; х,х- численные значения случайной величины и её среднее арифметическое (взвешенное) значение; е- основание натурального логарифма; ст и ст2 - стандарт и дисперсия. Теоретическая функция распределения обычно вычисляется по данным эмпирического ряда распределения. Оценка согласия эмпирических и теоретических законов распределения осуществляется с использованием специальных показателей, называемых критериями согласия. Широко используется критерии Пирсона х* и А. Н. Колмогорова Я, которые соответственно выражаются формулами в математической статистике изучают выборочные совокупности исследуемых предметов и явлений, а в теории вероятностей - их генеральную совокупность, т.е. всё множество однородных величин, все возможные значения исследуемойсовокупности; статистические характеристики изменчивы, а вероятностные - устойчивы, постоянны, являются как бы теоретическими, идеальными значениями к которым при определённых условиях стремятся эмпирические величины. Показателям, понятиям математической статистики соответствуют показатели, понятия теории вероятностей. Так, теоретическое понятие вероятности, можно определить как предел, к которому стремится частость или относительная плотность распределения при возрастании числа наблюдений. Таким показателям, как средняя арифметическая, взвешенная средняя арифметическая, в теории вероятностей соответствует математическое ожидание, которое можно рассматривать как вероятное предельное значение взвешенной среднеарифметической, характеризующее центр распределения. Дисперсия и среднеквадратическое отклонение являются в теории вероятностей характеристикой рассеяния случайной величины относительно центра распределения. Именно в наличии таких связей состоит практическая польза методов математической статистики. Создаётся возможность от эмпирических распределений перейти к теоретическим, выраженным соответствующими формулами, использование которых позволяет при задании численных значений переменных предвычислить и затабулировать вероятность событий. Задача о возможной замене эмпирических закономерностей теоретическими сводится к определению согласия эмпирических и теоретических законов распределения. т — число измерений; и - число интервалов, на который разделен вариационный ряд; Д1 - ширина интервала; Л/,,, Л/" СУММЫ накопленных частот эмпирического и теоретических распределений. 9.2.9. Определение формы и тесноты связи явлений и объектов (корреляционный анализ). Объекты и явления реальной действительности находятся между собой в той или иной взаимосвязи. Эти связи могут быть функциональными или статистическими. Последние характеризуются тем, что одна случайная переменная реагирует на изменение другой изменением своего закона распределения. Между некоторыми явлениями связь может отсутствовать. При решении научно-технических задач возникает необходимость установления формы и тесноты связей между двумя или большим числом различных явлений, изображенных, например, на картах разной тематики, или между различными состояниями одного явления на два или более различных моментов или отрезков времени. Эффективными методами исследования указанных взаимосвязей являются корреляционный и регрессионный анализы, при использовании которых исходят из предположения о том, что исследуемые явления подчинены определённым вероятностным законам. Прн определении взаимосвязей явлений с помощью аппарата корреляционного анализа могут быть исследованы: наличие и форма взаимосвязи между двумя или большим числом явлений природы и общества; способы определения взаимосвязей с использованием результатов измерений, представленных в различных формах (количественной, качественной или смешанной); различные виды связей и, следовательно, различные виды коэффициентов корреляции. Предварительное представление о форме и тесноте связи можно получить с помощью графиков, образующих поля корреляций (диаграммы рассеяния). При использовании количественных показателей изучается параметрическая корреляция, при наличии качественных характеристик - непараметрическая корреляция. Рассмотрим различные виды коэффициентов параметрической корреляции. При наличии двух зависимых случайных величин хну математическое ожидание выражения Лфс - х)(у - у) называют ковариацией случайных величин х и у. Разделив ковариацию на среднеквадратические истинные отклонения этих величин, получаем истинный коэффициент корреляции М(х-х)(у-у) Эмпирическая мера тесности линейной связи между рассматриваемыми величинами определяется с помощью простого (выборочного) коэффициента корреляции; величины же линейной зависимости одной переменной от нескольких измеряются множественным коэффициентом корреляции. Выборочный парный коэффициент корреляции вычисляется по формуле т Х(*,-*Х>>-Я r=j=i- та/гу где х, у, <7Х, ст,-средние арифметические значения и стандарты. Числовые значения г находятся в пределах -lsr<l. При г = \ или г = -1 между явлениями существуют точные прямые или обратные прямолинейные связи (функциональные зависимости). Связь считается установленной, если выполняется условие И > Ътг. В случае, когда число наблюдений т < 50 оценка значимости коэффициента корреляции может быть определена с использованием критерия Фишера: z = l{ln(l + H)-ln(l-r)}) который подчиняется нормальному закону распределения. Среднее квадратическое отклонение величины z вычисляется по формуле Определяют пределы возможного изменения z z, <z<z2, где z, = z - 8[z), z2=z + S[z) и вычисляют по значениям z, и z2 коэффициенты корреляции z,, z2 и Дг =г2 - г, по формуле Г-2"в2 + Г В случае, если доверительный интервал Дг меньше коэффициента корреляции г, то наличие линейной корреляции между рассматриваемыми явлениями можно считать установленным. Частные коэффициенты корреляции позволяют оценить связь между двумя рассматриваемыми переменными при исключении влияния взаимодействия этих двух переменных с другими оставшимися переменными. at асЬс и даёт возможность оценить связь между первыми двумя явлениями при исключении влияния третьего. Значения этого коэффициента корреляции заключены в пределах между -1 и +1; нуль означает, что явления а и Ъ независимы, когда величины переменных с и d фиксированные. Множественный коэффициент корреляции даёт возможность установить меру линейной зависимости между данным явлением X, и другими Для трёх переменных формула ко >ффициента множественной корреляции имеет вид: о \r\2 +ri3 2rl2rnr2l «1.23 = -J--, где 0 £ R < 1. Значение Л.2з,. = 1 указывает ш полную линейную зависимость переменной Хх от линейной комбинации переменных Х2,ХЪ,... . Нулевое значение этого коэффициента означает, что неременная X, линейно не зависит от набора переменных Х2, Х},... Из коэффициентов непараметрической корреляции наибольшее применение находят ранговые коэффициенты корреляции. В ряде случаев исследуемые объекты (явления) или их признаки не имеют точной количественной оценки, но имеется возможность их сравнения по качественным показателям. Для этого по рассмотренному признаку устанавливают ранги объектов, которыми являются порядковые номера, начиная с единицы, и увеличивающиеся по мере убывания признака. Единицу присваивают, например, объекту, имеющему наибольшую протяженность по длине, или наибольшую пло- В случае, когда г = 0, между явлениями прямой корреляционной связи не Имеется (может быть криволинейная связь). Для оценки значимости коэффициента корреляции г при числе наблюдений т > 50 применяется формула В. И. Романовского: 1-г2 В частности при рассмотрении трёх явлений а, Ь, с, этот коэффициент имеет вид 0 ... 26 27 28 29 30 31 32 ... 36
|