Первым шагом в анализе данных всегда является построение частотных распределений для каждой изучавшейся переменной.
Частотное распределение – это упорядоченный подсчет количества признаков по каждому значению переменной.
Для облегчения работы с частотными распределениями, а также для обобщенного представления их характеристик, обычно используют определенные числовые значения - статистики. Наибольшее практическое значение имеют две группы статистик: меры центральной тенденции и меры изменчивости (разброса).
Меры центральной тенденции указывают на расположение среднего, или типичного, значения признака, вокруг которого сгруппированы остальные наблюдения. Способность среднего значения давать некую обобщенную информацию о распределении вытекает из того соотношения, которое связывает среднее значение с другими «особыми» точками распределения - минимумом и максимумом: зная среднее значение, мы можем утверждать, что наименьшее наблюдаемое значение полученного распределения было не больше среднего, а наибольшее зафиксированное значение - не меньше среднего. В статистике понятие среднего значения может быть строго задано лишь для одномерного распределения переменной-признака.
Самой простой из мер центральной тенденции является мода (Мо). Для номинальных переменных мода - это единственный способ указать наиболее типичное, распространенное значение. Мода - это такое значение в совокупности наблюдений, которое встречается чаще всего. Например, если в выборке содержится 60% православных, 30% мусульман и 10% представителей других конфессий, то модальным значением будет «православный». У моды как меры центральной тенденции есть определенные недостатки, ограничивающие ее интерпретацию: в распределении могут быть две и более моды (соответственно оно является бимодальным или мультимодальным).
Медиана (Md) - это значение, которое делит упорядоченное множество данных пополам, так что одна половина наблюдений оказывается меньше медианы, а другая - больше.
Необходимо знать не только то, что типично для выборки наблюдений, но и установить, насколько выражены отклонения от типичных значений. Чтобы определить, насколько хорошо та или иная мера центральной тенденции описывает распределение, нужно воспользоваться какой-либо мерой изменчивости, разброса.
Дисперсия вариационного ряда – средняя арифметическая квадратов отклонений вариантов от их средней арифметической.
Величина, равная квадратному корню из дисперсии, называется стандартным отклонением (sx):
Очевидной интерпретацией стандартного отклонения является его способность оценивать «типичность» среднего: стандартное отклонение тем меньше, чем лучше среднее суммирует, «представляет» данную совокупность наблюдений.
Поможем написать любую работу на аналогичную тему
Реферат
Элементы статистического анализа эмпирических данных – частотное распределение.
От 250 руб
Контрольная работа
Элементы статистического анализа эмпирических данных – частотное распределение.
От 250 руб
Курсовая работа
Элементы статистического анализа эмпирических данных – частотное распределение.
От 700 руб