По территориям региона за некоторый год приводятся данные о среднедушевом прожиточном минимуме в день на одного трудоспособного жителя страны (региона) в рублях, обозначаемые х, и среднедневная заработная плата в рублях — у. Соответственно: х — 78, 82, 87, 79, 89, 106, 67, 88, 73, 87, 76, 115; у — 133, 148, 134, 154, 162, 195, 139, 158, 152, 162, 159, 173.
1. Построить линейное уравнение парной регрессии у от х.
2. Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.
3. Оценить статистическую значимость параметров регрессии и корреляции и самого уравнения регрессии в целом.
Решение:
1. Для расчета параметров уравнения регрессии строим расчетную таблицу
1 Внимание!
Если вам нужна помощь в написании работы, то рекомендуем обратиться к
профессионалам. Более 70 000 авторов готовы помочь вам прямо сейчас. Бесплатные
корректировки и доработки. Узнайте стоимость своей работы.
|
78 |
133 |
10374 |
6084 |
17689 |
149 |
-16 |
12 |
2 |
82 |
148 |
12136 |
6724 |
21904 |
152 |
-4 |
2,7 |
3 |
87 |
134 |
11658 |
7569 |
17956 |
157 |
-23 |
17,2 |
4 |
79 |
154 |
12166 |
6241 |
23716 |
150 |
4 |
2,6 |
5 |
89 |
162 |
14418 |
7921 |
26244 |
159 |
3 |
1,9 |
6 |
106 |
195 |
20670 |
11236 |
38025 |
174 |
21 |
10,8 |
7 |
67 |
139 |
9313 |
4489 |
19321 |
139 |
0 |
0 |
8 |
88 |
158 |
13904 |
7744 |
24964 |
158 |
0 |
0 |
9 |
73 |
152 |
11096 |
5329 |
23104 |
144 |
8 |
5,3 |
10 |
87 |
162 |
14094 |
7569 |
26244 |
157 |
5 |
3,1 |
11 |
76 |
159 |
12084 |
5776 |
25281 |
147 |
12 |
7,5 |
12 |
115 |
173 |
19895 |
13225 |
29929 |
183 |
-10 |
5,8 |
Итого |
1027 |
1869 |
161808 |
89907 |
294377 |
1869 |
0 |
68,8 |
Среднее значение |
85,6 |
155,8 |
13484 |
7492,3 |
24531,4 |
- |
- |
5,7 |
12,95 |
16,53 |
- |
- |
- |
- |
- |
- |
|
167,7 |
273,4 |
- |
- |
- |
- |
- |
- |
;
- уравнение регрессии.
2. - линейный коэффициент парной корреляции;
, это означает, что 52% вариации заработной платы () объясняется вариацией фактора - среднедушевого прожиточного минимума.
Качество модели определяет средняя ошибка аппроксимации: . Качество построенной модели оценивается как хорошее, так как не превышает 8 – 10%.
3. Оценку статистической значимости параметров регрессии проведем с помощью t-статистики Стьюдента и путем расчета доверительного интервала для каждого из показателей.
Выдвигаем гипотезу о статистически незначимом отличии показателей от нуля: .
для числа степеней свободы и
Определим случайные ошибки , , :
; ;
.
Тогда ; ; .
Фактические значения t-статистики превосходят табличные значения:
;
;
, поэтому гипотеза отклоняется, то есть , и не случайно отличаются от нуля, а статистически значимы.
Рассчитаем доверительные интервалы для и . Для этого определим предельную ошибку для каждого показателя:
, .
Доверительные интервалы:
; ; ;
; ; .
С вероятностью параметр находиться в интервале , а параметр . Параметры не принимают нулевых интервалов, т. е. не являются статистически незначимыми и существенно отличны от нуля.
Поможем написать любую работу на аналогичную тему