Понятие ошибки выборки. Почему невозможно сравнить выборочную совокупность с генеральной ?Как контролируется ошибка выборки в массовых опросах: практика ВЦИОМ.
Предположим, m — генеральная совокупность, обладает среднестатистической характеристикой xген Это может быть средний возраст, доход, доля консерваторов и количество испытывающих счастье. Предположим далее, что из генеральной совокупности m отобрана совокупность п — выборочная, которая обладает средней характеристикой хвы6 Ясно, что п < т. Тогда задача заключается в сопоставлении xген и хвы6 Отклонение выборочной средней от генеральной средней называется ошибкой выборки:
Из формулы следует, что исчисление Δ — ошибки выборки является принципиально неосуществимым, если не известны значения переменной в выборочной и генеральной совокупностях. Так возникает замкнутый круг: чтобы установить значение генеральной средней, нужно построить выборку, но, даже реализовав выборку, мы не сможем определить ее ошибку, потому что не знаем генеральной средней. Если бы мы знали генеральную среднюю, задача определения ошибки выборки решалась бы просто, но в данном случае выборка была бы просто не нужна. Практически ошибка выборки определяется путем сравнения известных характеристик генеральной совокупности с выборочными средними. В социологии при обследованиях взрослого населения чаще всего используют данные переписей населения, текущего статистического учета, предшествующих опросов на том же объекте. В качестве контрольных параметров обычно применяются социально-демографические признаки. Это можно сделать по завершении анализа данных. Исключение составляют предвыборные опросы и опросы, предшествующие переписям населения и референдумам — исследователи стремятся предсказать их результаты и, тем самым, подтвердить репрезентативность своих данных.
Например, институт Дж. Гэллапа, систематически проводящий обследования общественного мнения по национальной выборке объемом 1500 человек, контролирует репрезентативность по имеющимся в национальных цензах данным о распределении населения по полу, возрасту, образованию, доходу, профессии, расовой принадлежности (белый — цветной), месту проживания, величине населенного пункта1.
В исследованиях, проводимых Всероссийским центром изучения общественного мнения, надежность выборочных данных также оценивается посредством «апостериорного» контроля. В анкету мониторинга экономических и социальных перемен (руководитель — Т.И. Заславская) включены признаки (вопросы), по которым имеется информация в Государственном комитете по статистике Российской Федерации. Такими признаками являются пол, возраст, образование, тип поселения, семейное положение, сфера занятости, должностной статус респондента. Четыре показателя — пол, возраст, образование и место жительства респондента используются для выделения контролируемых групп при определении весов опрошенных — они должны соответствовать аналогичным группам в генеральной совокупности2.
Показатели семейного положения, сферы занятости и должностного статуса в определении весов не участвуют и служат для дополнительного контроля выборки (табл. 5.1).
Таблица 5.1
Соотношение параметров выборочной и генеральной совокупностей в мониторинге общественного мнения об экономических к социальных переменах в России, ВЦИОМ, март и июнь 1993 г., %
Группы населения (признаки I — II — контрольные при взвешивании) |
Данные государственной статистики |
Выборочные данные (взвешенные) |
|
март |
Июнь |
||
Пол Внимание!
Если вам нужна помощь в написании работы, то рекомендуем обратиться к
профессионалам. Более 70 000 авторов готовы помочь вам прямо сейчас. Бесплатные
корректировки и доработки. Узнайте стоимость своей работы.
|
|
|
|
1. Мужской |
45,1 |
45,4 |
45,6 |
2. Женский |
54,9 |
54,6 |
54,4 |
Продолжение
Группы населения (признаки I — II контрольныепри взвешивании) |
Данные государственной статистики |
Выборочные данные (взвешенные) |
||
март |
июнь |
|||
Возраст |
26,9 |
25,3 |
25,4 |
|
3, До 29 лет |
44,5 |
47,2 |
45,9 |
|
4. 30 — 54 года |
28,6 |
27,5 |
28,6 |
|
5. 55 лет и старше |
|
|
|
|
Образование |
|
|
|
|
6. Высшее и незаконченное |
|
|
|
|
высшее |
13,7 |
14,7 |
14,3 |
|
7. Среднее и среднее специальное |
47,6 |
47,3 |
43,0 |
|
8. Неполное среднее |
38,7 |
38,0 |
42,7 |
|
Тип поселения |
|
|
|
|
9а. Санкт-Петербург, Москва |
9,3 |
8,9 |
9,3 |
|
9б. Большие города |
26,4 |
26,6 |
28,6 |
|
10. Средние и малые города |
38,5 |
38,1 |
36,6 |
|
11. Сельские поселения |
25,8 |
26,4 |
25,5 |
|
Семейное положение |
|
|
|
|
12, Холост (незамужем) |
16,1 |
16,7 |
16,4 |
|
13. Женат (замужем) |
65,3 |
64,6 |
63,1 |
|
14. Разведен (разведена) |
7,2 |
7,9 |
7,6 |
|
15. Вдовец (вдова) |
11,1 |
10,8 |
12,7 |
|
Сфера занятости |
|
|
|
|
16. Промышленность |
49,4 |
43,9 |
48,8 |
|
17. Сельское хозяйство |
13,4 |
43,9 |
13,7 |
|
18. Торговля, снабжение |
13,5 |
14,4 |
14,7 |
|
19. Культсфера |
19,8 |
15,5 |
16,7 |
|
20. Органы управления |
3,2 |
18,8 |
2,7 |
|
21. Армия, милиция, МВД, МГБ |
0,7 |
3,1 |
2,7 |
|
22. Другая отрасль |
- |
- |
1,2 |
Специалисты ВЦИОМа обеспечивают при анализе данных тщательный ремонт выборки, чтобы минимизировать отклонения, возникшие на этапе полевых работ. Особенно сильные смещения наблюдаются по параметрам пола и возраста. Объясняется это тем, что женщины и люди с высшим образованием больше времени проводят дома и легче идут на контакт с интервьюером, т. е. являются легко достижимой группой по сравнению с мужчинами и людьми «необразованными»3. В принципе эту погрешность можно было бы уменьшить, увеличив число повторных посещений с трех до восьми-девяти, как делают западные социологи. Однако это привело бы к значительному увеличению расходов на проведение полевых работ, а во-вторых, к увеличению сроков проведения поля, — справедливо полагают Е.В. Козеренко и С.Г. Новиков4.
Максимальное отклонение показателей выборочной совокупности от соответствующих значений государственной статистики составляет 3,1 процентных пункта. Предполагается, что в этих пределах варьирует и ошибка выборки по изучаемому параметру, значение которого в генеральной совокупности неизвестно.
Аналогичным образом строятся другие всероссийские выборки. В обследованиях Центра «СоциоЭкспресс» Института социологии РАН выборка тоже имеет всероссийский масштаб. Ее проектный объем 2 тыс. человек. Опрос производится методом формализованного интервью по месту жительства. В основе размещения выборки лежат десять экономико-географических зон, в каждой из которых выделяются крупные города (численностью свыше 500 тыс. населения), средние города (50 — 500 тыс.), малые города (до 50 тыс.) или поселки городского типа, а также сельские населенные пункты. Репрезентативность контролируется по региональным пропорциям численности населения, пропорциям между городским и сельским населением, пропорциям между населением указанных типов населенных пунктов. Авторы полагают, что предельная ошибка их выборки не превышает трех процентов5.
Более надежны сопоставления данных выборочной совокупности с результатами иных крупномасштабных исследований, где используются «субъективные» переменные. Уникальные возможности в этом отношении возникают при проведении референдума, который являет собой опрос генеральной совокупности. 25 апреля 1993 г. в России состоялся референдум, где задавались четыре вопроса: о доверии президенту, об отношении к социально-экономической политике, проводимой президентом и правительством в 1992 г., о необходимости досрочных выборов президента, а также о необходимости досрочных выборов депутатов. Многие социологические службы страны делали свои прогнозы. Наиболее точным, но только по первым двум вопросам, оказался прогноз ВЦИОМ6, выполненный по заказу газеты «Известия» и опубликованный за день до референдума (табл. 5.2).
Таблица 5.2
Прогнозы результатов референдума 25 апреля 1993 г. различными социологическими службами, % положительных ответов
Прогнозы социологических служб и результаты референдума |
Позиции вопросника |
||
Доверяете ли Вы президенту России? |
Одобряете ли Вы социальноэкономическую политику, проводимую президентом и правительством с 1992 г. |
||
Прогноз ВЦИОМ в «Известиях» |
57 |
522 |
|
Прогноз ВЦИОМ по опросу на избирательных участках |
64 |
56 |
|
Cable News Research |
65 |
58 |
|
Фонд «Общественное мнение» |
74 |
66 |
|
Результат референдума |
59 |
53 |
При отсутствии лучшего критерия следует согласиться с тем, что, если выборка выходит за приемлемые рамки по известным переменным, она непригодна и по изучаемой переменной. И все-таки важно сознавать, что одна и та же совокупность единиц описывается многообразными характеристиками, каждой из которых присуща своя степень вариации. Иначе говоря, по одним характеристикам генеральная совокупность «хорошо перемешана» и является однородной, по другим — дифференцированной. Например, по признаку «грамотность — неграмотность» современное российское общество практически однородно: можно, опросив нескольких человек, уверенно утверждать, что подавляющее большинство людей грамотны. Иное дело — дифференциация доходов. Она столь велика, что малой выборкой не обойдешься. Отсюда следует, что не существует выборки на все случаи социологической жизни. Лучшая выборка — не обязательно большая. Даже очень маленькая выборка может быть вполне представительной. Главное, чтобы она была хорошо перемешана в генеральной совокупности,
Поможем написать любую работу на аналогичную тему