Show last authors
1 {{box title="**Содержание**"}}
2 {{toc/}}
3 {{/box}}
4
5 = Глава 1. Общие положения =
6
7 ~1. Методика построения выборки домашних хозяйств по обследованию [[занятости>>doc:working:Глоссарии.Занятость.WebHome]] [[населения>>doc:xwiki:Глоссарии.Население.WebHome]] (далее – Методика) относится к статистической методологии, формируемой в соответствии с Законом Республики Казахстан «О государственной статистике».
8
9 2. Настоящую Методику применяет Бюро национальной статистики Агентства по стратегическому планированию и реформам Республики Казахстан для формирования выборки домашних хозяйств по обследованию [[занятости>>doc:working:Глоссарии.Занятость.WebHome]] [[населения>>doc:xwiki:Глоссарии.Население.WebHome]].
10
11 3. Целью настоящей Методики является построение выборки домашних хозяйств для выборочного обследования [[занятости>>doc:working:Глоссарии.Занятость.WebHome]] [[населения>>doc:xwiki:Глоссарии.Население.WebHome]] (далее – ВОЗН). Методика определяет основные аспекты и методы построения выборки с учетом районного уровня, включая описание этапов формирования, стратификации и расчета выборочных весов.
12
13 4. В Методике используются понятия в значениях, определенных в Законах Республики Казахстан «О государственной статистике», «О [[занятости>>doc:working:Глоссарии.Занятость.WebHome]] [[населения>>doc:xwiki:Глоссарии.Население.WebHome]]», а также определения принятые Международными Конференциями Статистиков Труда (далее – МКСТ) и рекомендации Международной Организации Труда (далее – МОТ).
14
15 = Глава 2. Генеральная совокупность (основа выборки) =
16
17 5. В качестве генеральной совокупности для формирования выборочной совокупности домашних хозяйств ВОЗН с учетом районного уровня является информационная система «Статистический регистр жилищного фонда», компонент интегрированной информационной системы «е-Статистика» (далее – CРЖФ)
18
19 6. Указанная база данных обладает рядом преимуществ:
20
21 * наличие готовой рамки выборки;
22 * наличие постоянно актуализируемой базы данных;
23 * наличие информации о домашних хозяйствах в территориальном разрезе.
24
25 7. Единицами учета СРЖФ являются все жилые дома и жилые помещения, находящиеся на территории Казахстана. К ним относятся квартиры, одноквартирные (индивидуальные) дома, двухквартирные дома, трех и более квартирные дома.
26
27 8. База данных СРЖФ состоит из двух таблиц, дом – основная таблица, содержит информацию в целом по жилому дому, квартира – дополнительная таблица, содержит информацию о каждой квартире жилого дома.
28
29 9. Особенности формирования генеральной совокупности:
30
31 1) в генеральную совокупность включаются все типы жилых помещений, за исключением общих коммунальных квартир, общежитий, медико-социальных учреждений (организаций) для престарелых, лиц инвалидностью, детей с инвалидностью в условиях стационара, детских домов, тюрем, гостиниц, религиозных общин и других аналогичных жилых помещений;
32
33 2) в целях снижения нагрузки на интервьюеров при сборе информации из генеральной совокупности исключаются населенные пункты с численностью проживающих менее 100 домашних хозяйств.
34
35 = Глава 3. Дизайн выборки =
36
37 10. ВОЗН с учетом районного уровня проводится во всех регионах Казахстана на основе выборочного метода наблюдений с последующим распространением итогов на всю численность [[населения>>doc:xwiki:Глоссарии.Население.WebHome]] страны обследуемого [[возраста>>doc:xwiki:Глоссарии.Возраст.WebHome]] (15 лет и старше).
38
39 ~11. Модель организации ВОЗН с учетом районного уровня разработана на основе выборки с наложением, формируется один раз в год и в целях снижения нагрузки на интервьюеров равномерно распределена на двенадцать месяцев.
40
41 12. Домашнее хозяйство, попавшее в выборку текущего года, имеет равную вероятность быть отобранным снова при формировании выборки на новый год. Наложение осуществляется в размере части ежегодно рассчитываемой от общего количества домашних хозяйств.
42
43 13. Для целей сглаживания скачков ежемесячных данных обследования [[занятости>>doc:working:Глоссарии.Занятость.WebHome]], предусмотрено использование ежемесячного наложения ежегодно рассчитываемой части домашних хозяйств. Ежемесячно, начиная с февраля, ежегодно рассчитываемая часть домашних хозяйств переходят из предыдущего месяца на следующий месяц (обследуются два месяца подряд), а остальные – новые каждый месяц.
44
45 14. Ежемесячное формирование каталога для наложения осуществляется на территориальном уровне автоматически в программном комплексе на основе каталога введенных отчетов за отчетный месяц и заданного количества домашних хозяйств Z (рассчитывается Департаментом статистических регистров и классификаций при формировании выборочной совокупности на текущий год) путем использования шага Nn, где n – месяц в котором используются выбранные домохозяйства. Шаг Nn = Notc/Z, где Z – количество домашних хозяйств определенное для наложения по данному региону, постоянное для всех месяцев отчетного года, Notc – количество домашних хозяйств, фактически отчитавшихся в текущем месяце.
46
47 15. Данная модель, обеспечивает:
48
49 1) репрезентативные годовые итоги на основе объединения всех двенадцати месячных выборок:
50
51 * по Республике Казахстан;
52 * по областям;
53 * по районам.
54
55 2) репрезентативные квартальные итоги на основе объединения трех месячных выборок, входящих в квартал:
56
57 * по Республике Казахстан;
58 * по областям.
59
60 №) репрезентативные месячные итоги на основе месячной выборки:
61
62 * по Республике Казахстан.
63 * сглаживание скачков ежемесячных данных.
64
65 16. Первичной единицей обследования являются жилые дома (индивидуальные дома, многоквартирные дома), в обследовании участвуют все квартиры в доме, попавшие в выборку.
66
67 Вторичной единицей обследования являются домашние хозяйства (лица в [[возрасте>>doc:xwiki:Глоссарии.Возраст.WebHome]] от 15 лет и старше, проживающие в них).
68
69 Выборочная совокупность домашних хозяйств формируется методом двухступенчатой стратифицированной кластерной выборки.
70
71 Формирование выборочной совокупности осуществляется централизовано на республиканском уровне в разрезе регионов Казахстана.
72
73 = Глава 4. Стратификация генеральной совокупности =
74
75 17. Стратификация является действенным приемом повышения эффективности выборочного метода. Преимуществами стратификации являются:
76
77 * большая точность, по сравнению с другими вариантами отбора для тех же данных;
78 * большая точность, при использовании меньшей по размеру выборки, что экономит средства;
79 * обеспечение представительности выборки.
80
81 18. Необходимость стратификации генеральной совокупности обусловлена неоднородностью единиц наблюдения по характеристикам.
82
83 19. При формировании выборки для ВОЗН с учетом районного уровня используется следующая процедура стратификации:
84
85 * генеральная совокупность стратифицируется по районам, по типу местности (город, село), по классам размерности зданий (1 квартирные дома, 2–20 квартирные дома, 21–80 квартирные дома, более 80 квартирные дома);
86 * определяется объем генеральной совокупности в каждой страте путем суммирования количества домов.
87
88 20. Непосредственный отбор домов разных типов осуществляется с помощью специализированного программного обеспечения с использованием метода случайного отбора. Использование данного программного продукта сокращает объем [[работ>>doc:working:Глоссарии.Работа.WebHome]] и дает гарантированный качественный результат.
89
90 Если в отобранных адресах фактически проживают несколько домашних хозяйств, то случайным методом выбирается одно из них.
91
92 После отбора формируются списки домашних хозяйств, попавших в выборку, для каждой области.
93
94 = Глава 5. Определение размера выборки =
95
96 21. Размером выборки является общее число единиц наблюдения в выборочной совокупности. Размер выборки зависит от размера относительной ошибки выборки, которая с определенной вероятностью обеспечивает заданную точность результатов наблюдения.
97
98 22. Для определения оптимального размера выборки для ВОЗН необходимого для оценки генеральной совокупности с заданной точностью, используется следующая формула:
99
100 [[image:attach:11.png]] (1)
101
102 где,
103
104 k – аргумент функции Лапласа (k = 1,96 для 95% уровня доверительности);
105
106 N – объем генеральной совокупности;
107
108 [[image:image-20230518142110-2.png]] – дисперсия;
109
110 E – абсолютная ошибка.
111
112 23. Дисперсия генеральной совокупности определяется как среднее значение квадратов отклонений всех отдельных наблюдений от их среднего значения.
113
114 Дисперсия генеральной совокупности:
115
116 [[image:image-20230517171454-13.png]] (2)
117
118 Если ошибка выражается как стандартная ошибка [[image:image-20230517170758-1.png]] можно воспользоваться следующей формулой:
119
120 [[image:image-20230517171514-14.png]]// // (3)
121
122 где, RSE – относительная стандартная ошибка выборки.
123
124 Если не принимать во внимание поправку для конечной совокупности формула будет выглядеть следующим образом:
125
126 [[image:image-20230517171430-12.png]]// // (4)
127
128 24. При определении объема выборочной совокупности на текущий год для ВОЗН используется расчет относительной ошибки выборки результатов ВОЗН за предыдущий год. Относительная ошибка выборки обратно пропорциональна объему выборки, при увеличении размера выборки в четыре раза, ошибки уменьшаются вдвое.
129
130 25. Основным требованием к результатам ежемесячного обследования является получение репрезентативных данных на уровне района со стандартной ошибкой выборки по показателю «уровень [[безработицы>>doc:working:Глоссарии.Безработица.WebHome]]» на уровне 5–7%.
131
132 С учетом требований рассчитан и принят оптимальный размер выборки – 5%.
133
134 = Глава 6. Компенсация неполученных ответов =
135
136 26. Недополучение ответов от отобранных домашних хозяйств является серьезным недостатком, искажающим результаты обследования. В этих условиях возникает необходимость компенсации недостающих данных. Данная процедура призвана осуществить досчет показателей, компенсировать недополучение данных выборочного обследования.
137
138 27. В ходе обследования имеет место случаи, когда не удается опросить домохозяйства. Существуют два типа причин объективные и субъективные.
139
140 Объективные причины отказа:
141
142 * все члены домашнего хозяйства в [[возрасте>>doc:xwiki:Глоссарии.Возраст.WebHome]] 73 года и старше;
143 * дом разрушен;
144 * уехали, пустая квартира (дом);
145 * объединение квартир;
146 * дом под снос;
147 * дом (адрес) не найден;
148 * иная причина (изменение назначения помещения).
149
150 Субъективные причины отказа:
151
152 * отказ домашнего хозяйства от участия в обследовании.
153
154 28. Замена адресов жилых помещений в случае отсутствия членов домашнего хозяйства или отказа участвовать в обследовании не производится.
155
156 Интервьюер опрашивает членов домашних хозяйств, проживающих по адресам, только согласно спискам, представленным в выборке.
157
158 28-1. При наличии объективных причин отсутствия ответов в ходе проведения обследования домашних хозяйств, составляются резервные списки. Резервная выборочная совокупность составляется специалистами по формированию выборочной совокупности для возможной замены домашних хозяйств по объективным причинам отсутствия ответов. Резервная выборочная совокупность составляется тем же методом, которым составлена основная выборочная совокупность.
159
160 Замена адресов жилых помещений допускается только из резервного списка на то домохозяйство, которое конкретно предназначено служить субститутом или заменой не ответившего домохозяйства по объективным причинам. Это делается для исключения замены на "удобное" домохозяйство, при которой увеличивается погрешность выборки.
161
162 29. При обработке случаев не предоставления данных, неполученные ответы по объективным причинам – не компенсируются. Компенсации подлежат только случаи неполученных ответов по субъективным причинам.
163
164 Для этих целей обработки применяется метод перевзвешивания, заключающийся в корректировке выборочных весов.
165
166 30. В целях получения данных, распространенных на генеральную совокупность, производится статистическое взвешивание итогов обследования.
167
168 Взвешивание результатов выборочного обследования производится путем присвоения соответствующего веса каждой отдельной единице наблюдения – персоне.
169
170 31. Окончательный индивидуальный вес К представляет собой произведение базового веса F и коэффициентов компенсации и экстраполяции.
171
172 Индивидуальный вес, рассчитанный для каждого респондента, вводится в базу индивидуальных данных в качестве множителя распространения и используется при формировании распространенных данных на всю численность [[населения>>doc:xwiki:Глоссарии.Население.WebHome]] обследуемого [[возраста>>doc:xwiki:Глоссарии.Возраст.WebHome]], пола и типа местности по любым показателям программы обследования.
173
174 32. Веса для показателей [[занятости>>doc:working:Глоссарии.Занятость.WebHome]] [[населения>>doc:xwiki:Глоссарии.Население.WebHome]] рассчитываются ежемесячно. Для расчета весов используются данные СРЖФ о распределении обследуемых домашних хозяйств отдельно по городскому и сельскому [[населению>>doc:xwiki:Глоссарии.Население.WebHome]] в региональном разрезе.
175
176 33. При расчете индивидуальных весов применяется метод итеративного взвешивания выборки по отношению к общей численности [[населения>>doc:xwiki:Глоссарии.Население.WebHome]] в периоде, наиболее приближенному к отчетному периоду (критической неделе обследования).
177
178 Процедура заключается в сопоставлении выборочной совокупности, распределенной на группы с учетом половозрастной и региональной характеристик, со всей совокупностью [[населения>>doc:xwiki:Глоссарии.Население.WebHome]], распределенной по этим же характеристикам.
179
180 34. При обработке результатов ежемесячного опроса расчет индивидуальных весов взвешивания (коэффициентов экстраполяции) производится последовательно в несколько этапов.
181
182 35. В целях выравнивания неизбежных при выборках случайных, а также неслучайных систематических ошибок:
183
184 * проводится выравнивание известных случаев несостоявшихся опросов – компенсация;
185 * проводится распространение на генеральную совокупность до показателей СРЖФ – адаптация или экстраполяция.
186
187 Для этого вычисляются соответствующие факторы, фактор компенсации и фактор экстраполяции.
188
189 **Параграф 1. Компенсация**
190
191 36. С помощью данной процедуры осуществляется дорасчет показателей по домашним хозяйствам, с субъективными причинами отказа от обследования, и компенсируются недополученные данные выборочного обследования.
192
193 37. Перед осуществлением этой процедуры суммируют количество домашних хозяйств, предполагаемых к обследованию (S,,1,,), количество домашних хозяйств, фактически опрошенных (S,,2,,) и количество неопрошенных домашних хозяйств с указанием причины (Sр).
194
195 Численность неопрошенных подразделяют на группы – по объективным причинам (Sр,,1,,) и по субъективным причинам (Sр,,2,,):
196
197 * объективные причины связаны с невозможностью проведения обследования, вследствие разрушения (сноса) или объединения самого жилого помещения, смерти, отсутствия длительное время или выбытия на новое место подлежащего обследованию члена домашнего хозяйства и других непредвиденных обстоятельств;
198 * к субъективным причинам относят отсутствие на момент обследования жильцов, отказ отдельного члена или всего домашнего хозяйства от опроса.
199
200 38. С помощью процедуры компенсации осуществляется дорасчет показателей по домашним хозяйствам, попадающим под субъективные причины отказа от обследования, компенсируются недополученные данные выборочного обследования. Для этого рассчитывается промежуточный компенсирующий фактор (вес) К1
201
202 [[image:image-20230517171404-11.png]]// // (5)
203
204 где,
205
206 К1 – компенсирующий фактор (коэффициент досчета);
207
208 Sр,,2,, – количество домашних хозяйств, не опрошенных по субъективным причинам отказа от опроса;
209
210 S,,2,, – количество фактически опрошенных домашних хозяйств.
211
212 39. Промежуточный компенсирующий фактор вычисляется с точностью до пяти десятичных знаков по каждому району отдельно и присваивается каждому респонденту данного района вне зависимости от его пола и [[возраста>>doc:xwiki:Глоссарии.Возраст.WebHome]].
213
214 Далее производится корректировка базового веса (f) на компенсирующий фактор (K1).
215
216 Скорректированный на базовый вес, компенсирующий фактор используют для определения численности, полученной в результате доведения числа домашних хозяйств до обследуемого (S,,1,,)
217
218 [[image:image-20230517171352-10.png]]// // (6)
219
220 40. Для компенсации случаев полного неполучения данных применяется схема корректировки весов, путем задания больших весов для всех ответивших домохозяйств в данном населенном пункте. Веса всех домашних хозяйств, ответивших на вопросы в данном населенном пункте, увеличиваются на один и тот же коэффициент. Все не ответившие домашние хозяйства исключаются из выборки путем задания для каждого из них фактического веса равного нулю.
221
222 **Параграф 2. Экстраполяция**
223
224 41. Распространение выборочных данных обследования основано на присвоении соответствующего индивидуального веса каждой отдельной единице наблюдения – домашнему хозяйству.
225
226 Для этого осуществляется сопоставление данных обследования по выборочной совокупности численности обследованных граждан), стратифицированной с учетом половозрастной и региональной характеристик, с генеральной совокупностью [[населения>>doc:xwiki:Глоссарии.Население.WebHome]] по данным текущих демографических расчетов, стратифицированной по этим же характеристикам.
227
228 42. В общем виде формула расчета фактора адаптации (веса) имеет вид
229
230 [[image:image-20230517171308-8.png]]// // (7)
231
232 где,
233
234 Vg – вес по признаку g;
235
236 Wg – доля [[населения>>doc:xwiki:Глоссарии.Население.WebHome]] в генеральной совокупности, с характеристикой g;
237
238 N – общее число опрошенных;
239
240 Ng – число опрошенных, с характеристикой g.
241
242 43. Процедура взвешивания производится на основе данных о структуре [[населения>>doc:xwiki:Глоссарии.Население.WebHome]] по сложившейся совокупности, используемой в качестве генеральной, только внутри региональных слоев (страт) по полу и [[возрасту>>doc:xwiki:Глоссарии.Возраст.WebHome]]. Для каждого респондента рассчитывается система факторов адаптации (весов) по следующим признакам:
243
244 * территориальная структура (район);
245 * тип местности;
246 * пол (мужчины и женщины);
247 * 6 возрастных групп (6–10 лет; 11–14 лет; 15–34 года; 35–54 года; 55–71 год; 72 года и выше).
248
249 44. Для расчета базового индивидуального веса используется следующая формула расчета фактора адаптации:
250
251 [[image:image-20230517171335-9.png]] (8)
252
253 где,
254
255 K,,2,, – фактор адаптации;
256
257 S – численность [[населения>>doc:xwiki:Глоссарии.Население.WebHome]] по генеральной совокупности;
258
259 S,,1,, – численность [[населения>>doc:xwiki:Глоссарии.Население.WebHome]] фактически опрошенных домашних хозяйств;
260
261 K – отличительный признак в зависимости от совокупной характеристики лица, для которого рассчитывается фактор.
262
263 45. Окончательный индивидуальный вес (или коэффициент экстраполяции) является произведением фактора компенсации и фактора адаптации.
264
265 [[image:image-20230517171545-15.png]]// // (9)
266
267 где,
268
269 К – индивидуальный вес (коэффициент экстраполяции);
270
271 К1 – компенсирующий фактор (коэффициент досчета);
272
273 К2к – фактор адаптации.
274
275 При этом, если фактор компенсации для всех членов заданного домашнего хозяйства имеет одно и тоже значение, то факторы адаптации, как соответственно и окончательный фактор экстраполяции (индивидуальный вес) – различен.
276
277 46. Рассчитанные индивидуальные веса в качестве дополнительных переменных записываются в базу индивидуальных данных по каждому опрошенному респонденту и используются при формировании сводных итогов по соответствующему месяцу, кварталу, году на республиканском, областном, районном уровнях.
278
279 Распространенные данные в среднем за текущий год получаются путем объединения ежемесячных выборок за год, а распространенные квартальные данные – путем объединения ежемесячных выборок за квартал.
280
281 = Глава 7. Ротация выборки =
282
283 47. Ротация домашних хозяйств (обновление выборки) проводится ежегодно в размере 100%, ежегодно вся выборка заменяется новыми домашними хозяйствами.
284
285 = Глава 8. Оценка точности показателей =
286
287 48. В качестве показателей точности статистического оценивания, используются стандартная ошибка выборки и стандартная относительная ошибка выборки.
288
289 49. Стандартной ошибкой выборки является стандартное отклонение значения параметра выборки от выборочного среднего значения этого параметра.
290
291 Относительной стандартной ошибкой является отношение оцениваемой статистической величины к его среднему значению.
292
293 50. Точность обследования по районам рассчитывается раз в год по показателям численность [[занятых>>doc:working:Глоссарии.Занятые лица.WebHome]], численность [[безработных>>doc:working:Глоссарии.Безработные.WebHome]], численность [[рабочей силы>>doc:working:Глоссарии.Рабочая сила.WebHome]], численность [[лиц, не входящих в состав рабочей силы>>doc:working:Глоссарии.Лица, не входящие в состав рабочей силы.WebHome]], доля [[рабочей силы>>doc:working:Глоссарии.Рабочая сила.WebHome]] в численности [[населения>>doc:xwiki:Глоссарии.Население.WebHome]], уровень [[безработицы>>doc:working:Глоссарии.Безработица.WebHome]].
294
295 51. В качестве показателей точности статистического оценивания используются стандартная ошибка выборки и стандартная относительная ошибка выборки.
296
297 52. Стандартная ошибка выборки (m) определяет возможные расхождения между характеристиками выборочной и генеральной совокупности. Значение стандартной ошибки выборки определяются по формуле:
298
299 [[image:image-20230517171612-16.png]]** ** (10)
300
301 где,
302
303 [[image:image-20230518142054-1.png]] – генеральная дисперсия;
304
305 //n// – объем выборочной совокупности;
306
307 N – объем генеральной совокупности.
308
309 53. По итогам ВОЗН статус респондента определяется из ответов респондентов на вопросы (например: да или нет). Переменные, определяющиеся выбором одной из двух альтернативных ответов, являются бинарной. По теории вероятностей для бинарной переменной рассчитывается дисперсия. Для расчета относительной стандартной ошибки ВОЗН, используется долевое значение ответов (да или нет). Определяется дисперсия доли, затем вычисляется стандартная относительная ошибка.
310
311 Стандартная ошибка выборочной доли (mg) определяется по формуле:
312
313 [[image:image-20230517171649-17.png]] (11)
314
315 где:
316
317 w - доля ответов (доля «успехов») в процентах;
318
319 //n// – объем выборочной совокупности;
320
321 N – объем генеральной совокупности.»;
322
323 дополнить пунктом 54 следующего содержания:
324
325 «54. Часто требуется рассмотреть не абсолютные значения стандартной ошибки, но ее значение в отношении оцениваемой статистической величины. Относительная стандартная ошибка (далее – ОСО) рассчитывается как отношение оцениваемой статистической величины к его среднему значению.
326
327 ОСО определяется по следующей формуле:
328
329 [[image:image-20230517171709-18.png]]// // (12)
330
331 где,
332
333 RSE – относительная стандартная ошибка выборки;
334
335 SE – стандартная ошибка выборки;
336
337 [[image:image-20230518142231-3.png]] – среднее значение переменной, использованной для оценки величины относительной стандартной ошибки.
338
339 [[image:image-20230517171732-19.png]]// // (13)
340
341 где,
342
343 //N,,i,,// – количество элементов генеральной совокупности i-страте;
344
345 //x,,i ,,//– показатель i-страты.».

Commonwealth of Nations

Languages