Архив. Законодательство Украины

 

Архів сайту. Оновлення.

Про затвердження Методики розрахунку характеристик надійності оцінювання показників за результатами вибіркового обстеження населення (домогосподарств) з питань економічної активності

Державний комітет статистики України (Держкомстат)

Наказ № 639 від 29.12.2006

Страница 1

Стр. 1 Стр. 2 Стр. 3 Стр. 4 Стр. 5 Стр. 6 Стр. 7 Стр. 8

<< Главная страница





               ДЕРЖАВНИЙ КОМIТЕТ СТАТИСТИКИ УКРАЇНИ

                            Н А К А З
 
                        29.12.2006  N 639
 
 
               Про затвердження Методики розрахунку
               характеристик надійності оцінювання
              показників за результатами вибіркового
              обстеження населення (домогосподарств)
                 з питань економічної активності
 
 
     Відповідно до  статті  14  Закону   України   "Про   державну
статистику"   (   2614-12  )  та  з  метою  удосконалення  системи
показників стану економічно активного  населення,  їх  аналізу  та
використання Н А К А З У Ю:
 
     1. Затвердити  та  ввести  в дію з 1 січня 2007 року схвалену
методичною комісією Держкомстату Методику розрахунку характеристик
надійності   оцінювання  показників  за  результатами  вибіркового
обстеження  населення  (домогосподарств)  з   питань   економічної
активності (далі - Методика), що додається.
 
     2. Департаменту статистики праці (Григорович Н.В.):
 
     2.1. Здійснювати  керівництво  щодо  застосування на практиці
Методики, затвердженої пунктом 1 цього наказу.
 
     2.2. Довести Методику, затверджену пунктом 1 цього наказу, до
відома головних управлінь статистики в Автономній Республіці Крим,
областях, у м. Києві та Управління статистики у м. Севастополі.
 
     3. Контроль за виконанням цього наказу покласти на заступника
Голови Власенко Н.С.
 
 Голова                                              О.Г.Осауленко
 
 
                                      ЗАТВЕРДЖЕНО
                                      Наказ Держкомстату України
                                      29.12.2006  N 639
 
 
                             МЕТОДИКА
               розрахунку характеристик надійності
              оцінювання показників за результатами
                 вибіркового обстеження населення
                    (домогосподарств) з питань
                      економічної активності
 
 
                             Анотація
 
     Методика визначає  основний  зміст  характеристик  надійності
оцінювання  показників  за  результатами  вибіркового   обстеження
населення  (домогосподарств)  з  питань  економічної активності та
принципи їх розрахунку на основі методу збалансованих  реплікацій,
реалізованого в пакеті статистичних програм "WesVarPC".
     В Методиці розглянуто  інформаційне  забезпечення  зазначених
розрахунків,   наведені   конкретні   приклади   та   представлена
технологія їх здійснення.  Наведені  інструктивні  матеріали  щодо
реалізації розрахунків у програмному пакеті "WesVarPC".
     Дослідження та практичні роботи виконані за підтримки проекту
технічної  допомоги  в  галузі  статистики  Міністерства у справах
міжнародного розвитку Сполученого Королівства Великої Британії  та
Північної Iрландії.
     Методику призначено  для  використання  працівниками  органів
державної  статистики,  насамперед  на  державному  рівні.  Вона є
корисною   також   для   працівників   територіальних    управлінь
статистики,  а  також  фахівців наукових організацій та навчальних
закладів, що проводять дослідження в галузі методології вибіркових
обстежень.
     Методику розроблено   фахівцями   Iнституту   демографії   та
соціальних досліджень  НАН   України   В.Г.Саріогло,    О.В.Лисою,
фахівцями департаменту  статистики  праці   Держкомстату   України
Н.В.Григорович,  Н.В.Рубльовою, А.В.Солоп  та  за  участю фахівців
департаменту      обстежень      домогосподарств     I.I.Осипової,
С.О.Радченко.
 
                            Передмова
 
     При проведенні  вибіркових  обстежень вирішальне значення для
правильної інтерпретації їх  результатів,  контролю  оптимальності
дизайну   вибірки  та  статистичної  ефективності  окремих  етапів
обробки даних має інформація щодо надійності оцінювання показників
для  генеральної сукупності.  Оцінка показника,  надійність якої є
недостатньою,  не може бути використана для  аналізу  процесів  та
явищ.
     Можливість визначення   надійності   оцінювання    показників
генеральної   сукупності   за   результатами  певного  вибіркового
обстеження є найважливішим фактором,  який обумовлює  ефективність
вибіркового методу спостережень при зборі статистичної інформації.
Як відомо,  зазначена   можливість   забезпечується   імовірнісним
характером, тобто репрезентативністю вибірки.
     Для імовірнісних  вибірок  зі  складним  дизайном,  якою   є,
зокрема, вибірка       вибіркового       обстеження      населення
(домогосподарств) з питань економічної активності (далі  -  ОЕАН),
побудова  аналітичних  залежностей  для  розрахунку  характеристик
надійності  є  складною  статистичною  проблемою,  оскільки   такі
залежності  визначаються  як особливостями дизайну вибірок,  так і
типом  показників,  що  оцінюються.  При   цьому   використовувати
спрощені залежності,  які не враховують реального дизайну вибірок,
неприпустимо,  оскільки  це  може  призвести   до   катастрофічної
недооцінки  похибки  вибірки.  За  таких  умов більш ефективними є
універсальні наближені розрахункові  методи  оцінки  характеристик
надійності, зокрема реплікаційні методи та методи лінеаризації.
     З метою визначення характеристик надійності в даній  Методиці
використовується  так званий метод збалансованих реплікацій,  який
дозволяє  за  результатами  вибіркового   обстеження   розрахувати
величину   дисперсії  вибіркових  оцінок  для  будь-якого  дизайну
вибірки та для  будь-якого  типу  показника.  Цей  метод  дозволяє
ефективно  використовувати  первинні дані обстеження,  статистичні
ваги обстежених одиниць та дизайн вибірки.  Метод  реалізований  в
статистичному   програмному   пакеті  "WesVarPC",  який  в  цілому
гармонізований  з  програмним  пакетом  "SPSS",   що   є   базовим
програмним  продуктом  для  обробки  статистичних  даних в системі
Держкомстату України.
     Необхідність розробки даної Методики обумовлена,  насамперед,
визначальною роллю інформації щодо  рівня  надійності  результатів
ОЕАН  у  адекватній їх інтерпретації та використанні,  підвищенням
зацікавленості користувачів у отриманні  характеристик  надійності
та  рекомендаціями  міжнародних статистичних служб щодо стандартів
оцінювання  показників  та  змісту  публікацій   за   результатами
зазначених обстежень.
 
                             ПЕРЕЛIК
                  умовних позначень та символів.
                   Визначення основних термінів
 
 
     Умовні позначення:
 
------------------------------------------------------------------
¦ПТОВ ¦- первинна територіальна одиниця вибірки;                 ¦
¦-----+----------------------------------------------------------¦
¦ВТОВ ¦- вторинна територіальна одиниця вибірки;                 ¦
¦-----+----------------------------------------------------------¦
¦ОЕАН ¦- обстеження економічної активності населення;            ¦
¦-----+----------------------------------------------------------¦
¦BRR  ¦- (balanced repeated replications) метод збалансованих    ¦
¦     ¦реплікацій.                                               ¦
¦     ¦                                                          ¦
------------------------------------------------------------------
 
     Символи:
 
-----------------------------------------------------------------------------
¦n               ¦- обсяг вибірки;                                          ¦
¦----------------+----------------------------------------------------------¦
¦ ^              ¦                                                          ¦
¦ТЭТА            ¦- оцінка показника за результатами вибіркового обстеження;¦
¦----------------+----------------------------------------------------------¦
¦  ^      ^      ¦                                                          ¦
¦ТЭТА  + ТЭТА    ¦- верхня та нижня межі довірчого інтервалу;               ¦
¦    L       R   ¦                                                          ¦
¦----------------+----------------------------------------------------------¦
¦     ^          ¦                                                          ¦
¦ CV(ТЭТА)       ¦- коефіцієнт варіації вибіркових оцінок показника ТЭТА;   ¦
¦----------------+----------------------------------------------------------¦
¦       ^        ¦                                                          ¦
¦ deff(ТЭТА)     ¦- дизайн-ефект;                                           ¦
¦----------------+----------------------------------------------------------¦
¦      ^         ¦                                                          ¦
¦ LSE(ТЭТА)      ¦- гранична похибка;                                       ¦
¦----------------+----------------------------------------------------------¦
¦     ^          ¦                                                          ¦
¦ SE(ТЭТА)       ¦- стандартна похибка;                                     ¦
¦----------------+----------------------------------------------------------¦
¦    ^           ¦                                                          ¦
¦ V(ТЭТА)        ¦- дисперсія вибіркових оцінок ТЭТА.                       ¦
-----------------------------------------------------------------------------
 
    Основні терміни [1, 2]:
 
------------------------------------------------------------------
¦Гранична похибка                ¦- гранично припустима          ¦
¦                                ¦розбіжність між оцінкою        ¦
¦                                ¦показника за результатами      ¦
¦                                ¦вибіркового обстеження та      ¦
¦                                ¦дійсним значенням показника    ¦
¦                                ¦(невідомим) для генеральної    ¦
¦                                ¦сукупності, визначена на основі¦
¦                                ¦стандартної похибки вибірки та ¦
¦                                ¦встановленого рівня довірчої   ¦
¦                                ¦імовірності.                   ¦
¦--------------------------------+-------------------------------¦
¦                    ^           ¦                               ¦
¦Дизайн-ефект (deff(ТЭТА))       ¦- міра відносної статистичної  ¦
¦                                ¦ефективності певного дизайну   ¦
¦                                ¦вибірки у порівнянні з простою ¦
¦                                ¦випадковою вибіркою (відношення¦
¦                                ¦дисперсії вибіркових оцінок    ¦
¦                                ¦показника для реального дизайну¦
¦                                ¦вибірки, до дисперсії оцінки   ¦
¦                                ¦цього показника, отриманої за  ¦
¦                                ¦допомогою простого випадкового ¦
¦                                ¦відбору).                      ¦
¦--------------------------------+-------------------------------¦
¦Дисперсія вибіркових оцінок     ¦- середній квадрат відхилень   ¦
¦                                ¦оцінок показника за всіма      ¦
¦                                ¦можливими вибірками даного     ¦
¦                                ¦дизайну від середнього значення¦
¦                                ¦оцінки за всіма вибірками.     ¦
¦--------------------------------+-------------------------------¦
¦Довірчі межі (межі довірчого    ¦- крайні значення оцінки       ¦
¦інтервалу)                      ¦показника, між якими міститься ¦
¦                                ¦дійсне значення показника.     ¦
¦--------------------------------+-------------------------------¦
¦Коефіцієнт варіації (відносна   ¦- відносна стандартна похибка  ¦
¦стандартна похибка)             ¦вибірки. Визначається як       ¦
¦                                ¦відношення величини стандартної¦
¦                                ¦похибки вибірки до оцінки      ¦
¦                                ¦показника у відсотках.         ¦
¦--------------------------------+-------------------------------¦
¦Надійність                      ¦- близькість оцінок показника  ¦
¦                                ¦за всіма можливими вибірками   ¦
¦                                ¦даного дизайну до дійсного     ¦
¦                                ¦(невідомого) значення          ¦
¦                                ¦показника.                     ¦
¦--------------------------------+-------------------------------¦
¦Оцінка показника                ¦- значення показника для       ¦
¦                                ¦генеральної сукупності,        ¦
¦                                ¦отримане за результатами       ¦
¦                                ¦вибіркового спостереження.     ¦
¦--------------------------------+-------------------------------¦
¦Стандартна похибка              ¦- середньоквадратичне          ¦
¦                                ¦відхилення вибіркових оцінок   ¦
¦                                ¦показника за всіма можливими   ¦
¦                                ¦вибірками даного дизайну від   ¦
¦                                ¦дійсного значення показника для¦
¦                                ¦генеральної сукупності.        ¦
------------------------------------------------------------------
 
                      1. Загальні положення
 
     Iз статистичної   точки  зору  оцінка  певного  показника  за
результатами вибіркового обстеження  є  надійною,  якщо  вибіркові
оцінки,  побудовані  на  базі  всіх  можливих  вибірок  однакового
дизайну та обсягу, сконцентровані біля дійсного значення показника
[3].  Висока  концентрація,  тобто надійність,  бажана тому,  що в
окремому процесі побудови вибірки та розрахунку оцінки, який майже
завжди  застосовується  на практиці,  існує лише деяка імовірність
наблизитись до дійсного значення (див. рис. 1 ( va639202-06 ).
     Реальна надійність оцінок будь-якого показника,  оціненого за
даними  вибіркового  обстеження,  може  бути  визначена   лише   у
виключному   випадку,   так   як  на  практиці  процедура  відбору
реалізується лише один раз і дійсні значення показників  невідомі.
При  обробці  даних  вибіркових  обстежень  в  більшості  випадків
надійність лише  оцінюється.  Слід  відмітити,  що  в  теоретичній
статистиці  розвинуті  підходи,  котрі  дозволяють  відходити  від
необхідності повторення обстеження для широкого  спектру  дизайнів
вибірок.   Ці   підходи  вимагають,  перш  за  все,  імовірнісного
характеру вибірки - кожна сукупність елементів повинна мати відому
(не  нульову) імовірність потрапити до вибірки.  Крім того існують
методи,  які дозволяють прямо оцінити надійність показників -  так
звані реплікаційні методи.
     Близькість оцінки показника до реального значення  показника,
а саме    її    надійність,   має   два   аспекти   (див.   рис.1.
( va639202-06 ):
     - вибіркові оцінки мають малу дисперсію;
     - середнє  значення  оцінок  показника  близьке  до  дійсного
значення.
     Оцінки дисперсії,  отримані  по  різних  вибірках,  називають
дисперсією вибіркових оцінок або вибірковою дисперсією.
     Дисперсія вибіркових оцінок визначається за формулою:
 
                                         -
             ^        1     H   ^        ^  2
          V(ТЭТА) = ---    S  (ТЭТА  - ТЭТА) ,                 (1)
                     Н   i = 1     i
 
     де:
      ^
     ТЭТА - оцінка показника по вибірці
     i,i =  1,  2,  ...,  H;  - середнє значення вибіркових оцінок
показника,
      -
      ^       1     H   ^
     ТЭТА =  ---    S  ТЭТА ;
              H    i=1     i
 
     H - кількість вибірок,
     S - знак суми.
 
     Рис. 1.  Порівняння надійності оцінок при  великій  дисперсії
без зміщення та при малій дисперсії зі зміщенням ( va639202-06 )
 
     Похибка вибірки розраховується  як  стандартна  похибка SE на
                                          ^
підставі величини  оцінки  дисперсії  V(ТЭТА) значень показника за
формулою:
                              ---------
                        SE = \¦    ^                           (2)
                                V(ТЭТА)
 
     Для вибірок зі складним дизайном,  якою є,  зокрема,  вибірка
                          ^
для ОЕАН,   величина  V(ТЭТА)  може  бути  розрахована  на  основі
класичної  формули  для  оцінки  дисперсії  ознаки  при   простому
випадковому відборі:
 
                                                 2
                                            сигма
                      ^            ^             s
                   V(ТЭТА) = deff(ТЭТА) x  --------,           (3)
                                              n
 
     де:
         2
    сигма  -  дисперсія  оцінки  показника по одиницях вибірки для
         s
простого випадкового відбору.
 
    Коефіцієнт варіації  CV  (або  відносна   стандартна   похибка
вибірки RSE) розраховується за формулою:
 
                         SE
                   CV = ------- x 100%                         (4)
                          ^
                        (ТЭТА)
 
     Відносні стандартні похибки в аналізі надійності  результатів
обстежень доцільно використовувати,  оскільки вони не залежать від
рівня ознаки.
     Величина коефіцієнта   варіації  часто  використовується,  як
показник придатності даних для аналізу.  Так,  якщо CV   = 5%,  то
оцінка вважається  точною,  якщо  5%     =  CV   = 10%  - оцінка є
придатною для кількісного аналізу,  але  її  точність  недостатньо
висока, якщо 10%    CV   = 25% - оцінка придатна лише для якісного
аналізу і її слід використовувати обережно (іноді публікують  дані
для яких CV досягає 30% і навіть 40%).
 
     Гранична похибка  вибірки  LSE   розраховується   на   основі
стандартної похибки вибірки за формулою:
 
                      LSE = T x SE,                            (5)
 
     де:
     t -  довірче  число  (квантіль  нормального   розподілу   або

<< Главная страница

Стр. 1 Стр. 2 Стр. 3 Стр. 4 Стр. 5 Стр. 6 Стр. 7 Стр. 8



Украина онлайн