Конспект лекций Санкт-Петербург 2007 г


Надежность статистической информации



страница7/14
Дата30.12.2017
Размер3.54 Mb.
ТипЛекция
1   2   3   4   5   6   7   8   9   10   ...   14

Надежность статистической информации


Типичная отраслевая демографическая статистика по территориям. Фиксируется по свидетельству о рождении. Хотя, конечно, эти факторы учитываются и в системе здравоохранения. Но если сопоставить данные по здравоохранению и по ЗАГСу по одной и той же территории, окажется, что статистика ЗАГСов всегда ниже. Потому что в медицинские показатели рождаемости входят все случаи рождения живого ребенка, но там же учитывается перинатальная и постнатальная смерть.

Для регистрации смерти существует особая форма, здесь первичные данные собираются по врачебным свидетельствам о смерти то есть ее заполняет работник здравоохранения. Но само врачебное свидетельство о смерти, это тоже документ ЗАГСа, поэтому он сразу идет в демографическую статистику. Поэтому по очень многим видам показателей существует несколько различающихся видов статистических данных. И в этом нет ничего удивительного. Любая статистическая система в основном предназначена для отражения 2 процессов, совершенно не связанных между собой: 1) сами факты или явления на данной территории, 2) деятельность каких-то ведомств или служб, которые работают с этими фактами. Еще их называют статистикой явлений и статистикой деятельности. Но проблема заключается в том, что статистику ведут соответствующие государственные органы, подавляющее большинство статистической информации относится к деятельности этих органов, а вовсе не явлений. Предположим, нас интересует статистика правонарушений, совершенных в пьяном виде. Такой учет ведется во всем мире. Что мы фактически имеем, когда видим эту статистику? Сколько было задержано. Статистика заболеваемости - это фактически статистика обращаемости в медицинские учреждения. Даже статистика поголовья крупного рогатого скота, это статистика скота, который облагается налогом, скота выявленного у крестьян. Следовательно, здесь заложен самый большой источник ошибок государственной статистики. Фактически, она отражает деятельность бюрократической организации, которая заинтересована в том, чтобы представить свою деятельность в выгодном для себя свете. То есть если благополучие людей зависит от того, какую статистику они составляют, они будут составлять ту статистику, которая лучше.

Например, статистика раскрываемости тяжких преступлений по Санкт-Петербургу. Во времена министра Щелокова она составляла 90%. На самом деле ни в одной стране мира она никогда не может подняться выше 48%. Это предел, который могут обеспечить полицейские органы. У нас при социализме было 90%. Потом, когда наступили реформы, вдруг оказалось, что 10%. Речь здесь идет об одном показателе за очень короткое время. То есть он менялся от 10 до 90%.

Причем существуют простые способы влияния на статистику. Вы знаете, что у нас в Петербурге около 35-40% обращений в милицию просто отказываются фиксировать. А если нет фиксации, нет и правонарушения. Самый простой способ снизить уровень преступности - просто не фиксировать его.

Таким образом, если вы знаете, что данной системе показателей оценивается работа соответствующего органа управления, можете считать, что достоверность такой статистики равна нулю. А вы знаете, что у нас чаще всего как раз по такой статистике и оценивается работа органов.

Далее существует еще понятие латентности. Дело в том, что далеко не со всеми показателями можно поступать подобным образом. Есть такие виды фактов, подлежащих статистическому учету, которые очень тяжело скрыть от учета, но существуют и такие, которые от учета скрыть чрезвычайно легко. Например, во многих штатах США и, по-моему, до сих пор в нашем законодательстве существует уголовная ответственность за изнасилование собственной жены. Как вы думаете, сколько народу привлекается по этой статье? В Америке за 100 лет существования этого закона 1 или 2 таких случая было. Все они полуанекдотические. Тем не менее маловероятно, что это явление - редкое, но чрезвычайно высока латентность. То же самое внутрисемейное насилие. Факты смерти, имущественного повреждения, типа поджогов, вряд ли уходят из учета. Это очевидные факты. А есть и такие, которые очень легко скрываются. То есть принцип такой: чем выше латентность, тем ниже надежность информации.

Таким образом, первый вид ошибок или факторов, влияющих на надежность статистической информации, это умышленное тенденциозное искажение, исходящее из самой природы деятельности органов государственного управления как бюрократических органов. Существует здесь еще один подраздел. Он не всегда имеет значение, но иногда имеет: умышленное представление неверных данных. Но здесь это происходит не по. причине заинтересованности этих органов, а в силу каких-то государственных установок. Например, наша страна много лет отчитывалась перед ВОЗ, что мы победили венерические заболевания. То есть предоставлялись такие цифры, которых не может быть. Во всем мире показатели были в 10-20 раз выше, чем у нас и в Китае. Надо сказать, что в нашей стране существовала искаженная статистика по очень большому кругу областей, в частности по криминологии, здравоохранению, фактически социальная и экономическая статистика очень сильно искажалась. Но производить такую статистику чрезвычайно тяжело. Только кажется, что это простая задача, на самом деле существует устойчивый уровень каких-то явлений в популяции и какие-то устойчивые тенденции. И вообще все показатели друг с другом связаны. Например, если мы хотим снизить процент кожно-венерических больных, то соответственно должно быть снижено и количество коек и число врачей патовенерологов и т.д. То есть, представьте, сколько статистики надо изменить, чтобы изменить одну цифру. Возьмем самую безобидную сферу - обучение. Изменили мы количество циклов по кожно-венерическим болезням, сразу меняется нагрузка преподавателей, нагрузка учебных аудиторий и т.д. Поэтому искажать, таким образом статистику - дело очень тяжелое и неблагодарное. И я даже могу сказать вам с большой уверенностью, что при советской власти это почти не делалось, кроме исключительных случаев. Потому что у нас все-таки были специалисты, которые понимали насколько это опасное и сложное дело. Фальсификации очень легко выявляются. На ложные индикаторы, которые мы представляли в ВОЗ, западные эксперты сразу же выходили. Поэтому, что бы вы ни прочитали или ни услышали от старших коллег, в нашей стране существует полностью максимально объективная картина статистических данных по всем основным видам социально-экономического развития. И эти данные все опубликованы, публиковались при советской власти. Мы все привыкли к мнению, что ничего не публиковалось, все было закрыто. На самом деле, как это делалось?

Все давалось не в абсолютных цифрах, а в процентах или в долях, или на тысячу населения, без абсолютных цифр для базового расчета.

Второй и основной вид ошибок, это ошибки несистематические или ошибки учета и сводки.

Ошибки учета - это когда либо фиксируются не все случаи, либо они просто "берутся с потолка". Вот скажем, вы знаете, что существует такой документ как лист первичного учета особо опасных инфекций. То есть, как только появляется сигнал об особо опасных инфекциях, сразу заполняется специальный статистический талон, на основе которого предпринимаются все дальнейшие действия: идентификация очага, карантинные мероприятия, обследование всех заболевших и т.д. Так вот мне как-то пришлось сравнивать по Василеостровскому району количество талонов об особо опасных инфекциях с реальным количеством людей, которые обследовались. Выяснилось, что 2/3 талонов просто не заполнялись. То есть на самом деле количество людей, охваченных особо опасными инфекциями на 2/3 выше, чем проходит по статистике. По больничным листам они лечились, а вся статистика ведется на основе талона.

Еще один поразительный пример. Кандидатская диссертация, которая выполнялась на кафедре статистики педиатрического института. Количество детей, охваченных педиатрической помощью в ранние годы жизни. Из 10 детей 8 не учитывается. Причем это не только советский феномен. В Великобритании одно время была очень большая проблема заболеваемости горняков. Это один из наиболее подверженных заболеваемости контингентов болеющих, с большими претензиями, с очень большими страховыми выплатами. Оказалось, что 5/6 случаев, когда выплачивались деньги, не попадали в медицинскую статистику. То ли докторам было лень заполнять документы, то ли по дороге терялся, неизвестно, но до конца не доходили. И это те случаи, которые имеют очень маленькую латентность.

Следующий вид ошибок - это ошибки сводки или агрегирования. Представьте, что на каждом уровне управления все первичные данные сводятся вручную. Возьмем тот же пример со статистическими талонами. Любой работник, который ведет первичный учет, уверен, что это чушь, ерунда, никому не нужная вещь. И что не напиши, все будет хорошо. Вы не найдете работника, занятого первичным учетом, который бы серьезно к этому относился.

Скажем на территории муниципального образования 10 поликлиник. Ну, вы представляете, с какой точностью это будет посчитано, а потом суммировано. Калькулятор сломался или его вообще нет. Представьте, сколько в районе муниципальных образований, 12-15 может быть. А в городе 22 района. Какое количество ошибок должно быть на уровне уже городском при такой системе, представляете? То есть, если вам нужно составить представление об уровне какого-то показателя на территории, цифры, которые вы найдете в агрегированной статистике, к этому вообще не имеют никакого отношения. Если вы хотите знать реально об уровне явления на территории, вы должны все начинать с первичного учета. Никакой надежды, что сводка делается более-менее правильно на всех уровнях управления, нет.

Для того, чтобы получить достоверные данные, в статистике существует метод переписи. Переписной метод заключается в единовременном, то есть на какую-то определенную временную точку, полном учете всех объектов по некоему ограниченному кругу показателей или признаков. Во-первых, перепись подразумевает, что есть однородный объект. В переписи населения объектом является человек. Кроме этого, могут переписи всех, например, больных на какое-то число, находящихся на стационарном лечении, или перепись всего машинного парка, или перепись всех промышленных предприятий, или торговых предприятий. Но вот, скажем, переписи всех больных и коек не может быть. Либо перепись коек, либо перепись больных. То есть множество объектов однородно.

Вообще переписи населения имеют давнюю традицию, еще с петровских времен. Сейчас они проводятся каждые 10 лет по девятым годам. Это делается для того, чтобы следующий расчетный год был нулевой. Хотя за период советской власти из-за экономических сложностей уже четвертый раз пропускается переписной год.

В 1934 году, как вы знаете, перепись проводилась. Дело в том, что перепись вместо 1929 года была сделана в 1933 - 1934 годах (и вот сейчас очередная перепись смещается на три года, ее хотят провести в 2002 году). Там получились совершенно катастрофические результаты, оказалась убыль населения 30 миллионов в год взрослых мужчин, минимальная рождаемость, диспропорция по городскому - сельскому населению. В результате все, кто делал эту перепись, были расстреляны. Беда была в том, что это было последнее поколение специалистов, которые умели делать перепись в нашей стране. Все последующие переписи давали огромные неточности.

Далее. Почему по ограниченному числу признаков? Дело в том, что чем больше число признаков, тем ниже надежность учета.

Надежность статистической информации - это тот уровень точности, в котором она отражает реальное положение дел. Признак - это та сторона объекта учета, которая подлежит фиксации.

Следовательно, вообще любой объект обладает бесконечным количеством признаков. Скажем, сейчас учитывают около 5000 показателей человека, биохимических, клинических... То есть говорить, что объект может быть учтен по всем признакам, - это бессмыслица. Что отбирается? Отбирается то, что нам нужно знать об этих людях. И обязательно при статистическом учете этот признак должен быть присущ всем объектам. В XIX веке любой статистик это правило знал. А перепись 1998 года провалилась по одной простой причине. Есть признаки, которые всегда входят в перепись, это пол, возраст, этническая принадлежность и семейный статус. Иногда включают языковую принадлежность. В перепись 1989-го года были включены жилищные условия, и люди с экстремальными жилищными условиями - бомжи или люди, у которых по три пятикомнатных квартиры, не попали в эту группу автоматически.

Что представляет из себя переписной лист или талон? Это маленькая карточка, на которой отмечены основные признаки и какая-то шкала, по которой они фиксируются. Например, перепись торговых предприятий - это тип предприятия: магазин, павильон, ларек и т.д., общая площадь, торговая площадь, количество рабочих мест. Иногда можно ассортимент включать, и то только по группам, продовольственные-непродовольственные, предположим.

Надежность переписи зависит от надежности фиксации. Как можно зафиксировать национальность? По паспорту. Какой язык? Человек скажет, вряд ли он ошибется. А переписчик, скорее всего, правильно запишет. Возраст? По паспорту. Пол чаще всего очевиден. Ну а, скажем, такой признак- отношение к духовным ценностям? То есть чем более сложен для фиксации признак, тем ниже надежность. Поэтому там, где это не видно невооруженным глазом, обычно переписные листы заполняются по документам. Например, при торговой переписи, какие документы будут использоваться? Лицензия и техническое разрешение на эксплуатацию. Вот при условии, что были жестко соблюдены все эти требования, и правильно обрабатывался материал, можно получить хоть какую-то объективную картину.

В профессиональной терминологии люди, которые занимаются фиксацией, называются счетчики, а первичный документ называется переписной лист. Счетчики всегда специально обучаются.

И здесь еще важно соблюсти фактор времени, чтобы все данные были зафиксированы на определенное время. Перепись населения делают на 1-е января чаще всего, на начало года и причем на 12 часов. Но ко всем в 12 часов невозможно прийти, поэтому счетчик спрашивает: "Кто находился в вашем доме вчера в 12 часов, кто постоянно живет, кто пришел, кто ушел?" То есть пытаются привести все данные к одному времени. Потому что на больших объемах такие вещи в сумме дают очень большие смещения.

Всего у нас было проведено 6 больших переписей, причем в 1989 году перепись не была доведена до конца, а 1934 году - закрыта. Но, скажем, торговых переписей было проведено всего 2. Промышленная перепись была 1 в 1933 году, а в 1950 году начата и незакончена. Настоящая перепись это настолько сложное, трудоемкое мероприятие, что это требует напряжения всех сил государства. Это огромная работа, но реально другого способа установить уровень признаков, нет.

Как коррегируются результаты, когда не удается сделать полную перепись? Берется для сплошного учета часть территории, например по одной области из каждого региона по средним показателям. Это по территории.

По признакам. Мы говорили, что в переписи всегда ограниченное количество признаков. Для того, чтобы увеличить количество признаков, делают так называемые бюджетные обследования, когда определенная часть территориальной совокупности дообследуется по расширенной программе. Все исследования на популяции по расширенной программе планируются иногда без всякой связи с задачами переписывания. Например, исследование скрытой заболеваемости, скажем психической, по которой люди часто не обращаются в медицинские учреждения. Или исследование потребления спиртных напитков на дому, в том числе и самопроизведенных. Имейте в виду, что эти исследования очень тесно связаны с переписью. Там всегда стараются подгадать исследование к переписному году. Для чего? Чтобы результаты можно было экстраполировать на реальное население, потому что выборочные обследование имеют очень маленькую генерализованность, если мы не знаем реальных параметров населения. Переписные точки это именно те периоды, когда мы лучше всего представляем себе реальное население.

То, о чем мы говорили с самого начала, относится к этапу фиксации исследования. Но как вы видите, уже здесь возникает очень много проблем. Что происходит с любой статистической информацией безотносительно к процедуре фиксации? Далее следуют этапы группировки, сводки и анализа.

Лекция 2. Социально-статистическое исследование


В государственной статистике первичный документ называется статистической формой. Статистические формы бывают трех видов:

• Сигнальные или статистические талоны. Они предназначены для сплошного учета фактов.

• Формы текущего учета.

• Формы текущей отчетности.

Если сигнальные талоны заполняются и запускаются по мере появления самого явления, то формы учета и отчетности имеют определенную периодичность: месячные, квартальные, полугодовые и годовые.

Содержание любой статистической формы - это содержание направления или курса государства. Является должностным преступлением изменение или добавление какой-либо статистической формы. Статистическая форма утверждается в установленном законом порядке и не подлежит изменениям.



Этапы и содержание социально-статистического исследования


1. Статистическое наблюдение надо отличать от наблюдения поведенческих навыков.

Статистическое наблюдение - фиксация наличия единичного социального факта.

Единица наблюдения - единица из объекта исследования.

Если объект исследования наркоманы, то фиксируемая единица - наркоман.

Первичным документом социально-статистического исследования, посредством которого фиксируется единичный статистический факт, является статистическая карта (статкарта).

Статкарта - совокупность статистических признаков исследования, то есть предмета.

Пример. Социальный факт - развод.

Единица наблюдения - семья.

1. Первый этап - заполнение статкарты.

Признаки для фиксации:

1. Возраст каждого из супругов: до 30 лет, 30-60 лет, после 60 лет.

2.Продолжительность брака: до 5, 5-10, 11-15, больше 15 лет.

3.Возраст формального вступления в брак каждого из супругов.

4..Дети: 0,1-2, больше 2.

5. Образование (число лет обучения): 9-10 лет, 11-20 лет, больше 20 лет.

6.Развод: первый или нет.

Статкарта состоит из статистических признаков и их градации.

2.После того, как на каждую пару заполнили карту, следующая процедура - группировка.

Группировка обычно не приводится в самой карте, а создается при последующей обработке.

Группировка - отнесение каждой единицы наблюдения по определенному признаку в свою группу, предварительно сформулированную.

Группировку делают вторично, так как при обработке возможно использование разных группировок, и одни и те же данные можно группировать с большими и меньшими интервалами.

3.Третий этап - сводка. Это процедура подсчета количества единиц, попавших в каждую группу по каждому признаку.

4.Четвертый этап - статистическая обработка. В самом примитивном виде она сводится к расчету процентов.

Социально-статистическое исследование имеет дело с реальными физическими характеристиками (реальная пара, реальный развод). Это то, что было, а не чьи-то мнения, ощущения, установки.

Для того, чтобы можно было использовать данные в социально-статистическом исследовании, они должны быть где-то зафиксированы.

Процедура вынесения где-то зафиксированных данных на статкарту носит название выкопировки.

В исследовании о разводах интересующие нас данные могут быть зафиксированы в паспорте (возраст, дети, развод), в дипломе об образовании. Реально наблюдатель может физически исследовать объект, как это было в сборе данных углубленных статистических разработок, популярных у нас в XIX веке (например, статистическое описание сельского хозяйства). Человек, заполняющий статкарту, называется счетчиком.

В социально-статистическом исследовании выкопировка осуществляется самим исследователем. Признаки в статистической карте формулируются в терминах программы исследования. Например, для респондента графа «дети» ничего не значит, она значима лишь для исследователя. Часто в экономике и медицине используются признаки, известные только исследователю (время пребывания в койкоднях, частота обращения), и подобную карту раздают людям с просьбой заполнить.

В статистической карте возникают категориальные признаки, которые пишутся в строчку для экономии места. Исследователь сам знает, как нужно с ними работать. Статистическая карта - это документ для исследователя.

Пример. Изучение 100 разводящихся пар.

Признаком будет возраст по каждой паре на момент развода (для мужчин и женщин отдельно). Слева в таблице пишется подлежащее, в нашем случае группировка по возрасту.


Возраст

Количество человек

До 30 лет

30-60 лет

Более 60


45

50

5



Всего

100

Можно то же самое зафиксировать в процентах.

Мы получили простое одномерное распределение по одному признаку.

Если перед исследователем стоит вопрос, кто будет чаще разводиться; гомогенные или гетерогенные (с большой разницей в возрасте) пары, то можно составить таблицу кросс-табуляции.

Статистические таблицы


Простое распределение после сводки по одному признаку называется простая таблица.

Распределение по двум или более признакам в виде таблицы называется комбинационной таблицей. Таблица может быть n-мерной, но практическое значение имеет только двухмерная таблица. Дело в том, что трехмерные таблицы в реальных выборочных исследованиях уже очень плохо бывают заполнены, и трудно их анализировать. Поэтому для анализа таблиц n-мерных в современной науке используется логлинейный анализ, который основан на использовании X2 статистики, а она требует полного заполнения таблицы. Таким образом группируются сами факторы, влияющие на явление, тогда сразу видно, как разные группы факторов определяют вариацию признака. Потому что, когда видишь в каком-нибудь отчете 10, 20, 40 маленьких табличек, их ни смотреть невозможно, ни понять ничего невозможно. То есть читателю должно быть понятно, как проведена процедура группировки.




Каталог: data -> uploads
data -> Примерная тематика рефератов для сдачи кандидатского экзамена по философии гуманитарные специальности, 2003-2004 уч
data -> Программа дисциплины для направления 040201. 65 «Социология» подготовки бакалавра
data -> Программа дисциплины «Э. Дюркгейм вчера и сегодня
data -> Методика исследования журналистики
data -> Источники в социологии
uploads -> «В стороне от больших дорог»
uploads -> «Грех у дверей…» о человеческой свободе в раю, «под законом»
uploads -> Конкурс «Русь моя родная»
uploads -> Программа производственной практики


Поделитесь с Вашими друзьями:
1   2   3   4   5   6   7   8   9   10   ...   14


База данных защищена авторским правом ©znate.ru 2019
обратиться к администрации

    Главная страница