Программа «Высшее образование»


Кудушая профессия студента



страница55/71
Дата10.05.2018
Размер4.29 Mb.
ТипПрограмма
1   ...   51   52   53   54   55   56   57   58   ...   71
Кудушая профессия студента

Степени удовлетворенностью учебой

Марги­нальные

частоты

1

2

3

4

5

1. Политолог

14

20

20

30

31

20

30

25

5

100

2.Социолог

30

40

40

60

60

40

60

50

10

10

200

3. Культуролог

90

60

90

90

60

60

45

75

15

300

4.Фм:юлог

31

20

30

30

19

20

25

5

100

5. Психолог

10

10

15

10

15

12.5

2

50

6. Историк

27

50

110

75

15

50

85

62.5

13

12.5

250

Маргинальные частоты

200

300

200

250

50

N=1000

Является естественным для определения отклонения от статистической независимости воспользоваться разностью между реальными частотами и теоретическими (для случая статистической независимости), т.е. разностью вида nij - nj. Как и в случае введения формулы для вычисления дисперсии,




Для нашего примера эта величина вычисляется как сумма тридцати членов:

нам нужны абсолютные значения этой разности, поэтому возводим ее в квадрат. Этот квадрат делим на теоретическую частоту, т. е. как бы норми­руем. Тем самым достигается независимость от объема ячейки. Все ячейки становятся равноправными независимо от их объема. Затем суммируем все эти отклонения по всем 30-ти ячейкам таблицы и получаем величину называемую хи-кеадрат Она выглядит следующим образом:



Эта величина, эта статистика знаменита тем, что имеет закон распределения, который называется законом распределения хи-кеадрат Поэтому с ее помощью решается много различных задач, проверяются различные статистические гипотезы. Нас пока интересует только аспект использования величины хи-квадрат для конструирования мер связи. Самой этой величиной как мерой связи неудобно пользоваться, ибо ее значение может быть каким угодно большим и зависит от размера таблицы сопряженности. Различие в коэффициентах, основанных на хи-квадрат, заключается в определенном нормировании величины и-квадрат. Одним из часто используемы коэффициентов является коэффициент взаимной сопряженности Пирсона. Он имеет следующий вид:



С =

X

2

+ Ν

где N — общее число объектов. В нашем случае объекты — студенты-гуманитарии. Раньше и число мы обозначали через n00, которое было равно 1000. Для наши целей так было удобнее, а в данном случае нет никакой необ одимости ни в двойны индекса , ни в индекса вообще.

Если значение коэффициента получится близким к нулю или равным нулю, то это означает статистическую независимость признаков. Случай близости значения к единице будет говорить о статистической зависимости. Значение коэффициента ни при каких условиях не достигает единицы, но для социолога это не имеет никакого принципиального значения. Для нашей таблицы сопряженности X =125,6, а значение С = 0,33. Опять-таки возникает вопрос о значимости отличия такого значения от нуля.



О значимости значений коэффициентов

Определяются такого рода значимости на основе проверки ста­тистических гипотез. Эти гипотезы не следует путать с так называемыми содержательными гипотезами исследования. Разумеется, в ряде случаев гипотеза исследования может быть сформулирована и в виде статистической гипотезы. Проверка статистической гипотезы о значимости отличия значения коэффициента от нуля возможна при условии существования закона распределения коэффициента.

Что это означает? Предположим, каждый из вас для изучения студентов-гуманитариев (это наша генеральная совокупность) сформировал «отличную» выборку и подсчитал значение, например, коэффициента Юла. Какими бы «хорошими» ни были выборки, на каждой из них будет получено свое собственное значение этого коэффициента. Совокупность таких значений подчиняется и может быть описана некоторым законом распределения. Для коэффициента Юла известно, что он имеет вполне определенный закон распределения. Если для коэффициента теоретический закон распределения известен, то такой коэффициент называется статистикой в отличие от эвристики. Не надо путать с тем, что статистикой называют и просто совокупность данных в той области науки, которая называется статистикой. Мы сейчас рассуждаем в рамках другой науки, которая называется математической статистикой.

Каждый закон распределения имеет параметры. Примером закона является уравнение прямой у — аХ + b. Это семейство прямых. Здесь параметрами являются а, b. Аналогично можно рассуждать во всех случаях законов, известных вам из школьной программы (парабола, гипербола, синусоида и т. д.). Только теперь вы имеете дело с более сложными законами: нормальным, хи-квадрат и т. д. Более того, для некоторых законов, например для и-квадрат, даже нельзя в явной форме записать формулу.

Некоторые законы табулированы, т. е. существуют математические таблицы (они есть во многих книгах, где описываются методы математической статистики), из которых можно определить табличное значение некоторой статистики при заданны параметра распределения.

Например, табличное значение для величины « и-квадрат» — это то значение, которое оно принимает при статистической независимости.

Кроме параметров для обращения к математическим таблицам необходимо обязательно задать так называемый уровень значимости), т.е. уровень возможной ошибки. В математической статистике на основе данны выборки ни один вывод не делается без некоторой ошибки. Значение а может быть равным 0,10; 0,05; 0,01. Тогда наши выводы будут верны в 90 случаях из ста, если социолог задал первое из этих значений. Для второго уровня значимости выводы верны в 95 случаях из ста, а для третьего

— в 99 случая из ста, а для четвертого 999 случаев из тысячи.

Таким образом, если некоторая величина табулирована, то, задавшись уровнем значимости и параметрами закона распределения, можно узнать ее теоретическое значение. А у нас всегда есть реальное значение. Сравнение эти значений и позволяет проверять статистические гипотезы.

Возвращаясь к коэффициенту Юла и статистики «хи-квадрат», следует сказать, что первый из них имеет нормальный закон распределения, а второй

— распределение и -квадрат. Параметром для нормального закона является дисперсия, а параметром для хи-квад-рат — число степеней свободы, равное (r-l)(s-l). По существу, число степеней свободы — число ячеек в таблице сопряженности, которые могут изменяться свободно (отсюда и название число «степеней свободы») при заданных маргинальных частотах. В нашем случае реальное значение «хи -квадрат» равно X = 125,6, а табличное значение χ2 = 10,85 при уровне значимости, равной 0,05, и числе степеней

свободы (r-l)(s-l)=20. Таким образом, χ2 □ χ,2 , т. е. отклонение от нуля

значимо. Признаки «будущая профессия студента» и «удовлетворенность учебой» статистически зависимы.

Понятие значимости тесно связано с понятием «доверительный интервал». Для каждой статистики это интервал, в котором содержится «истинное» (для генеральной совокупности) значение этой статистики. Если истинное значение коэффициента Юла обозначить через QQ , а реально вычисленное через Q, то доверительный интервал выглядит:



Q-Δ

Для каждой статистики величина Δ определяется в зависимости от закона распределения статистики и, естественно, в помощью математических таблиц, где эти законы табулированы. Приводить формулы для вычисления доверительных интервалов мы не будем. К примеру, социолога всегда интересует значимость процентов. В работе [8, с. 191— 195] вы можете найти формулу для вычисления доверительного интервала в этом случае.



Из такого упрощенного анализа значимости и законов распределения социологу необходимо усвоить, что умные люди, работающие в далекой от него науке под названием математическая статистика, владеют большим аппаратом для решения социологических задач. Это не означает, что выг должныг эту науку изучить досконально, но это означает, что Выг должныг научиться задавать таким людям правильно поставленныге вопросыг, и не ожидать от математики того, чего она не может дать.

Задание на семинар или для самостоятельного выполнения Каждому студенту на основе своей собственной таблицы сопряженности необходимо выполнить следующие задания:

1 . Обозначить одну из градаций (любого из дву признаков таблицы сопряженности) как целевое свойство. Подсчитать значения коэффициента Юла между этим целевым признаком и несколькими другими. Провести ранжирование полученных значений по степени их влияния на целевой признак.

1712. Вычислить интенсивность и емкость детерминации для не­скольких свойств и на основе сравнения сделать соответствующие выводы.

3. Вычислить значение хи-квадрат и сравнить с табличным при различных уровнях значимости. Сделать соответствующие выводы.





Поделитесь с Вашими друзьями:
1   ...   51   52   53   54   55   56   57   58   ...   71


База данных защищена авторским правом ©znate.ru 2019
обратиться к администрации

    Главная страница
Автореферат
Анализ
Биография
Бюллетень
Глава
Диплом
Дипломная работа
Диссертация
Доклад
Задача
Закон