Цифры в левом верхнем углу каждой клетки данной таблицы перенесены из предыдущей. Цифры в центре клеток представляют собой результат возведения частот в квадрат (fij2). Путем деления fij2 на итоговые частоты соответствующих столбцов (fj) получаем значения, которые записываем в нижнем правом углу каждой клетки.
Суммируя данные величин (из последнего, 6-го столбца), получим
;
;
.
Величина первого коэффициента свидетельствует о наличии достаточно заметной связи между изучаемыми признаками. Коэффициент Чупрова обычно дает более осторожную оценку связи.
Некоторые особенности имеет анализ взаимосвязи между двумя альтернативными признаками, который производится с помощью четырехклеточных таблиц.
Оценить тесноту связи между признаками можно с помощью коэффициентов взаимной сопряженности Сили К
. Но проще это сделать с помощью коэффициентов ассоциации и контингенции.
Для их вычисления составляется таблица, которая показывает связь между двумя явлениями, каждое из которых должно быть альтернативным, то есть состоящим из двух качественно отличных друг от друга значений признака (например, хороший, плохой). (Таблица 3)
Таблица 3 | ||
Таблица для вычисления коэффициентов ассоциации и контингенции | ||
a | b | a+b |
c | d | c+d |
a+c | b+d | a+b+c+d |
Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если Ка>0,5 или Кk>0,3.
В социальных исследованиях нередко встречаются ситуации, когда признак не выражается количественно, однако единицы совокупности можно упорядочить. Такое упорядочение единиц совокупности по значению признака называется ранжированием. Примером может быть ранжирование студентов по способностям, любой совокупности людей по профессии и т.д.
При ранжировании каждой единице совокупности присваивается ранг, то есть порядковый номер. При совпадении значения признака у различных единиц им присваивается объединенный средний порядковый номер. Например, если у 5-й и 6-й единиц совокупности значения признаков одинаковы, обе получат ранг, равный (5+6)/2=5,5.
Измерение связи между ранжированными признаками производится с помощью ранговых коэффициентов корреляции Спирмена (ρ) и Кендела (τ). Эти методы применимы не только для качественных, но и для количественных показателей, особенно при малом объеме совокупности, так как непараметрические методы ранговой корреляции не связаны ни с какими ограничениями относительно характера распределения признака.
Коэффициент корреляции рангов (коэффициент Спирмена) рассчитывается по формуле:
,
где di2 – квадраты разности рангов признаков X и Y;
n – число наблюдений (число пар рангов).
Коэффициент Спирмена принимает любые значения в интервале [-1;1]. В случае отсутствия связи ρ=0. При прямой связи ρ – положительная правильная дробь, при обратной – отрицательная.
Значимость коэффициента корреляции рангов Спирмена проверяется на основе t-критерия Стьюдента. Расчетное значение критерия определяется по формуле:
.
Значение коэффициента корреляции считается статистически существенным, если tρ>tkρ.
Кэнделлом предложен другой показатель измерения корреляционной связи, также с использованием рангов признаков:
.
Упрощение расчетов коэффициента Кендэлла достигается следующим образом.
Ряд наблюдений располагается в возрастающем порядке по признаку X с указанием соответствующих им рангов по признаку Y.
Упорядоченная таким образом последовательность наблюдений берется как исходная для построения квадратной матрицы (aij) размерностью n*n. Для дальнейшего потребуются только элементы, расположенные выше главной диагонали. Для заполнения матрицы по каждой паре наблюдений (I,j) сравниваем ранги признака Y: