Поскольку параметрические методы статистики дают значительно больше возможностей, чем непараметрические, приведение шкал к интервальной форме имеет практический смысл. Так, при разработке тестов, предназначенных для широкого использования, делается предположение, имеющее основания как в теории вероятностей, так и в практике разнообразных измерений: считается, что распределение результатов измерения данного параметра на всех индивидах, подлежащих данному измерению, должно быть похоже на нормальное распределение (нормальное распределение будет введено в главе 4). С этим связан метод преобразования первоначально порядковой шкалы в интервальную путем некоторой монотонной деформации шкалы (допустимого преобразования), которое приводит к нормальному распределению измеряемого показателя по всей совокупности индивидов, потенциально подлежащих данной измерительной процедуре [1].
Пример 1.2(1). Грамотность школьников оценивается количеством ошибок в стандартном диктанте, имеющем объем 1000 знаков (примерно полстраницы). Можно ли считать шкалу «количество ошибок» интервальной?
Вопрос поставлен не вполне правильно. Мы можем считать такую шкалу интервальной, но при этом некоторые наши выводы могут оказаться сомнительными. Основания для сомнения таковы: школьники A и B, сделавшие 0 и 5 ошибок в диктанте соответственно, отличаются, если рассматривать их в контексте педагогических задач, сильнее, чем слабые ученики C и D, сделавшие 50 и 60 ошибок соответственно. Если мы хотим охарактеризовать интервальной шкалой степень грамотности, нам не обойтись без экспертных оценок.
Упражнение 1.2(2). Попробуйте себя в роли эксперта. Разбейте школьников на 5 групп по числу ошибок в диктанте: «очень сильные», «сильные», «средние», «слабые», «очень слабые». Например, так: «очень сильные (5 баллов), от 0 до 20 ошибок», «сильные (4 балла), 21 — 26 ошибок», «средние (3 балла), 27 — 29 ошибок», «слабые (2 балла), 30 — 44 ошибок», «очень слабые (1 балл), 45 и больше ошибок» [2]. Сделайте это так, чтобы разделяющие группы интервалы были, на ваш взгляд, равными с точки зрения педагогических задач. Сравните свои предложения с предложениями коллег-экспертов. Если вы можете достичь согласия, это серьезный аргумент в пользу принятия такой шкалы в качестве интервальной.
Упражнение 1.2(3). Возьмите с помощью калькулятора натуральные логарифмы от верхних границ первых четырех классов в вашем разбиении. Насколько последовательность логарифмов отличается от арифметической прогрессии?
Если в последнем задании вы получили нечто похожее на арифметическую прогрессию, то, возможно, в качестве интервальной разумно взять шкалу y=ln(x+1) (где x — количество ошибок), поскольку она хорошо согласуется с вашим интуитивным преобразованием шкалы ошибок. Подумайте, не использовали ли вы соображение такого рода: равный сдвиг оценки должен соответствовать пропорциональному увеличению числа ошибок (например, если ученики А, Б и В сделали 5, 10 и 20 ошибок соответственно, то интервалы между их оценками — равные). Этим соображениям соответствуют логарифмические шкалы. В подобных случаях логарифмы от сырых баллов используются достаточно часто.
Пример 1.2(4). Порядковые шкалы иногда называют ранговыми [3]. Предположим, группа из 8 экспертов оценивала 10 педагогов некоторой школы по степени их влияния на учеников. Эксперт должен был расположить педагогов в ряд по степени их влиятельности, начав с наиболее влиятельного (ему мы припишем ранг 1) и заканчивая наименее влиятельным (ранг 10). Результаты каждого эксперта, несомненно, принадлежат к порядковой шкале. Однако, используя эти результаты ранжирования, мы можем построить шкалу более похожую на интервальную. Если мы для каждого педагога рассчитаем его суммарный ранг по всем экспертам, то смысл этих сумм будет достаточно ясным, хотя с порядковыми шкалами производить такие операции не вполне корректно. Вычисленные суммы уже будут указывать на нечто, подобное расстоянию между педагогами. Действительно, если предположить, что влиятельность есть объективная характеристика педагога, а эксперты с некоторой точностью оценивают этот показатель, и если педагог A имеет существенно большую влиятельность, чем следующий за ним по влиятельности педагог B, то все эксперты, несмотря на вариации в оценках, все же предпочтут в списке поставить A выше B. Это значит, что разность суммарных рангов A и B будет равна 8 (количеству экспертов). Если же A более влиятелен, чем B, но разница между ними на грани различимости, то эксперты будут ставить A прежде B и B прежде A почти одинаково часто, поэтому суммарные ранги у A и B будут близки.
На таких соображениях основаны многие методы, которые, предполагая наличие неизвестной интервальной шкалы для данного показателя, ищут шкальные значения каких-то объектов с помощью оценок экспертов или испытуемых.
>> следующий параграф>>
[1] Некоторые авторы (Наследов, 2004, c. 59) считают нормальное распределение показателя главным или даже единственным аргументом в пользу интервальности данной шкалы. Однако этот аргумент имеет лишь ограниченную применимость. Например, шкалы субъективных оценок вообще не связаны с распределениями. К таковым относятся психофизические шкалы, шкалы, используемые в психосемантике, и т д.
[2] Нашу классификацию мы сделали заведомо неразумной, чтобы не навязывать читателю свое мнение.
[3] Это не совсем правильно, поскольку приписывание упорядоченных чисел может производиться и не в связи с ранжированием. Например, порядковые, но не связанные с ранжированием результаты дают обычные опросники.