Отправляет email-рассылки с помощью сервиса Sendsay

Эконометрика

  Все выпуски  

Эконометрика - выпуск 648


"Эконометрика", 648 выпуск, 24 июня 2013 года.

Здравствуйте, уважаемые подписчики!

*   *   *   *   *   *   *

Помещаем статьи А.И. Орлова "Теория измерений и методы анализа данных" и "Место теории измерений в методах анализа данных".

Все вышедшие выпуски доступны в Архиве рассылки по адресу subscribe.ru/catalog/science.humanity.econometrika.

*   *   *   *   *   *   *

Теория измерений и методы анализа данных

Проф., д.э.н., д.т.н., к.ф.-м.н. А.И. Орлов
Директор Института высоких статистических технологий и эконометрики МГТУ им. Н.Э. Баумана

Предварительно обосновав необходимость развития научной специальности "Математические и инструментальные методы в социологии", рассматриваем роль теории измерений при выборе методов сбора и анализа социологической информации.

Математические и инструментальные методы в социологии

Статья относится к достаточно самостоятельной области - математическим методам анализа социологических данных. Основной интерес в ней - к математическим вопросам, социологические постановки служат для постановки математических задач. Эта область относится к математической социологии - научной дисциплине, аналогичной математической экономике, математической физике и др.

Классификация наук закреплена формальными решениями. Например, в нашей стране утвержден список специальностей научных работников. Однако формальные решения могут быть модернизированы. Время от времени это происходит. Например, около 20 лет назад появились новые группы специальностей - социологические и политологические. Однако недостатки действующей системы очевидны. Приведем четыре примера.

Пример 1. Продолжает использоваться термин "физико-математические науки", хотя его нелепость ясна всем специалистам. Математика относится к формальным наукам, изучает конструкции, созданные мыслью, т.е. находящиеся не в реальном мире, а в идеальном (по Платону). Математика может быть применена в любой сфере деятельности, в любой отрасли народного хозяйства. Например, широко распространен термин "экономико-математические методы и модели", очевидно, относящийся к применению математики в экономике. В то же время физика - одна из областей естествознания, наука, изучающая наиболее общие и фундаментальные закономерности, определяющие структуру и эволюцию материального мира. Термин "физико-математические науки" не более обоснован, чем, например, термины "химико-математические науки" или даже "ветеринарно-социологические науки".

Пример 2. Как известно, статистические методы применялись на практике (и, следовательно, были теоретически разработаны) с древних времен. В Библии Ветхий завет начинается с Пятикнижия Моисеева, и четвертая книга Пятикнижия называется "Числа". Она начинается с описания проведенной под руководством Моисея переписи военнообязанных. Со времен библейского Моисея статистика получила значительное развитие. В США число статистических кафедр в университетах превышает число математических, соответственно и число статистиков больше числа математиков (примерно вдвое) [1]. Следовательно, в США статистика воспринимается одной из "больших" наук: математика, физика, статистика, химия, биология... Совсем не так в нашей стране. В официальной структуре науки статистика упоминается дважды, и оба раза на вторых ролях. Во-первых, как одна из экономических наук (специальность 08.00.12 "Бухгалтерский учет, статистика", присуждаются ученые степени по экономическим наукам). Во-вторых, в названии математической специальности 01.01.05 "теория вероятностей и математическая дисциплина" (присуждаются ученые степени по физико-математическим наукам). Все остальные применения статистических методов, в частности, в социологических исследованиях, остаются вне официальной структуры науки.

Пример 3. На знамени научного прогресса второй половины ХХ в. начертано: "Кибернетика". Однако нет в нашей стране докторов и кандидатов кибернетических наук (есть, правда, математическая специальность "Дискретная математика и математическая кибернетика", при защите присуждается ученая степень по физико-математическим наукам).

Пример 4. Очевидно, что менеджмент (управление людьми) - более широкая сфера деятельности, чем экономика. Управленческие решения необходимо принимать на основе все совокупности социальных, технологических, экологических, экономических, политических факторов [2]. Между тем в действующей официальной номенклатуре специальностей научных работников (в редакции Приказа Минобрнауки РФ от 11.08.2009 N 294) менеджмент находится внутри экономической специальности 08.00.05 "Экономика и управление народным хозяйством". При этом есть целый ряд технических специальностей, включающих в себя термин "управление", среди которых выделяется специальность 05.13.10 "Управление в социальных и экономических системах" (присуждаются ученые степени по техническим (!) наукам).

Приведенные примеры показывают, что действующая официальная номенклатура специальностей научных работников нуждается в модернизации.

К социологическим наукам близки экономические. Вплоть до того, что на включение в свою сферу маркетинга (изучения предпочтений потребителей) претендуют и те, и другие. Однако у экономистов есть специальность 08.00.13 "Математические и инструментальные методы в экономике", а у социологов нет аналогичной специальности, математическая социология не выделена среди социологических наук.

К чему это приводит? В частности, к отсутствию должного внимания к развитию математических методов в социологии, к их вытеснению из перечней секций социологических конференций и конгрессов. В результате падает квалификационный уровень работ. На заседании секции "Измерение в социологии" VI научно-практической конференции памяти первого декана факультета социологии Александра Олеговича Крыштановского "Современная социология - современной России" (1-3 февраля 2012 года) пришлось урезонивать воинствующего невежду, который пытался навязать докладчику свое неправильное понимание проверки значимости при проверке статистических гипотез. Впрочем, и докладчик продемонстрировал непонимание необходимости обязательной проверки значимости различия долей тех или иных значений признаков при сравнения совокупностей, сказавши: "В журнале "Социология-4М" нас заставили проверить значимость различия долей". К необходимости повышения качества математической составляющей социологических исследований мы старались привлечь внимание в работе [3].

Мы считаем необходимым усилить внимание к проблемам развития и применения математических методов анализа социологических данных, математического моделирования социальных процессов, короче - к математической социологии. Целесообразно в рамках социологической науки создать специальность "Математические и инструментальные методы в социологии", аналогичную экономической специальности "Математические и инструментальные методы в экономике".

К математическим методам в социологии относим нет только методы анализа числовых и нечисловых социологических данных, но и методы математического моделирования социальных процессов [4, 5].

Под инструментальными методами понимаем прежде всего методы, нацеленные на развитие и применение информационных технологий, включая сетевые (в том числе модели распространения нововведений в сфере информационных и телекоммуникационных технологий [6] и онлайн исследования [7]).

О развитии математической социологии в нашей стране

Много интересных работ, относящихся к математической социологии, было выполнено в нашей стране в 70-80-е годы ХХ в. Назовем только некоторые из них. В 1977 г. Институт социологических исследований выпустил сборники [8, 9]. На основе материалов Всесоюзной научной конференции "Проблемы применения математических методов в социологическом исследовании" издательство "Наука" опубликовала солидный сборник [10]. Хотя прошло уже 30 лет, материалы этих сборников по-прежнему актуальны. Квалифицированные работы не устаревают. И даже необходимо отметить методологическую несостоятельность современных публикаций Росстата по переписям населения по сравнению с книгой "Числа" Ветхого Завета, в которой рассказано о переписи военнообязанных, проведенной под руководством Моисея.

По сей день наиболее многоплановой публикаций по методам анализа нечисловых данных является сборник [11], подготовленный совместно академическим Институтом социологии и комиссией "Статистика объектов нечисловой природы" Научного Совета АН СССР по комплексной проблеме "Кибернетика". В настоящее время анализу нечисловых данных посвящены обширные разделы в учебниках по прикладной статистике [12], есть и специальные учебники по нечисловой статистике [13], но сборник [11] по-прежнему актуален и необходим тем, кто хочет разобраться в методах анализа нечисловой (т.е. качественной) информации в социологических исследованиях. Отметим, что именно практические запросы социологов (и специалистов по экспертным оценкам) послужили стимулом для разработки нечисловой статистики [13].

В дальнейшем появились адресованные студентам-социологам учебники и учебные пособия, в частности, книги Ю.Н. Толстовой [14-16] и Г.Г. Татаровой [17, 18]. С 1991 г. выпускается журнал "Социология: методология, методы, математическое моделирование" (сокращенно "Социология-4М"). Развитию математических и статистических методов в российской социологии посвящены обзорные работы [19, 20].

Казалось бы, все хорошо в области математической социологии. Однако всё заметнее проявляются отрицательные тенденции. Большинство социологов остаются невежественными в области методов анализа данных. Проявляется это, например, в преклонении перед давно устаревшим западным статистическим пакетом SPSS (анализу статистических пакетов посвящена статья [21]). Полученные еще в 70-е годы ХХ в. научные результаты остаются неизвестными, а потому, естественно, не применяются. Научный инструментарий социолога зачастую соответствует уровню XIX в. В последнее время даже номинальное признание важности математической социологии в виде организации отдельных секций на социологических конгрессах и конференциях постепенно сходит на нет. Подробнее эти мысли развиты в нашем выступлении [22] в "Дискуссии о социологии" на сайте Российского общества социологов.

О теории измерений

Согласно теории измерений все реальные данные измерены в той или иной шкале [12-14]. Обычно выделяют шесть основных шкал - наименований (номинальную), порядковую, интервальную, отношений, разностей, абсолютную. Первые две - шкалы качественных признаков, остальные четыре - шкалы количественных признаков. Только абсолютная шкала не накладывает никаких ограничений на математические методы анализа данных.

Группы допустимых преобразований - вот что интересует нас в шкалах измерения, поскольку именно они задают ограничения на методы обработки данных, измеренных в соответствующих шкалах.

На основе анализа реальной ситуации выясняем шкалу измерения интересующих нас данных, т.е. ее группу допустимых преобразований. Методы анализа данных должны быть инвариантны относительно этой группы. Возникает целый ряд задач:

- является ли инвариантным конкретный метод анализа данных;

- найти хотя бы один конкретный метод анализа данных, решающий поставленную задачу:

- найти все инвариантные методы из некоторого заранее определенного класса;

- для каких шкал инвариантен заданный метод;

- найти все шкалы, относительно которых инвариантен определенный метод;

- найти все методы, выводы с помощью которых инвариантны с вероятностью, стремящейся к 1 (здесь своя достаточно обширная система постановок исследовательских задач), и т.д.

Перейдем к более подробному изложению. Выяснение типов используемых шкал необходимо для адекватного выбора методов анализа данных. Основополагающим требованием является независимость выводов от того, какой именно шкалой измерения воспользовался исследователь (среди всех шкал, переходящих друг в друга при допустимых преобразованиях). Например, если речь о длинах, то выводы не должны зависеть от того, измерены ли длины в метрах, аршинах, саженях, футах или дюймах. Другими словами, выводы должны быть инвариантны относительно группы допустимых преобразований шкалы измерения. Только тогда их можно назвать адекватными, т.е. избавленными от субъективизма исследователя, выбирающего определенную шкалу из множества шкал заданного типа, связанных допустимыми преобразованиями.

Требование инвариантности выводов накладывает ограничения на множество возможных алгоритмов анализа данных. В качестве примера рассмотрим порядковую шкалу. Одни алгоритмы анализа данных позволяют получать адекватные выводы, другие - нет. Например, в задаче проверки однородности двух независимых выборок алгоритмы ранговой статистики (т.е. использующие только ранги результатов измерений) дают адекватные выводы, а статистики Крамера-Уэлча и Стьюдента - нет. Значит, для обработки данных, измеренных в порядковой шкале, критерии Смирнова и Вилкоксона можно использовать, а критерии Крамера-Уэлча и Стьюдента - нет.

Выбор вида средних величин на основе условия устойчивости результата сравнения средних

Оказывается, требование инвариантности является достаточно сильным. Из многих алгоритмов анализа статистических данных ему удовлетворяют лишь некоторые. Покажем это на примере сравнения средних величин.

Пусть Х1 , Х2 ,..., Хn - выборка объема n. Наиболее общее понятие средней величины введено французским математиком первой половины ХIХ в. академиком О. Коши. Средней величиной (по Коши) является любая функция f(X1, X2,...,Xn) такая, что при всех возможных значениях аргументов значение этой функции не меньше, чем минимальное из чисел X1, X2,...,Xn, и не больше, чем максимальное из этих чисел. Средними по Коши являются среднее арифметическое, медиана, мода, среднее геометрическое, среднее гармоническое, среднее квадратическое.

Средние величины используются обычно для того, чтобы заменить совокупность чисел (выборку) одним числом, а затем сравнивать совокупности с помощью средних. Пусть, например, Y1, Y2,...,Yn - совокупность оценок экспертов, "выставленных" одному объекту экспертизы, Z1, Z2,...,Zn - второму. Как сравнивать эти совокупности? Очевидно, самый простой способ - по средним значениям.

При допустимом преобразовании шкалы значение средней величины, очевидно, меняется. Но выводы о том, для какой совокупности среднее больше, а для какой - меньше, не должны меняться (в соответствии с требованием инвариантности выводов, принятом как основное требование в теории измерений). Сформулируем соответствующую математическую задачу поиска вида средних величин, результат сравнения которых устойчив относительно допустимых преобразований шкалы.

Пусть f(X1, X2,...,Xn) - среднее по Коши. Пусть среднее по первой совокупности меньше среднего по второй совокупности:

f(Y1, Y2,...,Yn) < f(Z1, Z2,...,Zn).

Тогда согласно теории измерений для устойчивости результата сравнения средних необходимо, чтобы для любого допустимого преобразования g (из группы допустимых преобразований в соответствующей шкале) было справедливо также неравенство

f(g(Y1), g(Y2),...,g(Yn)) < f(g(Z1), g(Z2),...,g(Zn)),

т.е. среднее преобразованных значений из первой совокупности также было меньше среднего преобразованных значений для второй совокупности. Причем сформулированное условие должно быть выполнено для любых двух совокупностей Y1, Y2,...,Yn и Z1, Z2,...,Zn. И, напомним, для любого допустимого преобразования. Средние величины, удовлетворяющие сформулированному условию, назовем допустимыми (в соответствующей шкале). Согласно теории измерений только допустимыми средними величинами можно пользоваться при анализе мнений экспертов и иных данных, измеренных в рассматриваемой шкале.

С помощью математической теории, развитой в монографии [23], удается описать вид допустимых средних величин в основных шкалах. Рассмотрим обработку, для определенности, мнений респондентов или экспертов, измеренных в порядковой шкале. Справедливо следующее утверждение.

Теорема 1. Из всех средних по Коши допустимыми средними в порядковой шкале являются только члены вариационного ряда (порядковые статистики).

Теорема 1 справедлива при условии, что среднее f(X1, X2,...,Xn) является непрерывной (по совокупности переменных) и симметрической функцией. Последнее означает, что при перестановке аргументов значение функции f(X1, X2,...,Xn) не меняется. Это условие является вполне естественным, ибо среднюю величину находим для совокупности (множества) чисел, а не для последовательности. Множество не меняется в зависимости от того, в какой последовательности мы перечисляем его элементы.

Согласно теореме 1 в качестве среднего для данных, измеренных в порядковой шкале, можно использовать, в частности, медиану (при нечетном объеме выборки). При четном же объеме следует применять один из двух центральных членов вариационного ряда - как их иногда называют, левую медиану или правую медиану. Моду тоже можно использовать - она всегда является членом вариационного ряда. Можно применять выборочные квартили, минимум и максимум, децили и т.п. Но никогда нельзя рассчитывать среднее арифметическое, среднее геометрическое и т.д.

Естественная система аксиом (требований к средним величинам) приводит к так называемым ассоциативным средним. Их общий вид нашел в 1930 г. А.Н.Колмогоров [24]. Теперь их называют "средними по Колмогорову". Для чисел X1, X2,...,Xn средним по Колмогорову является

G{(F(X1) + F(X2) +...+ F(Xn))/n},

где F - строго монотонная функция (т.е. строго возрастающая или строго убывающая), G - функция, обратная к F. Среди средних по Колмогорову - много хорошо известных персонажей. Так, если F(x) = x, то среднее по Колмогорову - это среднее арифметическое, если F(x) = ln x, то среднее геометрическое, если F(x) = 1/x, то среднее гармоническое, если F(x) = x2, то среднее квадратическое, и т.д. (в последних трех случаях усредняются положительные величины).

Среднее по Колмогорову - частный случай среднего по Коши. С другой стороны, такие популярные средние, как медиана и мода, нельзя представить в виде средних по Колмогорову. Справедливы следующие утверждения.

Теорема 2. В шкале интервалов из всех средних по Колмогорову допустимым является только среднее арифметическое.

Таким образом, среднее геометрическое или среднее квадратическое температур (в шкале Цельсия), потенциальных энергий или координат точек не имеют смысла. В качестве среднего надо применять среднее арифметическое. А также можно использовать медиану или моду.

Теорема 3. В шкале отношений из всех средних по Колмогорову допустимыми являются только степенные средние с F(x) = xс, причем с отлично от 0, и среднее геометрическое.

Есть ли средние по Колмогорову, которыми нельзя пользоваться в шкале отношений? Конечно, есть. Например, с F(x) = ex. Среднее геометрическое является пределом степенных средних при с, стремящемся к 0. Теоремы 2 и 3 справедливы при выполнении некоторых внутриматематических условий регулярности.

На наш взгляд, теоремы 1-3 должны быть известны всем студентам-социологам. (Как и все специалисты, я не могу претендовать на полное знание литературы. Буду благодарен за указание учебников для социологов, в которых приведены теоремы 1-3.)

Аналогично средним величинам могут быть изучены и другие статистические характеристики - показатели разброса, связи, расстояния и др. Нетрудно показать, например, что коэффициент корреляции не меняется при любом допустимом преобразовании в шкале интервалов, как и отношение дисперсий. Дисперсия не меняется в шкале разностей, коэффициент вариации - в шкале отношений, и т.д.

К сожалению, достаточно систематическому изучению подверглись лишь средние величины (см. выше) и расстояния ( см. [14, 25] и другие работы Ю.Н. Толстовой). Отметим, что исходные работы 1970-х годов по средним величинам породили достаточно обширное множество следующих работ (обзор дан в [26]), к сожалению, ничего существенно не добавивших к полученному вначале.

По нашему мнению [23, 27], необходимо развивать теорию на стыке математической статистики и теории измерений. Это - призыв к математикам. А социологов надо призвать к использованию полученных результатов. Например, для усреднения порядковых данных использовать не среднее арифметическое, а медиану.

Как показали многочисленные опыты, человек более правильно (и с меньшими затруднениями) отвечает на вопросы качественного, например, - сравнительного характера, чем количественного [28]. В очередной раз мы убедились в этом в 2011-2012 гг., проводя опросы летного состава авиакомпании "Волга-Днепр" в ходе разработки автоматизированной системы прогнозирования и предотвращения авиационных происшествий. Пилоты достаточно уверенно отвечали на вопросы о том, какое из предшествующих событий сильнее влияет на последующее, без труда ранжировали предшествующие события. Измерения в порядковой шкале не представляли для них сложности. При этом на вопросы типа "В скольких случаях на 1000 полетов осуществится определенное событие" отвечали с трудом или вообще отказывались отвечать. Поэтому пришлось отказаться от измерений в количественных шкалах и ограничиться порядковыми, с соответствующими ограничениями на методы обработки данных.

Литература

1. Налимов В.В. О преподавании математики экспериментаторам // О преподавании математической статистики экспериментаторам. Препринт Межфакультетской лаборатории статистических методов No.17. - М.: Изд-во Московского университета им. М.В. Ломоносова, 1971. - С.5-39.

2. Орлов А.И. Менеджмент: организационно-экономическое моделирование. Учебное пособие для вузов. Ростов-на-Дону: Феникс, 2009.

3. Орлов А.И. Об оценке качества процедур анализа данных // Социологические методы в современной исследовательской практике: Сборник статей, посвященный памяти первого декана факультета социологии НИУ ВШЭ А.О. Крыштановского / Отв. ред. и вступит. ст. О.А. Оберемко; НИУ ВШЭ, ИС РАН, РОС. М.: НИУ ВШЭ, 2011. - С.7-13.

4. Математическое моделирование социальных процессов. Вып. 10: сб. ст. / Под ред. А.П. Михайлова. М.: КДУ, 2009.

5. Шведовский В.А. Особенности социолого-математического моделирования в исследовании социальных процессов. - М.: АПКиППРО,2009.

6. Делицын Л.Л. Количественные модели распространения нововведений в сфере информационных и телекоммуникационных технологий. М.: МГУКИ, 2009.

7. Онлайн исследования в России 2.0 / Под ред. Шашкина А.В., Девятко И.Ф., Давыдова С.Г. - М.: РИЦ "Северо-Восток", 2010.

8. Методы современной математики и логики в социологических исследованиях. / Под ред. Э.П.Андреева. М.: Институт социологических исследований АН СССР, 1977.

9. Математические методы и модели в социологии. / Под ред. В.Н. Варыгина. М.: Институт социологических исследований АН СССР, 1977.

10. Математические методы в социологическом исследовании. / Под ред. Т.В. Рябушкина и др. М.: Наука, 1981.

11. Анализ нечисловой информации в социологических исследованиях. / Под ред. В.Г. Андреенкова, А.И.Орлова, Ю.Н. Толстовой. М.: Наука, 1985.

12. Орлов А.И. Прикладная статистика. М.: Экзамен, 2006.

13. Орлов А.И. Организационно-экономическое моделирование: учебник : в 3 ч. Часть 1: Нечисловая статистика. М.: Изд-во МГТУ им. Н.Э. Баумана. 2009.

14. Толстова Ю.Н. Измерение в социологии. М.: Инфра-М, 1998.

15. Толстова Ю.Н. Анализ социологических данных: методология, дескриптивная статистика, изучение связей между номинальными признаками. М.: Научный мир, 2000.

16. Толстова Ю.Н. Основы многомерного шкалирования. Учебное пособие для вузов. М.: Издательство КДУ, 2006.

17. Татарова Г.Г. Методология анализа данных в социологии (введение). Учебник для вузов. М.: NOTA BENE, 1999.

18. Татарова Г.Г. Основы типологического анализа в социологических исследованиях. М.: Издательский Дом "Высшее образование и наука", 2007.

19. Толстова Ю.Н. Математические методы в социологии. / Социология в России. Под ред. В.А. Ядова. - 2-е изд., перераб. и дополн. - М.: Издательство Института социологии РАН, 1998. С.83-89, 98-103.

20. Орлов А.И. Статистические методы в российской социологии (тридцать лет спустя). - Журнал "Социология: методология, методы, математические модели". 2005. No.20. С.32-53.

21. Орлов А.И. Статистические пакеты - инструменты исследователя. - Журнал "Заводская лаборатория". 2008. Т.74. No.5. С.76-78.

22. Орлов А.И. Черная дыра отечественной социологии. - Выступление 09-01-2011 в "Дискуссии о социологии" на сайте Российского общества социологов http://www.ssa-rss.ru/index.php?page_id=19&id=456

23. Орлов А.И. Устойчивость в социально-экономических моделях. М.: Наука, 1979.

24. Колмогоров А.Н. Избранные труды. Математика и механика. М.: Наука, 1985. С. 136-138.

25. Толстова Ю.Н. Адекватность функции расстояния в алгоритмах автоматической классификации. - В сб.: Исследования по вероятностно-статистическому моделированию реальных систем. М.: ЦЭМИ АН СССР, 1977. С.168-173.

26. Барский Б. В., Соколов М. В. Средние величины, инвариантные относительно допустимых преобразований шкалы измерения. - Журнал "Заводская лаборатория". 2006. No.1. С.59-.67.

27. Орлов А.И. Связь между средними величинами и допустимыми преобразованиями шкалы. - Журнал "Математические заметки". 1981. Т. 30. No.4. С. 561-568.

28. Тюрин Ю.Н., Литвак Б.Г., Орлов А.И., Сатаров Г.А., Шмерлинг Д.С. Анализ нечисловой информации (препринт). М.: Научный Совет АН СССР по комплексной проблеме "Кибернетика", 1981.

Публикация;

793. Орлов А.И. Теория измерений и методы анализа данных // Современная социология - современной России: Сборник статей памяти первого декана факультета социологии НИУ ВШЭ А. О. Крыштановского *Электронный ресурс+ / НИУ ВШЭ; РОС; СоПСо. - М.: НИУ ВШЭ, 2012. - С.217-225. ISBN 978-5-904804-08-4

*   *   *   *   *   *   *

Место теории измерений в методах анализа данных

А.И. Орлов (Москва)

Согласно современной парадигме прикладной статистики, теория измерений является неотъемлемой частью методов анализа данных. По мнению П.Ф. Веллемана и Л. Уилкинсона [5], применение теории измерений "при выборе или для рекомендации тех или иных методов статистического анализа неуместно и зачастую приводит к ошибкам". В статье приведены краткие сведения о шкалах измерения и применении теории измерений при выборе средних величин с соответствии с шкалами измерения данных, а затем скрупулезно анализируются аргументы П.Ф. Веллемана и Л. Уилкинсона. Итог дискуссии: "теория измерений важна для интерпретации статистического анализа" [5]. Дискуссия позволила уточнить ряд вопросов применения прикладной статистики (анализа данных): выявлена роль решаемой задачи и применяемой модели данных для установления типов шкал измерения этих данных; разделены области применения разведочного анализа и доказательной статистики.

Ключевые слова: теория измерений, анализ данных, прикладная статистика, шкалы измерения, допустимые преобразования, инвариантность выводов.

Методы анализа данных (другими словами, прикладная статистика, статистические методы) необходимы социологу для обработки результатов массовых обследований, а также для подведения итогов экспертных опросов [1]. Эта научная область бурно развивается. Согласно новой парадигме прикладной статистики, теория измерений является неотъемлемой частью современных методов анализа данных [2]. В наших учебниках ([3], [4] и др.) рассказано о теории измерений и ее применении при выборе адекватных методов анализа данных.

Есть и другие мнения о целесообразности использования теории измерений при анализе социологических данных. Основная идея статьи П.Ф. Веллемана и Л. Уилкинсона [5] выражена в ее названии. По их мнению, применение теории измерений "при выборе или для рекомендации тех или иных методов статистического анализа неуместно и зачастую приводит к ошибкам" [5, с.167].

Прежде чем разбирать аргументы П.Ф. Веллемана и Л. Уилкинсона, целесообразно привести краткие сведения о предмете дискуссии, в частности, определить используемые нами термины и сформулировать основные положения в стиле отечественной вероятностно-статистической школы, основоположником которой является А.Н. Колмогоров, превративший теорию вероятностей и математическую статистику в раздел математики. При этом уточняем изложение в [5, с.168-172] и описываем применение теории измерений в теории средних величин, позволившее создать стройную и окончательную систему средних.

Основы теории измерений

Теория измерений исходит из того, что арифметические действия с используемыми в практической работе числами не всегда имеют смысл. Например, зачем складывать или умножать номера телефонов? Далее, не всегда выполнены привычные арифметические соотношения. Например, сумма знаний двух двоечников не равна знаниям "хорошиста", т.е. для оценок знаний 2+2 не равно 4. Приведенные примеры показывают, что практика использования чисел для описания результатов наблюдений (измерений, испытаний, анализов, опытов) заслуживает методологического анализа.

Основные шкалы измерения. Наиболее простой способ использования чисел - применение их для различения объектов. Например, телефонные номера нужны для того, чтобы отличать одного абонента от другого. При таком способе измерения используется только одно отношение между числами - равенство (два объекта описываются либо равными числами, либо различными). Соответствующую шкалу измерения называют шкалой наименований (при использовании термина на основе латыни - номинальной шкалой; иногда называют также классификационной шкалой). В этой шкале измерены штрих-коды товаров, номера паспортов, ИНН (индивидуальные номера налогоплательщиков) и многие иные величины, выраженные числами. С прикладной точки зрения шкала измерения - это способ приписывания чисел рассматриваемым объектам, соответствующий имеющимся между объектами отношениям.

Отметим, что числа могут быть приписаны объектам разными способами. Переход от одного способа к другому наблюдаем при замене паспортов или телефонных номеров. Каковы свойства допустимых преобразований? Для шкалы наименований естественно потребовать только взаимной однозначности. Другими словами, применив к результатам измерений взаимно-однозначное преобразование, получаем новую шкалу, столь же хорошо описывающую систему исходных объектов, как и прежняя шкала.

Шесть основных типов шкал измерения описаны в табл.1.

Таблица 1. Основные шкалы измерения.

Тип шкалы

Определение шкалы

Примеры

Группа допустимых преобразований

Шкалы качественных признаков

Наименований

Числа используют для различения объектов

Номера телефонов, паспортов, ИНН, штрих-коды

Все взаимно-однозначные преобразования

Порядковая

Числа используют для упорядочения объектов

Оценки экспертов, баллы ветров, отметки в школе, полезность, номера домов

Все строго возрастающие преобразования

Шкалы количественных признаков

(описываются началом отсчета и единицей измерения)

Интервалов

Начало отсчета и единица измерения произвольны

Потенциальная энергия, положение точки, температура по шкалам Цельсия и Фаренгейта

Все линейные преобразования φ(x) = ax + b,

a и b произвольны, а>0

Отношений

Начало отсчета задано, единица измерения произвольна

Масса, длина, мощность, напряжение, сопротивление, температура по Кельвину, цены

Все подобные преобразования φ(x) = ax,

а произвольно, а>0

Разностей

Начало отсчета произвольно, единица измерения задана

Время

Все преобразования сдвига φ(x) = x + b,

b произвольно

Абсолютная

Начало отсчета и единица измерения заданы

Число людей в данном помещении

Только тождественное преобразование φ(x) = x

Кроме перечисленных в табл.1, используют и иные типы шкал [6]. Отметим, что в табл.1 выражение "единица измерения произвольна" означает, что она может быть выбрана по соглашению специалистов, но не вытекает из каких-либо фундаментальных соотношений. При измерении времени естественная единица измерения задается периодами обращения небесных тел. Начало отсчета при измерении длины задается длиной отрезка, у которого начало и конец совпадают, и т.д.

В настоящее время считается необходимым перед применением тех или иных алгоритмов анализа данных установить, в шкалах каких типов измерены рассматриваемые величины. При этом с течением времени тип шкалы измерения определенной величины может меняться. Например, температура сначала измерялась в порядковой шкале (теплее - холоднее). После изобретения термометров она стала измеряться в шкале интервалов (по шкалам Цельсия, Фаренгейта или Реомюра). Температура С по шкале Цельсия выражается через температуру F по шкале Фаренгейта с помощью линейного преобразования. С открытием абсолютного нуля температур стал возможным переход к шкале отношений (шкала Кельвина).

Требование инвариантности (адекватности) выводов. Выяснение типов используемых шкал необходимо для адекватного выбора методов анализа данных. Основополагающим требованием является независимость выводов от того, какой именно шкалой измерения воспользовался исследователь (среди всех шкал, переходящих друг в друга при допустимых преобразованиях). Например, если речь о длинах, то выводы не должны зависеть от того, измерены ли длины в метрах, аршинах, саженях, футах или дюймах.

Другими словами, выводы должны быть инвариантны относительно группы допустимых преобразований шкалы измерения. Только тогда их можно назвать адекватными, т.е. избавленными от субъективизма исследователя, выбирающего определенную шкалу из множества шкал заданного типа, связанных допустимыми преобразованиями.

Требование инвариантности выводов накладывает ограничения на множество возможных алгоритмов анализа данных. В качестве примера рассмотрим порядковую шкалу. Одни алгоритмы анализа данных позволяют получать адекватные выводы, другие - нет. Например, в задаче проверки однородности двух независимых выборок алгоритмы ранговой статистики (т.е. использующие только ранги результатов измерений) дают адекватные выводы, а статистики Крамера-Уэлча и Стьюдента - нет. Значит, для обработки данных, измеренных в порядковой шкале, критерии Смирнова и Вилкоксона можно использовать, а критерии Крамера-Уэлча и Стьюдента - нет.

Выбор средних величин в соответствии со шкалами измерения

Требование инвариантности является достаточно сильным. Из многих алгоритмов анализа статистических данных ему удовлетворяют лишь некоторые. Покажем это на примере сравнения средних величин.

Средние по Коши. Среди всех методов анализа данных важное место занимают алгоритмы усреднения. Еще в 1970-х годах удалось полностью выяснить, какими видами средних можно пользоваться при анализе данных, измеренных в тех или иных шкалах.

Пусть Х1 , Х2 ,..., Хn - выборка объема n. Наиболее общее понятие средней величины введено французским математиком первой половины ХIХ в. О. Коши. Средней величиной (по Коши) является любая функция f(X1, X2,...,Xn) такая, что при всех возможных значениях аргументов значение этой функции не меньше, чем минимальное из чисел X1, X2,...,Xn, и не больше, чем максимальное из этих чисел. Средними по Коши являются среднее арифметическое, медиана, мода, среднее геометрическое, среднее гармоническое, среднее квадратическое.

Средние величины используются обычно для того, чтобы заменить совокупность чисел (выборку) одним числом, а затем сравнивать совокупности с помощью средних. Пусть, например, Y1, Y2,...,Yn - совокупность оценок экспертов (или респондентов), "выставленных" одному объекту экспертизы, Z1, Z2,...,Zn - второму. Как сравнивать эти совокупности? Самый простой способ - по средним значениям.

При допустимом преобразовании шкалы значение средней величины, очевидно, меняется. Но выводы о том, для какой совокупности среднее больше, а для какой - меньше, не должны меняться (в соответствии с требованием инвариантности выводов, принятом как основное требование в теории измерений). Сформулируем соответствующую математическую задачу поиска вида средних величин, результат сравнения которых устойчив относительно допустимых преобразований шкалы.

Пусть f(X1, X2,...,Xn) - среднее по Коши. Пусть среднее по первой совокупности меньше среднего по второй совокупности:

f(Y1, Y2,...,Yn) < f(Z1, Z2,...,Zn).

Тогда согласно теории измерений для устойчивости результата сравнения средних необходимо, чтобы для любого допустимого преобразования g (из группы допустимых преобразований в соответствующей шкале) было справедливо также неравенство

f(g(Y1), g(Y2),...,g(Yn)) < f(g(Z1), g(Z2),...,g(Zn)),

т.е. среднее преобразованных значений из первой совокупности было меньше среднего преобразованных значений для второй совокупности. Причем сформулированное условие должно быть выполнено для любых двух совокупностей Y1, Y2,...,Yn и Z1, Z2,...,Zn. И, напомним, для любого допустимого преобразования. Средние величины, удовлетворяющие сформулированному условию, назовем допустимыми (в соответствующей шкале). Согласно теории измерений только допустимыми средними величинами можно пользоваться при анализе мнений экспертов и иных данных, измеренных в рассматриваемой шкале.

С помощью математической теории, развитой в монографии [7], удается описать вид допустимых средних величин в основных шкалах.

Средние величины в порядковой шкале. Рассмотрим обработку, для определенности, мнений экспертов, измеренных в порядковой шкале. Справедливо следующее утверждение.

Теорема 1. Из всех средних по Коши допустимыми средними в порядковой шкале являются только члены вариационного ряда (порядковые статистики).

Теорема 1, впервые полученная в статье [8], справедлива при условии, что среднее f(X1, X2,...,Xn) является непрерывной (по совокупности переменных) и симметрической функцией. Последнее означает, что при перестановке аргументов значение функции f(X1, X2,...,Xn) не меняется. Это условие является вполне естественным, ибо среднюю величину находим для совокупности (множества) чисел, а не для последовательности. Множество не меняется в зависимости от того, в какой последовательности мы перечисляем его элементы.

Согласно теореме 1 в качестве среднего для данных, измеренных в порядковой шкале, можно использовать, в частности, медиану (при нечетном объеме выборки). При четном же объеме следует применять один из двух центральных членов вариационного ряда - как их иногда называют, левую медиану или правую медиану. Моду тоже можно использовать - она всегда является членом вариационного ряда. Можно применять выборочные квартили, минимум и максимум, децили и т.п. Но никогда нельзя рассчитывать среднее арифметическое, среднее геометрическое и т.д.

Средние по Колмогорову. Естественная система аксиом (требований к средним величинам) приводит к так называемым ассоциативным средним. Их общий вид нашел в 1930 г. А.Н. Колмогоров [9]. Теперь их называют "средними по Колмогорову".

Для чисел X1, X2,...,Xn средним по Колмогорову является

G{(F(X1) + F(X2) +...+ F(Xn))/n},

где F - строго монотонная функция (т.е. строго возрастающая или строго убывающая), G - функция, обратная к F. Среди средних по Колмогорову - много хорошо известных персонажей. Так, если F(x) = x, то среднее по Колмогорову - это среднее арифметическое, если F(x) = ln x, то среднее геометрическое, если F(x) = 1/x, то среднее гармоническое, если F(x) = x2, то среднее квадратическое, и т.д. (в последних трех случаях усредняются положительные величины).

Среднее по Колмогорову - частный случай среднего по Коши. С другой стороны, такие популярные средние, как медиана и мода, нельзя представить в виде средних по Колмогорову. В статье [10] впервые доказаны следующие утверждения.

Теорема 2. В шкале интервалов из всех средних по Колмогорову допустимым является только среднее арифметическое.

Таким образом, среднее геометрическое или среднее квадратическое температур (в шкале Цельсия), потенциальных энергий или координат точек не имеют смысла. В качестве среднего надо применять среднее арифметическое. А также можно использовать медиану или моду.

Теорема 3. В шкале отношений из всех средних по Колмогорову допустимыми являются только степенные средние с и среднее геометрическое.

Есть ли средние по Колмогорову, которыми нельзя пользоваться в шкале отношений? Конечно, есть. Например, с F(x) = ex.

Замечание 1. Среднее геометрическое является пределом степенных средних при с ->0.

Замечание 2. Теоремы 1 и 2 справедливы при выполнении некоторых внутриматематических условий регулярности. Доказательства теорем 1-3 приведены в монографии [7]. Перенос на случай взвешенных средних дан в статье [11].

Аналогично средним величинам могут быть изучены и другие статистические характеристики - показатели разброса, связи, расстояния и др. (см., например, [6, 7]). Нетрудно показать, например, что коэффициент корреляции не меняется при любом допустимом преобразовании в шкале интервалов, как и отношение дисперсий. Дисперсия не меняется в шкале разностей, коэффициент вариации - в шкале отношений, и т.д. В статье [12] рассмотрены дальнейшие результаты о средних величинах.

Согласно рассматриваемому подходу сначала надо установить, в каких шкалах измерены социологические данные, а затем использовать только инвариантные относительно этих шкал алгоритмы обработки данных.

В статье [5] теория измерений именуется "ограничения Стивенса", порядковая шкала названа ординальной, шкала отношений - относительной, нет понятия "группа допустимых преобразований", и т.п. Будем пользоваться устоявшимися в прикладной статистике терминами [4]. В целом же позиция сторонников использования теории измерений при анализе данных описана в [5] верно.

На русском языке имеется достаточно много публикаций по теории измерений, написанных строго, квалифицированными авторами. Поскольку мы не ставим целью дать здесь обзор по теории измерений, отошлем читателей к работам [6, 7, 12] и имеющимся там ссылкам на литературные источники.

Первые размышления над переводом статьи П.Ф. Веллемана и Л. Уилкинсона

Эта статья написана в виде обзора различных публикаций, изложение идет на словесном уровне, строгие определения, формулы, таблицы, примеры почти отсутствуют. Поэтому приходится додумывать за авторов, что они хотели сказать. Не всегда удается придать точный смысл их высказываниям.

На с.173 выделено три направления критики:

1. Требование инвариантности выводов относительно допустимых преобразований шкал измерения "представляется опасным для анализа данных".

2. Подход на основе теории измерений "слишком строг, чтобы его можно было применять для реальных данных".

3. Этот подход "часто ведет к понижению уровня данных через их преобразования в ранги и последующее ненужное обращение к непараметрическим методам".

Начнем с разбора в общих терминах этих трех направлений критики.

1. Опасным для получения обоснованных выводов является, наоборот, отказ от требования инвариантности. Разве можно опираться на выводы, которые меняются при допустимом преобразовании шкалы?

Конечно, при первоначальном разведочном анализе данных можно их "прогнать" через весь арсенал имеющихся в программном продукте методов обработки - вдруг удастся что-нибудь интересное заметить? Полученные нестрогими методами "находки" необходимо затем проверить с помощью обоснованных процедур анализа данных [3].

Практика зачастую вынуждает использовать соображения теории измерений. Так, при проведении нашим научным коллективом опросов летного состава авиакомпании "Волга-Днепр" выяснилось, что пилотам легче сказать, какое событие встречается чаще, а какое реже, чем оценить число осуществлений событий на 1000 полетов. Проводить оценивание в абсолютной шкале (оценивать вероятности событий) пилоты не берутся, в то время как задачи сравнения событий по частоте встречаемости или оценки их по встречаемости условными баллами (значениями качественных признаков) не вызывают сложностей. Таким образом, полученные при опросах пилотов оценки измерены в порядковых шкалах.

2. При практической работе обычно вполне ясно, в каких шкалах измерены данные. Если попытаться навязать респондентам неправильную шкалу, их ответы будут произвольными, не отражающими истинных мнений, или же они могут попросту отказаться давать ответы, как это было в описанных выше опросах летного состава авиакомпании "Волга-Днепр".

Можно признать, что в отдельных редких случаях определение типа шкалы измерения данных требует специальных исследований.

3. Уже ко времени появления статьи П.Ф. Веллемана и Л. Уилкинсона (1993 г.) с помощью непараметрических методов можно было решать все те задачи анализа данных, для которых всё еще в отдельных работах используются параметрические методы. Согласно современной парадигме прикладной статистики [2], вместо параметрических методов, характерных для устаревшей парадигмы середины ХХ в., следует применять непараметрические методы.

Согласно современным взглядам, параметрические методы - это методы, основанные на вероятностно-статистических моделях, в которых распределения случайных величин принадлежат тому или иному из параметрических семейств - семейству нормальных, логарифмически-нормальных, гамма-распределений или иных, входящих в четырехпараметрическое семейство К. Пирсона, введенное им в начале ХХ в. Непараметрические методы исходят из распределений произвольного вида. "Преобразование в ранги" [5] не обязательно при применении непараметрических методов. Оно соответствует [7] случаю, когда данные измерены в порядковой шкале.

Как показали многочисленные исследования, почти все распределения реальных данных не принадлежат ни одному из известных параметрических семейств [3]. Боязнь непараметрических методов не имеет рационального обоснования, она порождена предрассудками устаревшей парадигмы прикладной статистики середины ХХ в.

От анализа общих возражений против применения теории измерений при анализе социологических данных перейдем к рассмотрению конкретных примеров, приведенных П.Ф. Веллеманом и Л. Уилкинсоном. Чтобы не раздувать объем настоящей статьи, не будем повторять формулировки примеров, предполагая, что читатели имеют перед собой перевод их исходной статьи [5].

В критике Лорда [5, с.173] выделим несколько составляющих. Во-первых, выбор типа шкалы может быть связан с решаемой задачей. Так, номера договоров предприятия служат прежде всего для того, чтобы различать эти договора (и связанные с ними действия), т.е. естественно принять, что они измерены в шкале наименований. Однако эти номера возрастают с течением времени (в соответствии с датами заключения договоров), поэтому в некоторых задачах принятия управленческих решений естественно считать, что они измерены в порядковой шкале. Во-вторых, при обработке порядковых данных с помощью алгоритмов, не являющимися инвариантными в порядковой шкале, может создаться впечатление, что получены обоснованные выводы. Лорд рассказывает о применении неравенства Чебышева (можно было использовать критерий Крамера-Уэлча [3]). Однако при применении той же процедуры анализа к данным, подвергнутым некоторому допустимому преобразованию в порядковой шкале, выводы будут прямо противоположными. Для обнаружения различия между двумя независимыми выборками следовало применить непараметрические критерии однородности, например, критерий Вилкоксона [3].

Бейкер, Хардик и Петринович, Боргатта и Боршштейн [5, с.173-174] не хотят применять непараметрические методы, объяснений нет. Веллеман и Уилкинсон напрасно критикуют их за нежелание "связываться с проблемой робастности" [5, с.174]. Робастные методы, т.е. устойчивые к малым отклонениям функций распределения данных, не позволяют справиться с произвольным допустимыми преобразованиями. Если же от робастности перейти к более общей системе понятий - к общей схеме устойчивости, то оказывается, что устойчивые к допустимым преобразованиям шкал методы анализа данных - это ранговые методы как частный случай непараметрических [4, 7].

Гутман предлагает использовать "функцию потерь, выбранную для проверки качества модели" [5, с.174]. Действительно, если задана функция потерь, то нет необходимости привлекать теорию измерений. Проблема в том, чтобы выбрать эту функцию, причем обоснованно. Ни с одним таким практиком за более чем 40 лет консультирования в области анализа данных мне встретиться не довелось. Тот, кто сможет выбрать функцию потерь, уже не практик, а квалифицированный специалист в области математической статистики.

По мнению Тьюки, "какое знание не основано на некоторой приблизительности" [5, с.175]. Действительно, при первоначальном разведочном анализе одного взгляда на данные специалисту бывает достаточно для формулировки вывода. Однако и практики, и теоретики настаивают на том, чтобы интуитивные выводы были обоснованы строгими рассуждениями.

Дискуссия о статистиках и шкальных типах

Названный так раздел [5, с.175-177] начинается словами: "Статистики отвергли запрет на методы, основанный на ограничениях, связанных с допустимыми преобразованиями". Это совершенно неверно. Статистики приняли этот запрет (см. обсуждения в [1-4, 6-8, 10-12]). Особенно ясно это сейчас, через 20 лет после написания статьи [5]. В настоящее время сомнения остаются у некоторых из тех, кто не является профессионалом в области анализа данных, к тому же склонен к принятию простых решений и не хочет утруждать себя изучением теории измерений и непараметрической статистики. Такой настрой практиков вполне естественен и разумен, но не плодотворен. Современная прикладная статистика [1, 3, 4] не является простой, для ее усвоения нужно приложить усилия и затратить время.

Приходится констатировать, что в статью [5] включено большое количество категоричных утверждений, не подтвержденных аргументами и противоречащих практике анализа данных. На с.176 сказано: "Ключевой аргумент против использования предписания статистик на основе шкального типа гласит: это не работает!". Еще как работает - и на практике, и при развитии теории (в начальных разделах настоящей статьи показано, что теория измерений позволила придать теории средних законченный вид). На с.177 говорится, что "опыт показывает, что применение запрещенных статистик к данным приводит к научно значимым результатам, важным при принятии решений и ценным для дальнейших исследований". Примеров нет. Видимо, потому, что это утверждение неверно.

В [5] часто используются термины без определений. Отечественного читателя может поразить заявление о "фундаментальной разнице между математикой и наукой" (с.176). В нашей стране согласно традиции и нормативным документам Минобразования и ВАК математика - одна из наук. Мы считаем, что статистические методы и анализ данных - это одно и то же. Именно поэтому наша крайняя книга называется "Статистические методы анализа данных" [13]. Конечно, можно определить термины так, что математика не будет наукой, а анализ данных станет отличаться от математической статистики. Дискуссия о терминах - увлекательное занятие. Только в одной брошюре [14] приведено около 200 определений термина "статистика". Однако ясно, что использование терминов без определений, как это сделано в [5, с.176], может только запутать читателя.

Различные виды данных

Нельзя не согласиться с Веллеманом и Уилкинсоном в том, что данные - это не всегда числа [5, с.177-179]. Элементами выборок могут быть вектора, функции, различные виды объектов нечисловой природы - бинарные отношения, множества, нечеткие множества, интервалы и др. [3, 4]. Тем более это касается результатов расчетов, таких, как доли или набор точек на плоскости, полученных в результате многомерного шкалирования. Обратите внимание: при рассказе о применении теории измерений при анализе данных в начале этой статьи шла речь об инвариантности выводов, сделанных на основе обработки наборов чисел. Следовательно, теория измерений используется не во всех разделах прикладной статистики, а лишь при статистическом анализе числовых величин [3, гл.8]. Это замечание понадобится при дальнейшем разборе статьи [5].

Необходимо всегда различать разведочный статистический анализ, нацеленный на "интуитивное проникновение в закономерности массива данных" [5, с.179], и доказательную статистику, основанную на строгих рассуждениях. Именно к разведочному анализу относятся методы преобразования данных [5, с.178] и многомерного шкалирования [5, с.179]. При разведочном анализе соблюдать требования теории измерений не обязательно, а в доказательной статистике - наоборот.

В разделе "Хороший анализ данных не основан на допущениях о типе данных" [5, с.179-180] Веллеман и Уилкинсон справедливо обращают внимание на важность правильного выбора статистической модели. В следующем разделе "Стивенсовские категории не описывают фиксированных свойств данных" [5, с.180-182] речь фактически идет о том же: в ряде ситуаций "шкальный тип зависит от интерпретации данных или от наличия дополнительной информации" [5, с.180]. Это утверждение совершенно верно, набор чисел сам по себе не дает возможности обосновать тип шкалы. Результат измерения равен 2911397 - какая шкала? Если это число из бухгалтерского отчета, то шкала отношений (переход от одной валюты к другой - подобное преобразование). Если же это число - из телефонного справочника, то номер телефона измерен в шкале наименований. На эту тему мы говорили ранее в связи с разбором работы Лорда [5, с.173]. Итак, весьма важен выбор статистической модели, им определяются шкалы измерения данных.

В разделе "Категории Стивенса недостаточны для описания шкал данных" [5, с.182-183] рассматриваются "многомерные шкалы". Что это такое - неясно, так как определений нет. Однако квазипрактический пример, заданный табл.1, достаточно понятен. Поскольку я пять лет проработал в медицинских учреждениях (в "кремлевской больнице" и в НИИ профессиональных заболеваний и гигиены труда АМН СССР), то отмечу, что число имеющихся у пациента симптомов нельзя рассматривать как показатель тяжести заболевания, поскольку подобное рассмотрение предполагает, что все симптомы равноценны по вкладу в тяжесть заболевания. Такого в медицине не бывает.

О чем идет речь в абзаце, посвященном работе Андерсона [5, с.183], остается неясным, поскольку определений используемых понятий нет.

Робастность, шкалы и анализ данных

В разделе "Статистические процедуры не могут классифицироваться по критериям Стивенса" [5, с.183-184] Веллеман и Уилкинсон обсуждают обратную задачу (в терминологии [7, 11, 12]), в которой для заданной процедуры анализа данных требуется установить, в каких шкалах эта процедура дает инвариантные выводы. Действительно, нами доказано, что вывод о сравнении рассчитанных по двум выборкам значений линейной функции от порядковых статистик, заданной формулой (5) на с.185 [5], инвариантен в порядковой шкале, если только один весовой коэффициент отличен от 0 (см. [8] и теорему 1 в начале статьи), и в шкале интервалов (и в шкалах с более узкими группами преобразований - отношений, разностей, абсолютной), если по крайней мере два весовых коэффициента отличны от 0 (см. [11]). Остальной текст этого раздела статьи [5] не поддается интерпретации в строгих терминах. Отметим только, что рассматривается иная задача, чем раньше, - увязка процедур расчетов со шкалами измерения, а не установление типа шкалы измерения исходных данных.

В разделе "Шкальные типы - не точные категории" [5, с.184-185] в очередной раз бездоказательно утверждается, что "реальные данные не удовлетворяют требованиям шкальных типов". Вместе с тем правильно отмечено, что при сомнениях "следует осуществить понижение уровня" шкалы, например, с интервальной до порядковой. В задаче, рассмотренной Тьюки в 1961 г., была бы полезна статистика интервальных данных, развиваемая с начала 1980-х годов [3, 4].

В разделе "Шкалы и анализ данных" [5, с.185-186] рассуждения построены на смешении разведочного статистического анализа, при котором можно не обращать внимание на шкалы, в которых измерены данные, и анализа данных на стадии получения строгих выводов, немыслимых без обращения к теории измерений. Странно, что Веллеман и Уилкинсон считают "хорошим" только разведочный анализ. Фраза: "Хороший анализ данных редко следует формальной парадигме проверки гипотезы" [5, с.186] демонстрирует их нигилизм по отношению к математической статистике, который никак нельзя оправдать.

В разделе "Осмысленность" [5, с.186-188] термин, давший название разделу, так и остался без определения. Как справедливо отмечают Веллеман и Уилкинсон, согласно теории измерений осмысленность - это то, что сохраняется при допустимых преобразованиях. Такое определение им не нравится, но дать другое они не могут, занимаясь общими рассуждениями о праве на ошибку. Странно читать такое: "Если бы наука была ограничена доказуемо осмысленными суждениями, она не смогла бы развиваться". Математика же успешно развивается!

Раздел "Роль типов данных" [5, с.188-189] начинается неожиданно - с признания важности теории измерений: "Были бы ошибкой полагать, что типы данных не имеют значения... Понятие типа шкалы важно, а терминология Стивенса (т.е. теории измерений - А.О.) зачастую бывает удобна". Дальнейшие рассуждения снова посвящены констатации того, что, в нашей терминологии, тип шкалы определяется не самими данными, а моделью, соответствующей решаемой задаче (см. выше интерпретацию числа 2911397 как результата измерений в шкале отношений или в порядковой шкале в зависимости от постановки задачи). Вторая идея, которая также уже встречалась, - упор на разведочный анализ и умаление роли доказательной статистики.

Заключение

Раздел "Заключение" статьи [5, с.190] написан взвешенно, высказанные в нем положения в целом справедливы. Как уже говорилось, нельзя считать, "что тип шкалы как бы самоочевиден и не зависит от того, какой вопрос ставит исследователь перед своими данными". За двадцать лет после написания статьи [5] стало ясно, что после постановки вопроса исследователь должен описать модель анализа данных, обычно вероятностно-статистическую, включающую выбор типа шкал измерения данных, а затем в рамках этой модели разработать метод решения задачи или выбрать его из уже имеющихся [3].

Совершенно верно, что "статистическое программное обеспечение, способствующее любому анализу для любых данных, допускает и безответственный анализ". Об этом предупреждал В.В. Налимов более 40 лет назад [15]. Он имел в виду прежде всего склонность к проведению расчетов без знакомства с сутью применяемых методов.

Анализ статьи [5] закончен.

Подводя итоги настоящей статьи, необходимо констатировать пользу от сопоставления подходов теории измерений и критических замечаний по ее поводу, собранных в статье Веллемана и Уилкинсона [5]. Дискуссия позволила уточнить ряд вопросов применения прикладной статистики (анализа данных). Прежде всего, выявлена роль решаемой задачи и применяемой модели данных для установления типов шкал измерения этих данных, разделены области применения разведочного анализа и доказательной статистики. Подтвердилась справедливость пословицы: "В споре рождается истина".

Работа выполнена при финансовой поддержке Министерства образования и науки РФ в рамках Постановления Правительства РФ No. 218.

Литература

1. Орлов А.И. Статистические методы в российской социологии (тридцать лет спустя) // Социология: методология, методы, математические модели. 2005. No. 20. С.32-53.

2. Орлов А.И. Новая парадигма прикладной статистики // Заводская лаборатория. 2012. Том 78. No.1, часть I. С.87-93.

3. Орлов А.И. Прикладная статистика. Учебник. - М.: Экзамен, 2006. - 672 с.

4. Орлов А.И. Организационно-экономическое моделирование: учебник : в 3 ч. Часть 1: Нечисловая статистика. - М.: Изд-во МГТУ им. Н.Э. Баумана. - 2009. - 541 с.

5. Веллеман П.Ф., Уилкинсон Л. Типология номинальных, ординальных, интервальных и относительных шкал вводит в заблуждение // Социология: методология, методы, математическое моделирование. 2011. No. 33. С.166 - 193.

6. Толстова Ю.Н. Измерения в социологии. - М.: Инфра-М, 1998. - 352 с.

7. Орлов А.И. Устойчивость в социально-экономических моделях. - М.: Наука, 1979. - 296 с.

8. Орлов А.И. Допустимые средние в некоторых задачах экспертных оценок и агрегирования показателей качества. // Многомерный статистический анализ в социально-экономических исследованиях. - М.: Наука, 1974. С. 388-393.

9. Колмогоров А.Н. Об определении среднего // Избр. труды. Математика и механика. М.: Наука, 1985. С. 136-138.

10. Орлов А.И. Допустимые преобразования в задаче сравнения средних. Пси-постоянные статистики. // Алгоритмы многомерного статистического анализа и их применения. - М.: Изд-во ЦЭМИ АН СССР, 1975. С.121-127.

11. Орлов А.И. Связь между средними величинами и допустимыми преобразованиями шкалы // Математические заметки. 1981. Т. 30. No.4. С. 561-568.

12. Барский Б.В., Соколов М.В. Средние величины, инвариантные относительно допустимых преобразований шкалы измерения // Заводская лаборатория. 2006. Том 72. No.1. С.59-66.

13. Орлов А.И. Организационно-экономическое моделирование : учебник : в 3 ч. Ч.3. Статистические методы анализа данных. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2012. - 624 с.

14. Никитина Е.П., Фрейдлина В.Д., Ярхо А.В. Коллекция определений термина "статистика". - М.: МГУ, 1972. - 46 с.

15. Налимов В.В. О преподавании математики экспериментаторам // О преподавании математической статистики экспериментаторам. Препринт Межфакультетской лаборатории статистических методов No.17. - М.: Изд-во МГУ им. М.В. Ломоносова, 1971. - С.5-39.

Об авторе: Александр Иванович Орлов, профессор, доктор экономических наук, доктор технических наук, кандидат физико-математических наук, директор Института высоких статистических технологий и эконометрики МГТУ им. Н.Э. Баумана, профессор МФТИ, советник президента группы авиакомпаний "Волга-Днепр", президент Российской ассоциации статистических методов. E-mail: prof-orlov@mail.ru .

Публикация:

Орлов А.И. Место теории измерений в методах анализа данных // Журнал "Социология: методология, методы, математическое моделирование". No.35 (2012).

*   *   *   *   *   *   *

На сайте "Высокие статистические технологии", расположенном по адресу http://orlovs.pp.ru, представлены:

На сайте есть форум, в котором вы можете задать вопросы профессору А.И.Орлову и получить на них ответ.

*   *   *   *   *   *   *

Удачи вам и счастья!


В избранное