Отправляет email-рассылки с помощью сервиса Sendsay

Эконометрика

  Все выпуски  

Эконометрика - выпуск 684


"Эконометрика", 684 выпуск, 3 марта 2014 года.

Здравствуйте, уважаемые подписчики!

*   *   *   *   *   *   *

Продолжаем публиковать новую книгу А.И. Орлова "Полвека в мире формул". Начало - в выпусках No.No.680-683 от 3, 10, 17, 24 февраля 2014 г. В настоящем выпуске - продолжение Части I "Статистическая теория" - глава "Теоретическая математическая статистика" и начало главы "Прикладная математическая статистика" (разделы "1. Непараметрическая статистика случайных величин", "2. Параметрическая теория оценивания и проверки гипотез" и из раздела "3. Многомерный статистический анализ" подразделы "3.1. Регрессионный анализ и смежные вопросы" и "3.2. Методы классификации").

Все вышедшие выпуски доступны в Архиве рассылки по адресу subscribe.ru/catalog/science.humanity.econometrika.

*   *   *   *   *   *   *

Александр Иванович ОРЛОВ

ПОЛВЕКА В МИРЕ ФОРМУЛ

Комментарии к списку научных и методических трудов

Часть I. Статистическая теория

(продолжение)

Теоретическая математическая статистика

Прикладная математическая статистика

(начало)

Теоретическая математическая статистика

1. Оценка скорости сходимости

2. Асимптотическое поведение статистик интегрального типа

3. О теоретических результатах в прикладной статистике и иных областях

К теоретической математической статистике относим работы, посвященные изучению математических свойств статистических структур, но не позволяющие получить выводы, полезные для обработки конкретных данных. Если подобные выводы вытекают из результатов работы, относим ее к прикладной математической статистике.

Граница между теоретической математической статистикой и прикладной математической статистикой, конечно, условна, но обычно конкретную научную работу по статистической теории без долгих раздумий можно отнести к той или иной из этих областей. Критерий прост: на основе работы по прикладной математической статистике можно составить методику (алгоритм) обработки конкретных статистических данных (или получить полезные сведения о такой методике, например, рекомендации по области ее применения). В то время как работа по теоретической математической статистике, хотя и посвящена свойствам статистических структур, не позволяет непосредственно перейти к обработке конкретных данных.

Иногда в работе по теоретической математической статистике развивается математический аппарат (техника), позволяющий получать полезные результаты в области прикладной математической статистики. Например, математический аппарат, созданный в разработанной нами предельной теории статистик интегрального типа, позволяет получить предельные распределения для конкретных статистик типа омега-квадрат, например, для статистики, предложенной нами для проверки симметрии распределения относительно 0 (см. ниже). Отметим, что реальный ход исследований шел в противоположном направлении: сначала была предложена и изучена конкретная статистика типа омега-квадрат, а потом в качестве обобщения построена предельная теория статистик интегрального типа и получены - в качестве окончательных результатов - необходимые и достаточные условия.

Часто даже в перспективе не просматривается возможность использования результатов работы по теоретической математической статистике при обработке реальных данных. Например, с прикладной точки зрения оценку скорости сходимости распределения классической статистики омега-квадрат (статистики Крамера - Мизеса - Смирнова) следовало бы проводить методами вычислительной математики с целью выявления зоны применимости предельного распределения и получения точных распределений и/или поправок при конечных объемах выборок. Оценки типа О(.) в принципе не могут иметь практического значения. Однако они интересны с чисто математической точки зрения (см. ниже).

Для математики такая ситуация обычна. Например, т.н. "великая теорема Ферма" не имеет никакой связи с практикой. Однако сколько веков она о ней говорят!

1. Оценка скорости сходимости

Первая моя научная публикация - резюме доклада в Математическом институте АН СССР весной 1971 г., когда я был студентом пятого курса мехмата:

15. Орлов А.И. Оценки скорости сходимости к пределу распределений некоторых статистик. - Журнал "Теория вероятностей и ее применения". 1971. Т. XVI. No.3. С. 583-584.

Речь шла об оценке максимального расхождения функции распределения статистики омега-квадрат (Крамера - Мизеса - Смирнова) и предельной функции распределения. Оценка имела вид "О-большое от объема выборки в степени (-С)".

Существенно, что ряд достаточно известных исследователей решали задачу в такой постановке и получили оценку при С = 1/10, 1/6, 1/5, 1/4. В моей первой опубликованной научной работе оценка была получена при С = 1/3. Летом того же 1971 г. я разработал новый метод - "процесс итерации формул". С его помощью получил оценку с С = 1/2, ставшую основным результатом кандидатской диссертации.

Для меня рассматриваемая научная проблема возникла естественным образом как третий шаг на пути исследований. Первым шагом было построение и изучение критерия типа омега-квадрат для проверки симметрии распределения относительно 0 (данная работа относится к прикладной математической статистике - см. раздел "Статистика случайных величин"). Это была курсовая работа на четвертом году обучения, задача была поставлена научным руководителем Ю.Н. Тюриным. Второй шаг - построение предельной теории статистик интегрального типа, включающей ряд необходимых и достаточных условий. Это направление работ Ю.Н. Тюрин уже не одобрил - зачем нужны необходимые и достаточные условия? Однако результаты первых двух шагов были объединены в моей дипломной работе, выполненной на кафедре теории вероятностей математической статистики (заведующий - Б.В. Гнеденко) механико-математического факультета Московского государственного университета им. М.В. Ломоносова, защищенной весной 1971 г.

Третий шаг - изучение скорости сходимости - уже не относился к диплому и послужил началом работы над кандидатской диссертацией. Эта постановка задачи Ю.Н. Тюрину тоже не нравилась, поскольку была чисто абстрактной и не вела к получению полезных для практики рекомендаций. Проще сказать, относилась к теоретической статистике, а не к прикладной. В этом он был прав. С точки зрения прикладной статистики следовало бы численно изучать функцию распределения статистики омега-квадрат и ее отклонение от предельной. Через 20 лет так и сделали минские исследователи (Залесский Б.А., Ольшевская О.В. / Заводская лаборатория. 1989. Т.55. No. 7. С.103-105).

Однако оказалось, что я опередил ряд исследователей, в частности, американца Дж. Кифера и ленинградца Я.Ю. Никитина, чьи работы с С = 1/4 были опубликованы в 1972 г., т.е. позже моего резюме 1971 г. Так что для теоретической математической статистики рассматриваемая постановка была весьма актуальной. История вопроса с подробными ссылками опубликована в разделе 2.3 моей первой научной монографии:

131. Орлов А.И. Устойчивость в социально-экономических моделях (Серия "Проблемы советской экономики", в надзаг. ЦЭМИ АН СССР). - М.: Наука,1979.- 296 с.

После первого доклада последовали дальнейшие, в том числе с включением результатов по смежным вопросам теории статистик интегрального типа:

37. Орлов А.И. Переход от сумм к интегралам и его применения в изучении асимптотических распределений статистик. - Журнал "Теория вероятностей и ее применения". 1973. Т. XVIII. No.4. С. 881-883.

39. Орлов А.И. Предельные теоремы для статистик интегрального типа. - В сб.: Тезисы докладов Международной конференции по теории вероятностей и математической статистике (Вильнюс, 25-30 июня 1973 г.). Т.2. - Вильнюс: Изд-во Вильнюсского госуниверситета, 1973. С.137-140.

50. Орлов А.И. Применение критериев типа омега-квадрат для проверки принадлежности функции распределения выборки некоторому семейству. - В сб.: Многомерный статистический анализ в социально-экономических исследованиях. - М.: Наука, 1974. С.401-403.

Основная публикация по этой тематике - большая статья:

47. Орлов А.И. Скорость сходимости распределения статистики Мизеса - Смирнова. - Журнал "Теория вероятностей и ее применения". 1974. Т.19. No.4. С.766-786.

Помнится, я около года не мог собраться доработать статью по замечаниям рецензента. Связано это было, конечно, с объективными причинами. Тяжело болела и в июне 1973 г. умерла моя мать. Активно шла работа по новым направлениям исследований - статистике нечисловых данных, управлению запасами. Вечерняя Математическая Школа и связанные с нею издательские проекты требовали сил. Все же, мысленно возвращаясь назад, думаю, что надо было по-иному расставить приоритеты. Мог бы защитить кандидатскую диссертацию на 2-3 года раньше, а это могло изменить к лучшему и дальнейшую жизненную траекторию.

Диссертацию я закончил в мае 1975 г.:

75. Орлов А.И. Оценки скорости сходимости распределений статистик интегрального типа. Диссертация на соискание ученой степени кандидата физико-математических наук (рукопись). - М.: ЦЭМИ АН СССР, 1975. - 148 стр.

Вся она представляла собой доказательство одной-единственной теоремы на основе разработанного мой еще летом 1971 г. процесса "итерации формул". За всю мою жизнь это была самая сложная работа с точки зрения математической техники. Две другие - это "теорема о медиане" в теории измерений:

49. Орлов А.И. Допустимые средние в некоторых задачах экспертных оценок и агрегирования показателей качества. - В сб.: Многомерный статистический анализ в социально-экономических исследованиях. - М.: Наука, 1974. С. 388-393.

и характеризация моделей с дисконтированием среди всех моделей динамического программирования:

103. Orlov A. Sur la stabilite' dans les modeles economiques discrets et les modeles de gestion des stocks. - Журнал "Publications Econometriques". 1977. Vol.X. F. 2. Pp.63-81.

По диссертации был сделан доклад в Математическом институте им. В.А. Стеклова:

68. Орлов А.И. Оценки скорости сходимости распределений статистик интегрального типа, определенных с помощью эмпирических процессов. - Журнал "Теория вероятностей и ее применения". 1975. Т. XX. No.3. С. 698-700.

А также доклад в Ташкенте, куда были включены и результаты по предельной теории статистик интегрального типа:

67. Орлов А.И. Асимптотические свойства статистик интегрального типа. - В сб.: Тезисы докладов III советско-японского симпозиума по теории вероятностей (Ташкент, 26 августа - 3 сентября 1975 г.). Т.1. - Ташкент: Изд-во "Фан", 1975. С.126-128.

Защита кандидатской диссертации состоялась лишь в октябре 1976 г.:

85. Орлов А.И. Оценки скорости сходимости распределений статистик интегрального типа. Автореферат диссертации на соискание ученой степени кандидата физико-математических наук (на правах рукописи). - М.: МГУ, ф-т вычислительной математики и кибернетики, 1976. - 16 с.

Наверно, это рекорд - до защиты было 84 публикации (правда, включая научно-популярные - см. раздел "Внеклассная математика"). У многих профессоров-докторов за всю жизнь бывает меньше. Конечно, только по числу публикаций нельзя судить о значимости вклада в науку и практику. Но об активности судить можно.

Защита задержалась по объективным причинам - происходила реформа ВАК. Но и по субъективным - не проявил я настойчивости. Научного руководителя у меня не было. К сожалению, я решил не выбиваться из стандарта и вписал в автореферат в качестве руководителя своего начальника Айвазяна С.А. Он не имел отношения к работе, о чем честно признался на защите.

А затем - после получения мною в 1971 г. основных результатов кандидатской диссертации - развитие науки пошло дальше. Группа венгерских математиков в 1974 г. разработала новый вариант т.н. "метода единого вероятностного пространства", который позволил принципиально иным способом несколько улучшить мой результат с С = 1/2. Я сам это сделал в статье:

148. Орлов А.И. Неравномерные оценки скорости сходимости в принципе инвариантности. - В сб.: Статистические методы оценивания и проверки гипотез. Межвузовский сборник научных трудов. - Пермь: Изд-во Пермского государственного университета, 1980, с.135-146.

Однако эта статья уже не выделялась по математической сложности среди иных. Принципиальный прорыв был сделан именно венграми.

Другие авторы довели работу до конца - до С = 1. Большего значения получить нельзя, как я установил в основной работе 1974 г. по этой тематике:

47. Орлов А.И. Скорость сходимости распределения статистики Мизеса - Смирнова. - Журнал "Теория вероятностей и ее применения". 1974. Т.19. No.4. С.766-786.

Таким образом, сохранить первенство при изучении скорости сходимости для функции распределения статистики омега-квадрат (Крамера - Мизеса - Смирнова) не удалось. Для этой конкретной статистики другие авторы получили более сильные результаты. Однако, как обычно и бывает, были получены не превзойденные никем до сих пор оценки для похожих статистик, например, для статистики Лемана-Розенблатта типа омега-квадрат, предназначенной для проверки однородности двух независимых выборок. В статье

102. Орлов А.И. Некоторые проблемы устойчивости в социально-экономических моделях и статистике, I. - В сб.: Избранные вопросы теории вероятностей и математической экономики. - М.: Изд-во ЦЭМИ АН СССР, 1977. С.47-91.

рассмотрены дальнейшие пути развития рассматриваемой тематики, сформулировано около 30 нерешенных задач. Это типичная ситуация - любое продвижение вперед порождает огромное число новых постановок.

Но - не было стимула двигаться дальше. Кому это надо - вот вопрос, на который не было ответа. Соревнование по конкретному вопросу (по классической статистике Крамера - Мизеса - Смирнова) закончилось. Принципиально новые методы и результаты не просматривались. Главное же - мне было ясно, что пользы для прикладных работ не получить. К тому же у меня появилась большая новая тематика, которую я вначале объединил идеей устойчивости, а затем - с другой точки зрения - выделил как самостоятельное направление в статистической теории - статистику объектов нечисловой природы.

Итог - рассматриваемое направление научных исследований для меня закончилось.

2. Асимптотическое поведение статистик интегрального типа

Как уже отмечалось, чуть раньше начались работы по статистикам интегрального типа. Первой был класс статистик типа омега-квадрат для проверки симметрии относительно 0, введенный и изученный в курсовой работе на 4-м году обучения (1969/1970 учебный год):

25. Орлов А.И. О проверке симметрии распределения. - Журнал "Теория вероятностей и ее применения". 1972. Т.17. No.2. С.372-377.

Эту работу мы относим к прикладной статистике. Статья сдана в журнал "Теория вероятностей и ее применения" в 1970 г. А вот общая теория была впервые разработана, судя по сохранившейся рукописи, осенью и зимой 1970 г. Она была отражена в моей дипломной работе (1971), а затем в двух докладах, полностью посвященных этой тематике:

36. Орлов А.И. Необходимые и достаточные условия в предельной теории статистик интегрального типа. - Журнал "Теория вероятностей и ее применения". 1973. Т. XVIII. No.3. С. 673-675. (Доклад на секции теории вероятностей Московского математического общества.)

38. Орлов А.И. Необходимые и достаточные условия в предельной теории для интегралов от случайных процессов и их применения в статистике. - В сб.: Материалы Всесоюзного симпозиума по статистике случайных процессов (Киев, 5-8 июня 1973 г.). - Киев: Изд-во Киевского государственного ун-та, 1973. С.144-146.

(На конференцию в Киев я не ездил.) А также в ранее упомянутых докладах в связке с результатами по оценке скорости сходимости:

37. Орлов А.И. Переход от сумм к интегралам и его применения в изучении асимптотических распределений статистик. - Журнал "Теория вероятностей и ее применения". 1973. Т. XVIII. No.4. С. 881-883.

39. Орлов А.И. Предельные теоремы для статистик интегрального типа. - В сб.: Тезисы докладов Международной конференции по теории вероятностей и математической статистике (Вильнюс, 25-30 июня 1973 г.). Т.2. - Вильнюс: Изд-во Вильнюсского госуниверситета, 1973. С.137-140.

50. Орлов А.И. Применение критериев типа омега-квадрат для проверки принадлежности функции распределения выборки некоторому семейству. - В сб.: Многомерный статистический анализ в социально-экономических исследованиях. - М.: Наука, 1974. С.401-403.

Окончательная формулировка была опубликована в "Докладах АН СССР" (статья представлена академиком Ю.В. Прохоровым):

46. Орлов А.И. Асимптотическое поведение статистик интегрального типа. - Журнал "Доклады АН СССР". 1974. Т.219. No.4. С. 808-811.

В этой неоднократно переписанной статье я достиг предела по количеству информации на один печатный знак. Думаю, что в результате она оказалась никому не понятной. Приведенными в ней теоремами о необходимых и достаточных условиях я горжусь и сейчас. Необходимые условия показывают, что достаточные условия не могут быть усилены.

Через 15 лет я вернулся к этой тематике, рассмотрев постановки в естественной общности - вместо интегрирования по конечномерному пространству брались интегралы по пространству общей природы:

250. Орлов А.И. Асимптотическое поведение статистик интегрального типа. - В сб.: Вероятностные процессы и их приложения. Межвузовский сборник научных трудов. - М.: МИЭМ, 1989. С.118-123.

Формулировки стали более естественными. Отметим, что цикл полученных теорем полностью заменяет известный "принцип инвариантности" применительно к непараметрическим статистикам типа Колмогорова - Смирнова и омега-квадрат. Другими словами, асимптотическое поведение классических и новых непараметрических статистик можно получить на основе нашего метода приближения ступенчатыми функциями, не обращаясь к принципу инвариантности Прохорова - Скорохода.

Некоторые из теорем о необходимых и достаточных условий рассмотрены в монографиях:

131. Орлов А.И. Устойчивость в социально-экономических моделях (Серия "Проблемы советской экономики"). - М.: Наука, 1979.- 296 с.

611. Орлов А.И. Прикладная статистика. Учебник. - М.: Экзамен, 2006. - 672 с.

Речь идет, прежде всего, о необходимых и достаточных условиях "наследования сходимости", т.е. вывода сходимости значений функции из сходимости аргументов. Результаты о "наследовании сходимости" постоянно применяются в прикладной математической статистике, в отличие от других результатов предельной теории статистик интегрального типа, имеющих ограниченную применимость (к статистикам интегрального типа).

Однако доказательства полученных в предельной теории статистик интегрального типа так и не были опубликованы полностью, тем более в математических изданиях. Предельная теория статистик интегрального типа, в том числе цикл теорем о необходимых и достаточных условиях, заслуживает подробной публикации.

3. О теоретических результатах в прикладной статистике

Интересные с математической точки зрения результаты получены в ряде областей прикладной статистики, прежде всего в статистике объектов нечисловой природы и особенно в ее центральной части - в статистике в пространствах произвольной природы. Так, при изучении асимптотического поведения решений экстремальных статистических задач и непараметрических оценок плотности вероятности использовался аппарат общей топологии.

Были и иные интересные постановки. В теории люсианов и в статистическом контроле применялись несмещенные оценки (в асимптотике растущей размерности). В асимптотике квантования и при моделировании систем управления запасами рассматривались суммы случайного числа случайных слагаемых. И т.д., и т.п.

Поскольку эти исследования были стимулированы потребностями прикладных областей и получали непосредственные практические применения, мы рассматриваем их в комментариях к соответствующим разделам, а не здесь.

Прикладная математическая статистика

В данной главе рассмотрены классические области прикладной математической статистики - статистика случайных величин, многомерный статистический анализ, временные ряды. Новым областям - статистике объектов нечисловой природы и статистике интервальных данных - посвящены дальнейшие разделы.

1. Непараметрическая статистика случайных величин

1.1. Проверка симметрии распределения относительно 0

1.2. Проверка однородности двух независимых выборок

1.3. Применение фундаментальных результатов статистики объектов нечисловой природы

1.4. Непараметрическое оценивании характеристик

2. Параметрическая теория оценивания и проверки гипотез

3. Многомерный статистический анализ

3.1. Регрессионный анализ и смежные вопросы

3.2. Методы классификации

3.3. Индекс инфляция и оценивание уровня жизни

4. Анализ временных рядов

5. Разбор типовых ошибок

6. О нерешенных задачах прикладной математической статистики

7. Преподавание статистики и эконометрики

1. Непараметрическая статистика случайных величин

Под непараметрической статистикой понимаем совокупность постановок и методов решения задач оценивания и проверки гипотез, в которых хотя бы одна случайная величина имеет распределение, которое не обязательно входит в то или иное параметрическое семейство. Соответственно в задачах параметрической статистики все распределения входят в заданное параметрическое семейство (как правило, с числом параметров от 1 до 4).

Таким образом, к непараметрической статистике относятся задачи, связанные со статистиками, свободными от распределения, задачи оценивания характеристик (например, математического ожидания или дисперсии), плотности, регрессионной зависимости, задачи построения (линейных и нелинейных) правил классификации, проверки гипотез относительно характеристик (например, проверка совпадения математических ожиданий) и т.д., и т.п. Задачи непараметрической статистики гораздо более разнообразны, чем задачи параметрической статистики. Мне приходилось заниматься и теми, и другими.

1.1. Проверка симметрии распределения относительно 0

Первая моя доведенная до публикации научная работа, в которой были получены существенные результаты, - это курсовая работа на 4-м году обучения на механико-математическом факультете МГУ им. М.В. Ломоносова, выполненная под руководством Ю.Н. Тюрина. Он предложил построить статистику типа омега-квадрат для проверки симметрии распределения относительно 0, что и было сделано. Мною был введен класс статистик интегрального типа, изучено их асимптотическое поведение, для чего понадобилось разработать новый метод приближения ступенчатыми функциями. Было найдено выражение для предельного распределения, на основе которого Г.В. Мартынов рассчитал таблицу предельного распределения. Текст переписывался 10 раз. На одном из промежуточных этапов Л.Н. Большев отредактировал статью. И вот появилась моя первая подробная научная публикация (ранее были тезисы по другой тематике):

25. Орлов А.И. О проверке симметрии распределения. - Журнал "Теория вероятностей и ее применения". 1972. Т.17. No.2. С.372-377.

Более чем через тридцать лет я доработал эту статью, выделив конкретную статистику для проверки симметрии распределения относительно 0 и связав эту задачу с проверкой однородности связанных выборок:

581. Орлов А.И. Методы проверки однородности связанных выборок. - Журнал "Заводская лаборатория". 2004. Т.70. No.7. С.57-61.

Этот материал вошел в учебники:

525. Орлов А.И. Эконометрика. Учебник для вузов. - М.: Изд-во "Экзамен", 2002, 2003, 2004. - 576 с.

611. Орлов А.И. Прикладная статистика. Учебник. - М.: Экзамен, 2006. - 672 с.

Любопытно, что в учебнике "Эконометрика" мой научный результат появился на 2 года раньше (в 2002 г.), чем в журнале "Заводская лаборатория", хотя статья сначала была представлена в журнал, а потом включена в рукопись учебника. Таковы были темпы публикации в то время - 3 года от передачи рукописи в журнал до выхода в свет.

1.2. Проверка однородности двух независимых выборок

Двухвыборочная статистика Смирнова предназначена для проверки однородности двух независимых выборок. Если объемы выборок совпадают, то, как показали Б.В. Гнеденко и В.С. Королюк, распределение этой статистики выражается через биномиальные коэффициенты, чем я и воспользовался.

Моя кандидатская диссертация была посвящена оценке скорости сходимости распределений статистик интегрального и супремумного типов (см. раздел "Теоретическая математическая статистика"). Асимптотические разложения и продвинутые варианты разработанного мной в ходе диссертационного исследования класса формул типа Эйлера - Маклорена были применены для изучения распределения двухвыборочной статистики Смирнова:

70. Орлов А.И. Оценка остаточного члена для функции распределения двухвыборочной статистики Смирнова. - В сб.: Алгоритмы многомерного статистического анализа и их применения. - М.: Изд-во ЦЭМИ АН СССР, 1975. С.105-108.

117. Орлов А.И., Орловский И.В. Равномерная оценка остаточного члена в асимптотическом разложении двухвыборочной статистики Смирнова. - В сб.: Прикладной многомерный статистический анализ. Ученые записки по статистике, т.33. - М.: Наука, 1978. С.312-313.

124. Орлов А.И., Орловский И.В. Оценка остаточного члена порядка n**(-2) для функции распределения двухвыборочной статистики Смирнова. - В сб.: Статистические методы оценивания и проверки гипотез. Межвузовский сборник научных трудов. - Пермь: Изд-во Пермского государственного университета, 1978, с.100-109.

125. Орлов А.И., Орловский И.В. Равномерная оценка остаточного члена порядка n**(-2) в асимптотическом разложении функции распределения двухвыборочной статистики Смирнова. - Журнал "Теория вероятностей и ее применения". 1978. Т. XXIII. No.2. С. 461-462.

К сожалению, равномерная оценка остаточного члена порядка (объем выборки в степени (-2)) в асимптотическом разложении функции распределения двухвыборочной статистики Смирнова (в случае выборок равного объема) оказалась мало полезной для практики, поскольку сильно завышала отклонения для отдельных значений аргумента. Однако эти оценки имеет методологическое значение. В моих учебниках последних лет эти результаты обсуждаются в разделах, посвященных устойчивости к изменению объема выборки и вопросам перехода от распределений конечных выборок к асимптотическим результатам.

Принципиально важной была работа по созданию таблиц критических точек двухвыборочного критерия Смирнова:

212. Орлов А.И., Миронова Н.Г., Фомин В.Н., Черномордик О.М. Методика. Проверка однородности двух выборок параметров продукции при оценке ее технического уровня и качества. - М.: ВНИИСтандартизации, 1987. - 116 с.

Это - вторая редакция документа. Враги науки сорвали выпуск заключительной редакции таблиц в Издательстве стандартов, а выпускать их во ВНИИС малым тиражом я так и не собрался, поскольку вторая реакция мало отличалась от итогового варианта, а сам я уже переключился на "Проект СТАТПРОМ" (см. ниже). Целесообразно издать окончательный вариант методики.

Основной теоретический раздел в этой книге (методике 212) - обоснование выбора критерия проверки однородности двух выборок на основе изучения свойств различных критериев однородности двух независимых выборок. Этой тематике был посвящен ряд описанных ниже статей.

На использовании метода Монте-Карло основана статья, связанная с изучением и сравнением свойств различных критериев однородности двух независимых выборок:

204. Камень Ю.Э., Камень Я.Э., Орлов А.И. Реальные и номинальные уровни значимости в задачах проверки статистических гипотез. - Журнал "Заводская лаборатория". 1986. Т.52. No.12. С.55-57.

В этой статье продемонстрирована необходимость учета отличия, вызванного дискретностью распределения непараметрического критерия, реального уровня значимости статистического критерия от номинального (заданного).

Основные результаты, связанные с изучением критериев однородности двух независимых выборок, получены в статье:

213. Орлов А.И. О применении статистических методов в медико-биологических исследованиях. - Журнал "Вестник Академии медицинских наук СССР". 1987. No.2. С.88-94.

Показано, что вместо критерия Стьюдента надо применять критерий, который я назвал "критерий Крамера - Уэлча".

Новый вариант этой статьи (No.213), без привязки к медико-биологическим исследованиям и медицинских примеров, напечатан через 16 лет:

539. Орлов А.И. О проверке однородности двух независимых выборок. - Журнал "Заводская лаборатория". 2003. Т.69. No.1. С.55-60.

Важна статья:

430. Орлов А.И. Какие гипотезы можно проверять с помощью двухвыборочного критерия Вилкоксона? - Журнал "Заводская лаборатория". 1999. Т.65. No.1. С.51-55.

Эти две статьи вошли в учебники "Эконометрика" и "Прикладная статистика". См. также промежуточные публикации:

221. Орлов А.И., Камень Я.Э., Камень Ю.Э., Фомин В.Н. Сравнение критериев однородности двух выборок методом статистических испытаний. - В сб.: Тезисы докладов III Всесоюзной школы-семинара "Программно-алгоритмическое обеспечение прикладного многомерного статистического анализа". - М.: ЦЭМИ АН СССР, 1987. С. 200-201.

240. Орлов А.И., Фомин В.Н. Применение статистических методов при анализе технического уровня и качества продукции. - Журнал "Надежность и контроль качества". 1988. No.12. С.3-9.

251. Орлов А.И., Фомин В.Н. Проверка однородности двух выборок: система вероятностных моделей. - В сб.: Стандартизация контроля качества и надежности промышленной продукции. Тезисы докладов научно-технической конференции (Горький, май 1989). - Горький: Горьковский филиал ВНИИНМАШ, 1989. С.58-59.

До сих пор не доведен до публикации обширный материал, посвященный изучению свойств критериев однородности двух независимых выборок методом Монте-Карло. Он был включен в базовый документ:

261. Аванпроект СТАТПРОМ (аванпроект комплекса методических документов и пакетов программ по статистическим методам стандартизации и управления качеством) / Орлов А.И., Адлер Ю.П., Благовещенский Ю.Н. и еще 24 соавтора. (Рукопись.) - М.: Советско-франко-итальянское предприятие ИНТЕРКВАДРО, 1989 (по х/д с ВНИИС). - 1517 стр.

Поскольку тематика остается актуальной, целесообразно довести полученные результаты до читателей.

Проблематика построения статистических таблиц, в частности, сопряжения рекомендаций для конечных объемов выборок с асимптотическими рекомендациями, рассмотрена в статье:

403. Орлов А.И. Методы оценки близости допредельных и предельных распределений статистик. - Журнал "Заводская лаборатория". 1998. Т.64. No.5. С. 64-67.

"Инженерные решения" в этой области были реализованы при подготовке упомянутой выше методики:

212. Орлов А.И., Миронова Н.Г., Фомин В.Н., Черномордик О.М. Методика. Проверка однородности двух выборок параметров продукции при оценке ее технического уровня и качества. - М.: ВНИИСтандартизации, 1987. - 116 с.

Развернутое изложение методов проверки однородности двух независимых выборок, включающее описанные ранее результаты, содержится в учебнике:

691. Орлов А.И. Эконометрика. Изд. 4-е, доп. и перераб. Учебник для вузов. Гриф УМО. - Ростов-на-Дону: Феникс, 2009. - 572 с.

Крайняя публикация:

790. Орлов А.И. Состоятельные критерии проверки абсолютной однородности независимых выборок. - Журнал "Заводская лаборатория. Диагностика материалов". 2012. Т.78. No.11. С.66-70.

1.3. Применение фундаментальных результатов статистики объектов нечисловой природы

Основные теоретические результаты статистики объектов нечисловой природы содержатся в работах:

165. Орлов А.И. Асимптотика решений экстремальных статистических задач. - В сб.: Анализ нечисловых данных в системных исследованиях. Сборник трудов. Вып.10. - М.: Всесоюзный научно-исследовательский институт системных исследований, 1982. С. 4-12.

171. Орлов А.И. Непараметрические оценки плотности в топологических пространствах. - В сб.: Прикладная статистика. Ученые записки по статистике, т.45. - М.: Наука, 1983. С. 12-40.

Эти работы несут в себе большие потенциальные возможности применения в классических областях прикладной математической статистики. Речь идет прежде всего о непараметрических постановках, хотя в ряде случаев фундаментальные результаты статистики объектов нечисловой природы позволяют получить полезные следствия и в задачах параметрической статистики.

Так, первая из них позволяет единообразным образом изучить поведение оценок минимального контраста, максимального правдоподобия, робастных оценок различных видов. В работе:

614. Орлов А.И. Методы снижения размерности. - Приложение 1 к книге: Толстова Ю.Н. Основы многомерного шкалирования: Учебное пособие для вузов. - М.: Издательство КДУ, 2006. - 160 с.

эти результаты применяются для изучения асимптотики матрицы коэффициентов в методе главных компонент и для оценки размерности данных в задачах многомерного шкалирования.

Вторая из названных статей (No.171) предлагает, в частности, новые виды непараметрических оценок многомерных плотностей распределения вероятностей и устанавливает их свойства. Эти оценки используют в постановках непараметрической регрессии и в задачах классификации (как в дискриминантном анализе, так и в кластерном).

Об этой тематике см. ниже, а также раздел "Статистика объектов нечисловой природы".

1.4. Непараметрическое оценивании характеристик

По заказу ВНИИ резиновой промышленности (позже ВНИИ эластомерных материалов и изделий) был разработан метод непараметрической интервальной оценки коэффициента вариации:

215. Орлов А.И., Друянова Г.Б. Непараметрическое оценивание коэффициентов вариации технических характеристик и показателей качества. - Журнал "Надежность и контроль качества". 1987. No.7. С.10-16.

248. Орлов А.И. Комментарий к заметке Ф.В. и В.Ф. Залесских "Об относительных ошибках двух или нескольких выборочных средних". - Журнал "Заводская лаборатория". 1989. Т.55. No.3. С.101-102.

Дальнейшее развитие методов непараметрического оценивания характеристик распределения осуществлено позже:

576. Орлов А.И. Непараметрическое точечное и интервальное оценивание характеристик распределения. - Журнал "Заводская лаборатория". 2004. Т.70. No.5. С.65-70.

Эти методы включены в учебники по эконометрике и прикладной статистике.

Опубликован ряд статей общего типа, в которых обсуждается, в частности, предпочтительность непараметрических статистических методов перед параметрическими:

289. Орлов А.И. Пути развития статистических методов: непараметрика, робастность, бутстреп и реалистическая статистика. - Журнал "Надежность и контроль качества". 1991. No.8. С.3-8.

402. Орлов А.И. Современная прикладная статистика. - Журнал "Заводская лаборатория". 1998. Т.64. No.3. С. 52-60.

492. Орлов А.И. Прикладная статистика XXI в. - Журнал "Экономика XXI века", 2000, No.9, с.3-27.

2. Параметрическая теория оценивания и проверки гипотез

Методы оценивания параметров трехпараметрического гамма-распределения были разработаны в процессе подготовки нормативно-технического документа:

177. Орлов А.И., Миронова Н.Г., Бендерский А.М., Богатырев А.А., Филиппов Ю.Д., Фомина Л.А., Невельсон М.Б. ГОСТ 11.011-83. Прикладная статистика. Правила определения оценок и доверительных границ для параметров гамма-распределения. - М.: Изд-во стандартов, 1984. - 53 с. - Переиздание: М.: Изд-во стандартов, 1985. - 50 с.

Я разработал методы точечного и интервального оценивания и написал весь текст. Н.Г. Миронова просчитала примеры. Д.т.н. М.Б. Невельсон подготовил исходный обзор, посвященный оценкам максимального правдоподобия, который позже не понадобился. Остальные лица, указанные в качестве разработчиков, не внесли какого-либо творческого вклада в создание этой небольшой монографии. Бендерский А.М. и Богатырев А.А. были приписаны как вышестоящие администраторы, а Филиппов Ю.Д. и Фомина Л.А. - просто для поддержания имиджа сотрудников того сектора ВНИИ стандартизации Госстандарта СССР, где я тогда работал. Кто-то тогда удивлялся, что Бендерский А.М. не поставил свою фамилию первой. Это говорит как о нравах ВНИИС, так и о том, что в этом гадюшнике Бендерский А.М. был не самым худшим экземпляром.

Несмотря на свой формальный статус, фактически ГОСТ 11.011-83 был и остается научной монографии, в которую был включен целый спектр новых разработок. Прежде всего надо отметить создание основных идей статистики интервальных данных, позволивших разработать оригинальный подход к выбору метода оценивания (см. об этом в разделе "Статистика интервальных данных").

Были получены новые результаты относительно класса оценок параметров распределения, названных нами одношаговыми оценками. Они были предложены вместо оценок максимального правдоподобия, для нахождения которых требовалось численно решать систему уравнений максимального правдоподобия, а пригодные для стандартизации научно-обоснованные методы решения этой системы отсутствовали (и отсутствуют до сих пор).

Можно отметить также разработку оригинальных таблиц и асимптотических формул, применяемых вне границ этих таблиц.

Было бы целесообразно издать на основе ГОСТ 11.011-83 и дальнейших публикаций самостоятельную монографию, посвященную оцениванию параметров и проверке гипотез для гамма-распределения.

Разработанный в ГОСТ 11.011-83 метод одношаговых оценок (вместе с новыми научными результатами относительно асимптотического поведения этих оценок) был представлен научной общественности в докладе:

178. Орлов А.И. Одношаговые оценки параметров распределений вероятностей. - В сб.: Тезисы докладов Всесоюзной научно-технической конференции "Применение статистических методов в производстве и управлении" (Пермь, 31 мая - 2 июня 1984 г.). - Пермь: Изд-во ВСНТО, 1984. С.90-92.

Основные идеи метода одношаговых оценок изложены в статье:

197. Орлов А.И. О нецелесообразности использования итеративных процедур нахождения оценок максимального правдоподобия. - Журнал "Заводская лаборатория". 1986. No.5. С.67-69.

Основным идеям статистики интервальных данных применительно к оцениванию параметров гамма-распределения посвящена первая чисто научная публикация по статистике интервальных данных:

237. Орлов А.И. О влиянии погрешностей наблюдений на свойства статистических процедур (на примере гамма-распределения). - В сб.: Статистические методы оценивания и проверки гипотез. Межвузовский сборник научных трудов. Пермь: Изд-во Пермского государственного университета, 1988, с.45-55.

Дальнейшее развитие работ по статистике интервальных данных описано в разделе "Статистика интервальных данных".

Применительно именно к гамма-распределению метод одношаговых оценок разобран в статье:

238. Орлов А.И., Миронова Н.Г. Одношаговые оценки для параметров гамма-распределения. - Журнал "Надежность и контроль качества". 1988. No.9. С.18-22.

Цикл работ по оцениванию параметров гамма-распределения завершен статьей:

383. Орлов А.И. Об оценивании параметров гамма-распределения. - Журнал "Обозрение прикладной и промышленной математики". 1997. Т.4. Вып.3. С.471-482.

В настоящее время эти научные результаты включаем в учебную литературу, например:

611. Орлов А.И. Прикладная статистика. Учебник. - М.: Экзамен, 2006. - 672 с.

В связи с распространенными утверждениями о меньшей трудоемкости графических методов оценки параметров вероятностных распределений по сравнению с аналитическими методами было проведено сравнение этих двух групп методов:

203. Орлов А.И. Области применимости государственных стандартов по аналитическим и графическим методам оценки параметров вероятностных распределений. - Журнал "Надежность и контроль качества". 1986. No.11: С.29-34.

Группой пермских математиков в сотрудничестве с нами был разработан проект ГОСТ по оценке параметров гипергеометрического и отрицательного гипергеометрического распределений:

206. Орлов А.И., Миронова Н.Г., Лумельский Я.П., Бобров Н.Е., Чичагов В.В., Гусев А.Л. Разработать ГОСТ "Статистический контроль качества продукции. Правила определения оценок и доверительных границ для параметров гипергеометрического и отрицательного гипергеометрического распределений". Научно-технический отчет ВНИИС по теме No.1.2.4.17.84, арх. No.2656 (рукопись). - М.: ВНИИС, 1986. - 13 стр.

Проект был утвержден в качестве государственного стандарта и передан для издания. Однако набор был рассыпан из-за отмены системы государственных стандартов по прикладной статистике. В этой вредительской акции виновны А.М. Бендерский и А.А. Богатырев. Целесообразно опубликовать эту работу, выполненную на высоком научном уровне.

Общая формулировка метода моментов проверки гипотезы согласия эмпирического распределения с заданным параметрическим семейством предложена и изучена в статье:

249. Орлов А.И. Метод моментов проверки согласия с параметрическим семейством распределений. - Журнал "Заводская лаборатория". 1989. Т.55. No.10. С.90-93.

Метод был применен для проверки согласия с гамма-распределением.

Классические методы отбраковки выбросов (резко выделяющихся наблюдений) исходят из предположений о принадлежности распределений элементов выборки к тем или иным параметрическим семействам. Отсутствие научного обоснования таких методов вытекает из их крайней неустойчивости по отношению к малым отклонениям функции распределения элементов выборки от распределения из параметрического семейства:

307. Орлов А.И. Неустойчивость параметрических методов отбраковки резко выделяющихся наблюдений. - Журнал "Заводская лаборатория". 1992. Т.58. No.7. С.40-42.

3. Многомерный статистический анализ

В многомерном статистическом анализе элемент выборки - вектор. Выделяют регрессионный анализ (методы восстановления зависимости), теорию классификации (дискриминантный анализ и кластер-анализ), методы снижения размерности (в том числе метод главных компонент и методы снижения размерности). Особняком стоит теория индексов. Однако перечисленные области, как показано ниже, переплетаются. Например, проблема оценки размерности модели и информативного подмножества признаков актуальна для каждой из трех выделенных областей. Большинство задач прикладной статистики допускают оптимизационную постановку, а потому предельное поведение оценок параметров таких задач может быть установлено с помощью общих результатов об асимптотическом поведении решений экстремальных статистических задач. Поэтому внутреннее деление в данном подразделе условно.

3.1. Регрессионный анализ и смежные вопросы

В задачах регрессионного или дискриминантного анализа активно продолжает исследоваться проблема оценивания по статистическим данным такого объекта нечисловой природы, как информативное подмножество признаков. Часто его находят в результате решения соответствующей оптимизационной задачи, и поведение оценок информативного подмножества признаков может быть установлено с помощью результатов, полученных в моей работе об асимптотическом поведении решений экстремальных статистических задач:

165. Орлов А.И. Асимптотика решений экстремальных статистических задач. - В сб.: Анализ нечисловых данных в системных исследованиях. Сборник трудов. Вып.10. - М.: Всесоюзный научно-исследовательский институт системных исследований, 1982. С. 4-12.

Если возможные подмножества признаков образуют расширяющееся семейство, например, оценивается степень полинома, то естественно ввести термин "размерность модели" (используется также в многомерном шкалировании). Нам принадлежит ряд работ по оцениванию размерности модели.

Первая такая работа была выполнена мною во время командировки во Францию в 1976 г. В ней была изучена одна оценка размерности модели в регрессии, например, степени полинома в предположении, что зависимость описывается полиномом. Эта оценка была известна в литературе, но позже ее стали ошибочно приписывать мне, в то время как я лишь изучил ее свойства, в частности, установил, что она не является состоятельной, и нашел ее предельное геометрическое распределение:

122. Орлов А.И. Предельное распределение одной оценки числа базисных функций в регрессии. - В сб.: Прикладной многомерный статистический анализ. Ученые записки по статистике, т.33. - М.: Наука, 1978. С.380-381.

Другие, уже состоятельные оценки размерности регрессионной модели были предложены и изучены в статье:

144. Орлов А.И. Оценка размерности модели в регрессии. - В сб.: Алгоритмическое и программное обеспечение прикладного статистического анализа. Ученые записки по статистике, т.36. - М.: Наука, 1980. С.92-99.

Этот цикл завершила содержащая ряд уточнений работа:

173. Орлов А.И. Асимптотика некоторых оценок размерности модели в регрессии. - В сб.: Прикладная статистика. Ученые записки по статистике, т.45. - М.: Наука, 1983. С.260-265.

Крайняя публикация на эту тему включает в себя обсуждение результатов изучения скорости сходимости в полученных мною предельных теоремах методом Монте-Карло:

326. Орлов А.И. Об оценивании регрессионного полинома. - Журнал "Заводская лаборатория", 1994. Т.60. No.5. С.43-47.

Аналогичные по методологии оценки размерности модели в задаче расщепления смесей (часть теории классификации) рассмотрены в статье:

172. Орлов А.И. Некоторые вероятностные вопросы теории классификации. - В сб.: Прикладная статистика. Ученые записки по статистике, т.45. - М.: Наука, 1983. С.166-179.

Оценки размерности модели в многомерном шкалировании изучаются в работах:

187. Орлов А.И. Общий взгляд на статистику объектов нечисловой природы. - В сб.: Анализ нечисловой информации в социологических исследованиях. - М.: Наука, 1985. С.58-92.

316. Orlov A.I. On the Development of the Statistics of Nonnumerical Objects. - В сб.: Design of Experiments and Data Analysis: New Trends and Results. - M.: ANTAL, 1993. Р.52-90.

614. Орлов А.И. Методы снижения размерности. - Приложение 1 к книге: Толстова Ю.Н. Основы многомерного шкалирования: Учебное пособие для вузов. - М.: Издательство КДУ, 2006. - 160 с.

В этих же работах установлено предельное поведение характеристик метода главных компонент (с помощью асимптотической теории поведения решений экстремальных статистических задач).

С позиций статистики объектов нечисловой природы рассматривались классические постановки в работе:

214. Орлов А.И. Некоторые неклассические постановки в регрессионном анализе и теории классификации. - В сб.: Программно-алгоритмическое обеспечение анализа данных в медико-биологических исследованиях. - М.: Наука, 1987. С.27-40.

В частности, установлена возможность рассмотрения в рамках одной схемы регрессионного и дискриминантного анализа. Поставлены и изучены задачи параметрической аппроксимации и непараметрической регрессии (на основе применения непараметрических оценок совместной плотности) в пространствах общей природы.

На основе асимптотической теории поведения решений экстремальных статистических задач рассмотрены методы оценивания объектов нечисловой природы - наиболее информативных множеств признаков в регрессионном анализе:

337. Орлов А.И. Методы поиска наиболее информативных множеств признаков в регрессионном анализе. - Журнал "Заводская лаборатория". 1995. Т.61. No.1. С.56-58.

В этой статье с общих позиций рассматриваются проблемы, возникшие в связи с исследованиями, опубликованными на соседних страницах журнала.

Методы непараметрического интервального оценивания точки пересечения двух регрессионных прямых развиты в докладе:

222. Орлов А.И., Медведев В.Н. Программно-алгоритмическое обеспечение статистических методов в САПР стандартов. - В сб.: Тезисы докладов III Всесоюзной школы-семинара "Программно-алгоритмическое обеспечение прикладного многомерного статистического анализа". - М.: ЦЭМИ АН СССР, 1987. С. 313-315.

Эти работы были продолжены совместно с В.С. Муравьевой:

634. Муравьева В.С., Орлов А.И. Непараметрическое прогнозирование момента встречи. - Стратегическое планирование и развитие предприятий. Секция 2 / Материалы Восьмого всероссийского симпозиума. Москва, 10-11 апреля 2007 г. Под ред. чл.-корр. РАН Г.Б. Клейнера. - М.: ЦЭМИ РАН, 2007. - С.147-149.

653. Муравьева В.С., Орлов А.И. Непараметрическое оценивание точки пересечения регрессионных прямых. - Журнал "Заводская лаборатория". 2008. Т.74. No.1. С.63-68.

Итоги подведены в кандидатской диссертации В.С. Муравьевой (2011).

С позиций статистики интервальных данных линейная парная регрессия рассмотрена в диссертации Е.А. Гуськовой и в статье:

592. Гуськова Е.А., Орлов А.И. Интервальная линейная парная регрессия (обобщающая статья). - Журнал "Заводская лаборатория". 2005. Т.71. No.3. С.57-63.

В 2007-2013 гг. опубликованы работы по статистическим методам прогнозирования:

635. Муравьева В.С., Орлов А.И. Организационно-экономические проблемы прогнозирования на промышленном предприятии/ Управление большими системами. Выпуск 17. М.: ИПУ РАН, 2007. С.143-158.

640. Орлов А.И. Статистические методы прогнозирования. - В кн.: Малая российская энциклопедия прогностики. - М.: Институт экономических стратегий, 2007. - С.148-153.

729. Новиков Д.А., Орлов А.И., Баландина Т.А. Прикладные математические модели и методы: задача прогнозирования цены на лом черных металлов. - Журнал "Заводская лаборатория". 2011. Т.77. No.4. С.3-3.

(по тематике крайней из указанных работ защищена диссертация Е.М. Крюковой (2011).

Разработаны непараметрическое методы оценивания периодической (сезонной) составляющей в парной регрессии:

678. Орлов А.И. Непараметрический метод наименьших квадратов: учет сезонности. - В сб.: Статистические методы оценивания и проверки гипотез: межвуз. сб. науч. тр. Вып.21. - Пермь: Перм. ун-т, 2008. - С.135-148.

718. Орлов А.И. Непараметрический метод наименьших квадратов с периодической составляющей: условия применимости. В сб.: Статистические методы оценивания и проверки гипотез: межвуз. сб. науч. тр. Вып. 22. - Пермь: Перм. ун-т, 2010. - С.96-108.

Полученные результаты включены в учебник:

691. Орлов А.И. Эконометрика. Изд. 4-е, доп. и перераб. Учебник для вузов. Гриф УМО. - Ростов-на-Дону: Феникс, 2009. - 572 с.

Итоговая статья, в которой в дополнение к прежним публикациям рассмотрены методы интервального прогноза индивидуальных значений (а не только значения восстанавливаемой функции):

833. Орлов А.И. Восстановление зависимости методом наименьших квадратов на основе непараметрической модели с периодической составляющей / А.И. Орлов // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2013. - No.07(091). С. 189 - 218. - IDA [article ID]: 0911307013. - Режим доступа: http://ej.kubagro.ru/2013/07/pdf/13.pdf, 1,875 у.п.л., импакт-фактор РИНЦ=0,266.

3.2. Методы классификации

Многие мои работы по теории классификации следует отнести к статистике объектов нечисловой природы, поскольку они исходят из мер различия (расстояний, мер близости) классифицируемых объектов, а не из их представлений в виде точек конечномерных линейных пространств.

Первая работа по классификации была посвящена обработке социально-психологических данных, полученных в результате опроса учащихся ВМШ при Московском математическом обществе (см. раздел "Внеклассная работа"), поэтому имела значение прежде всего в рамках теории обучения:

98. Орлов А.И., Гусейнов Г.А. Математические методы в изучении способных к математике школьников. - В сб.: Исследования по вероятностно-статистическому моделированию реальных систем. - М.: Изд-во ЦЭМИ АН СССР, 1977. С.80-93.

Следующая публикация посвящена проблеме остановки алгоритмов - доказательству того, что итерации эталонных алгоритмов (типа "Форель" и метода k-средних) прекращаются через конечное число шагов (оцененное сверху в этой работе):

120. Орлов А.И. Сходимость эталонных алгоритмов. - В сб.: Прикладной многомерный статистический анализ. Ученые записки по статистике, т.33. - М.: Наука, 1978. С.361-364.

Обобщение было получено в докладе 25 октября 1978 г. на семинаре "Многомерный статистический анализ и вероятностное моделирование реальных процессов:

146. Орлов А.И. Остановка после конечного числа шагов для алгоритмов кластер-анализа. - В сб.: Алгоритмическое и программное обеспечение прикладного статистического анализа. Ученые записки по статистике, т.36. - М.: Наука, 1980. С.374-377.

Итоги многолетних работ по различным вопросам теории классификации подведены в работе:

172. Орлов А.И. Некоторые вероятностные вопросы теории классификации. - В сб.: Прикладная статистика. Ученые записки по статистике, т.45. - М.: Наука, 1983. С.166-179.

Задачи классификации в пространствах произвольной природы фундаментальным образом проанализированы как в этой статье, так и в докладе:

273. Орлов А.И. Классификация объектов нечисловой природы. - В сб.: Теория и практика классификации и систематики в народном хозяйстве. Тезисы докладов Всесоюзного научно-технического симпозиума с международным участием (Пущино, 17-19 декабря 1990 г.). - М.: ВИНИТИ, 1990. С.93-94.

Различным вопросам классификации, прежде всего в пространствах произвольной природы, посвящены работы:

198. Орлов А.И. Математические методы классификации, статистика объектов нечисловой природы и медико-биологические исследования. - В сб.: Доклады Московского Общества испытателей природы 1984 г. Общая биология. Цитогенетический и математический подходы к изучению биосистем. - М.: Наука, 1986. С.145-150.

199. Орлов А.И. Границы применимости вероятностных моделей в задачах классификации. - В сб.: Доклады Московского Общества испытателей природы 1984 г. Общая биология. Цитогенетический и математический подходы к изучению биосистем. - М.: Наука, 1986. С.179-182.

218. Орлов А.И. Некоторые вероятностные вопросы кластер-анализа. - В сб.: Доклады Московского Общества испытателей природы 1985 г. Общая биология: Новые данные исследований структуры и функций биологических систем. - М.: Наука, 1987. С.53-56.

219. Орлов А.И. О сравнении алгоритмов классификации по результатам обработки реальных данных. - В сб.: Доклады Московского Общества испытателей природы 1985 г. Общая биология: Новые данные исследований структуры и функций биологических систем. - М.: Наука, 1987. С.79-82.

254. Орлов А.И. Распределение показателя Мешалкина качества алгоритма классифицирования и метод проверки его применимости. - В сб.: IV Всесоюзная научно-техническая конференция "Применение многомерного статистического анализа в экономике и оценке качества продукции " (г. Тарту, 5-7 сентября 1989 г.). Тезисы докладов. - Тарту: Изд-во Тартуского гос. Ун-та, 1989. С.133-134.

В двух последних работах введен и изучен показатель качества алгоритма классификации, основанный на оценке аналога расстояния Махаланобиса между классами:

169. Орлов А.И. Махаланобиса расстояние. - В кн.: Математическая энциклопедия. Т.3. - М.: Советская энциклопедия, 1982. С.626.

В 1978-80 гг. мы обсуждали целесообразность введения такого показателя с Л.Д. Мешалкиным - отсюда его название в работе No.254. Однако Л.Д. Мешалкин (1934-2000) никогда не писал об этом показателе, поэтому редакторы моих дальнейших публикаций вычеркивали ссылки на эту беседу. Тем не менее я считаю нужным отметить, что основная идея и выражение для этого показателя принадлежит нам обоим, в то время как за результаты его изучения (теоремы) и рекомендации по применению несу ответственность именно я.

Основные мои результаты по теории классификации отражены в обширных статьях:

287. Орлов А.И. Классификация объектов нечисловой природы на основе непараметрических оценок плотности. - В сб.: Проблемы компьютерного анализа данных и моделирования: Сборник научных статей. - Минск: Изд-во Белорусского государственного университета, 1991. С.141-148.

292. Орлов А.И. Заметки по теории классификации. - Журнал "Социология: методология, методы, математические модели". 1991.No.2. С.28-50.

544. Орлов А.И. Математические методы исследования и диагностика материалов (Обобщающая статья). - Журнал "Заводская лаборатория". 2003. Т.69. No.3. С.53-64.

Надо еще раз подчеркнуть, что все методы классификации, основанные на использовании расстояний (мер различия или близости), естественно рассматривать как часть статистики объектов нечисловой природы.

В 2007-2013 гг. теория классификации был посвящен ряд докладов и статей:

644. Орлов А.И. Бинарные рейтинги и их сравнение. - В сб.: Теория активных систем / Труды международной научно-практической конференции (14-15 ноября 2007 г., Москва, Россия). Общая редакция - В.Н. Бурков, Д.А. Новиков. - М.: ИПУ РАН, 2007. - С.186-190.

688. Орлов А.И. О развитии математических методов теории классификации. - Журнал "Заводская лаборатория". 2009. Т.75. No.7. С.51-63.

725. Орлов А.И., Толчеев В.О. Об использовании непараметрических статистических критериев для оценки точности методов классификации (обобщающая статья). - Журнал "Заводская лаборатория". 2011. Т.77. No.3. С.58-66.

747. Орлов А.И. Прогностическая сила как показатель качества алгоритма диагностики. - В сб.: Статистические методы оценивания и проверки гипотез: межвуз. сб. науч. тр. Вып.23. - Пермь: Перм. гос. нац. иссл. ун-т, 2011. - С.104-116.

757. Новиков Д.А., Орлов А.И. Математические методы классификации. - Журнал "Заводская лаборатория. Диагностика материалов". 2012. Т.78. No.4. С.3-3.

795. Орлов А.И. Устойчивость классификации относительно выбора метода кластер-анализа. - Журнал "Заводская лаборатория. Диагностика материалов". 2013. Т.79. No.1. С.68-71.

В крайней статье 795 раскрывается и демонстрируется на примере идея, сформулированная в работе:

796. Орлов А.И. Устойчивость кластера - критерий его естественности // Математические методы изучения геологических явлений [Сб. ст.] Моск. об-во испытателей природы, Межсекц. семинар по применению математики в геологии; [Гл. ред. А. Л. Яншин]. - М.: Наука/МОИП, 1990. - С. 54-60.

О том, что статья 796 опубликована в 1990 г., я узнал только в 2013 г. благодаря Интернету.

*   *   *   *   *   *   *

На сайте "Высокие статистические технологии", расположенном по адресу http://orlovs.pp.ru, представлены:

На сайте есть форум, в котором вы можете задать вопросы профессору А.И.Орлову и получить на них ответ.

*   *   *   *   *   *   *

Удачи вам и счастья!


В избранное