Отправляет email-рассылки с помощью сервиса Sendsay

Эконометрика

  Все выпуски  

Эконометрика - выпуск 200


Информационный Канал Subscribe.Ru

Здравствуйте, уважаемые подписчики!

*   *   *   *   *   *   *

   Вы читаете юбилейный двухсотый выпуск рассылки "Эконометрика" от 22 ноября 2004 года.

   Когда чуть более четырех лет назад мы начинали рассылку, не было и мыслей о том, что эта идея получит столь долгую жизнь.

   Двести выпусков по примерно 50 тыс. знаков - это эконометрический архив объемом около 10 млн. знаков. В печатном виде он соответствует 10 книгам по 25 п.л. (по 400 стр. стандартного формата А5).

   Хотя формат рассылки не позволяет включать сложные формулы (с использованием редакторов формул), удалось найти подходящий по тематике материал на все 200 номеров. В частности, многие разделы помещенных на нашем новом сайте http://orlovs.pp.ru книг и статей были и ранее доступны в Интернете - через рассылку "Эконометрика".

   Отметим, что полные варианты эконометрических работ (со всеми формулами) помещены на указанном сайте. Новые работы будут со временем размещены там.

   Основная часть публикаций рассылки - наши работы (научно-исследовательские и связанные с преподаванием). Были включены статьи нескольких коллег, а также информационные сообщения о различных конференциях. Будем благодарны за присылаемые материалы и постараемся включить их в рассылку в кратчайшие сроки.

   В последнее время мы стали включать в рассылку подходящие по тематике перепечатки из различных изданий. Часто они дают хорошие иллюстрации к обсуждаемым проблемам.

   В настоящий юбилейный выпуск рассылки включены две последние статьи:

   1. Грядущая революция.

   2. Статистические методы в российской социологии (тридцать лет спустя).

   Все вышедшие выпуски Вы можете посмотреть в Архиве рассылки по адресу http://www.subscribe.ru/archive/science.humanity.econometrika.

*   *   *   *   *   *   *

Грядущая революция

(Основные идеи статьи опубликованы в статье:
Орлов А.И. Рыночного социализма нет.
- Газета "Правда", 2004, 20-21 июля, No.79 (28693).)

   О тяжелом положении России сказано достаточно. О виновниках - тоже. Основной вопрос, который надо обсуждать, ясен: "Что надо сделать для вывода России из кризиса?" Начнем с обсуждения неотложных мер.

Первоочередные задачи грядущей революции

   Как во время войны, государство должно взять под контроль основные отрасли народного хозяйства. Такая система известна как "мобилизационная экономика", и она должна сохраняться, по крайней мере, до восстановления прежнего положения России в мировой экономике. Т.е. до достижения той же доли в мировом хозяйстве, что была в 1985 г. Продолжительность восстановительного периода - несколько десятков лет (в оптимальном случае - 20 лет).

   Иначе - продолжение курса 1990-х годов, ведущее к гибели России.

   В течение этого переходного (восстановительного) периода государство должно установить монополию внешней торговли, продажи алкоголя, табака, драгоценных металлов, бензина, автомобилей, жилья, взять под контроль все крупные предприятия, оптовую торговлю, банки, средства воздушного и железнодорожного сообщения, связь, средства массовой информации (особенно электронные). Одновременно государство должно поддерживать малый бизнес, основанный на личном труде предпринимателей.

   Вначале взятые под контроль государства предприятия и организации остаются в собственности нынешних владельцев. Законность приобретения этой собственности проверяется правоохранительными органами. Если законность приобретения подтверждена, то после окончания восстановительного периода государство выкупает предприятие или возвращает его прежнему владельцу.

   В международный суд в Гааге выставляется иск к Международному валютному фонду, Мировому банку и аналогичным организациям о возмещении вреда, нанесенного России. До решения суда платежи прекращаются.

   Откуда взять кадры для осуществления перечисленных мер, учитывая известную всем коррумпированность госаппарата и правоохранительных органов? Очевидно, необходимо создать чрезвычайные комиссии (ЧК) из лиц, не затронутых коррупцией, например, военнослужащих отдаленных гарнизонов, активистов КПРФ, "Трудовой России" и аналогичных организаций. ЧК должны действовать быстро и энергично, исходя из интересов России. Следовательно, нынешнее законодательство и подзаконные акты должны уйти в историю.

   Очевидно, необходима зачистка Москвы, Ленинграда и других центров, как от криминального элемента, так и от тех "демократов" и "реформаторов", которые виновны в разрушении России или оказывают сопротивление переходу к мобилизационной экономике. Указанным лицам будет предоставлена возможность для трудовой деятельности, в частности, в районе Колымы-Яны.

   Что впереди - эволюция или революция? Могут ли описанные выше преобразования быть осуществлены эволюционным путем? Ясно, что это маловероятно. Значит, впереди - либо гибель страны, либо революция.

   Как делать революцию - особая тема. Есть и теория, и практический опыт. Тот, кто сказал: "Россия исчерпала лимит на революции" - ошибся. Будем готовиться к революции.

Рыночный социализм - вредная утопия
(К чему стремиться?)

   Как должно быть устроено народное хозяйство по окончании переходного (восстановительного) периода? Как ни странно, мало кто в оппозиционных кругах занимается стратегическим планированием в масштабе страны.

   Много сказано об антинародном характере нынешнего режима. Очередные статьи и выступления по этому поводу, как правило, не несут принципиально новой информации, а потому, по мнению ряда товарищей, не столько привлекают, сколько отталкивают возможных сторонников.

   Достаточно хорошо проанализированы достоинства советского проекта (1917-1991) и недостатки его реализации. Например, многие считают, что использование "валовых" показателей при оценке деятельности предприятия и планирование "от достигнутого" сдерживали темпы экономического развития СССР и внедрение достижений научно-технического прогресса.

   Но главное - будущее. К чему стремиться? Проектируемое будущее мало обсуждается. А если нет четкой цели, то нет и средств ее достижения, нет способа мобилизовать сторонников и привлечь новых.

   За завесой общих слов неясны конструкции планируемого общества. Да и смысл слов не всегда ясен. Например, основная идея так называемого "рыночного социализма", как выясняется, состоит в предоставлении государственным предприятиям определенной самостоятельности в хозяйственной деятельности. Против этого вряд ли кто-либо будет возражать, в то время как термин "рынок" - из пропагандистского арсенала врагов России. Ведь основа рынка - это анархия производства. Химера "рыночного социализма" может нанести значительный вред делу возрождения России.

   Первая тема для обсуждения - место государства в экономике. Во всем мире доля участия государства в производстве и распределении национального продукта стремительно растет. Если в настоящее время в России государственные расходы составляют 11,0% от валового внутреннего продукта, то в США - 32,8%, в Германии - 46,9%, во Франции - 54,3%, в Швеции - 58,5%. В СССР было 65,0%. Чтобы дойти хотя бы до уровня Франции, роль государства должна усилиться в 5 раз.

   Первоначальные действия вполне ясны. Как уже говорилось, государство должно взять под контроль экономику как целое (как систему). Прежде всего, государство должно взять под контроль и в управление предприятия, занимающиеся добычей нефти, газа и других природных ресурсов. Внешнеэкономическая деятельность должна полностью контролироваться государством, как и естественные монополии (транспорт, связь, электроэнергетика). Крупные предприятия, прежде всего военно-промышленного комплекса, должны принадлежать государству. Должна быть национализирована банковская система. Частной собственности на землю не место в России.

   Планирование и контроль - сердцевина современного подхода к управлению. Хорошо известно, и теоретически, и практически, что при четко сформулированных целях централизованное плановое управление эффективнее любых форм "рынка". Недаром в ситуации войны любое государство переходит к такой системе управления.

   Вторая проблема - обеспечение естественных основополагающих прав человека. Прав на пищу, жилье, работу, защиту от преступности, медицинскую помощь. На информацию, образование, пенсионное и социальное обеспечение и т.д. В частности, для обеспечения права на объективную информацию необходимо массированное государственное присутствие в СМИ, а также система защиты от "субъективизма" СМИ, т.е. цензура.

   Третья проблема - как организовать систему хозяйства. Основное - распределение полномочий между различными уровнями управленческой иерархии. Что относится к компетенции общегосударственных органов управления, что должно решаться на уровне отрасли или региона, что - на уровне предприятия, подразделения или отдельного работника? Какие решения вправе принять директор завода единолично, а какие - нет? Кто должен давать разрешение - трудовой коллектив или вышестоящая организация?

   В СССР действовали две основные формы организаций - государственные и коллективные (колхозы, артели и др.). Промежуточной формой являются арендные предприятия, в которых принадлежащие государству основные фонды на определенных условиях предоставляются в пользование трудовому коллективу. Кроме того, достаточно большая доля национального дохода создавалась в результате индивидуальной деятельности, прежде всего на приусадебных участках.

   Как построить хозяйство в будущей России? Каково должно быть соотношение государственных и "колхозных" предприятий? В частности, какова роль тех и других в торговле, в банковской деятельности? Как использовать конкуренцию между предприятиями для повышения качества работы и ускорения научно-технического прогресса и в то же время обеспечить социальную защиту "проигравшим" в конкурентной борьбе? Нужна ли вообще конкуренция (соревнование, состязание) в рамках производства или же можно решать все спорные вопросы на стадии принятия решений?

   Как обеспечить возможность реализации инициатив работников и трудовых коллективов? Нужна соответствующая правовая база. Видимо, возможность создания своего малого предприятия должна быть обеспечена любому гражданину России. Это позволит каждому желающему сделать попытку реализовать свои идеи.

   Как быть с нынешними российскими "собственниками"? Видимо, малые предприятия должны продолжать работать на благо России. Крупные и средние предприятия должны быть взяты под государственный контроль. Их нынешние владельцы получат по заслугам в соответствии с решением суда. Квалифицированные менеджеры нужны любой стране, поэтому руководители предприятий и их подразделений могут не беспокоиться о своей судьбе.

   Оптимальное построение организационно-экономического механизма будущей России заслуживает подробного обсуждения. Хочется сказать, что обсуждение разработки организационно-экономического механизма должно быть проведено на основе марксизма. Однако для такого утверждения есть неожиданное для многих препятствие.

Что такое "марксизм"?

   Термин "марксизм" встречается достаточно часто. Что он означает?

   Этот вопрос не тривиален. Дело в том, что Маркс и Энгельс не формулировали "Законы марксизма". Среди 30 томов их собрания сочинений не найти учебника по марксизму.

   Маркс и Энгельс писали много и на разные темы. Они были профессиональными литераторами и журналистами. В частности, Энгельс показал себя классиком научно-популярной литературы - его книга "Происхождение семьи, частной собственности и государства" доставит удовольствие каждому. Экономисты разных мастей обычно включают Маркса в тройку великих экономистов - А.Смит, К.Маркс, Дж. Кейнс. Напомним, что сам Маркс выпустил только первый том "Капитала", второй и третий тома - это компоновки рукописей.

   Вряд ли кто-то решится оспаривать вклад этих двух друзей (фабриканта Энгельса и свободного исследователя Маркса, жившего на его содержании) в развитие человеческой мысли.

   Идеи у них были глобальные, прежде всего:

  • уничтожение семьи;
  • уничтожение частной собственности;
  • уничтожение государства.

   Из этих трех идей нынешние "марксисты" обычно обсуждают только вторую - уничтожение частной собственности. Первая - уничтожение семьи - развивается вне марксизма. Началась ее практическая реализация с борьбы женщин за право получать образование, с феминисток 19 - начала 20 веков. А о нынешнем состоянии и говорить не хочется.

   Идею уничтожения государства почему-то связывают с другим идейным течением - анархизмом. Государства за 150 лет явно усилились, дело идет к мировому правительству наших врагов.

   К концу жизни основоположников заметные успехи были достигнуты только на социально-политическом фронте - созданы социал-демократические организации и партии. Прежде всего, в Германии. И пошли дискуссии. К. Маркс в "Критике Готской программы" воздал должное путаникам. Естественно, для просвещения партийных и беспартийных масс понадобились учебные пособия. Философ Евгений Дюринг написал учебник по "марксизму". Его разгромил Энгельс в серии статей, составивших солидную книгу, известную как "Антидюринг". Но своего учебника не составил.

   Начался марксизм в середине 19 века с краткой брошюры - "Манифеста Коммунистической Партии". Практически на ней общепризнанный марксизм и закончился, если не считать нечитаемого широкими массами "Капитала" (он и предназначался специалистам).

   Достойно удивления, что ведущие коммунисты и социалисты десятки лет вели политическую борьбу, не стремясь уточнить свои взгляды. Ни Ленин, ни Троцкий, ни Бебель, ни Каутский, ни Бернштейн, ни Лассаль, никто из ведущих политиков-марксистов не написал книгу о марксизме. Наверно, "Антидюринг" произвел впечатление, а вернее - непосредственная политическая борьба была несовместима с составлением учебников. "Три источника и три составные части марксизма" и другие блестящие работы В.И.Ленина - не академические учебники.

   Видимо, первым крупным шагом в рассматриваемом направлении был "Краткий курс истории ВКП(б)", изданный в конце 1930-х годов. Он написан или, во всяком случае, отредактирован И.В.Сталиным. Напомним, что в "Кратком курсе" излагалась не только история партии, но и основы марксизма в связи с гражданской и экономической историей.

   Итог таков. Концепция, известная сейчас как "марксизм", создана в 1950-60 годах безвестными (для нас) идеологами КПСС. Именно они в соответствии с политическим заказом написали учебники по истории КПСС, диалектическому и историческому материализму, политэкономии капитализма и социализма, научному коммунизму. Несколько десятилетий эти учебники в обязательном порядке изучали все студенты. Естественно, они поверили, что эти тексты и представляют собой марксизм.

   Однако исходным взглядам Маркса и Энгельса сочинения "шестидесятников" (в будущем многие из них предали идеи социализма) соответствуют не полностью. Например, идеи уничтожения семьи и государства отброшены.

   Хорошо, что из уважения к именам основоположников их труды собраны, переведены и изданы на русском языке (30 томов). Взгляды Маркса и Энгельса - в их сочинениях, а не в "марксизме" шестидесятников - будущих предателей...

   Правильно критиковал С.Г. Кара-Мурза "истмат", не имеет этот червивый плод 1960-х годов отношения к марксизму. Надо читать Маркса, Энгельса, Ленина, Сталина, Мао, Че, а не книги будущих предателей.

России рынок не нужен

   Буржуазная пропаганда активно промывает мозги. В том числе и коммунистов. Возможно, именно этим можно объяснить стремление совместить несовместимое - рыночные отношения и социализм. Именно с попыток внести элементы рыночных отношений в социалистическое хозяйство и началась "перестройка" Горбачева - Рыжкова.

   Нынешняя экономическая программа КПРФ составлена, как известно, С.Ю. Глазьевым. Специалисты хорошо знают, что эта программа - вариации на тему обращения американских нобелевских лауреатов по экономике (К.Эрроу, В.Леонтьева и др.) к кандидатам в президенты России на выборах 1996 г. А ее исходная точка - идеи Джона Кейнса, великого английского экономиста первой половины ХХ в.

   Основная мысль концепции Глазьева-Эрроу-Кейнса - государство должно активно вмешиваться в экономику. Ее идеал - регулируемый рынок. В конце прошлого тысячелетия эта концепция противостояла идеологии дикого рынка (либерализма - монетаризма) Гайдара-Чубайса и потому вполне заслуживала поддержки со стороны патриотов России, прежде всего КПРФ.

   Однако ясно, что концепция регулируемого рынка - буржуазная, а не марксистская. Ее временная поддержка со стороны руководства КПРФ породила идейные шатания. Например, левая интеллигенция стала всерьез обсуждать такую химеру, как "рыночный социализм".

   Более существенно для будущего страны, что рынок экономически неэффективен. Всем уже ясно, что в СССР экономика работала гораздо более эффективно, чем сейчас в России и других постсоветских республиках. Рынок - это анархия производства, и результат не может быть лучше, чем при плановой экономике. Это превосходно известно на Западе, как теоретикам, так и практикам. Первое, что там разъясняют будущим менеджерам (т.е. управленцам, в том числе будущим руководителям организаций) - им предстоит заниматься, прежде всего, планированием.

   Есть глобальная причина необходимости отказа от рынка. Это исчерпанность природных ресурсов, надвигающаяся экологическая катастрофа. В ближайшие десятилетия всему миру предстоит переход к новым экономическим отношениям, отказ от свободы предпринимательства. Недаром за двадцатый век роль государства в экономике выросла в среднем в 4 раза для всех экономически развитых стран (кроме России, где она искусственно возвращена к уровню 1913 г.).

   Что делать через год после взятия власти? Если не думать об этом, то не будет и взятия власти. Кто же пойдет за теми, у кого нет долгосрочной программы?

   Необходима разработка новой экономической программы КПРФ. Программы для страны и мира.

   Что может быть в этой программе? Основные идеи хорошо известны. Однако стоит их повторять снова и снова.

   Лозунг "регулируемого рынка" отработал своё. Вместо него на первое место должен быть поставлен принцип планомерного развития.

   Многоукладность экономики может быть лишь временной. Основные формы собственности - государственная (общенародная) и личная (трудовая). При этом трудовая инициатива должна иметь государственную поддержку и защиту.

   Должны быть национализированы крупные промышленные предприятия (в том числе по добыче полезных ископаемых), внешнеэкономическая и банковская деятельность, все жизнеобеспечивающие системы.

   Установлен государственный контроль за средствами массовой информации (введена цензура, действующая по четко прописанному и всем известному закону). И т.д.

   Однако нет речи о призыве "Назад в СССР". Необходимо четко сформулировать, от чего в СССР надо отказаться.

   Например, нельзя копировать неэффективные методы планирования и управления народным хозяйством. "Перевыполнение плана" - бессмыслица с точки зрения рационального хозяйствования (еще в 30-е годы ХХ в. это хорошо понимал, например, В.В.Куйбышев). Оценка работы завода по валовой продукции - один из факторов разрушения СССР. Да и рост производительности труда - не менее вредный фетиш.

   Демократы любят говорить о свободном выезде за границу. Пожалуйста! Но при этом не забудьте возместить расходы на бесплатное образование и медицинское обслуживание. И т.д.

   Как организовать принятие решений властными структурами? Современные информационные технологии позволяют реализовать идеи соборного принятия решений (на сходке, вече, в Совете). Не надо избирательных комиссий, нужен доступ в информационную сеть страны.

   Необходимо совместными усилиями разработать новую экономическую программу. Пора вместе планировать будущее. За планом пойдут действия.

А.И.Орлов

*   *   *   *   *   *   *

Статья для журнала
"Социология: методология, методы, математические модели"

От редакции

   Редакционный Совет журнала принял решение о публикации серии статей, посвященных актуальным для социологии математическим методам, плохо доступным в настоящее время для широкого круга читателей (Социология-4М, No.16, с.125). Сложность, прежде всего, в том, что читателю-социологу неизвестно, где и что искать. В статье президента Российской ассоциации статистических методов А.И. Орлова дается обзор развития статистических методов за последние тридцать лет.

Статистические методы в российской социологии
(тридцать лет спустя)

   В статье дан обзор развития статистических методов в российской социологии за 1974-2004 г.г. Обсуждаются основные научные события этих лет, прежде всего, формирование прикладной статистики и ее основы - статистики нечисловых данных (в социологии 70-90% переменных имеют нечисловой характер). Рассмотрены методы снижения размерности, в том числе методы состоятельной оценки размерности модели в многомерном шкалировании.

"Болезни роста" современной российской социологии

   В течение последних 15 лет российская социология бурно растет по всем количественным параметрам. Если в 1989 г. в России было 6 социологических факультетов, отделений, кафедр, то в 2003 г. - уже 105. Число студентов-социологов выросло более чем в 100 раз. Во всех вузах преподают социологию (она вошла в перечень "Общих гуманитарных и социально-экономических дисциплин" государственных образовательных стандартов высшего профессионального образования). Издается более 20 социологических журналов. Каждый год ВАК утверждает около 50 докторских диссертаций по социологии [1, с.2-3].

   Очевидно, глубину исследованиям придает использование развитого научного аппарата - методологии и методов сбора и анализа данных, математических моделей. На наш взгляд, принципиальный прорыв был осуществлен в нашей стране в 1970-е годы. Именно тогда в арсенале отечественных социологов появились теория измерений и нечеткие множества, математические методы классификации и многомерное шкалирование, непараметрическая статистика и статистика нечисловых данных.

   В дальнейшие десятилетия шло естественное развитие научного аппарата. К сожалению, нельзя сказать, что в последние годы темпы этого развития усилились. Действующие лица 1970-х годов выпустили учебники [2-5], но поток научных результатов в области математических методов в социологии не расширился по сравнению с 1970-ми - периодом "бури и натиска". Из этого следует, в частности, что публикации тех лет [6-8] отнюдь не устарели, они представляют большой интерес для социологов XXI века.

   Итак, социология бурно развивается вширь, но весьма медленно - вглубь. Это вполне естественно. Прочитав в 1970 г. популярную книгу В.Э. Шляпентоха [9], автор провел свое первое полевое исследование. Несмотря на простоту, оно позволило решить управленческие задачи, стоявшие перед автором как директором Вечерней математической школы (ВМШ) при Московском математическом обществе. Итоги многолетней деятельности в ВМШ подведены в [10]. И сейчас наши ученики-маркетологи, готовя выпускные работы на степень магистра делового администрирования, обходятся полевыми исследованиями на столь же простом уровне (см. описание исследования "Потребители растворимого кофе" в [5, гл.2]).

   И лишь постепенно практики приходят к необходимости применять более сложные методы. Например, в крупном маркетинговом агентстве, опрашивающем за год около 0,5 млн. потребителей, в котором автор этих слов работал консультантом, был создан специализированный отдел обработки данных, сотрудники которого ежедневно применяли различные алгоритмы статистической обработки данных, включенные в известный пакет SPSS.

   Как показывает анализ тезисов докладов и выступлений на II Всероссийском социологическом конгрессе "Российское общество и социология в XXI веке: социальные вызовы и альтернативы" [11], большинство участников конгресса не проводит полевых исследований и не испытывает потребности в применении математических и статистических методов. Такие методы необходимы для продвинутых социологических исследований. Очевидно, с укреплением социологических центров в них возникают подразделения анализа данных, которые сначала пользуются стандартными статистическими пакетами, а затем востребуют и современные методы.

   В социологии с успехом используются различные методы анализа данных и разнообразные математические модели [12]. Обсудим развитие методов обработки результатов выборочных исследований за последние тридцать лет.

Основное событие - появление прикладной статистики

   Математические методы выборочных исследований. Выборочные исследования - один из основных инструментов социологов. Для переноса выводов с выборки на всю интересующую исследователя совокупность необходимо использовать вероятностно-статистические методы и модели. Уже в 1970-х годах в нашей стране активно разрабатывались продвинутые математические и статистические методы анализа данных социологических опросов (см., например, сборники [6, 7]). Отметим, что работы тех уже далеких лет, как правило, отнюдь не устарели и по-прежнему представляют интерес для специалистов по анализу социологических данных и математическому моделированию социальных процессов. Однако за тридцать прошедших лет в некоторых направлениях удалось существенно продвинуться. Основное содержание настоящей статьи - обсуждение развития ориентированных на социологию статистических методов и моделей за последние тридцать лет в нашей стране.

   Одни и те же математические и статистические методы и модели могут с успехом применяться в самых разных областях науки и практики. Статистические методы и модели весьма эффективны в социологических, социально-экономических, управленческих, технических и технико-экономических исследованиях, медицине, истории, практически в любой прикладной отрасли и области знания.

   Очевидна связь между исследованиями, выполненными в рамках различных дисциплин. Например, на Втором Всероссийском социологическом конгрессе (2003) активно обсуждалась такая традиционно экономическая тематика, как маркетинговые и инновационные исследования [11]. Однако для специалиста вполне естественным является желание "замкнуться" внутри своей предметной области. Например, довольно странным выглядело бы предложение о преподавании на социологическом факультете в соответствии с учебником по эконометрике [5]. Удивление значительно возросло бы при констатации того, что этот учебник составлен в основном из статей, опубликованных в журнале "Заводская лаборатория" (в прошлом - орган Министерства черной металлургии). Действительно, есть ли что-либо общее у инженера-металлурга, менеджера, экономиста и социолога? Необходимо известное интеллектуальное развитие, чтобы понять, что все эти специалисты могут использовать одни и те же инструменты исследования - статистические методы и модели.

   В рассматриваемой области основное событие последних тридцати лет - это становление научно-практической дисциплины "прикладная статистика", посвященной разработке и применению статистических методов и моделей. На Западе, как мы убедились в процессе становления Всесоюзной статистической ассоциации, аналогичный процесс начался несколько раньше и протекает иначе из-за сложившихся традиций и отличия научно-организационных форм.

   Появление прикладной статистики. В нашей стране термин "прикладная статистика" вошел в широкое употребление в 1981 г. после выхода массовым тиражом (33940 экз.) сборника "Современные проблемы кибернетики (прикладная статистика)". В этом сборнике обосновывалась трехкомпонентная структура прикладной статистики [13]. Во-первых, в нее входят ориентированные на прикладную деятельность математико-статистические методы анализа данных (эту область можно назвать прикладной математической статисткой и включать также и в прикладную математику). Однако прикладную статистику нельзя целиком относить к математике. Она включает в себя две внематематические области. Во-первых, методологию организации статистического исследования: как планировать исследование, как собирать данные, как подготавливать данные к обработке, как представлять результаты. Во-вторых, организацию компьютерной обработки данных, в том числе разработку и использование баз данных и электронных таблиц, статистических программных продуктов, например, диалоговых систем анализа данных. В нашей стране термин "прикладная статистика" использовался и ранее 1981 г., но лишь внутри сравнительно небольших и замкнутых групп специалистов. Эти факты предыстории прикладной статистики также рассмотрены в сборнике [13].

   Прикладная статистика и математическая статистика - это две разные научные дисциплины. Первая относится к статистике, вторая - к математике. Различие четко проявляется и при преподавании. Курс математической статистики состоит в основном из доказательств теорем, как и соответствующие учебные пособия. В курсах прикладной статистики основное - методология анализа данных и алгоритмы расчетов, а теоремы приводятся для обоснования этих алгоритмов, доказательства же, как правило, опускаются (их можно найти в научной литературе).

   Структура современной статистики. Внутренняя структура статистики как науки была выявлена и обоснована при создании в 1990 г. Всесоюзной статистической ассоциации (см. об этом, например, статью [14]).

   Прикладная статистика - методическая дисциплина, являющаяся центром статистики. При применении методов прикладной статистики к конкретным областям знаний и отраслям народного хозяйства получаем научно-практические дисциплины типа "статистика в промышленности", "статистика в медицине" и др. С этой точки зрения эконометрика - это "статистические методы в экономике" [5]. Математическая статистика играет роль математического фундамента для прикладной статистики.

   К настоящему времени любому специалисту очевидно четко выраженное размежевание математической статистики и прикладной статистики. Математическая статистика исходит из сформулированных в основном в 1930-50 гг. постановок математических задач, происхождение которых связано с анализом статистических данных. Начиная с 70-х годов ХХ в. исследования по математической статистике посвящены лишь обобщению и дальнейшему математическому изучению этих задач. Поток новых математических результатов (теорем) не ослабевает, но новые практические рекомендации по обработке статистических данных при этом не появляются. Можно сказать, что в нашей стране математическая статистика как научное направление замкнулась внутри себя.

   Научное направление и сам термин "прикладная статистика" возникли как реакция на описанную выше тенденцию. Прикладная статистика нацелена на решение реальных задач. Поэтому в ней возникают новые постановки математических задач анализа статистических данных, развиваются и обосновываются новые методы. Обоснование часто проводится математическими методами, т.е. путем доказательства теорем. Большую роль играет методологическая составляющая - как именно ставить задачи, какие предположения принять с целью дальнейшего математического изучения. Велика роль современных информационных технологий, в частности, компьютерного эксперимента.

   Рассматриваемое соотношение математической и прикладной статистик отнюдь не являются исключением в мире научных дисциплин. Как правило, математические дисциплины проходят в своем развитии ряд этапов. Вначале в какой-либо прикладной области возникает необходимость в применении математических методов, накапливаются соответствующие эмпирические приемы (для геометрии это - "измерение земли", т.е. землемерие, в Древнем Египте). Затем возникает математическая дисциплина со своей аксиоматикой (для геометрии это - время Евклида). Затем идет внутриматематическое развитие и преподавание (считается, что большинство результатов элементарной геометрии получено учителями гимназий в XIX в.). При этом на запросы исходной прикладной области перестают обращать внимание, и та порождает новые научные дисциплины (сейчас "измерением земли" занимается не геометрия, а геодезия и картография). Затем научный интерес к исходной дисциплине иссякает, но преподавание по традиции продолжается (элементарная геометрия до сих пор изучается в средней школе, хотя трудно понять, в каких практических задачах может понадобиться, например, теорема о том, что высоты треугольника пересекаются в одной точке). Следующий этап - окончательное вытеснение дисциплины из реальной жизни в историю науки (объем преподавания элементарной геометрии в настоящее время постепенно сокращается, в частности, ей все меньше уделяется внимания на вступительных экзаменах в вузах). К интеллектуальным дисциплинам, закончившим свой жизненный путь, относится средневековая схоластика. Как справедливо отмечено, например, в [15], теория вероятностей и математическая статистика успешно двигаются по ее пути - вслед за элементарной геометрией.

   Статистические данные собираются и анализируются с незапамятных времен (см., например, Книгу Чисел в Ветхом Завете). Однако современная математическая статистика была создана сравнительно недавно, а именно, в первой половине ХХ века. Именно тогда были разработаны ее основные идеи, получены результаты, излагаемые ныне в учебных курсах математической статистики. Затем математики занялись разработкой внутриматематических проблем, а для создания новых статистических технологий и теоретического обслуживания практики анализа статистических данных стала использоваться новая дисциплина - прикладная статистика.

Точки роста прикладной статистики

   Внутри прикладной статистики наиболее значимым нам представляется создание и развитие статистики объектов нечисловой природы. Ее называют также статистикой нечисловых данных или нечисловой статистикой. Большое значение имеет развитие непараметрической статистики и методов снижения размерности. Рассмотрим три перечисленные "точки роста" прикладной статистики.

   Статистика объектов нечисловой природы как часть прикладной статистики. Согласно общепринятой в настоящее время классификации статистических методов прикладная статистика делится на четыре области: статистика (числовых) случайных величин; многомерный статистический анализ; статистика временных рядов и случайных процессов; статистика объектов нечисловой природы.

   Первые три из этих областей являются классическими. Они были хорошо известны еще в первой половине ХХ в. Остановимся на четвертой, сравнительно недавно вошедшей в массовое сознание специалистов. Анализ динамики развития прикладной статистики приводит к выводу, что в XXI в. статистика объектов нечисловой природы станет центральной областью прикладной статистики, поскольку содержит наиболее общие подходы и результаты.

   Исходный объект в прикладной математической статистике - это выборка. В классической математической статистике элементы выборки - это числа. В многомерном статистическом анализе - вектора. А в нечисловой статистике элементы выборки - это объекты нечисловой природы, которые нельзя складывать и умножать на числа. Другими словами, объекты нечисловой природы лежат в пространствах, не имеющих векторной структуры. Примерами объектов нечисловой природы являются:

  • значения качественных признаков, т.е. результаты кодировки объектов (например, ответов на вопросы социологической анкеты) с помощью заданного перечня категорий (градаций);
  • бинарные отношения - упорядочения (ранжировки), классификации (отношения эквивалентности), толерантности, (Толерантность - это рефлексивное симметричное отношение. Отличается от классификации (отношения эквивалентности) возможным отсутствием транзитивности. Толерантностями естественно описывать отношения сходства или знакомства. Вероятностно-статистическая теория толерантностей содержится в монографии [8].)
  • результаты парных сравнений, т.е. последовательности из 0 и 1;
  • множества (обычные или нечеткие),
  • слова, предложения, тексты;
  • вектора, координаты которых - совокупность значений разнотипных признаков, часть из них носит качественный характер, а часть - количественный;
  • ответы на вопросы экспертной, маркетинговой или социологической анкеты, часть из которых носит количественный характер (возможно, интервальный), часть сводится к выбору одной из нескольких подсказок, а часть представляет собой тексты; и т.д.

   В течение 1970-х годов на основе запросов социологии [16], экономики, техники и медицины развивались конкретные направления статистики объектов нечисловой природы. Были установлены связи между конкретными видами таких объектов, разработаны для них вероятностные модели. Научные итоги этого периода подведены в монографии [8].

   Следующий этап - выделение статистики объектов нечисловой природы в качестве самостоятельного направления в прикладной статистике, ядром которого являются методы статистического анализа данных произвольной природы. Программа развития этого нового научного направления впервые была сформулирована в статье [17]. Реализация этой программы была осуществлена в 1980-е годы. Для работ этого периода характерна сосредоточенность на внутренних проблемах нечисловой статистики. Предварительные итоги были подведены в сборнике научных статей [18], полностью посвященном нечисловой статистике.

   К 1990-м годам статистика объектов нечисловой природы с теоретической точки зрения была достаточно хорошо развита, основные идеи, подходы и методы были разработаны и изучены математически, в частности, доказано достаточно много теорем. Наступило время перейти к применению полученных результатов на практике. Одним из примеров такого применения являются работы по социологии науки [19].

   Непараметрическая статистика. Из многих "точек роста" прикладной статистики, рассмотренных в [5], отметим непараметрическую статистику, или непараметрику. В первой трети ХХ века в работах Спирмена и Кендалла появились первые непараметрические методы, основанные на коэффициентах ранговой корреляции. Но непараметрика, не делающая нереалистических предположений о том, что функции распределения результатов наблюдений принадлежат тем или иным параметрическим семействам распределений, стала заметной частью статистики лишь со второй трети ХХ века, после работ А.Н.Колмогорова и Н.В.Смирнова 1930-х годов. После второй мировой войны развитие непараметрической статистики пошло быстрыми темпами. К настоящему времени с помощью непараметрических методов можно решать практически тот же круг статистических задач, что и с помощью параметрических. Все большую роль играют непараметрические оценки плотности, непараметрические методы регрессии и распознавания образов (дискриминантного анализа). В нашей стране непараметрические методы получили достаточно большую известность после выхода в 1965 г. сборника статистических таблиц Л.Н. Большева и Н.В.Смирнова [20], содержащего подробные таблицы для основных непараметрических критериев.

   Тем не менее, параметрические методы всё еще популярнее непараметрических. Неоднократно публиковались (см., например, [5]) экспериментальные данные, показывающие, что распределения реально наблюдаемых случайных величин, в частности, ошибок измерения, в подавляющем большинстве случаев отличны от нормальных (гауссовских). Тем не менее, теоретики продолжают строить и изучать статистические модели, основанные на гауссовости, а практики - пытаться применять подобные методы и модели. С точки зрения прикладной статистики такие попытки напоминают поиск ключей под фонарем, где светло, а не там, где они потеряны.

   Почему же неадекватные параметрические методы довольно часто позволяют получать практически полезные выводы? Прикладная статистика позволяет изучать свойства конкретных алгоритмов анализа данных на основе вероятностно-статистических моделей. Например, рассмотрим простейший алгоритм анализа данных - расчет выборочного среднего арифметического. Если мы хотим перенести результаты с выборки на более широкую совокупность, то вынуждены использовать ту или иную модель порождения данных, например, рассматривать наблюденные значения как реализации независимых одинаково распределенных случайных величин (векторов или объектов иной природы). Эта модель позволяет обосновать использование выборочного среднего арифметического как точечной оценки теоретического среднего (математического ожидания), указать (доверительные) границы для теоретического среднего и решить иные задачи [5]. В частности, оказывается, что доверительные границы, рассчитанные при нереалистическом предположении нормальности, при увеличении объема выборки сближаются с адекватными непараметрическими границами, построенными на основе Центральной Предельной Теоремы теории вероятностей. В то же время методы отбраковки резко выделяющихся наблюдений, основанные на гипотезе нормальности, не являются адекватными [5].

   Ряд непараметрических методов рассмотрен в обзоре [21]. Более подробное изложение можно найти в учебнике [5], в котором, в частности, продемонстрировано, что свой естественный вид многие непараметрические методы, предназначенные для оценивания среднего, плотности, регрессионной зависимости и решения других задач (в частности, в теории классификации [22]), приобретают в рамках статистики объектов нечисловой природы. Отметим также "широту" непараметрики - в нее входят все методы, не опирающиеся на ту или иную модель принадлежности функций распределения результатов наблюдений к некоторому параметрическому семейству распределений. Ранговые методы составляют лишь часть одномерной непараметрики, как и методы, предполагающие непрерывность функции распределения результатов наблюдений. Например, выборочное среднее арифметическое - это непараметрическая оценка среднего в модели, в которой результаты наблюдений имеют произвольную функцию распределения с конечной дисперсией [5].

   Статистические методы и социология. Число актуальных для социологов публикаций по статистическим методам - не менее 100000 [5, 14]. Очевидна актуальность поиска необходимой исследователю информации. В среднесрочной перспективе можно ожидать помощи от Интернета (в частности, большой массив полезной информации содержится на сайте http://orlovs.pp.ru). Однако в настоящее время основные результаты представлены на бумажных носителях. Как нам представляется, представленная в настоящей статье концепция развития статистических методов, разработанная Российской ассоциацией статистических методов, окажется полезной специалистам по анализу социологических данных.

   Выше неоднократно отмечалась польза для социологов работ, формально относящихся к экономике, управлению (менеджменту), техническим исследованиям. Обратим внимание на информационный поток, идущий из социологии в другие области. В социологической литературе, как уже отмечалось, получены результаты в маркетинге и управлении инновациями. Отметим, например, работу по дискриминантному анализу [23], имеющую общестатистический интерес.

   Самостоятельная проблема - внедрение в практику работы организации современных статистических методов. Обратим внимание на систему "Шесть сигм" организации подобного внедрения [24].

   Мы рассмотрели развитие идей и научной области, а не персоналии. В краткой, но весьма содержательной сводке [25] описаны основные научные результаты большого числа отечественных исследователей в области статистических методов анализа социологических данных, названы основные исследовательские коллективы Москвы, Петербурга, Новосибирска и многих иных городов, приведена обширная библиография (119 названий). Подробное же описание требует серии книг, а не статьи.

Методы снижения размерности

   Как уже отмечалось, одной из "точек роста" прикладной статистики являются методы снижения размерности. Они все чаще используются при анализе социологических данных. Рассмотрим наиболее перспективные методы снижения размерности. В качестве примера применения вероятностно-статистического моделирования и результатов статистики нечисловых данных обоснуем состоятельность оценки размерности пространства, ранее предложенной Краскалом из эвристических соображений [26, 27].

   В многомерном статистическом анализе каждый объект описывается вектором, размерность которого произвольна (но одна и та же для всех объектов). Однако человек может непосредственно воспринимать лишь числовые данные или точки на плоскости. Анализировать скопления точек в трехмерном пространстве уже гораздо труднее. Непосредственное восприятие данных более высокой размерности невозможно. Поэтому вполне естественным является желание перейти от многомерной выборки к данным небольшой размерности, чтобы "на них можно было посмотреть".

   Кроме стремления к наглядности, есть и другие мотивы для снижения размерности. Те факторы, от которых интересующая исследователя переменная не зависит, лишь мешают статистическому анализу. Во-первых, на сбор информации о них расходуются финансовые, временные, кадровые ресурсы. Во-вторых, как можно доказать, их включение в анализ ухудшает свойства статистических процедур (в частности, увеличивает дисперсию оценок параметров и характеристик распределений). Поэтому желательно избавиться от таких факторов.

   При анализе многомерных данных обычно рассматривают не одну, а множество задач, в частности, по-разному выбирая независимые и зависимые переменные. Поэтому рассмотрим задачу снижения размерности в следующей формулировке. Дана многомерная выборка. Требуется перейти от нее к совокупности векторов меньшей размерности, максимально сохранив структуру исходных данных, по возможности не теряя информации, содержащихся в данных. Задача конкретизируется в рамках каждого конкретного метода снижения размерности.

   Метод главных компонент является одним из наиболее часто используемых методов снижения размерности. Основная его идея состоит в последовательном выявлении направлений, в которых данные имеют наибольший разброс. Пусть выборка состоит из векторов, одинаково распределенных с вектором X = (x(1), x(2), ... , x(n)). Рассмотрим линейные комбинации

Y(λ(1), λ(2), ..., λ(n)) = λ(1)x(1) + λ(2)x(2) + ... + λ(n)x(n),

   где

λ2(1) + λ2(2) + ...+ λ2(n) = 1.

   Здесь вектор λ = (λ(1), λ(2), ..., λ(n)) лежит на единичной сфере в n-мерном пространстве.

   В методе главных компонент прежде всего находят направление максимального разброса, т.е. такое λ, при котором достигает максимума дисперсия случайной величины Y(λ) = Y(λ(1), λ(2), ..., λ(n)). Тогда вектор λ задает первую главную компоненту, а величина Y(λ) является проекцией случайного вектора Х на ось первой главной компоненты.

   Затем, выражаясь терминами линейной алгебры, рассматривают гиперплоскость в n-мерном пространстве, перпендикулярную первой главной компоненте, и проектируют на эту гиперплоскость все элементы выборки. Размерность гиперплоскость на 1 меньше, чем размерность исходного пространства.

   В рассматриваемой гиперплоскости процедура повторяется. В ней находят направление наибольшего разброса, т.е. вторую главную компоненту. Затем выделяют гиперплоскость, перпендикулярную первым двум главным компонентам. Ее размерность на 2 меньше, чем размерность исходного пространства. Далее - следующая итерация.

   С точки зрения линейной алгебры речь идет о построении нового базиса в n-мерном пространстве, ортами которого служат главные компоненты.

    Дисперсия, соответствующая каждой новой главной компоненте, меньше, чем для предыдущей. Обычно останавливаются, когда она меньше заданного порога. Если отобрано k главных компонент, то это означает, что от n-мерного пространства удалось перейти к k-мерному, т.е. сократить размерность с n-до k, практически не исказив структуру исходных данных.

   Для визуального анализа данных часто используют проекции исходных векторов на плоскость первых двух главных компонент. Обычно хорошо видна структура данных, выделяются компактные кластеры объектов и отдельно выделяющиеся вектора.

   Метод главных компонент является одним из методов факторного анализа [28]. Различные алгоритмы факторного анализа объединены тем, что во всех них происходит переход к новому базису в исходном n-мерном пространстве. Важным является понятие "нагрузка фактора", применяемое для описания роли исходного фактора (переменной) в формировании определенного вектора из нового базиса.

   Новая идея по сравнению с методом главных компонент состоит в том, что на основе нагрузок происходит разбиение факторов на группы. В одну группу объединяются факторы, имеющие сходное влияние на элементы нового базиса. Затем из каждой группы рекомендуется оставить одного представителя. Иногда вместо выбора представителя расчетным путем формируется новый фактор, являющийся центральным для рассматриваемой группы. Снижение размерности происходит при переходе к системе факторов, являющихся представителями групп. Остальные факторы отбрасываются.

   Описанная процедура может быть осуществлена не только с помощью факторного анализа. Речь идет о кластер-анализе признаков (факторов, переменных). Для разбиения признаков на группы можно применять различные алгоритмы кластер-анализа [22]. Достаточно ввести расстояние (меру близости, показатель различия) между признаками. Пусть Х и У - два признака. Различие d(X,Y) между ними можно измерять с помощью выборочных коэффициентов корреляции:

d1(X,Y) = 1 - |rn(X,Y)|, d2(X,Y) = 1 - |ρn(X,Y)|,

   где rn(X,Y) - выборочный линейный коэффициент корреляции Пирсона, ρn(X,Y) - выборочный коэффициент ранговой корреляции Спирмена.

   Многомерное шкалирование. На использовании расстояний (мер близости, показателей различия) d(X,Y) между признаками Х и У основан обширный класс методов многомерного шкалирования [29, 30]. Основная идея этого класса методов состоит в представлении каждого объекта точкой геометрического пространства (обычно размерности 1, 2 или 3), координатами которой служат значения скрытых (латентных) факторов, в совокупности достаточно адекватно описывающих объект. При этом отношения между объектами заменяются отношениями между точками - их представителями. Так, данные о сходстве объектов - расстояниями между точками, данные о превосходстве - взаимным расположением точек [31].

   В практике анализа социологических данных используется ряд различных моделей многомерного шкалирования. Во всех них встает проблема оценки истинной размерности факторного пространства. Рассмотрим эту проблему на примере обработки данных о сходстве объектов с помощью метрического шкалирования.

   Пусть имеется n объектов О(1), О(2), ..., O(n), для каждой пары объектов О(i), O(j) задана мера их сходства s(i,j). Считаем, что всегда s(i,j) = s(j,i). Происхождение чисел s(i,j) не имеет значения для описания работы алгоритма. Они могли быть получены либо непосредственным измерением, либо с использованием экспертов, либо путем вычисления по совокупности описательных характеристик, либо как-то иначе.

   В евклидовом пространстве рассматриваемые n объектов должны быть представлены конфигурацией n точек, причем в качестве меры близости точек-представителей выступает евклидово расстояние d(i,j) между соответствующими точками. Степень соответствия между совокупностью объектов и совокупностью представляющих их точек определяется путем сопоставления матриц сходства ||s(i,j)|| и расстояний ||d(i,j)||. Метрический функционал сходства имеет вид (формула исключена).

   Геометрическую конфигурацию надо выбирать так, чтобы функционал S достигал своего наименьшего значения [29-30].

   Замечание. В неметрическом шкалировании вместо близости самих мер близости и расстояний рассматривается близость упорядочений на множестве мер близости и множестве соответствующих расстояний. Вместо функционала S используются аналоги ранговых коэффициентов корреляции Спирмена и Кендалла. Другими словами, неметрическое шкалирование исходит из предположения, что меры близости измерены в порядковой шкале.

   Пусть евклидово пространство имеет размерность m. Рассмотрим минимум среднего квадрата ошибки (формула исключена), где минимум берется по всем возможным конфигурациям n точек в m-мерном евклидовом пространстве. Можно показать, что рассматриваемый минимум достигается на некоторой конфигурации. Ясно, что при росте m величина αm монотонно убывает (точнее, не возрастает). Можно показать, что при m > n - 1 она равна 0 (если s(i,j) - метрика). Для увеличения возможностей содержательной интерпретации желательно действовать в пространстве возможно меньшей размерности. При этом, однако, размерность необходимо выбрать так, чтобы точки представляли объекты без больших искажений. Возникает вопрос: как рационально выбирать размерность пространства, т.е. натуральное число m?

   В рамках детерминированного анализа данных обоснованного ответа на этот вопрос, видимо, нет. Следовательно, необходимо изучить поведение αm в тех или иных вероятностных моделях. Если меры близости s(i,j) являются случайными величинами, распределение которых зависит от "истинной размерности" m0 (и, возможно, от каких-либо еще параметров), то можно в классическом математико-статистическом стиле ставить задачу оценки m0, искать состоятельные оценки и т.д.

   Начнем строить вероятностные модели. Примем, что объекты представляют собой точки в евклидовом пространстве размерности k, где k достаточно велико. То, что "истинная размерность" равна m0, означает, что все эти точки лежат на гиперплоскости размерности m0. Примем для определенности, что совокупность рассматриваемых точек представляет собой выборку из кругового нормального распределения с дисперсией σ2(0). Это означает, что объекты О(1), О(2), ..., O(n) являются независимыми в совокупности случайными векторами, каждый из которых строится как ζ(1)e(1) + ζ(2)e(2) + ... + ζ(m0)e(m0), где e(1), e(2), ... , e(m0) - ортонормальный базис в подпространстве размерности m0, в котором лежат рассматриваемые точки, а ζ(1), ζ(2), ... , ζ(m0) - независимые в совокупности одномерные нормальные случайные величины с математическим ожиданием 0 и дисперсией σ2(0).

   Рассмотрим две модели получения мер близости s(i,j). В первой из них s(i,j) отличаются от евклидова расстояния между соответствующими точками из-за того, что точки известны с искажениями. Пусть с(1), с(2), ... , с(n) - рассматриваемые точки. Тогда

s(i,j) = d(c(i) + ε(i), c(j) + ε(j)), i,j = 1, 2, ... , n,

   где d - евклидово расстояние между точками в k-мерном пространстве, вектора ε(1), ε(2), ... , ε(n) представляют собой выборку из кругового нормального распределения в k-мерном пространстве с нулевым математическим ожиданием и ковариационной матрицей σ2(1)I, где I - единичная матрица. Другими словами, ε(i) = η(1)e(1) + η(2)e(2) + ... + η(k)e(k), где e(1), e(2), ..., e(k) - ортонормальный базис в k-мерном пространстве, а {η(i,t), i = 1, 2, ... , n, t = 1, 2, ... , k} - совокупность независимых в совокупности одномерных случайных величин с нулевым математическим ожиданием и дисперсией σ2(1).

   Во второй модели искажения наложены непосредственно на сами расстояния:

s(i,j) = d(c(i), c(j)) + ε(i,j), i,j = 1, 2, ... , n, ij,

   где {ε(i,j), i,j = 1, 2, ... , n} - независимые в совокупности нормальные случайные величины с математическим ожиданием ) и дисперсией σ2(1).

   В работе [32] показано, что для обеих сформулированных моделей минимум среднего квадрата ошибки αm при n → ∞ сходится по вероятности к

f(m) = f1(m) + σ2(1)(k - m), m = 1, 2, ..., k,

   где (формула исключена).

   Таким образом, функция f(m) линейна на интервалах [1, m0] и [m0, k], причем на первом интервале она убывает быстрее, чем на втором. Отсюда следует, что статистика (формула исключена) является состоятельной оценкой истинной размерности m0.

   Итак, из вероятностной теории вытекает рекомендация - в качестве оценки размерности факторного пространства использовать m*. Отметим, что подобная рекомендация была сформулировано как эвристическая одним из основателей многомерного шкалирования Дж. Краскалом [26, 27, 29]. Он исходил из опыта практического использования многомерного шкалирования и вычислительных экспериментов. Вероятностная теория позволила обосновать эту эвристическую рекомендацию.

Литература

   1. Осипов Г.В. Российская социология в XXI веке. / Материалы II Всероссийского социологического конгресса. М.: 2003.

   2. Толстова Ю.Н. Анализ социологических данных: методология, дескриптивная статистика, изучение связей между номинальными признаками. М.: Научный мир, 2000.

   3. Толстова Ю.Н. Измерение в социологии. М.: Инфра-М, 1998.

   4. Татарова Г.Г. Методология анализа данных в социологии (введение). Учебник для вузов. М.: NOTA BENE, 1999.

   5. Орлов А.И. Эконометрика. М.: Экзамен, 2002 (1-е изд.), 2003 (2-е изд.), 2004 (3-е изд.).

   6. Методы современной математики и логики в социологических исследованиях. / Под ред. Э.П.Андреева. М.: Институт социологических исследований АН СССР, 1977.

   7. Математические методы и модели в социологии. / Под ред. В.Н. Варыгина. М.: Институт социологических исследований АН СССР, 1977.

   8. Орлов А.И. Устойчивость в социально-экономических моделях. М.: Наука, 1979.

   9. Шляпентох В.Э. Социология для всех: некоторые проблемы, результаты, методы. М.: Советская Россия, 1970.

   10. Орлов А.И. О теоретических основах внеклассной работы по математике и опыте Вечерней математической школы при Московском математическом обществе / Бюллетень No.2 Всесоюзного центра статистических методов и информатики. М.: ВЦСМИ, 1991.

   11. Тезисы докладов и выступлений на II Всероссийском социологическом конгрессе "Российское общество и социология в XXI веке: социальные вызовы и альтернативы": В 3 томах. М.: Альфа-М, 2003.

   12. Актуальные проблемы социологической науки и социальной практики: Научная конференция "Сорокинские чтения - 2002": Москва, МГУ им. М.В. Ломоносова, 17-18 декабря 2002 г.: Сб. науч. докл. в 3-х томах: Том 3: Математическое моделирование социальных процессов: Выпуск 5. / Под общей редакцией А.А.Самарского, В.И. Добренькова, А.П. Михайлова. М.: МАКС Пресс, 2003.

   13. Современные проблемы кибернетики (прикладная статистика). / Под ред. А.И.Орлова. М.: Знание, 1981.

   14. Орлов А.И. О перестройке статистической науки и её применений. / Вестник статистики. 1990. No. 1. С.65 - 71.

   15. Тутубалин В.Н. Границы применимости (вероятностно-статистические методы и их возможности). М.: Знание, 1977.

   16. Орлов А.И. Статистика объектов нечисловой природы и обработка социологических данных. - В сб.: Математические методы в социологическом исследовании. М.: Наука, 1981. С.67-75.

   17. Орлов А.И. Статистика объектов нечисловой природы и экспертные оценки. - В сб.: Экспертные оценки. Вопросы кибернетики. Вып.58. М.: Научный Совет АН СССР по комплексной проблеме "Кибернетика", 1979. С.17-33.

   18. Анализ нечисловой информации в социологических исследованиях. / Под ред. В.Г. Андреенкова, А.И.Орлова, Ю.Н. Толстовой. М.: Наука, 1985.

   19. Орлов А.И., Нечаева Е.Г., Соколов А.В. Статистика объектов нечисловой природы и анализ данных о научном потенциале. / Социология: методология, методы, математические модели. 1995. No. 5-6. С.118-136.

   20. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. М.: Наука, 1965 (1-е изд.), 1968 (2-е изд.), 1983 (3-е изд.).

   21. Тюрин Ю.Н., Шмерлинг Д.С. Непараметрические методы статистики / Социология: методология, методы, математические модели. 2004. No. 18. С.154-166.

   22. Орлов А.И. Заметки по теории классификации. / Социология: методология, методы, математические модели. 1991. No. 2. С.28-50.

   23. Бессокирная Г.П. Дискриминантный анализ для отбора информативных переменных. / Социология: методология, методы, математические модели. 2003. No. 16. С.25-35.

   24. Панде П., Холп Л. Что такое "Шесть сигм"? Революционный метод управления качеством / Пер. с англ. М.: Альпина Бизнес Букс, 2004.

   25. Толстова Ю.Н. Математические методы в социологии. / Социология в России. Под ред. В.А. Ядова. - 2-е изд., перераб. и дополн. - М.: Издательство Института социологии РАН, 1998. С.83-89, 98-103.

   26. Краскал Дж. Взаимосвязь между многомерным шкалированием и кластер-анализом // Классификация и кластер. М.: Мир, 1980. С.20-41.

   27. Kruskal J.B., Wish M. Multidimensional scaling // Sage University paper series: Qualitative applications in the social sciences. 1978. No.11.

   28. Харман Г. Современный факторный анализ. М.: Статистика, 1972.

   29. Терехина А.Ю. Анализ данных методами многомерного шкалирования. М.: Наука, 1986.

   30. Перекрест В.Т. Нелинейный типологический анализ социально-экономической информации: Математические и вычислительные методы. Л.: Наука, 1983.

   31. Тюрин Ю.Н., Литвак Б.Г., Орлов А.И., Сатаров Г.А., Шмерлинг Д.С. Анализ нечисловой информации. М.: Научный Совет АН СССР по комплексной проблеме "Кибернетика", 1981.

   32. Орлов А.И. Общий взгляд на статистику объектов нечисловой природы. - В сб.: Анализ нечисловой информации в социологических исследованиях. - М.: Наука, 1985. С.58-92.

А.И.Орлов

*   *   *   *   *   *   *

   На сайте "Высокие статистические технологии", расположенном по адресу http://orlovs.pp.ru, представлены:

   На сайте работает форум, в котором вы можете задать вопросы профессору А.И.Орлову и получить на них ответ.

   Заходите - вас будут рады видеть!

*   *   *   *   *   *   *

   Предыдущую версию сайта "Высокие статистические технологии" вы можете найти по адресу www.newtech.ru/~orlov. Для доступа к этой версии сайта вы можете воспользоваться бесплатным демо-доступом компании NewTech. Телефоны: (095)234-94-49, (095)956-37-46. Login: imt или demo. Password: test, Primary DNS: 212.16.0.1, Secondary DNS: 193.232.112.1. Вход под этим логином бесплатный, сеанс связи неограничен. Если Вам отказывают в авторизации, то просто повторите дозвон позже.

   На сайте http://karamurza.chat.ru представлена книга видного современного философа и политолога С.Г.Кара-Мурзы "Опять вопросы вождям", которая является глубоким научным исследованием проблем западного и российского общества. Книга предназначена всем интересующимся политологическими и социологическими проблемами.

*   *   *   *   *   *   *

Веселый подвальчик

   Лас Вегас. Казино "Луксор". Мохнатое чучело верблюда в натуральную величину. Мотает головой и клацает зубами. Табличка на русском: "ВЕРБЛЮДА НЕ КОРМИТЬ!"

   Один мой приятель работает инженером в Мосэнерго. Толковый малый, шарит во всяких там проводках, лампочках, рубильниках. Короче, перспективный. И вот послало его начальство в РАО "ЕЭС" на учебу - повышать уровень, чтобы поставить потом на ответственный участок. Ему в принципе учиться не надо - он и так все знает, но инструкция обязывает. В общем, послали (недалеко). Приехал, а там мужики из РАО - с мобилами, лаптопами, все в костюмах. Крутые как горы в Тибете. Ладно, начали слушать лекцию. Лектор, заумный такой профессор, вещает про закон Ома, напряжение, проводимость и прочую чушь. После часа замечает, что народу стало откровенно скучно, и решив это дело прекратить, спросив у присутствующих: "У кого есть вопросы?" Тут встает один из крутых, и говорит: "Вот я еду по дороге, и на столбах висит три провода, а приезжаю домой - у меня в розетке только два. Я не понял, нас что, кидают что ли?" Профессор от неожиданности надолго замолчал, вероятно обдумывая ответ. Если сейчас объяснять про резервные фазы, распределение мощности и прочее, то этот кадр может не так понять, а именно что его держат за лоха. И тогда профессор выдавил из себя: "Одна - запасная". Тут зал грохнул. Вернее, та его часть, которая поняла изящество ответа.

   В питерском Доме природы во время одной выставки аквариумных рыбок около аквариумов висела табличка "РЫБ НЕ КОРМИТЬ!", где снизу фломастером кто-то приписал: "И ПИТЬ НЕ ДАВАТЬ!"

   Как-то утром знакомый подполковник поехал в командировку в Москву, а вечером, после завершения всяких командировочных дел, решил зайти к родственникам - благо все семейство жило в центре. Идет он по Мясницкой (тогда - Кировской), и вдруг слышит робкий голос: "Тооварищ подполковник, разрешите обратиться..." Оборачивается. Видит - молодой лейтенант. Ну обращайтесь, говорит. - Товарищ подполковник, извините, но у вас - конь! - Что?! Лейтенант, отчаянно: - У вас сзади конь, товарищ подполковник!!! Оказалось: добрые друзья прицепили сзади к кителю шахматного коня на веревочке. С этим конем он проехал час на электричке, пол-Москвы на метро, и целый день встречался со всякими важными военными. И хоть бы одна сволочь...

   Ехал как-то под вечер тракторист на "Беларуси" (это - трактор такой с огромными задними колёсами и маленькими передними) из одной деревни в другую по каким-то своим делам. И не доехал несколько буквально километров - заглох. А ехать надо. Хорошо, что рядом проходила крупная трасса (по-моему, это было Минское шоссе). Ну, тракторист на него вышел и поймал дальнобойщика, который любезно согласился несколько километров "Беларусь" на тросу отбуксировать. Подцепили, поехали. Тракторист - понятное дело - в кабине трактора. А дальнобойщики на особо дальние расстояния ездят вдвоём - один рулит, другой спит, потом наоборот и т.д. Так и этот водила после того, как "Беларусь" прицепил, увидел, что его время спать наступило, сменщика разбудил, за руль посадил, сам спать лёг, а про трактор в горячке забыл сказать. А второй водила даже не почувствовал, что состав тяжелее стал - фура-то гружёная была. Но только через час-другой он первого будит и спрашивает: "Слышь, - говорит - братишка, а с какой скоростью "Беларусь" может ехать?" Тот (первый) отвечает: "Ну, не знаю, может, километров 60 в час осилит". Второй: "Да вот - хрен. Я уже час меньше сотки не еду, а сзади нас "Беларусь" не отстаёт. Да ещё фарами сигналит - сейчас на обгон пойдёт!" Ну, что какой диалог между помятым трактористом и дальнобойщиками дальше был - можете себе представить, но на их предложение дотащить его назад он отказался. Вот.

   Рассказал знакомый, который работает в типографии. Остался в ночную смену его коллега - молодой паренек лет 25 печатать небольшые картонные таблички для городского завода. И видать ночью то ли задумался он о своих личных делах, то ли просто устал, но в итоге утром в коробке лежала партия 500 штук табличек с текстом: "Пел на попел не бросать!!!"

   Насколько все-таки изобретателен русский человек! Как бы вы дали рекламу о своем бизнесе по подделыванию документов? Ни одна газета объявление типа "Подделываем документы" не примет. Так вот, читайте и учитесь. Объявление в русскоязычной газете Нью-Йорка: "Переводим водительские права и дипломы. Оригинал не обязателен!" Восторг, да и только.

   Наш сосед решил сделать металлический забор. Сначала взял свою любимую матерчатую десятиметровую рулетку и померил длину участка. Уложилось ровно три раза. Три умножил на десять и получил тридцать метров. Решил сделать полутораметровые секции. Тридцать разделил на полтора - получилось 20 секций. Заказал, привез. Начал устанавливать - 2 секции лишние! Снова измерил - 30. Измерил каждую секцию - полтора метра. Мужик - как тот учитель географии, не нашедший на карте Берингова пролива - чуть умом не тронулся. Останавливал соседей и предлагал сначала умножить 3 на 10, потом 30 делить на полтора. Водил всех смотреть на лишние секции и смеялся странным смехом. В конце концов выяснилось, что его теща пролила краску на рулетку между шестым и седьмым метром и, чтобы не расстраивать любимого зятя, аккуратно вырезала один метр и сшила рулетку! Мужик пообещал из оставшихся двух секций ей могильную ограду сделать.

   Во время оно, когда в родной деревне еще работал завод стекольно-термометровой продукции, этой продукции у всего села было завались, даже дорога от завода вся блестела... И одним из наименований, выпускаемых этим предприятием, был термометр для ванны - ну, знаете, весь покрытый пластмассой, нетонущий и не очень бьющийся приборчик. Проградуированный, разумеется. В градусах. По Цельсию. От минус двадцати до плюс двадцати...

   Попросил знакомый (я тогда был снабженцем) 300 штук конденсаторов - понадобились они ему для чего-то. Ну, деньги не свои, списать - не проблема. Заказал. Только на исполнение корпуса не посмотрел. А зря. В обычном варианте его три сотни штук тянули на коробочку весом килограммов в пять. А эти оказались военные какие-то. И выяснилось это только когда я пришел с доверенностью получать их на почту (шли они откуда-то издалека). "Подгоняй,- говорят,- машину!" - "Какую машину? Тут же метро рядом, донесу." - "Ну-ну...". И пошли выдавать мне коробочки. Да, килограммов по пять. Но в каждой - по одному конденсатору. Блин... Хорошо, десятка в кармане была - нанял какой-то грузовичок, и отвез заказчику. А что уж он с ними делал - не знаю, после этого мы с ним крупно рассорились... Коллеги сказали, что мне еще повезло - в соседней конторе снабженец-радиолюбитель тоже нарыл где-то конденсатор изумительной для тех времен емкости, и опять же не посмотрел на габариты. Или миллиметры с метрами перепутал... В результате контора платила штраф за простой железнодорожной платформы, а к конденсатору, который в конце концов затащили на территорию, водили экскурсии студентов.

   Произошло это в банке. Недавно снаружи на здание поставили камеры наблюдения для охраны территории и посадили одного "security" записывать заежающие и выежающие на территорию машины. Поскольку камеры стоят высоко и не всегда удается записать номер машин, охранник решил проблему, записывая марку и цвет... Через месяц статистика записей охраны показала, что за месяц территорию банка посетили: 123 черных Мерседеса, 42 белых Мерседеса, 202 черных Волг, 12 белых Волг, 164 черных Жигули, 84 белых Жигули, 21 черных Нив, 1 белая Нива. Начальник охраны спокойно подписывался о приеме рапорта! Для тех, у кого интеллект не больше, чем у начальника охраны этого банка, поясняю: монитор наблюдения был черно-белым :))

Удачи вам и счастья!


http://subscribe.ru/
http://subscribe.ru/feedback/
Подписан адрес:
Код этой рассылки: science.humanity.econometrika
Отписаться

В избранное