Отправляет email-рассылки с помощью сервиса Sendsay
  Все выпуски  

Статистика в SPSS: за пределами кнопочного интерфейса. Выпуск 66


В рассылке используются материалы веб-сайта www.spsstools.ru

11.03.2008 (66)

Содержание выпуска

Новое на сайте www.spsstools.ru

 

Здравствуйте, уважаемые подписчики!

 

Новое на сайте www.spsstools.ru

Добавлен раздел "Работа с пропущенными значениями", который содержит 14 примеров. Большая часть программ касается различных способов замены пропущенных значений ("миссингов", missings) при различных условиях. Наиболее частый способ: замена средним значением по переменной. Как вариант - средним значением по наблюдению, если рассматриваемая группа переменных является унифицированной шкалой, измеряющей одну и ту же интегральную характеристику. В последнем случае среднее значение по соседним переменным из той же шкалы - более "адекватная" замена пропуску, чем среднее по самой переменной. Рассмотрены варианты замены медианой , а также - случайным значением из той же переменной (т.н. hot deck-метод восстановления пропусков, не влияющий на форму распределения (в отличие от замены статистиками центральной тенденции)).

Иногда наличие пропуска не означает, что данные действительно неизвестны. Например, при ручной набивке повторяющиеся от наблюдения к наблюдению значения могут пропускаться. В этом случае их можно восстановить просто копируя значения из предыдущих наблюдений. А в некоторых случаях подобный же вариант замены будет оправдан при восстановлении реальных пропусков в динамических рядах.

При замене пропусков может быть необходимо соблюдение дополнительных условий: значения "третьих" переменных, доля пропусков в общем числе наблюдений, учет подгруппы (страты), к которой относятся наблюдения, имеющие пропуски.

Добавленный раздел содержит примеры указанных ситуаций.

Кроме того, есть ряд примеров синтаксиса иного назначения, кроме как замена пропусков. С помощью одного из них можно удалить из набора данных "пустые" переменные (не имеющие других значений, кроме пропусков или пустых строк). Другой определит, к какому типу относятся имеющиеся пропуски: системное пропущенное значение или определенное пользователем. Третий сформирует сводку по пропущенным значениям, которая облегчит ручную обработку отсутствующих данных: в таблице будет указано, в каком наблюдении и в какой переменной недостаёт данных. Обсуждается особенность работы конструкции DO IF - ELSE - END IF с пропусками в логических условиях. Наконец, показано, как можно "создать" системное пропущенное значение с помощью системной переменной $SYSMIS.

 

© См. www.spsstools.ru, 2005-2008


В избранное