Генерация синтаксиса SPSS по кодировочным таблицам
Сегодня я хочу обратить ваше внимание на вопросы автоматизации
составления и описания файлов данных SPSS. Тот, кто работает с разного рода
обследованиями и опросами, наверняка сталкивался с задачей приведения в соответствие
файла данных статистической программы форме вопросника. Основная масса рутинной
работы на этом этапе связана с именованием переменных, приписыванием меток переменных
и значений с тем, чтобы упростить последующие этапы проверки данных и их анализа.
Часто метки переменных и значений вовсе не присваиваются, но, на мой взгляд,
надёжнее, если переменная v123 имеет метку "Пол респондента", а её
значения 1 и 2 именованы как "мужской" и "женский". Если
слишком длинные метки загромождают выдачу, в крайнем случае, их можно отключить.
Кто-то освоил и эффективно пользуется, скажем, SPSS Data Entry
с возможностью параллельного построения формы вопросника и файла данных, а также
заданием правил, обеспечивающих уже на этапе ввода контроль формата и упрощающих
переходы по анкете. У кого-то есть другие инструменты, включая собственный набор
утилит, коллекции синтаксиса и скриптов, обеспечивающие "отображение"
бланка вопросника в файл данных.
В одном из следующих выпусков я рассчитываю поделиться небольшим
макросом для Microsoft Word, который сильно помогает мне при переводе анкет,
разработанных в этом текстовом редакторе, в файл данных SPSS. В этом же выпуске
я представлю интересную разработку Vijay Gupta, который, в свою очередь, указал
на неё в списке рассылки SPSSX-L.
Это файл Microsoft Word (z_spss_tools.doc) с сохранённым в нём
набором макросов на VBA, решающих ряд распространённых задач по описанию файла
данных. В частности, макросы упрощают приписывание меток переменным, а также
меток значений, в том числе, для нескольких переменных одновременно. Эта утилита
предполагает, что у пользователя имеется готовая кодировочная таблица (перечни
переменных, их меток, а также меток их значений, отформатированные именно как
таблицы Microsoft Word) без всякой лишней информации (постороннего текста).
Таблицу следует открыть в отдельном файле. Затем, при условии, что одновременное
на компьютере пользователя открыты 2 файла: указанная утилита и файл Word с
кодировочной таблицей, нажатие на гиперссылку в файле z_spss_tools.doc преобразует
таблицу из второго файла в синтаксис SPSS, который может быть вставлен в редактор
синтаксиса и исполнен. В ходе выполнения сгенерированного синтаксиса в файл
данных SPSS прописываются метки переменных и их значений.
Кроме этих возможностей, утилита z_spss_tools.doc упрощает операции
по перекодировке значений переменных, а также осуществляет некоторые операции
по форматированию текста (преобразование текста в таблицу). Последнее имеет
лишь косвенное отношение к SPSS.
Подробное описание работы этой утилиты содержится непосредственно
в её файле (на английском языке). Там же даны примеры кодировочных таблиц, которые
адекватно могут быть разобраны макросами. Для меня лично утилита не оказалась
очень полезной, поскольку в моей практике редко встречаются аккуратно оформленные
кодировочные таблицы. Обычно приходится работать с бланком анкеты из Microsoft
Word, который может быть отформатирован самым непредсказуемым образом. Тем не
менее, чей-то труд эта утилита действительно сможет сделать менее рутинным,
а кто-то, возможно, увидит в ней идеи, которые можно адаптировать под свои задачи.
Хочу сказать, что тем подписчикам, которые захотят поделиться
своими разработками по данной теме, место в рассылке будет предоставлено.
Адрес сайта разработчика: http://www.vgupta.com.
Согласно содержимому страницы, кстати, тут же можно запросить и пересылку электронных
пособий по статистике для начинающих.
Ссылка на файл с утилитой: http://www.vgupta.com/z_spss_tools.zip.
У меня, однако же, возникли трудности с загрузкой данного файла (грузилось процентов
20-30, а затем загрузка начиналась сначала), поэтому я попросил автора прислать
его мне по почте. На момент выхода рассылки проблема не была устранена, поэтому
на всякий случай, я временно выложу архив тут.
Он будет доступен в течение недели, чтобы заинтересованные подписчики смогли
получить его, после чего будет удалён.
Макросы, которые используются в этом файле, защищены паролем;
я их не видел, поэтому за надёжность и безопасность их работы ручаться не могу,
однако же, испытывал программу в действии без видимых негативных последствий.