Сегодня в выпуске - описание программы с которой все это будет происходить.
Ее нужно доделывать и переделывать, доводить до "товарного вида", размещать в файловых архивах, "раскручивать" и рекламировать и, в конце концов - продавать.
Программа называется "Wordstat" и предназначена для подсчета частот слов в тексте.
Для чего нужна программа
Всем, кто учит иностранный язык - узнать, какие слова нужно учить.
Это ее основное предназначение.
Точнее, надо говорить не "учить языки", а
тренировать иностранные языки по методу "ин/яз-спорт".
Что такое метод "ин/яз-спорт" можно узнать
в рассылке "Парное обучение", или немного подождать - подробности будут в одном из следующих выпусков "Чёрного ящика". Программа позволит
проанализировать словарный запас своего личного родного языка и определить ваше
"личное языковое ядро", в котором вам комфортно живется и с которым вам будет
так же приятно жить в среде любого другого языка.
Другое возможное применение: программа поможет Web-мастерам (всем, кто делает html-страницы) - подобрать слова для META-тагов
"Description" и "Keywords".
Размер: 180 Кб. Номер версии: 1.1.02 Язык
интерфейса: русский. Условия распространения этой версии: "как есть" (as is);
бесплатно (freeware). Стандартные оговорки: Вы можете использовать
программу Wordstat на свой страх и риск. Автор не несет ответственности за
последствия ее применения. Никакие претензии не принимаются.
Программа Wordstat защищена законами и международными соглашениями об авторском праве.
Подробности о работе с программой
Программа Wordstat для статистического анализа текстов позволяет подсчитать,
сколько раз то или иное слово встречается в выбранном тексте. Текст можно
взять либо из простого текстового файла (обычно с расширением .txt), либо
из файла гипертекста (обычно с расширением .htm или .html).
Допускаются такие кодировки: win1251, КОИ-8r, cp866 (dos). Эти кодировки
программа распознает автоматически. Прежде чем начать работу, проверьте,
правильно ли выбраны настройки подсчета. Затем выберите файл для обработки.
Внимание! обработка больших файлов может выполняться достаточно
долго.
Настройки программы.
Если Вам нужно выполнить статистический анализ
одного текста, то уберите отметку "Накапливать сумму результатов".
Если Вы хотите считать вместе похожие слова, которые имеют разные окончания
(т.е. отличаются числом, падежом, родом...), то установите отметку
"Объединять похожие слова". Внимание! используйте этот режим с
осторожностью - некоторые слова могут обрабатываться неверно! Если Вам не
нужны слова, которые встречаются в тексте только один раз, то установите отметку
"Считать только больше одного". Внимание! не используйте
последние две отметки при совместном анализе (суммировании) нескольких текстов.
Результаты работы программы.
Результаты подсчета сохраняются в отдельном
файле. Вы можете выбрать его имя (по умолчанию - wordstat.txt). Этот файл
сохраняется в том же каталоге, что и первый открываемый текст. Если в этом
каталоге уже был такой файл, и выбрано "накапливать сумму результатов",
то файл результатов будет перезаписан (и все, что было в нем до запуска
программы, будет стерто). Если же в этом каталоге есть файл
wordstat.txt, и "накапливать сумму результатов" не отмечено, то
программа автоматически выберет другой новый файл для записи результатов. Путь и
имя этого файла будут показаны. Результаты могут быть записаны построчно
(слово, пробел, число) или в две строки (в первой - слово, во второй - число).
Результаты могут быть отсортированы по алфавиту или по
частоте. Внимание! не изменяйте вид сортировки при совместном
анализе (суммировании) нескольких текстов.
Программа после окончания анализа текста может показать сводку результатов.
Программа может автоматически открыть для просмотра текстовый файл с
результатами. Дальнейшую обработку удобно выполнять в Microsoft Excel
(откройте Excel, выберите команду "открыть", укажите тип файлов: текст, в
мастере импорта текстов выберите разделитель: пробел).
Особенности совместного анализе нескольких текстов.
Если Ваши тексты
находятся в нескольких файлах, то можно получить общую статистику по выбранным
файлам. Для этого запустите программу. Установите отметку "Накапливать сумму
результатов", снимите отметки "Объединять похожие слова" и
"Считать только больше одного". Открывайте файлы по очереди. Не
изменяйте вид сортировки. Внимание! изменения, внесенные в файл
результатов вручную, не будут учитываться!
Если Вы нашли, что в какой-то ситуации программа неверно выполнила подсчеты,
то сообщите об этом (направьте по e-mail исходный файл и файл с
результатами, укажите использованные настройки и опишите, что именно программа
делает неверно). Пожалуйста, напишите свои пожелания: что в программе можно
улучшить и усовершенствовать. Пожалуйста, напишите с каким успехом Вы
использовали результаты, полученные с помощью программы. Где еще, кроме изучения
иностранных языков, может пригодится статистический анализ текстов?
История изменений
Версия 1.1 от 14.09.01 [+] Добавлена возможность накапливать сумму
результатов по нескольким файлам [+] Программа может показывать сводку
результатов. [+] Программа может автоматически открывать файл результатов.
[+] Добавлена краткая справка (кнопка "Помощь"). [+] Добавлена
возможность выбора имени файла результатов. [-] Исправлена ошибка,
приводившая к удалению из списка результатов редких терминов при объединении
похожих. [*] Устранена возможность предварительного редактирования списка
результатов.
Версии 1.0: сентябрь 2001 - первая версия программы.
Это была основная информация о программе, почти в таком виде она была размещена на одном сайте в сети. Есть еще два коротких текста, которые я помещу в одном из следующих выпусков.
Хроника текущих событий
Я получил доступ к SW-RUS - к списку рассылки отечественных разработчиков shareware.
Узнал, что в конце сентября в Москве будет конференция ISDEF'2002.
ISDEF - это "Ассоциация Независимых Разработчиков Программного Обеспечения". Очень интересно было бы там поучаствовать. Вот только проблема - денег я на шароварении еще не заработал. Успею ли до конца сентября? Посмотрим!
Ведущий проекта - Алексей.
Если есть что сказать по программе, пишите сюда: blackbox@mailru.com Все, что вы напишете, может быть использовано для вас в рассылке.
Если вы против публикации своего письма, укажите тему письма "секретно" или "не публиковать".