wc-text на Python
Предлагаю создать альтернативный lindocs эскизный проект
для управления копированием и реструктуризацией текстовых
данных wc-text (на Python). В дальнейшем, если получится,
создать wc-image, wc-sound и wc-math (последний - для
абстрактных математических данных).
Преимущества реализации на Python:
- высокая скорость проектирования;
- большой набор библиотек для работы с сетью;
- возможность интеграции с Java - Jython;
- кроссплатформенность Windows/MacOS/Linux/UNIX;
- наличие интерфейса Tk, curses.
Недостатки:
- язык интерпретируемый, поэтому на больших
объемах данных работает медленно, но есть
возможность подключать модули на C/C++.
Для начала предлагается следующий нетипизированный
язык обмена мета-данными:
# FIELD # VALUE
* символ "#" выделен как нетерминальный,
для ввода терминального "#" использовать "##"
Пример:
# NUMB # 1
# AUTH # Румянцев Д., Монастырский Л.
# NAME # Путь программиста: Опыт созидания личности программиста
# CITY # Москва
# PUBL # Издательский дом "Инфра-М"
# DATE # 2000
# PAGE # 864
* Четырехсимвольный идентификатор выбран для лучшей читабельности.
На основе "сырых" данных программа должна построить два типа словарей:
- словарь используемых идентификаторов;
- словарь используемых значений каждого из них.
Словари предполагается хранить в том же самом формате, что и исходные данные.
Табличный формат позволяет обрабатывать данные стандартными
утилитами UNIX/Linux: wc, cut, awk, ...
-- pacify
-*Информационный канал Subscribe.Ru
Адрес подписки:
Написать в лист: mailto:comp.soft.linux.kirovlug-list@subscribe.ru
Отписать: mailto:comp.soft.linux.kirovlug--unsub@subscribe.ru
http://subscribe.ru/ mailto:ask@subscribe.ru