Доброго времени суток, Kolotov
Thursday, November 11, 2004, 2:55:44 PM, you wrote:
KA> В Базе Знаний на сервере добавлен материал относительно продолжения
KA> развития проекта lindocs. Читайте. Высказывайте свое мнение.
KA> Присоединяйтесь к проекту.
>> База будет представлять из себя один XML файл.
База ссылок? А как быть с контентом который тоже давно уже требует
приведения его к нормальному виду... (например, преобразовал
пару книг по Perl из lindocs, к виду удобному для представления
в единой базе: единая таблица стилей + одна кодировка + удаление
баннеров и скриптов - в результате некоторые из них уменьшились
на 60%).
Предлагаю изенить формат хранения данных полностью, т.е. номинально
это будет тот же html, пусть даже в едином стиле оформления,
без скриптов банеров и прочих "обломков дизайна" и т.д.
НО, каждая книга будет в отдельной директории и в той
же директории будет храниться xml файл с описанием книги/статьи,
а скрипты будут уже потом всё это собирать в единое целое...
Статьи, поскольку их много, можно наверно размещать, при
необходимости, в одном каталоге, но тогда и описание их будет
в одном файле.
Плюсы - единая система хранения данных и их описания,
можно делать "срезы" базы при необходимости (т.е. например,
запустив скрипт можно из базы получить локальную выборку
на интересующую тему, или по автору, (см. далее ктаегории статей) и
скопировать из базы только то, что действительно нужно), простота
преобразования такого представления к уже привычному - тому которое
предлагаешь ты.
Статьи делятся на категории с помощью указания ключевых слов, авторов, даты
публикации, а также такой малоконкретной категории, как "практичность" - она
определяет, несёт ли эта статья достаточно большую информационную нагрузку или
является "руководством к действию" и для глубокого понимания может потребовать
чтения дополнительной литературы. В этой категории я предпологаю три варианта
theory - теория, article - статья, может включать в себя описание действий +
их поясдение, и recept - конечный алгоритм действий ("рецепт"), практически
без пояснений (такими могут быть файлы конфигурации и т.п.).
+ преобразование "контента", к нормальному виду, достаточно трудоёмко,
поэтому при желании можно разделить это на части...
я уже начал делать это с Perl документацией, так что, продолжу именно
с ним.
Вопросы/ответы:
>> 5. Вопрос: Нужно ли оставлять пустые parent или их можно совсем не указывать?
parent будут определять уровень вложенности?
А может обойтись без такой строгой иерархии и делать просто выборки
по ключевым словам? Или конечное представление на машине пользователя
так и останется статичным html-ем?
>> 10. Вопрос: Обязательно ли все время указывать normal или это значение может
>> быть по умолчанию?
Можно принять неопределённое значение за normal.
>> 15. Вопрос: Если автор не обнаружен, то оставлять author пустым или вообще
>> не указывать это поле.
Лучше оставлять пустым, или даже так и писать: <author>Неизвестен</author>
What do:
>> 2. Написать скрипт формирующий html-файлы из XML.
Наверное, это будет не скрипт а XSLT преобразование, которое,
уже в свою очередь можно выполнять вручныю/скриптом/...
>> Написать кроссплатформенное (Perl? Python? Java?) приложение для работы
>> с базой ссылок проекта lindocs
GUI нужен будет? А какой у нас GUI кроссплатформенный? GTK, но его вряд
ли будешь под Win* ставить и Java Swing, для использования которого
нужна JVM. Остаётся ещё, конечно Web-интрефейс, но у него тоже свои
требования.