как здорово, Стас, что ты объявился... Как у тебя дела?
> База ссылок?
да...
> А как быть с контентом который тоже давно уже требует
> приведения его к нормальному виду... (например, преобразовал
> пару книг по Perl из lindocs, к виду удобному для представления
> в единой базе: единая таблица стилей + одна кодировка + удаление
> баннеров и скриптов - в результате некоторые из них уменьшились
> на 60%).
>
> Предлагаю изменить формат хранения данных полностью, т.е. номинально
> это будет тот же html, пусть даже в едином стиле оформления,
> без скриптов банеров и прочих "обломков дизайна" и т.д.
> НО, каждая книга будет в отдельной директории и в той
> же директории будет храниться xml файл с описанием книги/статьи,
> а скрипты будут уже потом всё это собирать в единое целое...
> Статьи, поскольку их много, можно наверно размещать, при
> необходимости, в одном каталоге, но тогда и описание их будет
> в одном файле.
>
> Плюсы - единая система хранения данных и их описания,
> можно делать "срезы" базы при необходимости (т.е. например,
> запустив скрипт можно из базы получить локальную выборку
> на интересующую тему, или по автору, (см. далее категории статей) и
> скопировать из базы только то, что действительно нужно), простота
> преобразования такого представления к уже привычному - тому которое
> предлагаешь ты.
Ну если этим кто-то займется, то я не против - мне просто некогда и этим
тоже заниматься...
> Статьи делятся на категории с помощью указания ключевых слов, авторов, даты
> публикации, а также такой малоконкретной категории, как "практичность" - она
> определяет, несёт ли эта статья достаточно большую информационную нагрузку
или
> является "руководством к действию" и для глубокого понимания может потребовать
> чтения дополнительной литературы. В этой категории я предпологаю три варианта
> theory - теория, article - статья, может включать в себя описание действий
+
> их поясдение, и recept - конечный алгоритм действий ("рецепт"), практически
> без пояснений (такими могут быть файлы конфигурации и т.п.).
очень сложная система для оценки... хотя что-то подобное было бы очень
полезно... Я было подумал ставить ценность/информативность по
10(5)-бальной шкале, но понял что это субъективно, и лучше оценивать
несколько мнений - это сложно для offline проекта... Надо над этим еще
думать...
>>>5. Вопрос: Нужно ли оставлять пустые parent или их можно совсем не указывать?
>
> parent будут определять уровень вложенности?
> А может обойтись без такой строгой иерархии и делать просто выборки
> по ключевым словам? Или конечное представление на машине пользователя
> так и останется статичным html-ем?
если будет написанный клиент - то именно это он и будет делать... но
всегда нужно иметь возможность html-го представления - здесь-то и нужна
иерархия - для облегчения поиска...
>>>2. Написать скрипт формирующий html-файлы из XML.
>
> Наверное, это будет не скрипт а XSLT преобразование, которое,
> уже в свою очередь можно выполнять вручныю/скриптом/...
согласен, я тоже предусматривал такое, но я плохо знаю возможности XSLT
преобразования (хотя и стараюсь пополнить свой запас знаний по этому
вопросу), поэтому не стал затрагивать пока эту тему...
>>>Написать кроссплатформенное (Perl? Python? Java?) приложение для работы
>>>с базой ссылок проекта lindocs
>
> GUI нужен будет? А какой у нас GUI кроссплатформенный? GTK, но его вряд
> ли будешь под Win* ставить и Java Swing, для использования которого
> нужна JVM. Остаётся ещё, конечно Web-интрефейс, но у него тоже свои
> требования.
GUI будет нужен... Можно что GTK (можно пихать на диск с архивом
док-ии), что Swing (JVM поставить - не такая большая проблема для
участников проекта)... Если человек является просто читателем доки, то
может использовать просто html-страницы для навигации... На крайний
случай XML - обычный текстовый файл - можно поправить руками...