Re: зеркалирование citforum
Konnichiwa, Kanogin A.A., вы писали:
>Здравствуйте Pavel.
>
>Вы писали 19 апреля 2006 г., 0:03:52:
>
>PS> Konbanwa, Kanogin A.A., вы писали:
>
>
>
>>>Здравствуйте Pavel.
>>>
>>>Вы писали 18 апреля 2006 г., 20:50:42:
>>>PS> Там из последнего только citforum за восресенье, остальное так и тянется
>>>Вопрос, как и в каком виде снимаете зеркало с citforum ?
>>>сам инетерсуюсь, т.к. сам зеркалирую:
>>>http://www.opensoft.nnov.ru/?q=node/152
>>>
>>>
>>>
>PS> Встречный вопрос - chm вы под оффтопиком собираете?
>увы да :(
>
>
>
/me время от времени вспоминает о
http://htmlhelp.berlios.de/howto/mshh4wine.php и ругается, что не
работает... А больше ничего не нашел :(
>Как делаю я:
>[skip]
>
>
У меня что-то подобное выйдет (чтоб сам потом вспомнил):
1. Зеркалю citforum на локальную машину (она же сервер c Apache'м на
борту) по http://citforum.ru/mirror.shtml, у вас что-то подобное должно
вертеться на citforum.nis.nnov.su:
$ rsync -aPz rsync.citforum.ru::citforum/ /mnt/Text/citforum/
2. Отлючаю вставку банеров и счетчиков подменой 'ssi/bottom.html',
'ssi/top_style.html' на свои (главное копирайты не потерять :\). (F3 ->
no_banners)
2a. Как вариант, злобно подсовывать в url'ы no_banners, no_columns,
no_rights (в ssi citforum'a проверяется их наличие в $QUERY_STRING) ,
сравни http://citforum/internet/webd/article_11.shtml и
http://citforum/internet/webd/article_11.shtml?no_columns+no_banners, но
тут, похоже, без прокси никак :(
3. Делаю зеркало wget'ом - чтобы в страницы подставились директивы SSI:
$ wget -Y off -m -k -nc citforum -P /tmp/citforum/
4. Пакуем и радуемся жизни.
$ cd /tmp/citforum/
$ tar -cjf /tmp/citforum_mirror_html.tar.bz2 --remove-files ./
Затраты места:
$ du -sh /mnt/Text/citforum/ /tmp/citforum /tmp/citforum_mirror_html.tar.bz2
588M /mnt/Text/citforum/
855M /tmp/citforum/
316M /tmp/citforum_mirror_html.tar.bz2
> 3. Собираю непосредственно chm и зиплю... типа для последующей
> локальной распаковки...
> htm2chm 3.0.6 ( http://yarix.by.ru/ )
Ну хоть содержание-то (*.hhc) генерируете?
>чем под линукс можно баннеры убрать?
>
perl? ;)
Для prox'ей есть фильтры: или их приспособить или просто регулярки
оттуда достать... :\ Вроде, squidGuard что-то подобное может, не тестил...
На citkit'e искать пока лень...