← Ноябрь 2004 →
1 01.11.2004 10:22:58 17:09:03 21:47:04	2 02.11.2004 02:39:08 02:39:50 08:19:28 09:36:01 10:01:45 18:05:19 20:18:30 22:42:49 22:43:01 23:14:37 23:14:47	3 03.11.2004 17:32:13 17:33:44	4	5	6	7
8 08.11.2004 01:28:36 19:47:52	9	10 10.11.2004 11:45:59 11:47:08 16:46:48 16:58:32 18:13:31 18:19:10 22:35:10 23:03:30	11 11.11.2004 11:21:49 11:41:50 14:55:01 21:26:10	12 12.11.2004 07:06:24 08:20:27 14:19:15 14:20:26 15:22:35 15:29:22 23:12:52 23:48:17	13 13.11.2004 04:40:42 09:17:33 09:26:21 12:34:35	14
15 15.11.2004 08:14:16 13:28:24 13:49:22 15:48:22 15:52:39 21:52:36 22:59:09	16 16.11.2004 08:49:32 10:44:37 11:16:12 11:32:00 11:45:56 12:53:11 13:07:37 17:26:44	17 17.11.2004 00:09:00 00:45:47 14:51:24 18:06:39	18 18.11.2004 11:02:02 15:48:01 16:17:26	19 19.11.2004 02:31:08 08:17:13	20	21
22 22.11.2004 08:53:45 12:45:51	23	24 24.11.2004 06:17:17 10:11:48 10:13:01 15:40:48 15:46:11 16:34:10 19:21:26	25 25.11.2004 10:29:59 10:35:43 18:00:15 22:33:59 22:34:08	26 26.11.2004 04:40:03 05:00:05 08:18:53 11:21:57 12:39:33 14:22:08 16:23:23 17:47:38 17:50:45 20:00:24 20:50:43	27	28
29 29.11.2004 08:35:51 08:39:42 09:09:56 09:35:57 09:36:57 09:54:36 09:55:53 09:58:30 11:41:14 12:15:13 12:15:26 13:03:32 16:02:04 16:10:20	30 30.11.2004 11:04:43 22:49:29

← Ноябрь 2004 →

01.11.2004
10:22:58
17:09:03
21:47:04

02.11.2004
02:39:08
02:39:50
08:19:28
09:36:01
10:01:45
18:05:19
20:18:30
22:42:49
22:43:01
23:14:37
23:14:47

03.11.2004
17:32:13
17:33:44

08.11.2004
01:28:36
19:47:52

10.11.2004
11:45:59
11:47:08
16:46:48
16:58:32
18:13:31
18:19:10
22:35:10
23:03:30

11.11.2004
11:21:49
11:41:50
14:55:01
21:26:10

12.11.2004
07:06:24
08:20:27
14:19:15
14:20:26
15:22:35
15:29:22
23:12:52
23:48:17

13.11.2004
04:40:42
09:17:33
09:26:21
12:34:35

15.11.2004
08:14:16
13:28:24
13:49:22
15:48:22
15:52:39
21:52:36
22:59:09

16.11.2004
08:49:32
10:44:37
11:16:12
11:32:00
11:45:56
12:53:11
13:07:37
17:26:44

17.11.2004
00:09:00
00:45:47
14:51:24
18:06:39

18.11.2004
11:02:02
15:48:01
16:17:26

19.11.2004
02:31:08
08:17:13

22.11.2004
08:53:45
12:45:51

24.11.2004
06:17:17
10:11:48
10:13:01
15:40:48
15:46:11
16:34:10
19:21:26

25.11.2004
10:29:59
10:35:43
18:00:15
22:33:59
22:34:08

26.11.2004
04:40:03
05:00:05
08:18:53
11:21:57
12:39:33
14:22:08
16:23:23
17:47:38
17:50:45
20:00:24
20:50:43

29.11.2004
08:35:51
08:39:42
09:09:56
09:35:57
09:36:57
09:54:36
09:55:53
09:58:30
11:41:14
12:15:13
12:15:26
13:03:32
16:02:04
16:10:20

30.11.2004
11:04:43
22:49:29

Бешеной собаке 7 миль - не крюк, или как я привёл ссылки в lindocs к Правильному виду.

Бешеной собаке 7 миль - не крюк, или как я привёл ссылки в lindocs к Правильному
виду.

Колотову Александру в честь его дня рождения посвящается.
С днём рождения, Саня! :)

Некоторое время назад, на одной из линуксовок мы обсуждали проект
lindocs - замечательная подборка документации в котрой можно
найти очень много полезного. Однако, вероятно, часть документации
была собрана по Win* системой или перенесена оттуда, поэтому
при работе по *nix системами не работала часть ссылок из-за
несоответсвия регистра имён файлов.

Одним из самых простых и удобных решений было, хранить lindocs
на fat системе, для которой регистр в котором написано имя
глубоко безразличен и тогда все ссылки работают нормально.

Собственно именно этот способ я и использовал до того как
нашёл ещё одно "решение", о котором и хочу рассказать.

Недавно я решил провести эксперимент, на предмет обнаружения
"лишних" файлов, т.е. файлов которые лежат в lindocs, но на
которые, по тем или иным причинам нет ссылок с html страниц.

Для этого я... написал скрипт? Хм, конечно хорошо, но уж больно
лень. :) Да и хочется чего то такого... Unix Way-ного.
Что у нас тут на машине... ага, apache завалялся, для
экспериментов на подопытных браузерах...
Вот ему и придётся работать, ему и ещё... wget
Что может быть лучше! ...и неэкономнее :)
Собственно - за дело. Делаем в каталоге апача ссылку на
lindocs (они, как Вы, наверно, помните лежат на fat):
%ln -s /mnt/doc/lindocs/ lindocs

и командуем whet-у:
%wget -c -T 5 -o log -k -r http://inode/lindocs/

Строку, я, так и быть объяснять не буду, для того чтобы не
занимать место, и дать Вам, при необходимости, возможость
самостоятельно почитать документацию, что (по моим личным
наблюдениям) всегда полезнее :).

[ После нескольких часов работы... ]

Результаты:

Размер файлов:

%du -cd 1
842M ./inode
306K ./inode.bytesoft.hvn
856M .
856M total

(При стартовых)
%du -cd 1
1.2G total

Количество файлов:

%find ./ >../lindocs.before
%wc -l ../lindocs.before
65138 lindocs.before

(Аналогично для результирующего каталога)
%wc -l ../lindocs.after
36868 lindocs.after

Разница чувствуется? :)

Значит не зря, всё таки. Хм, а поконкретнее, кто, где, куда пропал?

%cat ../lindocs.before > lindocs.test; cat ../lindocs.after >>lindocs.test
%sort -f lindocs.test | uniq -i -u > result.log
%wc -l result.log
30138 result.log

(учитываются файлы которые отсутствуют в одном из каталогов,
поэтому число немного отличается от логически ожидаемой разности,
ведь wget тоже создал "пару" дополнительных файлов)

Что то потерялось?
Да. В частности, выяснилось, что очень много места занимают,
и нигде не упоминаются man pages к ASPLinux, хотя представлены
они в html, и часть howto тоже с ASPLinux Documentation CD.
Также были и другие файлы список которых слишком длинен,
чтобы приводить его здесь, но они занимали на порядок меньше чем
man-pages.

А чуть позже я обнаружил ещё один положительный эффект этого
"эксперимента" - wget создавал каталоги и файлы так, как
на них ссылались (хотя трудно было ожидать от него другого ;))
и в результате все ссылки стали работать!

p.s. Вот такой "ленивый" способ разрешить проблему с регистрами в
подборках гипертекстовых документов, который к тому же может,
иногда, сэкономить Вам место на диске.

p.p.s. Конечно, всё это можно было сделать гораздо более эффективнее, но
всегда есть более одного способа сделать это :)

(There is more than one way to do it.)

04/11/24
Author:Stan S. Krupderov mailto:pashelper[AT]mail.ru

Ответить

Круподёров Станислав

Thu, 25 Nov 2004 22:29:05 +0300 (#270412)

Ответы:

засунь это в wiki...

есть в твоей реализации пара глюков: какие гарантии что материал не
потерялся? допустим, я ошибся и ссылку не него поставил, а на соседа...
или пришла ко мне документация: главная страничка с ссылками на
подстранички - я посмотрел тему на главной страничке - поставил в
индексный файл, а работосопособность ссылок не проверил - а они битые -
и у тебя таким образом не скачаются. Вывод надо проверить все ссылки...

Аналогично, с man страницами...

С путями - я однажды тоже думал так подправить, но руки не дошли -
значит ты первый...

Ответить

Kolotov Alexandr

Fri, 26 Nov 2004 16:20:53 +0300 (#270821)

Friday, November 26, 2004, 4:20:53 PM, Kolotov Aleksandr wrote:

› показать цитату

Собственно это и было основной целью... найти "потеряный" материал.
Потому что если он потерян, то конечному пользователю с браузером
от него толку мало будет... только место занимает.
Когда доведу идею до ума - закину на сайт (в wiki :)).

› показать цитату

Там не только man. Полный список файлов если надо перешлю тебе.
В несжатом виде Кб 500 ссылок.

Ответить

Круподёров Станислав

Fri, 26 Nov 2004 19:29:03 +0300 (#270941)

› показать цитату

давай - в архиве, конечно...

Ответить

Kolotov Alexandr

Mon, 29 Nov 2004 08:38:19 +0300 (#271905)

› показать цитату

ну это смотря какому пользователю - если ему очень надо, то в, принципе,
он смог бы и руками попробовать найти этот материал в сборнике, т.к.
ссылка на него все же мной была добавлена в список...

Ответить

Kolotov Alexandr

Mon, 29 Nov 2004 09:56:47 +0300 (#271940)

← Ноябрь 2004 →
1 01.11.2004 10:22:58 17:09:03 21:47:04	2 02.11.2004 02:39:08 02:39:50 08:19:28 09:36:01 10:01:45 18:05:19 20:18:30 22:42:49 22:43:01 23:14:37 23:14:47	3 03.11.2004 17:32:13 17:33:44	4	5	6	7
8 08.11.2004 01:28:36 19:47:52	9	10 10.11.2004 11:45:59 11:47:08 16:46:48 16:58:32 18:13:31 18:19:10 22:35:10 23:03:30	11 11.11.2004 11:21:49 11:41:50 14:55:01 21:26:10	12 12.11.2004 07:06:24 08:20:27 14:19:15 14:20:26 15:22:35 15:29:22 23:12:52 23:48:17	13 13.11.2004 04:40:42 09:17:33 09:26:21 12:34:35	14
15 15.11.2004 08:14:16 13:28:24 13:49:22 15:48:22 15:52:39 21:52:36 22:59:09	16 16.11.2004 08:49:32 10:44:37 11:16:12 11:32:00 11:45:56 12:53:11 13:07:37 17:26:44	17 17.11.2004 00:09:00 00:45:47 14:51:24 18:06:39	18 18.11.2004 11:02:02 15:48:01 16:17:26	19 19.11.2004 02:31:08 08:17:13	20	21
22 22.11.2004 08:53:45 12:45:51	23	24 24.11.2004 06:17:17 10:11:48 10:13:01 15:40:48 15:46:11 16:34:10 19:21:26	25 25.11.2004 10:29:59 10:35:43 18:00:15 22:33:59 22:34:08	26 26.11.2004 04:40:03 05:00:05 08:18:53 11:21:57 12:39:33 14:22:08 16:23:23 17:47:38 17:50:45 20:00:24 20:50:43	27	28
29 29.11.2004 08:35:51 08:39:42 09:09:56 09:35:57 09:36:57 09:54:36 09:55:53 09:58:30 11:41:14 12:15:13 12:15:26 13:03:32 16:02:04 16:10:20	30 30.11.2004 11:04:43 22:49:29

KirovLUG: пользователи Linux в Вятке

Статистика

Бешеной собаке 7 миль - не крюк, или как я привёл ссылки в lindocs к Правильному виду.

Ответы: