Обсуждения и споры о свободных системах и всём сопутствующем (comp.soft.linux.debate) : Рассылка : Subscribe.Ru

← Июнь 2004 →
	1	2	3	4	5 05.06.2004 16:23:58 18:06:45	6 06.06.2004 01:55:50 03:01:59 21:02:19 21:05:17
7 07.06.2004 02:21:26 03:17:03 07:28:06 22:01:39 22:03:13 22:03:49 22:04:39 22:09:23 23:08:13	8 08.06.2004 00:32:14 07:37:49 10:56:13 11:45:05	9 09.06.2004 19:59:44 20:16:40 20:49:07	10 10.06.2004 01:58:48 02:18:30 04:09:01 13:36:20 13:37:07 13:42:30	11	12	13 13.06.2004 01:19:29 18:03:40 18:03:51 22:27:23 22:27:57
14 14.06.2004 01:49:01 01:51:23 13:28:34 19:02:28 19:03:35 19:50:16 21:00:31 21:47:24	15 15.06.2004 17:53:54 22:19:05 23:08:02 23:08:17	16 16.06.2004 00:20:04 11:27:52 11:28:14 12:24:36 12:58:40 21:56:16 22:00:16	17 17.06.2004 21:25:50 22:02:26 22:45:07	18	19 19.06.2004 01:01:50 11:58:37 15:01:19 18:33:30 18:35:17 19:17:51	20 20.06.2004 12:27:23 12:28:31 16:12:05 23:39:29 23:50:55 23:52:31
21 21.06.2004 00:54:54 01:15:31 09:42:30 13:44:35 22:26:50	22 22.06.2004 19:42:34 20:09:47 22:02:42 22:29:54	23 23.06.2004 00:16:38 00:17:06	24 24.06.2004 20:55:38 23:32:14	25 25.06.2004 09:13:00 12:58:45 18:33:18	26 26.06.2004 01:08:25 09:12:22 14:05:56 14:44:44 20:58:18 20:58:51 20:59:05 21:02:27 21:33:53 22:43:08	27 27.06.2004 00:13:40 00:14:12 00:28:27 02:34:46 05:09:24 16:52:45 18:54:24 18:54:57
28 28.06.2004 00:17:40 01:12:54 02:04:31 10:22:54 17:21:32 17:24:35 20:32:26 20:33:39 20:34:49	29	30 30.06.2004 11:33:25 11:52:17 18:43:41

За 2004-06-20

Re: Фрагментация (с лёгким оффтопиком)

> P.S. Если не секрет, сколько же лет этому рекордсмену
> "Cheetah X15 36LP", который "в лучшие годы..."? Наверное, уже
> лет двадцать сему рекорду?
>
А это бестселлер от Сигейта на сегодняшний день.
Стоит около 280 американских рублей в Москве.
15000 оборотов в минуту
36 Гигабайт объёма
8 мегабайт кэша
Интерфейс uwSCSI-320(MB/s)

С учетом особенностей теплового режима в особо трудных случаях ставлю только
эти диски.
Там, где запросы к скорости дисковой подсистемы попроще, ставлю
десятитысячники разные, даже бэ.ушные...

-*Название листа "Обсуждения и споры о свободных системах и всём сопутствующем"
Написать в лист: comp.soft.linux.debate-list@subscribe.ru
Архив Листа - http://subscribe.ru/archive/comp.soft.linux.debate Поиск: http://www.google.com
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.debate/rules
Номер письма: 1315; Возраст листа: 241; Участников: 583
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.debate/msg/174148

-*Информационный канал Subscribe.Ru
Написать в лист: mailto:comp.soft.linux.debate-list@subscribe.ru
Отписать : mailto:comp.soft.linux.debate--unsub@subscribe.ru

http://subscribe.ru/ mailto:ask@subscribe.ru

"Igor Gavriluk"

2004-06-20 23:52:31 (#174148)

Re: Фрагментация (с лёгким оффтопиком)

> IG> У меня NTFS5 на "Cheetah X15 36LP" (это при 15Krpm и
> IG> uwSCSI-320!) усредненно давала порядка 65ГБ/с в лучшие годы...
>
> Да будет вам известно, что число 320 в названии интерфейса
> означает ни что иное, как максимальная скорость передачи
> данных в мегабайтах в секунду. Т.е. с такой предельной
> скоростью передаются данные из кэша винта в память. Чтение
> происходит ЗНАЧИТЕЛЬНО медленнее.
>
> Дальше письмо читать не стал.
>

Да опечатка там... Чего вы... 65 Мегабайт, конечно, в секунду...

-*Название листа "Обсуждения и споры о свободных системах и всём сопутствующем"
Написать в лист: comp.soft.linux.debate-list@subscribe.ru
Архив Листа - http://subscribe.ru/archive/comp.soft.linux.debate Поиск: http://www.google.com
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.debate/rules
Номер письма: 1314; Возраст листа: 241; Участников: 583
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.debate/msg/174146

http://subscribe.ru/ mailto:ask@subscribe.ru

"Igor Gavriluk"

2004-06-20 23:50:55 (#174146)

Re: Фрагментация (с лёгким оффтопиком)

> центру диска она чуть меньше, поскольку стабилизация головок проходит
> легче при меньшей скорости обдува пограничным слоем воздуха.

сорри, кажется в коробке HDD вакуум и по определению воздуха нет !!!

-*Название листа "Обсуждения и споры о свободных системах и всём сопутствующем"
Написать в лист: comp.soft.linux.debate-list@subscribe.ru
Архив Листа - http://subscribe.ru/archive/comp.soft.linux.debate Поиск: http://www.google.com
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.debate/rules
Номер письма: 1313; Возраст листа: 241; Участников: 583
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.debate/msg/174136

http://subscribe.ru/ mailto:ask@subscribe.ru

Русскин Андрей 2004-06-20 23:39:29 (#174136)

Re: Фрагментация (с лёгким оффтопиком)

Доброго времени суток.

On Sun, 20 Jun 2004 00:41:00 +0300
"Igor Gavriluk" <gavrik2***@m*****.ru> wrote:

IG> У меня NTFS5 на "Cheetah X15 36LP" (это при 15Krpm и
IG> uwSCSI-320!) усредненно давала порядка 65ГБ/с в лучшие годы...

???

Да будет вам известно, что число 320 в названии интерфейса означает ни что иное,
как максимальная скорость передачи данных в мегабайтах в секунду. Т.е. с такой
предельной скоростью передаются данные из кэша винта в память. Чтение происходит
ЗНАЧИТЕЛЬНО медленнее.

Дальше письмо читать не стал.

iam 2004-06-20 16:12:05 (#173922)

Re: Фрагментация

Yuri N. Glibovetz [mailto:gyn***@m*****.ru] пишет:

> > не скажу - не помню...); RSX-11 - уже с фрагментацией
>
> ОС РВ - это советский клон RSX-11. Кстати, фрагментация там
> поддерживалась для файлов данных, программы должны были
> занимать непрерывную область. И хотя это определялось
> исключительно спецификой ядра (программа загружалась в память
> без участия файловой системы, в ядре запоминался адрес
> начального сектора программы на диске и ее размер), это
> приводило к быстрой загрузке программ, что я считаю правильным.
>
Так ведь эти системы - RealTime! И ядро у них крохотное было, большинство
функций выполнялось внешними утилитами. Естественно, чем быстрее выполняется
загрузка исполняемых модулей, тем круче. А время загрузки - это поиск файла
(включая Kernel Time Overhead) и его чтение в память. Целиком и полностью
солилдарен - так "правильнее"!. Если я не перепутал, в тех же vxWorks и QNX
даже специальная опция при создании файла есть - типа "DirectMapping" или
что-то в таком роде...

N.B. Кстати, по непроверенным слухам, всё те же PDP-11 до сих пор всякие
"ядрёные" экспериментальные установки обслуживают...
Их кто-то даже в одночиповом варианте с флэш-диском делал - то ли STMicro,
то ли HOLT IC, не помню...

-*Название листа "Обсуждения и споры о свободных системах и всём сопутствующем"
Написать в лист: comp.soft.linux.debate-list@subscribe.ru
Архив Листа - http://subscribe.ru/archive/comp.soft.linux.debate Поиск: http://www.google.com
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.debate/rules
Номер письма: 1311; Возраст листа: 241; Участников: 583
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.debate/msg/173864

http://subscribe.ru/ mailto:ask@subscribe.ru

"Igor Gavriluk"

2004-06-20 12:28:31 (#173864)

Re: Фрагментация (с лёгким оффтопиком)

Yuri N. Glibovetz [mailto:gyn***@m*****.ru] пишет:
>
> > 3. ОСНОВНЫЕ ЗАДЕРЖКИ на уровне файловой системы происходят не при
> > чтении-записи данных, а при открытии-закрытии файлов!
>
> Именно при чтении-записи данных и происходит основная
> задержка, связанная с фрагментацией. Причина в том, что
> скорость перемещения головки диска на несколько порядков ниже
> скорости чтения-записи информации. Допустим, время
> перемещения головки с начального до конечного цилиндра 30мс
> (что приблизительно соответствует реальности).
> Если соседние данные будут разбросаны на крайние цилиндры, то
> при размере кластера 4Кб за одну секунду будет прочитано
> всего 133Кб, в то время, как диск способен передавать 100Мб в
> секунду (разница почти на три порядка). Обычно такой дикой
> фрагментации не бывает, но все равно замедление на один
> порядок очень даже возможно.
>
Не совсем так. Более-менее "правильный" планировщик создаст в очереди команд
к диску две группы - на чтение в начале диска, и на чтение в конце диска. И
выполнит их последовательно, т.е. глобальных перемещений будет всего 3-5
(учитывая другие запросы к диску). К тому же время позиционирования
начало-конец на самом деле ненамного больше времени трэк-трэк (гораздо
меньше порядка)). Основное время занимает точная доводка и стабилизация
головок. Да и передать 100мб за секунду на сегодняшний день не способен
никто 8-)) - самый гнилой винт дает 2-3 ГБ/с уже "для приложений", т.е.
после всех "надстроек" файловой системы. А если имелось в виду
100_Гига_б/с... У меня NTFS5 на "Cheetah X15 36LP" (это при 15Krpm и
uwSCSI-320!) усредненно давала порядка 65ГБ/с в лучшие годы... Процы стояли
неслабые - Ксеоны однако.

Задержка первых данных ("сырых" секторов) при выполнении команды
позиционивания-чтения при сброшенных дисковых кэшах находится в порядках
"срденее время позиционирования"+"2-4 оборота диска"+"50~500мкс на системные
нужды" т.е. для ИДЕ дисков 7200об/мин это порядка 9-12мс, для uwSCSI дисков
на 10000об/мин это уже 3-5мс.

Как таковая, фрагментация файлов данных начинает играть заметную роль в
_быстродействии_приложения_ только в несколькох случаях:

1) приложение "медленное", и сервер успевает вытеснить данные из системного
кэша (имеются в виду _служебные_данные о файле - таблицы размещения и т.п.)
При перепрочтении ещё и служебной информации уж точно будет больше
позиционирования. Насколько я помню, и в NTFS, и в большинстве Униксовых ФС
служебная информация разбросана по диску, а в самых "умных" её размещение
начинается не с начала раздела диска, как многие думают, а с середины -
среднее расстояние позиционирования до данных от центра раздела в два раза
меньше, чем от края (можно и вперёд лететь, и назад)...

2) сервер сильно загружен другими задачами, и просто вытесняет блоки данных
из дискового кэша.

3) Близкий к 2) вариант - маленький размер самого кэша. По моим прикидкам,
дисковый кэш в RAM должен позволять вмещать всю служебную информацию со всех
смонтированных томов плюс 25-50% (хотя бы) от объёма часто запрашиваемых
данных. Это минимизирует "неудобные" запросы позиционирования-чтения. Запись
в служебные области все равно останется, но если разрешена отложенная
запись, это почти незаметно. Такие требования при современном "гигантизме"
дисков иногда непросто выполнить - служебная область на заполненном 120ГБ
томе может составлять 3-4гб, а если на нем очень много мелких файлов (при
хостинге веб сайтов, например) то ещё больше. Тут NTFS резко проигрывает
EXTам и UFSам, поскольку в НТ с каждым файлом хранится (и каждый раз
обрабатывается ситемой) не очень маленький Access Control List, который в
Униксах занимает всего пару DWORD. Сама идея ACL и NTFS Security очень
сильная, но в большинстве практических применений избыточная.

4) на сервере только один диск - и на систему, и на данные, и у него
отключена отложенная запись. Типично для "маленьких" серверов под
Вынь2000АС-контроллером домена. Эта "роль"(PDC) принудительно отключает
отложенную запись. Система создаёт _заметный_ поток на запись (логи и пр.),
да и сама запись осуществляется несколько медленнее, и позиционирование для
записи "вклинивается" в поток команд к диску самым бесцеремонным образом...

-= лёгкий оффтопик =-
Со скоростью работы дисков связано несколько разных факторов -
-- средняя задержка позинионирования - вычисляется именно "усреднением",
т.е. зависит от задач, выполняющихся его контроллером. У SCSI дисков,
поддерживающих очередь команд (а они все её поддерживают) контроллер может
лучше планировать перемещения головок. Вкупе с другими фишками средняя
скорость поиска на хороших uwSCSI дисках достигает 3.5-4мс(!).
-- задержка "track-to-track". При чтении очень больших объёмов данных
"подряд" создает паузы в потоке данных, вызванные "шаганием" тонарма с
головками. У хороших SCSI-дисков составляет 0.2-0.3мс(!). Ближе к центру
диска она чуть меньше, поскольку стабилизация головок проходит легче при
меньшей скорости обдува пограничным слоем воздуха.
-- средняя задержка поиска сектора, вызванная конечной скоростью вращения
дисков. Идеально было бы сразу после стабилизации головок на цилиндре
считать за один оборот все содержимое цилиндра, и потом разбираться с ним.
High-End диски, похоже, примерно так и делают - кэш 8мб примерно
соответствует объёму нескольких дорожек (например, Seagate Cheetah X15 36LP
имеет 18497 цилиндров - в среднем по 2мб на дорожку). Читают ли они только
одну поверхность, или весь цилиндр - не знаю, не изучал. По-моему, памяти
все-таки маловато для всего цилиндра, да и предыдущие данные надо отдавать в
шину постепенно.
-- Задержки передачи данных. Целиком и полностью зависят от возможностей
интерфейсов, загрузки контроллера и самой системы и пр.
-- "скрытые" технологические моменты:
- рекалибровка термическая - механические свойства системы меняются
при нагреве;
- рекалибровка вибрационная (есть такая на быстрых дорогих дисках)
для устранения резонансной вибрации в многодисковых шасси;
кстати, из этих же соображений реальная скорость вращения у
каждого диска чуть-чуть "своя"
- снижение активности с целью охлаждения микросхем (тоже видел такое
в одном Design Note на микроконтроллер от Fujitsu)
- искусственное "выравнивание" потока данных на т.н AV (Audio-Video)
дисках, предназначенных для потоковой записи-чтения (видеомонтаж etc.), при
котором даже в "удачных" последовательностях команд все равно имитируется
некоторая задержка позиционирования.

__ПОЛЕЗНОЕ:
Поскольку внешние треки позволяют записывать в 2-2.5 раза больше данных при
той же линейной (физической) плотности записи, современные диски используют
технологию зонной записи (кажется, так она называется), размечая внешние
треки на бОльшее количество секторов.
Это дает интересный эффект (проверен на практике): для интенсивной
файлогонятельной загрузки есть смысл создать отдельный раздел на внешнем
крае диска. Я генерил RAID 0+1 (stripped-marrored volume) на двух парах
небольших винтов (старенкие читы 9ГБ 10000об/мин) специально для хранения
данных 1С, для самодельного фокспрошного приложения, даже для кеширующих
прокси (SQUID, MS ISA Server) - результат очень заметный даже визуально!
И последствия фрагментации в таком случае минимизируются при прочих равных
условиях - количество перемещений головок в 2 раза меньше.
...Кстати, на IDE дисках почему-то иногда наблюдалось обратное (например, на
Fujitsu 20GB 7200rpm).

Спасибо за долготерпение при прочтении данного опуса.

Всех благ, Игорь Гаврилюк

-*Название листа "Обсуждения и споры о свободных системах и всём сопутствующем"
Написать в лист: comp.soft.linux.debate-list@subscribe.ru
Архив Листа - http://subscribe.ru/archive/comp.soft.linux.debate Поиск: http://www.google.com
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.debate/rules
Номер письма: 1310; Возраст листа: 241; Участников: 583
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.debate/msg/173863

http://subscribe.ru/ mailto:ask@subscribe.ru

"Igor Gavriluk"

2004-06-20 12:27:23 (#173863)

← Июнь 2004 →
	1	2	3	4	5 05.06.2004 16:23:58 18:06:45	6 06.06.2004 01:55:50 03:01:59 21:02:19 21:05:17
7 07.06.2004 02:21:26 03:17:03 07:28:06 22:01:39 22:03:13 22:03:49 22:04:39 22:09:23 23:08:13	8 08.06.2004 00:32:14 07:37:49 10:56:13 11:45:05	9 09.06.2004 19:59:44 20:16:40 20:49:07	10 10.06.2004 01:58:48 02:18:30 04:09:01 13:36:20 13:37:07 13:42:30	11	12	13 13.06.2004 01:19:29 18:03:40 18:03:51 22:27:23 22:27:57
14 14.06.2004 01:49:01 01:51:23 13:28:34 19:02:28 19:03:35 19:50:16 21:00:31 21:47:24	15 15.06.2004 17:53:54 22:19:05 23:08:02 23:08:17	16 16.06.2004 00:20:04 11:27:52 11:28:14 12:24:36 12:58:40 21:56:16 22:00:16	17 17.06.2004 21:25:50 22:02:26 22:45:07	18	19 19.06.2004 01:01:50 11:58:37 15:01:19 18:33:30 18:35:17 19:17:51	20 20.06.2004 12:27:23 12:28:31 16:12:05 23:39:29 23:50:55 23:52:31
21 21.06.2004 00:54:54 01:15:31 09:42:30 13:44:35 22:26:50	22 22.06.2004 19:42:34 20:09:47 22:02:42 22:29:54	23 23.06.2004 00:16:38 00:17:06	24 24.06.2004 20:55:38 23:32:14	25 25.06.2004 09:13:00 12:58:45 18:33:18	26 26.06.2004 01:08:25 09:12:22 14:05:56 14:44:44 20:58:18 20:58:51 20:59:05 21:02:27 21:33:53 22:43:08	27 27.06.2004 00:13:40 00:14:12 00:28:27 02:34:46 05:09:24 16:52:45 18:54:24 18:54:57
28 28.06.2004 00:17:40 01:12:54 02:04:31 10:22:54 17:21:32 17:24:35 20:32:26 20:33:39 20:34:49	29	30 30.06.2004 11:33:25 11:52:17 18:43:41