О блоге

Все новые материалы размещаются на Блогосайте alv.me. Старые - в процессе переноса.

26.07.2008

FreeBSD: физика файловой системы

2004-2005 гг

настоящей заметке речь пойдет о способе физической организации блоков дискового раздела, обеспечивающем возможность записи, хранения и манипулирования файлами, специфичном для FreBSD.

Вступление

Файловая система FreeBSD принадлежит к Unix-семейству файловых систем и обладает множеством общих для всех них черт. Она носит название UFS, в 5-й ветке используется ее усовершенствованная разновидность - UFS2. Для начала рассмотрим общие принципы устройства той и другой, а потом обратимся к рассмотрению особенностей, свойственных UFS2.

Для файловой системы FreeBSD (и вообще BSD-систем, начиная с 4.2BSD) можно встретить и еще одно наименование - FFS (Fast File System). Для понимания соотносимости этих терминов необходимо обратиться к истории...

Изначальная файловая система Unix носила имя s5fs (то есть файловая система System V). По свидетельству современников, была она отменно медленной, да еще и не допускала имен файлов из более чем 14 символов. А поскольку в те времена в Университете Беркли также разрабатвалась версия Unix (именовавшаяся BSD Unix - предтеча всех современных BSD-систем), то решили поправить дело. И создали файловую систему, названную FFS (где Fast означало ее быстроту сравнительно с s5fs).

Поскольку разработки Берклианцев изначально (еще до того, как RMS придумал Open Sources и Free Software Foundation) были свободными, разработчики первозданного Unix'а не погнушались включить поддержку FFS в очередную версию канонической System V. А уже от нее и произошло большинство современных файловых систем Unix'ов, как проприетарных, так и свободных. И UFS - одна из таких реализаций, включающей элементы виртуальной файловой системы, vfs/vnode (по крайней мере, именно так трактует эти понятия Ю.Вахалия в своей книге "Unix изнутри"). А UFS2, как легко догадаться, - усовершнествованная 64-разрядная версия последней.

Хотя вообще говоря, UFS расшифровывается просто как файловая система Unix (Unix File System). И под этим именем известны и файловые системы других ОС этого семейства, отнюдь не идентичные UFS из FreeBSD. Так что некоторая неопределенность терминологии имеет место быть...

Как было выяснено в предыдущей заметке, логический дисковый раздел (часть слайса) - это, говоря метафорически, группа смежных цилиндров, разбитых на физические блоки по 512 байт. Однако специфика файловых систем BSD-клана заключается в том, что реально она делится еще и на части фиксированного объема (зависящего от объема раздела). Это т.н. группы цилиндров (условно назовем ее внутренней), каждая из которых имеет включает четыре самостоятельные части:

  • суперблок, идентичный по содержанию для всех групп;
  • блок группы цилиндров, оную описывающий; одной из важнейших его частей является
  • индексная таблица (или таблица inodes);
  • область блоков данных.

Рассмотрение их целесообразно начать с конца списка, то есть с области данных.

Блоки данных

Область данных (она занимает подавляющий объем пространства каждой группы цилиндров) образована блоками файловой системы. Подобно физическому блоку, блок файловой системы (именуемый также блоком логическим) представляет собой квант информации, доступный за одну операцию чтения/записи, но уже не дисковой головки, а операционной системы. Очевидно, что логический блок не может быть меньше блока физического (то есть 512 байт), и размер его обязательно кратен целому числу последних.

Понятие логического блока введено для повышения производительности дисковых операций. Не требует доказательства утверждение, что скорость обмена данными квантами по 1 Кбайт будет выше, чем 512-байтными, 2-килобайтными - еще быстрее, и так далее. И потому с точки зрения быстродействия файловых операций выгоден максимальный размер логического блока файловой системы.

С другой стороны, увеличение размера логического блока ведет к непроизводительному расходу дискового пространства за счет т.н. внутренней фрагментации данных. Ее не следует путать с внешней фрагментацией, для борьбы с которой на файловых системах FAT-семейства были в свое время мобилизованы всякого рода speeddisk'и с комбатантами: вследствие особенностей алгоритмов управления данными файловые системы Unix-семейства настолько мало подвержены внешней фрагментации, что о преодолении оной вообще практически не говорят.

Внутренняя же фрагментация выражается в том, что данные файлов, размер которых меньше блока файловой системы, все равно занимают его целиком. Также целый блок потребуется и для хранения файловых хвостов, то есть остатков сверх объема, кратного размеру логического блока. Для борьбы с фрагментацией в UFS, пардон за тавтологию, введено понятие фрагмента - логической части блока файловой системы, которая может быть записана или считана независимо от остальной его части.

Ясно, что размер фрагмента все равно не может быть меньше физического блока. При этом UFS накладывает на него и встречное ограничение - минимальный размер фрагмента определяется в 1/8 логического блока. Другие же возможные значения - 1/4 и 1/2 блока файловой системы (очевидно, что выделение фрагмента в размере блока равносильно отказу от фрагментации блока вообще, хотя это, как будто бы, не запрещено).

Inodes

Каким образом определяется принадлежность блока данных тому или иному файлу? К помощью индексной таблицы, именуемой также таблицей индексных дескрипторов или таблицей inodes. Она образована некоторым (конечным) количеством записей фиксированной длины (128 байт в UFS, 256 - в UFS2), каждая из которых однозначно соответствует одному файлу, как реально существующему, так и только могущему быть созданным.

Такая запись индексной таблицы носит название inode, которое мы и оставим за нею. Ибо все известные мне переводы этого термина, вроде информационных узлов или индексных дескрипторов, выглядят очень коряво. Кроме того, слово "дескриптор" фигурирует еще и в контексте "дескриптор файла", под чем подразумевается идентификатор (уникальный, иначе что же он будет идентифицировать?) файла, используемого неким процессом (что уже к файловым системам не имеет ни малейшего отношения - это сфера подсистемы управления процессами). И эти дескрипторы - не имеют меж собой ничего общего. Так, inode c идентификатором 2 (а это всегда идентификатор корневого каталога файловой системы) и дескриптор файла с номером 2 (а им для любого процесса будет стандартное устройство вывода сообщений об ошибках, /dev/stderr) ни коим образом друг с другом не соотносятся (хотя об этом почему-то не любят говорить вслух).

Однако я отвлекся - вернемся к нашим inodes. Каждый член этой таблицы содержит так называемые метаданные файла. Для реально существующего файла они включают в себя:

  • уникальный идентификатор inode (и, соответственно, файла, метаданные которого он содержит) - это просто счетчик создаваемых файлов в файловой системе);
  • тип файла - это может быть каталог, символическая ссылка, файл устройства, именованный канал или сокет, или же обычный (то есть не относящийся ни к какому из перечисленных типов) файл;
  • размер файла в байтах;
  • количество ссылок на файл (к этому вопросу придется вернуться чуть ниже);
  • адреса логических блоков и их фрагментов, составляющих файл;
  • число занятых им блоков;
  • атрибуты файла - принадлежности, доступа, режима, времени.

А вот чего в inode не обнаружить никакими силами - так это имени соответствующего ему (или ей? - мне почем-то кажется, что inode, вопреки грамматике, - женского рода). В любой книжке про Unix не устают повторять (и я не отступлю от этой доброй традиции), что имя файла - не атрибут самого файла, а элемент каталога, в который он входит. Поскольку понимание этого потребуется вскоре при знакомстве с механизмом Soft Updates, сделаю маленькое отступление для прояснения вопроса именования файлов во FreeBSD (и вообще в Unix).

При описании содержания таблицы inodes вскользь было упомянуто поле типа файла. Так вот, в Unix все файлы (а все, что в Unix имеется вообще, включая физические устройства, для системы представляется в виде файлов) делятся на две группы - каталоги и прочие. Прочие файлы могут служить для различных целей (хранения данных и исполняемых программ, быть символическими ссылками, описывать устройства или средства взаимодействия процессов). Назначение же каталогов - единственное, но оченно важное: быть хранителями имен входящих в них файлов, которым однозначно поставлены в соответствие идентификаторы inodes, хранящих метаданные этих файлов.

То есть имя файла существует только в списке каталога и нигде более в системе. А создание файла - это не только заполнение относящейся к нему записи в индексной таблице и заполнение указанных в ней блоков данных, но и внесение записи вида "идентификатор - имя_файла" в область данных какого-либо каталога. А каталог, как и любые другие файлы, имеет свои метаданные в таблице inodes и свою область данных. И, в свою очередь, имя его вместе с идентификатором inode входит в каталог более высокого уровня, и так - вплоть до корня файловой системы. В поле количества ссылок inode создаваемого файла устанавливается минимально возможное значение, равное единице, поскольку любой файл входит по меньшей мере в один каталог, иначе он просто не будет доступен системе - файлы с нулевым количеством ссылок для нее как бы не существуют (и на самом деле их inodes и блоки данных со временем неизбежно будут перезаписаны физически; если, конечно, файл не был открыт в какой-либо программе - в этом случае он будет сущестовать, даже если имя его удалено из всех каталогов).

На самом деле один и тот же набор данных и метаданных может быть приписан к произвольному количеству каталогов в пределах одной файловой системы и даже фигурировать под разными именами в одном каталоге - в этом случае количество ссылок на него будет соответствующим. А вот минимальное количество ссылок на каталог равно двум - так как запись о нем существует как в родительском каталоге (..), так и в текущем (. - то есть в самом себе). И каждый вложенный подкаталог увеличивает счетчик ссылок каталога на единицу.

Ссылки, с помощью которых связывается имя файла как элемент каталога с его записью в таблице inodes и блоками образующих файл данных, именуются еще жесткими (hardlinks, хорошим русскоязычным эквивалентом было бы слово "связь", но оно как-то не прижилось). Посредством жестких ссылок одному и тому же набору данных или исполняемой программе можно придать произвольное количество имен, которые никто не запрещает включить в один и тот же или разные каталоги. Единственное условие для этого - все эти имена-дублеры должны находиться в каталогах единой файловой системы (фигурально говоря, на одной дисковой партиции, хотя, как это будет показано в разделе о программном RAID'е, это не совсем точно).

Определенности ради отмечу, что жесткие ссылки нужно отличать от ссылок символических (symlinks, часто говорят просто links - почему и резонно было бы сохранит за ними обозначение ссылок, а hardlinks по русски именовать связями). Символические ссылки - файлы особого типа, отдаленно сходные с ярлыками в Windows или shadow в OS/2, которые сами по себе никаких данных не содержат, а просто описывают путь к имени другого файла (который может локализоваться и за пределами данной файловой системы).

Для файлов несуществующих свободные записи в таблице inodes просто резервируются. А поскольку количество этих записей - конечно, именно объем индексной таблицы и определяет, сколько файлов реально может быть создано в данной файловой системе. Исчерпание свободных записей в ней приводит к тому, что, вне зависимости от объема свободного дискового пространства, ни одного нового файла создать не удастся.

Блок группы цилиндров и суперблок

Таблицы inodes содержатся в блоке группы цилиндров, наряду с картами свободных/занятых inodes и карты свободных/занятых блоков данных). Это имеет целью размещение inodes и относящихся к ним блоков данных максимально близко друг к другу, что, кроме повышения производительности (за счет минимизации перемещений головок), влечет за собой и сведение к минимуму той самой внешней фрагментации данных, о которой говорилось выше.

Однако сведений об объеме индексной таблицы в блоке группы цилиндров не обнаруживается. Ибо место их размещения - тот самый суперблок, который идет первым в нашей партиции (вообще-то первым в любой партиции будет загрузочный блок, но реально он занят только в загрузочном же разделе - во всех остальных для него просто зарезервировано место). А также дублируется в каждой группе цилиндров - чем обеспечивается устойчивость к механическим повреждениям диска. Кроме этого, в суперблоке же записывается размер блока файловой системы и их суммарное количество, число блоков данных, размер блокового фрагмента и их число в блоке, число блоков, реально занятых файлами, объем партиции, перманентно резервируемый как свободный, и еще множество характеристик файловой системы, о которых сейчас говорить неуместно.

Практика форматирования

Таким образом, процесс создания файловой системы сводится к а) выделению суперблока и записи общих параметров файловой системы, б) созданию таблицы inodes (в UFS, в отличие от некоторых современных файловых систем для Linux, все inode создаются раз и навсегда, а не выделяются динамически, по мере надобности), и в) разметке блоков в области данных. Из за все это, подобно незабвенной Катерине Матвевне, отвечает одна-единственная программа, именуемая незамысловато - newfs.

Команда newfs требует единственного аргумента - имени файла форматируемой партиции, например,

$ newfs /dev/ad0s1a

после чего все базовые свойства файловой системы будут определены по умолчанию. Однако пользователь в силах влиять на них с помощью опций команды newfs, задаваемых в командной строке или раз и навсегда глобально, через пункт Options программы sysinstall. Важнейшие из этих опций мы и рассмотрим,

Опция -b определяет размер логического блока файловой системы. Минимальный размер его - 4096 байт, максимальный - 65536. Однако, как говорят, при максимально возможном размере возможны всякие неприятности, и потому надежным считается верхнее ограничение в 32768 байта. А с точки зрения здравого смысла, "умолчальное" значение в 16384 байт представляется в большинстве случаев разумным.

Опция -f устанавливает размер фрагмента блока. Рекомендуется определить его в 1/8 размера блока, что по умолчанию и составит 2048 байта. Значения в 1/4 или 1/2 блока также допустимы, но очень не рекомендуются в документации.

Опция -i очень важна - она-то косвенно и устанавливает количество записей в индексной таблице (то есть максимальное количество файлов в файловой системе). Значение этой опции дается в байтах, отводимых на элемент индексной таблицы, и должно быть кратным размеру блокового фрагмента. Значение по умолчанию - учетверенный объем оного, что определяет средний прогнозируемый размер файла (8192 байт). А максимальное количество файлов в конкретной файловой системе легко рассчитать, исходя из объема отведенного под нее раздела.

Еще одна интересная опция - это -m, значение которой указывается в процентах от суммарного объема дискового пространства, отведенного на раздел. И представляет собой объем, резервируемый от записи обычными пользователями (но не root'ом - тот всегда имеет возможность записать свои действия на диск). Он определяется потому, что быстродействие файловых операций в UFS просто катастрофически падает, когда количество свободных блоков в области данных близко к исчерпанию (проверено на практике). И потому некий объем файловой системы резервируется принудительно (по умолчанию - 8%).

С этой опцией связана еще одна, -o, которая определяет алгоритм выделения свободных блоков данных при создании новых файлов. Дело в том, что UFS в состоянии размещать их двумя способами. Первый - методом плотнейшей упаковки с целью минимизации внутренней фрагментации и экономии дискового пространства. И называется он оптимизацией по объему (опция -o принимает значение space). Второй же метод (-o time) обеспечивает быстрейшее выделение свободных блоков с целью увеличения скорости создания файлов (то есть вопреки принципу Леонида Ильича Брежнева - "экономика должна быть экономной"). Так вот, умолчальное значение -o коррелирует со значением -m: если оно больше или равно 8%, применяется оптимизация по времени, если меньше - по объему. Хотя явным образом можно указать прямо противоположные значения.

Вообще-то, все приведенные выше опции очень важны, интересны и полезны для общего образования, однако пользователю вряд ли придется к ним прибегать: их значения по умолчанию, как и почти все во FreeBSD, разумны и приемлемы в подавляющем большинстве случаев. А вот опция -U при запуске newfs по умолчанию не задействуется. Обеспечивает же она поддержку штуки крайне полезной - механизма Soft Updates, способствующему (парадоксально, но - правда) как повышению быстродействия файловых операций, так и устойчивости файловой системы.

Тема Soft Updates, однако, столь интересна сама по себе, что заслуживает отдельного обсуждения, чем мы и займемся в следующем разделе. А пока под рассмотрим отличия текущей разновидности файловой системы FreeBSD, UFS2, от ее предшественницы - UFS.

Все, что было сказано выше о файловой системе FreeBSD, относилось в равной мере к обеим ее разновидностям. Главная особенность UFS2 - то, что она 64-разрядная и, соответственно, способна работать с дисковыми объемами более терабайта (интересно, скоро это станет актуальным для настольного пользователя? Судя по темпам дискобольства, срок этот не за горами). В этой связи напомню, что длина записи в таблице inodes в UFS2 удвоилась, и равна 256 байт.

Далее, в UFS2 включена поддержка расширенных атрибутов файлов, в частности, ACL, но это существенно для сетевых администраторов. А вот что может заметить пользователь - то, что создание новой файловой системы происходит быстрее (на больших дисковых разделах это действительно заметно, что называется, органолептически). Происходит это за счет т.н. "ленивой" инициализации inodes, хотя динамического их выделения, как, например, в XFS, и нету.

А вообще, с точки зрения пользователя, различий между UFS и UFS2 можно и не увидеть. Тем не менее, отказываться от UFS2 также оснований нет. Тем более, что и newfs, о которой говорилось выше, и sysinstall, речь о которой была в одном из статье про инсталляцию, по умолчанию ныне (в 5-й ветке) создают именно ее. Если же требуется создать просто UFS (для совместимости с версиями прежних веток, UFS2 не поддерживающих), это нужно сделать принудительно, указав для newfs опцию -O 1.

Парадокс Soft Updates

При всех своих многочисленных достоинствах, файловая система FreBSD не может похвастаться одним - быстродействием. И это не смотря на то, что в основе ее лежит обще-берклианская FFS - быстрая файловая система. Однако эпитет здесь выступает в сравнении с прежней Unix'овой файловой системой - s5, все вариации которой, как говорят знающие люди, отличались исключительной задумчивостью. Если же сравнить производительность файловой системы FreeBSD с родной для Linux Ext2fs - перед пользователем она предстанет существенно более медленной, чем последняя, особенно на операциях с большим количеством мелких файлов.

Почему? Нетрудно ответить: вследствие принятого во FreeBSD по умолчанию режима обращения с измененными файлами. Большинство нормальных файловых систем способны функционировать в одном из трех режимов:

  • полностью синхронном, когда обновления и метаданных, и области данных файла записываются на диск сразу вслед за его изменением;
  • полностью асинхронном, при котором все изменения файла (и его метаданных, и области данных) кэшируются в оперативной памяти и реально записываются на диск в подходящее для того время;
  • смешанном, реализующем синхронный механизм для измененных метаданных и кэширование - для модификаций области данных.

Очевидно, что первый режим обеспечивает наибольшую устойчивость файловой системы к сбоям, второй - наибольшее быстродействие файловых операций (ценой возможности нарушения целостности файловой системы и даже полного ее разрушения при аварийном завершении работы), а третий представляет собой как бы компромисс между первым и вторым решением.

Так вот, в файловой системе Linux (конкретно - в ext2fs, Linux нынче за родные признает много файловых систем) по умолчанию задействуется полностью асинхронный режим работы, а во FreeBSD - смешанный. Конечно, это определяется при монтировании файловых систем, и с помощью соответствующих опций команды mount (что я покажу в соответствующей заметке) файловую систему FreeBSD можно заставить работать полностью асинхронно. Однако резонные люди не рекомендуют это делать категорически - и, вероятно, имеют к тому основания (одна из причин к тому станет ясной в конце этого раздела). Да и, как следует из тестов, существенного прироста быстродействия асинхронное монтрование файловых систем во FreeBSD не дает.

И действительно, в умолчальном режиме файловая система FreeBSD (в сравнении с той же ext2fs) демонстрирует замечательную устойчивость. За годы общения с этой ОС (а из которых половина пришлась на селянские условия, когда неожиданное отключение электричества было вещью более чем обычной) мне ни разу не пришлось столкнуться с проблемами из-за аварийного завершения сеанса работы (в Linux'е такие проблемы, до внедрения журналируемых файловых систем, возникали сплошь и рядом).

Однако цена за это - быстродействие. Вернее, отсутствие оного. И проявляется это особенно наглядно именно при копировании большого количества мелких файлов (процедура, весьма обычная при работе с текстовыми, по преимуществу, материалами). Действительно, при этом в синхронном режиме обновляется огромное количество файловых inodes, тогда как собственно данных изменяется ничтожное по объему количество, и их кэширование доставляет мало радости. В любом случае копирование набранных в текстовом редакторе статеюшечек размером с эту заметку и суммарным объемом в стандартный CD затягивается на вполне чувствительное время (в отличие от Linux'а, где подобная операция выполняется внешне мгновенно - другое дело, что индикатор активности жесткого диска может еще долго подмигивать).

Далее, не смотря на всю свою фактическую устойчивость, файловая система FreeBSD, не будучи журналируемой, сама по себе не имеет механизма гарантии собственной целостности. То есть: при аварийном завершении работы, когда в файловой системе не устанавливается т.н. бит чистого размонтирования (clean byte - это один из важных параметров файловой системы, записываемый в ее суперблоке при корректном выходе из системы), в ходе процедуры последующей загрузки принудительно вызывается программа проверки ее на предмет нахождения противоречий между метаданными и областями данных (и их устранения). А при современных объемах дисков (и, соответственно, файловых систем на них) такая проверка может затянуться на часы. Конечно, это особенно прискорбно для серверов, но и на настольной машине доставляет мало положительных эмоций.

Проблема нарушения целостности существует и в Linux'е (по указанным выше причинам - даже в большей мере). И в Linux'е с нею борются посредством журналирования, то есть опережающей регистрации изменений метаданных (и, в некоторых случаях, даже и данных). Во FreeBSD же борьба за целостность файловой системы велась исторически по двум направлениям. Одно из них (хотя исторически и второе) - появившаяся в 5-й ветке фоновая проверка целостности файловой системы, допускающая начало нормальной работы сразу после аварийной перезагрузки машины. Поскольку это - одно из принципиальных новшество, скажу пару слов по сему поводу.

Для проверки целостности файловой системы во FreeBSD используется утилита fsck (одноименная есть и в Linux - для ext2fs, есть аналогичные инструменты и для прочих файловых систем). Она может быть запущена пользователем (вернее, root'ом) из командной строки. Однако схема старта системы предусматривает ее принудительный запуск, если в какой-либо из автоматически монтируемых файловых систем не обнаружен бит чистого размонтирования. А поскольку fsck - побитная операция, во избежание тяжких последствий она обычно проводится на размонтированных файловых системах.

Так было и во FreeBSD вплоть до версий 4-й ветки. А вот в версиях 5-й ветки, начиная с первой, проверка диска может выполняться на смонтированной и готовой к работе файловой системе. И, соответственно, в фоновом режиме после полной загрузки системы, параллельно с выполнением обычной работы. Казалось бы - пустячок, а приятно: затрудняюсь сказать, сколько заняла бы полная проверка обычных ныне 80- или 120-гигабайтных винтов.

Однако первым по времени реализации способом борьбы за целостность файловой системы был механизм Soft Updates, обеспечивающий одновременно (вернее, главным образом) и повышение быстродействия файловых операций.

Сам по себе механизм Soft Updates (оставим этот термин без перевода - варианты оного типа "мягких обновлений" не только не блещут литературным изяществом, но и сути дела не проясняют) детально описан в специальной статье Макказика и Ганджера, смысла пересказывать которую я не вижу (благо она имеется в русском переводе). В двух же словах суть этого механизма - в сведении к минимуму синхронных операций записи без явно асинхронного манипулирования метаданными, с одной стороны, но и без предварительного журналирования метаданных (как в файловых системах типа ReiserFS или XFS) - с другой.

Реализуется это, опять же говоря довольно грубо (детали реализации моему пониманию недоступны - каюсь) за счет так называемых зависимостей обновления. Что такое эти зависимости - интуитивно ясно из примера создания нового (для простоты - пустого) файла. Для этого требуется:

  • запись в таблице inodes, с заполнением полей типа файла, его идентификатора, счетчика ссылок (со значением 1 - каждый файл должен принадлежать как минимум одному каталогу), ну и прочих там - прав доступа в соответствие с умолчальной маской, и так далее;
  • изменение карты свободных/занятых inodes в блоке группы цилиндров (соответствующий новому файлу inode должен быть помечен в ней битом занятости);
  • внесение записи вида "идентификатор - имя_файла" в структуру каталога, в котором новый файл создается, что обеспечивает ту самую единственную ссылку в соответствующем поле inode файла.

С точки зрения целостности файловой системы, эти операции должны быть выполнены именно в этой последовательности. То есть наличие в каталоге имени файла с идентификатором незаполненного (еще не созданного или уже уничтоженного) inode - явный непорядок: именно для исправления такого рода безобразий и запускается программа проверки диска после аварийного завершения сеанса.

Выполнять связанные зависимостями операции обновления в синхронном режиме - долго (каждая потребует своего обращения к диску), в асинхронном - нет гарантии сохранения последовательности (обновления в кэше могут быть записаны тогда, когда бог на душу положит). Так вот, механизм Soft Updates обеспечивает, с одной стороны, контроль за последовательностью выполнения зависимых обновлений (что способствует целостности состояния файловой системы), с другой - группирует их в единую атомарную операцию синхронного обращения к диску, за счет сокращения числа коих и растет производительность. В этом, насколько я понимаю, и состоит объяснение парадокса Soft Updates - неожиданного увеличения и надежности, и быстродействия.

В общем, постарался объяснить, как смог и как сам понял - за подробностями к упомянутой статье. В дополнение только замечу - во избежание недоразумений: механизм Soft Updates не только не гарантирует сохранности пользовательских данных, не записанных на диск по раздолбайству юзера перед крахом системы, но и не преследует такой цели. Его призвание - следить, чтобы файловая система всегда представала по возможности в непротиворечивом виде. Впрочем, то же можно сказать и о любой журналируемой файловой системе - ни одна из них не страхует от ошибок пользователя...

Теперь посмотрим, как же Soft Updates можно использовать. Если создавать файловые системы через sysinstall - все просто: там по умолчанию включение этого механизма уже давно (версии примерно с 4.3) предусмотрено для всех файловых систем, кроме корневой. Последнее аргументируется соображениями безопасности. Да и для корневой файловой системы Soft Updates не особо нужна: при правильном разбиении диска и грамотной эксплуатации запись в нее (после первичной установки) происходит только при инсталляции нового ядра, а часто ли это проделывается в нормальных условиях?

При создании же файловых систем вручную, командой newfs, Soft Updates автоматически не включается: это нужно сделать, как уже говорилось, указанием опции:

$ newfs -U /dev/ad#s#?

Впрочем, если она при форматировании была забыта - ничего страшного: для всех разделов, кроме корневого, включить Soft Updates легко с помощью команды tunefs. Для этого следует перейти в однопользовательский режим (очень рекомендуется; я как-то обошелся без этого, но лучше следовать советам резонных людей), что делается командой

$ shutdown now

Размонтировать все файловые системы, кроме корневой (с ней все равно этот номер не пройдет) командой

$ umount -Af

Дать команду

$ tunefs -n enable /dev/ad#s#?

для каждого раздела, в файловой системе которого требуется Soft Updates. И, наконец, повторением команды

$ shutdown now

вернуться в многопользовательский режим. Перезагрузки, что характерно, не потребуется.

В принципе, Soft Updates можно включить и для корневой файловой системы, но для этого потребуется загрузка с внешнего носителя, типа rescue-CD из штатного комплекта FreeBSD.

Да, забыл сказать, что механизм Soft Updates требует включения соответствующей опции в конфигурацию ядра. Впрочем, по умолчанию в ядре GENERIC это уже сделано - важно только не отключить ее случайно при пересборке.

Что же дает Soft Updates с точки зрения производительности? Как оказалось, очень немало. В упоминавшейся выше статье приведены результаты выполнения файловых операций в обычном синхронном режиме, в режиме чисто асинхронном (при котором игнорируются все зависимости обновлений), и в синхронном режиме с Soft Updates. Результаты этих тестов показывают, что быстродействие операций записи и удаления файлов с включением Soft Updates возрастает в 2 и 20 раз соответственно, лишь на 5% уступая результатам чисто асинхронного режима. Из чего следует резонность совета резонных людей - не включать асинхронный режим: использование его просто не обеспечивает прироста производительности, оправдывающего снижение надежности.

Я в свое время (еще на FreeBSD 4-й ветки) провел серию сравнений быстродействия файловых операций в UFS (как без Soft Updates, так и с ней) и в файловых системах Linux (ext2fs, ext3fs, reiserfs). Использовался массив в 4 Гбайт очень смешанного характера, от большого количества мелких html'ок до нескольких объемных tiff- и avi-файлов, то есть типичный набор данных настольного пользователя.

Результаты впечатляли. Если UFS в чистом виде проигрывала по скорости ext2fs в 4-6 раз на копировании и более чем в 10 - на удалении файлов, то при задействованном Soft Updates разница в скорости копирования не превышала полутора раз, а скорость удаления практически сравнялась (в пределах ошибки эксперимента). Обе же журналируемые же файловые системы Linux не обнаружили отличий в быстродействии от UFS с Soft Updates - а ведь только их можно сравнивать между собой с точки зрения формальной устойчивости...

Подчеркну, что файловые системы FreeBSD во всех случаях монтировались в соответствие с рекомендациями, то есть в "смешанном" режиме, тогда все файловые системы Linux'а - в режиме всинхронном, как это принято в этой ОС. Так что не столь уж медленна UFS, как это обычно считается...