Вы здесь
Олейников О.В.
Комплектование Государственного архива Российской Федерации электронными документами
История и практика архивного дела и делопроизводства
УДК 930.25+004
Массовый переход в работе учреждений и организаций на электронный документооборот актуализировал вопросы приема электронных документов (ЭД) в государственные и муниципальные архивы. Их решению архивисты уделяют первостепенное внимание, в том числе в рамках Совета по архивному делу при Федеральном архивном агентстве[1].
В настоящей статье представим опыт работы в этом направлении Государственного архива Российской Федерации (ГАРФ), где информационные технологии применяются с 1993 г. – сначала для ведения списка источников комплектования архива в формате СУБД Q&A for DOS, а с середины 1990‑х гг. – для ввода и печати архивных описей. База данных «Источники комплектования», содержащая сведения из паспорта организации, в 2000‑х гг. была дополнена БД «Пофондовый учет», в которую заносилась информация о находящихся на ведомственном хранении фондах профиля ГАРФ по состоянию на 1 декабря отчетного года, согласно разработанной форме (она направляется в организации в ходе проведения паспортизации источников комплектования)[2]. Необходимость сбора сведений отдельно по фондам связана с тем, что в значительной части ведомств хранится от двух и более фондов (в Минсельхозе России – 78), а часть их находится у правопреемников источников комплектования, но которые таковыми не являются.
Работа по вводу описей велась в двух направлениях – ввод карточной описи в текстовом редакторе или в базу данных. Опыт создания баз данных архивных описей, позволивший определить требования к полям и их спецификациям, был учтен в Памятке по заполнению полей БД «Опись (Дело)», разработанной для создания и пополнения информационно-поисковой системы по фондам ГАРФ «Электронные описи»[3]. В настоящее время с помощью этого информационного ресурса для исследователей доступно почти 100 % заголовков хранящихся здесь дел.
С 2000‑х гг. отрабатывались требования к заголовкам дел, единообразию в заполнении описей дел. Например, решено полностью отказаться от использования в заголовках указания на повторяющуюся информацию «То же…». В 2001 г. была составлена Инструкция по подготовке архивных описей с применением компьютерных технологий для организаций – источников комплектования ГАРФ, ставившая одной из целей унификацию таблиц Microsoft Word для последующего конвертирования в БД в формате Microsoft Access. В 2012 г. Инструкцию дополнили Требованиями к графическому оформлению архивных описей и Памяткой по графическому оформлению внутренних описей дел, содержащих распорядительную документацию, для последующего конвертирования в БД «Документ» и включили в состав методических рекомендаций «Составление исторических справок, справочного аппарата к описям дел»[4].
С 2006 г. приступили к сбору электронных версий описей, утвержденных ЭПК ГАРФ; позднее к ним добавились внутренние описи. Описи конвертировались в формат Microsoft Access как вручную, так и с помощью специально разработанного онлайн-конвертера архивных и внутренних описей. Теперь требование передавать в государственные и муниципальные архивы вместе с контрольными экземплярами описей их электронные версии, на необходимость которого неоднократно указывал ГАРФ, закреплено в Правилах организации хранения, комплектования, учета и использования документов Архивного фонда Российской Федерации и других архивных документов в органах государственной власти, органах местного самоуправления и организациях (далее – Правила 2015)[5].
Изучение того, как компьютерные технологии внедряются в организациях – источниках комплектования ГАРФ и какие машиночитаемые документы должны поступить на постоянное хранение, началось еще в 1990‑е гг. Тогда предполагалось, что их прием можно ожидать в 2000 г., поскольку срок временного хранения машиночитаемых документов государственной части Архивного фонда Российской Федерации составлял 5 лет[6]. В период с 1994 по 1999 г. ГАРФ трижды проводил анкетирование организаций – источников комплектования[7]. Последнее из них показало, что в организациях было много разнообразного программного обеспечения, как готового, в том числе адаптированного под их нужды, так и разработанного самостоятельно или под заказ, а документы и базы данных создавались и хранились в форматах этих программ. Проблему пестроты программного обеспечения и форматов несколько нивелировал тот факт, что в электронном виде были представлены в основном проекты документов, программы и базы данных в сфере управления (бухгалтерия, кадры, делопроизводство), однако встречались и базы данных по основной деятельности. Электронные документы хранились в специальных архивах (службах, магнитотеках) в 11 организациях, среди них значились и ведомства, у которых в настоящее время такой архив отсутствует.
Примечательно, что из 56 организаций, принявших участие в анкетировании, 43 предпочли бы распределенное (в организации) хранение ЭД постоянного хранения, пять высказались за централизованное хранение в государственном архиве, три поддержали оба варианта и пять воздержались. Современный опыт показывает, что организации предпочитают в основном передавать ЭД на постоянное хранение в ГАРФ.
В 2014 г. практика изучения ЭД в делопроизводстве и архивах организаций приняла новую форму. ГАРФ пришел к решению одновременно с паспортизацией (она проводится в соответствии с Регламентом государственного учета документов Архивного фонда Российской Федерации[8] раз в три года) запрашивать информацию о наличии систем электронного документооборота (СЭД), в том числе выведенных из оборота; информационных систем (баз данных, реестров и др.) постоянного хранения, не являющихся СЭД; наличии ЭД постоянного хранения в других форматах; использовании информационных систем в кадровой и бухгалтерской работе, причем с указанием объемов и временных рамок ЭД и информационных систем. Интерес к СЭД объясняется тем, что они могут являться источником пополнения информационно-поисковой системы по фондам ГАРФ (на уровне документа) и фонда пользования на документы на бумажном носителе, принимаемые в ГАРФ.
В результате была подготовлена и направлена в ведомства табличная форма «Сведения об электронных документах и системах электронного документооборота по состоянию на 1 декабря 2015 г.». В общей сложности поступило 132 письма, содержащих 110 заполненных таблиц; в 22 сопроводительных письмах информировалось о наличии или отсутствии ЭД и СЭД. Их обработка показала наличие действующих СЭД в 103 организациях и в 32 – СЭД, завершенных делопроизводством. Базы и банки данных, реестры в электронном виде постоянного хранения имелись в 49 организациях, в которых действовали 3753 информационные системы общим объемом 114,9 Тб. В 11 организациях отмечено наличие 248 771 электронного документа постоянного хранения общим объемом 240 Гб (это аналитические документы, вестники, аудиовизуальные документы). В шести организациях имелись электронные образы (фонд пользования) документов постоянного хранения на бумажных носителях.
Отметим, что во многих случаях заполнение формы сведений для делопроизводственной и архивной служб организаций оказалось достаточно сложной задачей из-за неподготовленности сотрудников в области информационных технологий и малом участии в их внедрении. Если же предоставление сведений поручалось IT-специалистам и сотрудникам структурных подразделений, то при их консультировании приходилось разъяснять основы архивного дела и делопроизводства, смысл данной работы. Компьютерная неграмотность архивистов и архивная – IT-специалистов, отсутствие вовлеченности архивов и делопроизводственных служб в информатизацию организаций приводило как к отказу от предоставления сведений, так и к ошибкам в заполнении формы.
С учетом того, что для ГАРФ эта работа оказалась первой после анкетирований 1990‑х гг., сведения, полученные в ходе паспортизации 2015 г., носили скорее справочный характер, но и они дали необходимое представление о масштабах и объемах внедрения информационных технологий в организациях, что впоследствии оказалось крайне востребованным, в том числе при разработке предложений по проектированию создаваемого в рамках строительства филиала ГАРФ в Обнинске Центра хранения электронных документов.
По итогам консультаций и анализа сведений стало понятно – апробированную форму надо перерабатывать, что и было сделано. Перед рассылкой в 2018 г. расширенная указаниями по заполнению форма прошла дополнительную апробацию в нескольких ведомствах. В результате в ней осталось пять частей и 44 вопроса (в 2015 г. было три части, 17 вопросов). Среди новых выделим вопросы о наличии электронного фонда пользования, возможности выгрузки электронных документов, электронных образов документов и метаданных к ним, их передачи в ГАРФ.
Сведения про ЭД запрашивались по состоянию на 1 декабря года проведения паспортизации и не ограничивались завершенными делопроизводством ЭД и базами данных, хранящимися в архиве организации. Это связано с необходимостью своевременного учета ЭД и информационных систем в ведомствах, изучения тенденций информатизации организаций и проведения подготовительных мероприятий по обеспечению их сохранности: экспертизе ценности, подготовке к передаче в ГАРФ документов постоянного хранения и сохранению доступа в течение установленных сроков к документам временного хранения.
В 2018 г. ведомства оказались более подготовленными к заполнению формы. Было получено 160 ответов, но табличная форма прилагалась к 148 из них. В 116 формах и 15 сопроводительных письмах и пояснительных записках содержатся данные о наличии ЭД, информационных систем, СЭД, электронных фондов пользования и электронного НСА, а также перечисляются системы и документы в электронном виде; в 29 письмах и формах говорится о полном их отсутствии в организациях.
Анализ полученных сведений показал, что действующие ЭД и информационные системы постоянного и долговременного (по личному составу) хранения за 1900[*]–2018 гг. имеются в 42 организациях. Их общий объем 143,28 Тб в 200 197 ед. хр. В 17 организациях хранится 21 Тб электронных документов и сведений из информационных систем и баз данных за 1992–2018 гг. в 367 609 ед. хр., завершенных делопроизводством. По личному составу, как правило, имеются сведения в бухгалтерских и кадровых программах, но в архив организации они поступают уже на бумаге.
Завершенные делопроизводством документы хранятся в 15 организациях, девять из которых сообщили, что могут осуществить выгрузку документов и сведений из БД для передачи в ведомственный архив или ГАРФ. Четыре организации отметили наличие самостоятельного архива ЭД, но в основном документы и БД хранятся в структурных подразделениях. Форматы хранения как исходные, так и определенные ведомствами для выгрузки данных.
В архивах 77 организаций имеются различные информационные системы – как самостоятельные (17 организаций), так и СЭД и модули к ним (67 организаций), содержащие сведения за 1935–2018 гг. В основном охват документов частичный, но 14 организаций указали, что имеется информация по всем архивным документам, а 17 – отметили возможность подготовки сведений к передаче в архив.
Электронный фонд пользования в графических и текстовых форматах создан в 67 организациях, причем на документы начиная с 1935 г. Полностью оцифрованы архивные документы в девяти организациях; в двух отмечена привязка всех образов к описям дел.
СЭД есть в 113 организациях, при этом в двадцати в систему включены документы постоянного и долговременного (свыше 10 лет) хранения только в электронном виде. В 61 СЭД прикрепляются электронные образы документов; в 74 – принципиально поддерживается возможность выгрузки ЭД, электронных образов документов и метаданных к ним. Следует отметить, что в ряде федеральных органов исполнительной власти в СЭД имеются организационно-распорядительные документы, оформленные и подписанные исключительно в электронном виде, перевод которых в электронную форму не был согласован с Росархивом, как того требуют Рекомендации 2011 г.[9] В 32 организациях существуют СЭД, выведенные из эксплуатации или использующиеся в справочно-поисковых целях.
По сравнению с 2015 г. объем электронных документов и информационных систем постоянного и долговременного (свыше 10 лет) хранения вырос на 28 Тб.
В 2021 г. Государственный архив Российской Федерации уже в третий раз запросит сведения об электронных документах и информационных системах, а также собирается ввести промежуточный сбор данных и предложить заполнять форму онлайн. Паспортизация – это важный, самый массовый по охвату, однако не единственный способ выявления электронных документов. Старые, но опробованные методы – изучение нормативных актов, относящихся к организации (в основном, положений), состава документов в организации при рассмотрении описей дел, номенклатур, выездах и консультировании, просмотр сообщений ведомств о своих достижениях и опыте внедрения информационных технологий – также позволяют кураторам организаций обратить внимание на создающиеся там электронные документы и базы данных. Именно подобным образом были выявлены, подготовлены к передаче на государственное хранение и приняты в 2011 г. первые электронные документы: учетно-поисковая база данных претендентов и их наследников Федерального государственного учреждения «Фонд взаимопонимания и примирения» и двух государственных реестров Государственной регистрационной палаты при Министерстве юстиции Российской Федерации: Сводного государственного реестра организаций, осуществлявших лизинговую деятельность на территории Российской Федерации, и Государственного реестра коммерческих организаций. В том же году на государственное хранение поступили графические образы переписных листов Всероссийской сельскохозяйственной переписи 2006 г. в количестве 694 электронных дел. Все описи электронных дел были рассмотрены ЭПК ГАРФ годом ранее.
Фактически же подготовка к приему ЭД началась еще в конце 2002 г. с принятия Правительством Российской Федерации постановления от 14 ноября 2002 г. № 824 «О порядке хранения переписных листов и иных документов Всероссийской переписи населения 2002 г.»[10]. В соответствии с утвержденным Положением о порядке и сроках хранения переписных листов и иных документов Всероссийской переписи населения 2002 г. графические образы переписных листов ВПН‑2002 в одном экземпляре должны были поступить на постоянное хранение в ГАРФ до 1 января 2004 г. Практически с самого начала стало очевидным, что передача ЭД должна производиться не в одном, а как минимум в двух экземплярах. Это требование и обязательность подтверждения аутентичности графических образов являются, по мнению ГАРФ, необходимыми. Одновременно с этим архиву предстояло восполнять отсутствующее нормативное обеспечение и самостоятельно вырабатывать подходы к описанию ЭД, подтверждению аутентичности уже принятых документов, определять место и способ их хранения.
Сразу же было принято решение, что два экземпляра будут храниться раздельно на двух территориях архива с применением бесконтактных технологий. В 2008 г. в этих целях Росархивом для ГАРФ были приобретены два комплекта роботизированных библиотек для установки на Б. Пироговской улице и Бережковской набережной. Однако пока ГАРФ обсуждал с Росстатом вопросы передачи ЭД ВПН‑2002 (количество экземпляров, подтверждение их аутентичности, упорядоченное состояние согласно архивной описи), последний бросил все ресурсы на проведение Всероссийской сельскохозяйственной переписи 2006 г.
Тем временем ГАРФ разработал требования по описанию электронных документов. Особое внимание в них уделялось предисловию к описи: оно должно было отражать историю бытования ЭД (кто, когда, зачем и как их создавал, использовал и хранил), процесс подготовки документов к постоянному хранению (этапы подготовки, конвертирование и формирование дел и др.), структуру и форматы архивных электронных документов, электронных дел для их использования и обеспечения доступности при хранении. Так, в предисловии аутентичность графических образов переписных листов была подтверждена Росстатом описанием процесса создания и передачи образов от территориальных органов в ГМЦ Росстата (с приложением требований локального нормативного акта) и пояснением, что в файлах электронных пачек переписных листов имеется журнал операций с образами и соответствующей пачкой.
Что касается формы описи, то разработчики предусмотрели в ней избыточный объем информации с тем, чтобы ее можно было перерабатывать под обновляемые требования без обращения к документам. К описи прилагается удостоверяющий лист – перечень файлов с контрольными характеристиками (объем, хеш-суммы), датой и временем последнего изменения и форматами файлов.
Данные формы описей использовались в ГАРФ с 2010 по 2017 г. Затем в соответствии с приложением № 24 Правил 2015 г. форма описи была изменена (см. форму № 1). Она стала проще; ее единственное отличие от таблицы описи управленческой документации лишь в том, что вместо количества листов указывается объем в мегабайтах. В итоговой записи вместе с объемом в мегабайтах также приводится объем в байтах, а при необходимости в гигабайтах и терабайтах.
Также изменилась форма удостоверяющего листа (см. форму № 2). Он стал теперь приложением № 1 к описи и удостоверяет документы с контрольными данными в электронной форме. К ним относятся: реестр файлов / документов, структура каталогов, файл проверки контрольной суммы. Контрольные суммы в реестрах файлов и файлах проверки контрольных сумм вычисляются в двух форматах – SHA‑1 и SHA‑2 256/SHA‑2 512, в удостоверяющем листе – в SHA‑2 256/SHA‑2 512. Формат SHA‑1 используется для быстрых проверок как уникальный идентификатор файла / документа, поскольку высчитывается быстрее и имеет меньшее количество знаков в хеш-сумме. Реестры файлов / документов и файлы проверки контрольных сумм остаются в электронном виде в связи с большим объемом сведений (для Всероссийской переписи населения 2016 г. для их хранения на бумажном носителе потребовалось бы отдельное хранилище); сами реестры адаптированы для использования в информационных системах архива, а файлы контрольных сумм – для незамедлительного использования.
Реестр файлов содержит сведения о файлах (путь, название, объем в байтах, дата и время последнего изменения, контрольные суммы, форматы, ПО, примечания), а реестр документов – путь и название файла + хеш-сумму, название документа, дату документа, аннотацию (при наличии), иные сведения, зависящие от вида документа и формата файла. Структура каталогов отображает схему каталогов на носителе и количество файлов в каждом из них. Файл проверки контрольных сумм составляется автоматически программами расчета этих сумм и выглядит следующим образом: [хеш-сумма] [разделитель] [путь к файлу / заголовок файла]. Первые три описи электронных дел прошли утверждение ЭПК ГАРФ в 2010 г. В 2012 г. утверждена опись графических образов переписных листов Всероссийской переписи населения 2002 г.; ЭД по описи поступили в архив, завершив десятилетнюю эпопею. В настоящее время прием ЭД осуществляется на физически обособленных носителях (CD, DVD-дисках, HDD) в двух экземплярах. На оптический носитель данные записываются на минимальной скорости, не занимая его полностью; опознавательные надписи и наклейки на него не наносятся. Ведомство оформляет только вкладыши и чехлы носителей. Сотрудники ГАРФ при приеме проверяют носители на наличие дисков в боксах, соответствие их количества описи, читаемость путем копирования данных на служебный компьютер. Затем проверяются скопированные документы на целостность и аутентичность путем проверки контрольных сумм. Электронные дела, скопированные на носители ГАРФ и прошедшие проверку на соответствие описи и удостоверяющему листу, становятся третьим экземпляром.
При приеме ЭД личного происхождения (аудиовизуальных, литературных произведений и др.) все экземпляры документов и носителей создаются сотрудниками ГАРФ. От фондообразователей документы поступают, как правило, в одном экземпляре, часто с повреждениями носителей или сложностью с воспроизведением. В таких случаях проводятся работы по восстановлению доступа к документам. Например, было осуществлено конвертирование видеозаписей из формата DVD-video в форматы AVI и MP4 одновременно из фонда писателя, политзаключенного, правозащитника А.Г. Матвеевича.
Форматы приема ЭД зависят от нескольких факторов. Во-первых, это сам исходный формат документа, его распространенность. Во-вторых, возможность фондообразователя подготовить электронный документ, базу данных к передаче зависит от лицензионных ограничений на используемое ПО, а также от наличия специалистов и документации на ЭД и информационные системы, что позволяет выполнять необходимые процедуры. Так, Фонд взаимопонимания и примирения смог подготовить и передать в ГАРФ учетно-поисковую базу не только в исходном, но и в оговоренном с архивом формате с ограниченным объемом сведений, а также в виде виртуальной машины, что дало возможность ГАРФ после упразднения Фонда в сжатые сроки описать и принять на хранение около 500 тыс. дел на бумажном носителе претендентов на получение денежной компенсации и их наследников, одновременно выполняя поступающие социально-правовые запросы. Но есть и противоположные примеры, в частности, Регистрационная палата в период своей деятельности подготовила и передала базы данных государственных реестров в конвертированном формате, однако в ходе работы ликвидационной комиссии была осуществлена выгрузка баз данных лишь в исходном формате.
Отметим, что с 2000‑х гг. в ходе работы по обеспечению сохранности документов ликвидированных министерств и ведомств начали выявляться документы на электронных носителях преимущественно временного хранения и в небольших объемах. При обнаружении ЭД постоянного хранения (например, Единого государственного реестра сертификатов ключей подписей удостоверяющих центров за 2006–2011 гг. в виде электронной таблицы) их можно было распечатать и включить в традиционную опись документов на бумажной основе. Подобным образом поступили с названным Реестром, включив его отдельным делом в фонд Федерального агентства по информационным технологиям. В 2014 г., после упразднения Министерства регионального развития Российской Федерации, возникли новые проблемы в комплектовании ГАРФ электронными документами. На этапе упразднения министерства выяснилось, что ряд документов постоянного хранения, в частности поручения Правительства Российской Федерации и документы по их выполнению, с середины 2008 г. на бумагу не выводились и доступны по 2013 г. в СЭД организации, а за 2014 г. и вовсе оказались утраченными из-за работ по ее модернизации и сбоев в новой системе. С учетом лицензионных ограничений министерство смогло организовать выгрузку и передачу только базы данных СЭД без программного обеспечения.
Опыт ГАРФ показывает, что сохранение электронных документов в упраздняемых организациях затруднено ограниченным сроком работы и недостаточным финансированием ликвидационных комиссий, увольнением специалистов, работавших и обслуживавших ЭД и информационные системы, сложностью и дороговизной самих технологий и процедур по подготовке документов к передаче на государственное хранение. Именно поэтому ГАРФ сейчас сосредоточен на раннем выявлении электронных документов и информировании ведомств о необходимости заранее готовить процедуры и принимать меры по обеспечению сохранности их цифрового наследия. Новые перспективы в работе с источниками комплектования откроет ввод в действие Центра хранения электронных документов в г. Обнинске. Во-первых, продолжится совершенствование нормативной базы, которая должна обеспечить правовую среду функционирования Центра. Во-вторых, появится возможность хранить электронные документы не на полке, а в полноценной среде, обеспечивающей сохранность, использование и их введение в научный оборот (пока же использование ЭД ограничено техническими возможностями архива). В-третьих, материально-техническое и программное обеспечение Центра позволит совершенствовать пути приема электронных документов как по сетям связи, так и из различных систем электронного документооборота, что становится актуальной задачей.
Список литературы
-
Олейников О.В. Перспективы комплектования ГАРФ документами в электронном формате // Государственный архив Российской Федерации: 10 лет работы (1992–2002): сб. ст. / отв. ред. С.В. Мироненко. М., 2002. С. 34–42.
[1] См., напр., доклад О.В. Наумова «Цифровая трансформация Росархива» на Совете по архивному делу при Федеральном архивном агентстве в Казани 3 сентября 2020 г. (URL: http://archives.gov.ru/reporting/report-naumov-2020-kazan.shtml)
[2] URL: http://statearchive.ru/1100 (Паспортизация 2018: О составлении паспорта архива организации. Письмо.)
[3] URL: http://statearchive.ru/383
[4] URL: http://statearchive.ru/385
[5] URL: http://archives.gov.ru/documents/ministry-orders/prik_526_2015.shtml
[6] Указ Президента Российской Федерации от 21.03.1994 № 552 «Об утверждении Положения об Архивном фонде Российской Федерации и Положения о Государственной архивной службе России» // Собр. законодательства Российской Федерации. 1994. № 12. Ст. 878.
[7] Подробнее см.: Олейников О.В. Перспективы комплектования ГАРФ документами в электронном формате // Государственный архив Российской Федерации: 10 лет работы (1992–2002): сб. ст. / отв. ред. С.В. Мироненко. М., 2002. С. 34–42.
[8] URL: http://archives.gov.ru/documents/regulations/reglam.shtml
[9] Рекомендации по подготовке федеральными органами исполнительной власти перечней документов, создание, хранение и использование которых должно осуществляться в форме электронных документов при организации внутренней деятельности. (URL: http://archives.gov.ru/documents/rekomend_edocument.shtml (п. 3.4))
[10] См.: Собр. законодательства Российской Федерации. 2002. № 47. Ст. 4679.
[*] 1900 г. указан в паспорте ИТАР-ТАСС. Речь идет о фотографии, включенной в оцифрованном виде в банк данных «Фотоархив tassphoto.com», содержащий 24,5 млн изображений.