• Главная
  • 2023
  • Любимов Р.П., О ходе реализации в Астраханской области краудсорсингового проекта «Твоя родословная»

21092023

ПРЕЗЕНТАЦИЯ

Любимов Роман Петрович,
заместитель начальника департамента архивного,
библиотечного и музейного дела
Министерства культуры Астраханской области
(г. Астрахань)

О ходе реализации в Астраханской области краудсорсингового проекта «Твоя родословная»

В докладе обобщен опыт астраханских архивистов по созданию генеалогического краудсорсингового проекта, представлены его основные возможности, проблемы реализации и использования.

Ключевые слова: генеалогия, краудсорсинг, электронные копии архивных документов, интернет-публикации, информационные ресурсы.

В последние десятилетия в мировой историографии явственно прослеживается всплеск интереса к изучению истории народонаселения, генеалогии, исторической демографии. Его особой отличительной чертой стало усиление интереса самых широких масс непрофессиональных историков к данному процессу. В последние десятилетия генеалогические изыскания приобрели доминирующей характер в работе пользователей в читальных залах государственных архивов.

Лавинообразный интерес широкой публики к истории своей семьи, биографиям своих предков привел к тому, что одними из самых востребованных комплексов архивной документации стали метрические книги, ревизские сказки, исповедные росписи и иные документы, содержащие сведения о рождении, бракосочетании и смерти людей.

Однако утверждение о том, что интерес к этой документации появился недавно, было бы несправедливым, поскольку отечественные академические исследователи начали вводить в научный оборот исторические источники генеалогического характера еще в 1960-е гг. XX века. Это происходило в рамках развития таких направлений исторической науки как историческая демография, просопография, социальная и персональная история (биографика)1.

С недавних пор интерес к истории и архивным документам по генеалогии приобрел массовый характер, проявившейся отчасти через различные непрофессиональные, любительские инициативы, отчасти через работу исследователей по составлению родословных. Это связано с несколькими особенностями генеалогии.

Первая заключается в том, что генеалогия в своей практической части – установление истории семьи, степени родства – может существовать вне рамок исторической науки. Для ее осуществления не требуется специального исторического образования.

Вторая – в практически неограниченной источниковой базе, поскольку генеалогическим источником может служить любой документ, содержащий сведения об отдельном лице – письменный, вещественный, архитектурный, археологический, аудиовизуальный и т.п.

Третья – в распространении компьютерных технологий, умелое использование которых позволяет проводить генеалогические исследования в «удаленном режиме», при условии, размещения электронных копий источников в сети Интернет. Эта задача еще более упрощается, если к ним создан поисковый механизм, т.е. простейшая база данных с распознанными и внесенными в нее сведениями из представленных электронных копий архивных документов.

К практической реализации проекта по публикации информации по генеалогии под рабочим названием «Твоя родословная» (далее — проект «Твоя родословная») астраханские архивисты подошли, проделав большую предварительную работу. В первую очередь они провели анализ востребованности документов генеалогического характера. Подробно изучены исследовательские темы и образовательный уровень пользователей читальных залов Государственного архива Астраханской области. Подобному анализу были подвергнуты и пользователи читальных залов, на предмет их исследовательских тем и образовательного уровня. Сформирован перечень фондов и архивных дел, содержащих данную информацию, находящуюся в свободном доступе, а также проанализирован, пересмотрен и усовершенствован весь научно-справочный аппарат, имеющийся в распоряжении Государственного архива Астраханской области.

Очевиден вывод, что реализация данного проекта, с одной стороны, способна значительно облегчить работу архивистов, сняв с них нагрузку по выполнению запросов генеалогического характера, разгрузить читальные залы, перенеся деятельность генеалогов в виртуальную среду, а с другой, – требует значительных финансовых вложений, большей частью в основном на создание электронных копий архивных документов и машиночитаемой базы данных. Совокупность этих факторов послужила основой для реализации генеалогического проекта с применением механизмов краудсорсинга.

Впервые понятие «краудсорсинг» ввел писатель и редактор Wired Джефф Хау в 2006 году. Краудсорсинг основан на одной простой идее: коллективный разум более продуктивен, чем отдельный, даже самый гениальный человек. Повсеместное распространение Интернета и огромное количество энтузиастов дают возможность использовать их потенциал из самых отдаленных уголков планеты. Затраты сводятся к минимуму, а качество решений зачастую гораздо выше, чем при обращении к профессионалам2.

При реализации проекта были поставлены следующие задачи:
1. предоставить широкой публике свободный, удаленный доступ к электронным копиям архивных документов, содержащим информацию по генеалогии;
2. использовать «в мирных целях» активность части пользовательской аудитории, перенеся ее деятельность в виртуальную среду;
3. наладить взаимовыгодный контакт с пользователями, сформировав рабочую группу волонтеров, работа которых носит общественно-полезный характер;
4. создать с помощью волонтеров машиночитаемую базу данных на основе индексированных ими записей из электронных копий архивных документов;
5. значительно сократить финансовые затраты архивов на формирование машиночитаемой базы данных;
6. заметно сократить сроки на реализацию проекта за счет увеличения количества исполнителей.

Работа по разработке альтернативных методов предоставления информации по генеалогии пользователям началась в Государственном архиве Астраханской области еще в 1993 году, когда специалистами архива была начата работа по микрофильмированию архивных дел, содержащих данную информацию. Этот процесс продолжился вплоть до 2000-х годов и в целях обеспечения сохранности документов Архивного фонда Астраханской области в читальный зал государственного архива исследователям стал выдаваться исключительно фонд пользования на микрофильмах и микропленках.

На протяжении многих лет исследователям приходилось тратить много времени и усилий, чтобы получить доступ к историческому наследию, находящемуся на государственном хранении в архиве. Их количество всегда было ограничено как вместимостью читальных залов, так и техническими возможностям и использование документов. Для поиска информации необходимо было просматривать огромное число катушек с микрофильмами или часами листать ветхие рукописные документы.

Хотелось бы отметить, что отличительной особенностью данного проекта от других, реализуемых архивными органами и учреждениями в Российской Федерации, стало абсолютное отсутствие финансовых затрат на его реализацию, за исключением текущего финансирования государственного архива. К сведению, что затраты только на перевод в электронную форму архивных документов с привлечением внешнего аутсорсинга превысили бы свыше 600 миллионов рублей.

Первым этапом стало создание электронных копий архивных дел, содержащих сведения генеалогического характера. На сегодняшний день их количество насчитывает 27 тысяч 634 единицы хранения, что составило свыше 2 миллионов цифровых образов архивных документов, объемом свыше 2,5 Тб. Эту работу нам удалось выполнить в кратчайшие сроки благодаря некоммерческой организации «FamilySearch International». Она безвозмездно осуществила перевод в электронную форму архивных дел с микрографических копий и предоставила нам электронные копии с большим цифровым разрешением для их последующей публикации.

Не буду подробно описывать разработку технологической платформы для публикации, дизайна и интерфейса, отмечу что весь функционал сайта был разработан на открытой платформе Drupal 7, а его материалы доступны по лицензии Creative Commons Attribution 4.0 International. Модули администрирования, предмодерирования и публикации данных созданы на этой же платформе с использованием модулей таксономий, fusion и preview и всевозможных скриптов.

Сайт проекта «Твоя родословная» имеет простую понятную структуру. Он состоит из шести служебных разделов: «Главная», «О проекте», «Стать волонтером», «Обратная связь», «Сообщи об ошибке», «Новости» и четырех основных содержательных блоков: «Архивные фонды», «Архивные дела», «Географический указатель», «Именной указатель».

Первый содержательный блок – «Архивные фонды» включает сведения об архивных фондах, в которых отложились архивные дела, содержащие информацию по генеалогии. Каждая запись о фонде позволяет ознакомиться с исторической справкой к фонду, электронными описями фонда (скачать их при желании), содержит, при наличии, фотографию фондообразователя, а также позволяет перейти к списку единиц хранения. Выбор любой единицы из списка дает возможность увидеть ее электронную копию.

Режим просмотра копий позволяет пользователям увеличивать или уменьшать ее размеры, рассматривать их в масштабе 1 к 1, листать экранные страницы, устанавливать масштаб просмотра, переходить в режим полноэкранного вида, а также свободно переходить к конкретному электронному образу (по номерам файлов –разворотов страниц).

В связи с большим для интернет-проекта объемом цифровых данных электронные копии представлены в разворот, в режиме «оттенки серого», что позволяет рассматривать карандашные пометы. Для защиты авторства на копии наложен «водяной знак» архива, не мешающий чтению основного текста.

При реализации проекта архивисты столкнулись с широко распространенной проблемой несоответствия нумерации листов архивного дела в его электронном образе. Но посчитали для себя неоправданным потерю целостности архивного дела путем отказа от публикации обложки, листов-заверителей и т.д. Несмотря на это, единицы хранения переведены в электронный формат так, что установка ссылки на лист в электронном образе не будет вызывать проблем.

Второй содержательный блок – «Архивные дела» – содержит полный перечень электронный копий архивных дел и предоставляет доступ к ним. Данный блок имеет гибкую систему поиска, позволяющую осуществлять поисковые процедуры не только по архивному шифру дела, но и по видам документов (брачные обыски, ведомости о родившихся, бракосочетавшихся, умерших, выписки из метрических книг, документальные источники, исповедные росписи, метрические книги о родившихся, бракосочетавшихся и об умерших, печатные издания, ревизские сказки, списки рожденных и крещенных), а также по наименованию (заголовку дела) и географическому указателю.

Третий содержательный блок – «Географический указатель» – представляет перечень географических объектов, указанных в наименованиях архивных дел. Перед нами стояла задача не дублировать Справочник административно-территориального деления Астраханской губернии, тем более, что часть географических наименований выходит за ее пределы, а создать отдельный указатель в рамках проекта. В этом же блоке имеется поисковая система, позволяющая провести поиск по персоналиям, событиям и его хронологическим рамкам.
И, наконец, четвертый блок – «Именной указатель» – построен аналогичным образом и дает возможность быстро найти конкретное лицо в алфавитном списке фамилий или посредством 8 поисковых полей. В настоящее время в этом указателе имеется информация о 137 тысячах 120 распознанных лиц. Ежедневно этот показатель увеличивается на 100-300 фамилий.
Теперь хотелось бы остановится на самом процессе использования краудсорсинга для формирования машиночитаемой базы данных по записям архивных документов.

Астраханскими архивистами был разработан сервис, позволяющий любому желающему после прохождения регистрации и заключения соглашения об информационном взаимодействии стать волонтером проекта и приступить к заполнению базы данных. Заключение соглашения - мера вынужденная, принятая в соответствии с Порядком использования архивных документов в государственных и муниципальных архивах Российской Федерации (утвержден приказом Росархива от 1 сентября 2017 г. № 143), и позволяющая оценить соответствующие компетенций волонтера, а также вести их учет. В настоящие время в проекте работают 263 волонтера, из которых активное непрерывное участие в расшифровке записей принимают около 90 человек.
Волонтерам на сайте проекта «Твоя родословная» предоставлена возможность непосредственного ввода данных по каждому событию архивного дела. Сервисом определен принцип, когда конкретное архивное дело доступно для индексирования лишь одному волонтеру. При назначении модератором волонтеру для индексирования архивного дела оно становится доступным в разделе «Мои архивные дела», а все расшифрованные им фамилии доступны для просмотра в разделе «Мною проиндексировано». В этом же разделе возможно проследить статус записи на прохождение ей процесса модерации.

Публикация волонтерами расшифрованных данных в свободном доступе осуществляется только после подтверждения правильности их прочтения и расшифровки архивным сотрудником-модератором проекта.

Несмотря на то, что на сайте проекта опубликованы подробные видео-инструкции для волонтеров по заполнению полей, нам приходится проводить практически индивидуальное обучение каждого волонтера. Фактором, влияющим на качество расшифровки данных, а, следовательно, и замедляющим процесс их публикации в свободном доступе, является отсутствие базового (профильного) образования, позволившего бы волонтерам непринужденно оперировать историческими источниками. Тем не менее та категория волонтеров, которая действительно нацелена на помощь, благодаря обучению и выдает в итоге наиболее качественный контент.

Еще один функция волонтеров в рамках данного проекта – проверка редактирования и уточнение заголовков архивных дел (с обязательной их проверкой в дальнейшем специалистами архива). К этому процессу мы подключили не только волонтеров проекта, но и обычных пользователей данного интернет- ресурса с помощью раздела сайта «Сообщи об ошибке».
Цель этой работы – формирование в дальнейшем в автоматическом режиме усовершенствованных описей дел, содержащих максимально выверенные заголовки дел (т.е. соответствующие их реальному содержанию). В частности, особое внимание волонтеров сосредоточено на корректировке «глухих» заголовков дел ревизских сказок и брачных обысков, которые порой содержат в себе данные, выходящие за пределы Астраханской губернии, а также выявляют ошибки в формировании архивных дел организацией-сдатчиком. Приведу пример. К сведению, волонтерами, с момента первой публикации архивных данных было внесено свыше 380 предложений, из них 363 рассмотрены положительно.

Сам краудсорсинговый сервис был построен по логике модуля администрирования записей сайта, которая позволяет публиковать информацию исключительно после проверки модератором сайта и/или другим архивистом (если информация внесена сотрудником архива). Этот «двойной контроль» позволяет заметно минимизировать количество ошибок.
И немного статистики. Сайт активно использовали с января текущего года. его посетило свыше 23 тысячи пользователей из 53-х субъектов Российской Федерации: а также Казахстана, Белоруссии, Украины, Германии, Латвии, Молдовы, Израиля, Кипра, США, Узбекистана, Великобритании, Франции, Венгрии, Грузии, Испании, Китая, Нидерландов, Польши, Сербии, Таджикистана, Финляндии, Швеции, Японии.

________________________________________________________________________________
1. Юмашева Ю.Ю. Историко-биографические исследования: методы и базы данных//Уральский исторический вестник. -2015. -№4(49). - С.146-152.
2. Краудсорсинг: Коллективный разум как инструмент развития бизнеса / Джефф Хау; Пер. с англ. - М.:Альпина Паблишер, 2012. 288 с.

Печать

Top.Mail.Ru