Методика и источники
Как из выписок из метрических книг и ревизских сказок — хранящихся в государственных архивах Ростовской и Волгоградской областей — собрана база персон по слободе Даниловка с восстановленными семейными связями.
Охват и контекст
Эта база — побочный продукт частного исследования родов Сорокиных и Брыжиных. Поэтому именно они представлены наиболее полно: восстановлены связи между поколениями, найдены жёны и дети, прослежены ветви до начала XIX века. Остальные роды добавляются по мере того, как они встречаются в тех же записях — в качестве свидетелей, восприемников или брачных партнёров.
Жителей в Даниловке было намного больше, чем в этой базе. По данным переписи населения, в слободе жило:
- 18593 072 человека (510 дворов)
- 18974 779 человек
- 19157 232 человека (830 дворов)
В базе при этом ≈2 900 канонических персон за весь период 1795–1922 гг. — это малая выборка из того потока людей, что прошёл через приход. Подробнее об истории слободы — статья в Википедии: основана в 1747 г. атаманом Данилой Ефремовым на пожалованной императрицей Елизаветой земле «Черногаевского юрта» Усть-Медведицкого округа.
Источники
Исследование опирается на два архивных корпуса. Внутри — метрические книги (рождения / браки / смерти, ≈970 событий) и ревизские сказки (помещичьи крестьяне, ≈100 домохозяйств). Все записи лежат в одном Excel-файле; парсинг детерминированный, БД пересобирается из xlsx за секунды.
Ссылки на конкретные дела даны в формате фонд_опись_дело_лист, как принято в ГАРО.
ГАРО — Государственный архив Ростовской области
пр. Ворошиловский, 28, г. Ростов-на-Дону, 344006. zaprosy@gosarhro.ru, gosarhro.ru. Тел. (863) 240-61-26.
Метрические книги — что есть
- Иоанно-Богословская церковь слободы Даниловки — 1771, 1773, 1775, 1776, 1797 гг.
- Покровская церковь слободы Даниловки — 1850–1855, 1858–1859, 1860, 1862 гг. (вместе с книгами 1773–1797 — всего 15 единиц).
Метрические книги — чего нет
На хранение в ГАРО не поступали метрические книги слободы Даниловки за 1764–1766, 1828, 1832, 1838, 1863–1912, 1893, 1898 гг. Часть этих лет — в Волгоградском госархиве (см. ниже).
Ревизские сказки крестьян Усть-Медведицкого округа
Ф. 301, оп. 24 и оп. 34: ревизии 1795, 1811, 1813, 1816, 1835, 1850 гг. — всего 4 дела по Даниловке. Помещичьими крестьянами владели разные лица, поэтому количество дел внушительное.
301_34_866— ревизия 1795 г.301_24_524, 792, 793, 796, 866— ревизии 1795–1816 гг.301_24_806— ревизия 1835 г.301_24_811— ревизия 1850 г.
Церковный клир
Ф. 226, оп. 2, д. 6118; оп. 3, д. 8728. Ф. 301, оп. 24.
ГАВО — Государственный архив Волгоградской области
Метрические книги Покровской церкви слободы Даниловки за 1860–1861, 1863–1883, 1886–1914, 1916–1919, 1921–1924 гг. находятся именно в Волгоградском архиве — это основной корпус, на котором держатся записи о рождениях, браках и смертях с 1860 по 1922 г. в настоящей базе.
Основание: ГАРО СИФ. Методическое пособие по составлению родословной «И моя семья должна принадлежать истории». Волгоград, 2007. С. 34. Инв. № 53665.
Печатные источники
- А. Г. Сизенко. «Алфавитный список населенных мест Области войска Донского». Новочеркасск, 1915. С. 151–153.
- А. Г. Сизенко. «Церковный клир церквей Войска Донского (городские, станичные, хуторские, слободские, станционные, поселковые и сельские) XVIII в. — 1918 г.». Фактографический справочник. Ростов-на-Дону, 2018. С. 725.
- «Методическое пособие по составлению родословной. И моя семья должна принадлежать истории». Волгоград, 2007. С. 34. Инв. № 53665 (ГАРО СИФ).
- «Поверка переписи вольным черкасам по Войску Донскому 1764 г.» — 99 домохозяйств основателей слободы Даниловки; используется на странице /census-1764.
Конкретные находки в архивных делах
Часть запросов в ГАРО вернулась с прямыми выписками — это опорные точки, к которым привязаны основные родовые линии в базе.
Сорокины (Ф. 301, оп. 34, д. 866, л. 83 — РС 1795 г.)
Семья Фёдора Кирилловича Сорокина, 31 год; жена Ирина Ивановна, 28 лет; дети: Николай 6 лет, Татьяна 10 лет, Домна 5 лет.
Сорокины (Ф. 301, оп. 24, д. 792, л. 229 и 234 об. — РС 1811 г.)
Под №1: семья Фёдора Кирилловича Сорокина, 47 лет; дети Фёдора: Николай 22 года, Василий 8 лет.
Под №52: семья Никифора Кирилловича Сорокина, 64 года; дети Никифора: Сергей 39, Николай 32, Василий 33, Лука 26 лет; Антон — по предыдущей переписи 8 лет, отдан в рекруты; Гавриил умер в 1801 г.
Брыжины (записаны в архиве как «Брижин»)
301_24_866_083, 097, 097об., 098— РС 1795 г. На листе 107 об. упоминается, что в 1788 г. крестьяне проживали в казённой слободе Пишко… Харьковского наместничества.301_24_792_195, _203— РС 1811 г.301_24_806_270, _307, _308— РС 1835 г.301_24_811_012, _065, _066, _067— РС 1850 г.
Имена и отчества
Структура крестьянского имени критична для дедупликации:
- 1 токен — только имя («Лидия»).
- 2 токена — имя и отчество: «Анна Петрова» = Анна, дочь Петра. Это не фамилия.
- 3 токена — имя, отчество, фамилия («Анна Петрова Сорокина»).
Отчество — сильный идентификатор. Разные корни (Лука vs Лукьян, Афанасий vs Игнат) — разные отцы, а значит разные люди, даже при совпадении имени и фамилии.
Сборка персон
Из ≈4500 упоминаний имени собрано ≈2900 канонических персон. Это пять последовательных проходов:
Каждое упоминание сводится к тройке (имя, отчество, фамилия) в нижнем регистре. Маскулинизация женских окончаний (Сорокина → Сорокин), плюрали (Сорокины → Сорокин), прилагательные-фамилии (Пшеничная → Пшеничный, Терновой/Терновая → Терновой), украинские -енко/-енков. Алиасы дореволюционных имён: Иоанн = Иван, Феодор = Фёдор, Димитрий = Дмитрий.
Внутри одного канон-ключа упоминания делятся на «персон» по совместимости года рождения, допуск ±5 лет. Если у одного «Ивана Иванова Сорокина» два упоминания с разрывом 30 лет — это два разных человека.
Если у одного отца дети от двух матерей с пересекающимися годами — это два разных отца с одним именем. Так найдены два Дмитрия Антонова Сорокина.
LLM с строгим промптом сшивает написания, которые правила не ловят: разные орфографии отчеств (Никифорова/Никифрова, Афанасьева/Афанасиева), пропуски букв (Стефаида/Стефанида), диалектные имена (Дария/Дарья). Промпт явно запрещает сливать разные корни — модель не объединит Афанасиеву с Игнатовой. Аналогично для фамилий и поселений.
Для каждого брака ищется женщина с именем и отчеством невесты, но фамилией мужа — это её упоминания после свадьбы. С учётом года рождения такие персоны сливаются. На карточке появляется пометка «В замужестве: Х».
Годы рождения
Год рождения может приходить из нескольких источников: запись о рождении (точно), брак (год минус возраст), смерть (год минус возраст), ревизия (колонка «лет ныне»). Все оценки усредняются, диапазон min–max сохраняется как индикатор точности.
Если ни одного прямого источника нет, год выводится из ролей в событиях:
- отец — первый ребёнок минус 25 лет
- мать — первый ребёнок минус 22
- жених или невеста — год свадьбы минус 20
- восприемник или поручитель — событие минус 30
Это даёт ориентир для людей, по которым нет ни одной прямой записи о рождении (особенно до 1860 года).
Сшивка с MyHeritage
Семейное дерево (~1200 человек, ~500 семей) кросс-матчится с архивом по строгому ключу: имя, отчество, фамилия и ±3 года по году рождения. Современная форма отчества «-ович/-овна» сводится к архивной «-ов/-ев».
Совпавшие персоны помечаются зелёным бейджиком ✓ В дереве MyHeritage на странице человека. По якорям генерируется отчёт о пропусках: «у вашего предка X в архиве зафиксированы дети A, B, C — их нет в дереве».
Привязка к переписи 1764
Перепись 1764 г. фиксирует основателей слободы, но между ней и метрическими книгами 1860+ — век без записей. Поэтому связь строится по цепочке отчества и фамилии: если 1764-главу звали «Архип Степанов Иваненко», то взрослый «N Архипов Иваненков», встреченный в 1795+, — его потомок (сын, прав-, прав-правнук — точно сказать нельзя).
На странице такого потомка появляется бейджик Линия от переписи 1764 и ссылка на главу-предка. На странице рода — карточка «Откуда пришли» с регионом миграции и годом прихода в Даниловку.
Что не идеально
Открытые ограничения, о которых стоит помнить, читая страницы:
- Дети до 1860 г. часто без прямого года рождения — оценка эвристикой, погрешность ±5 лет.
- Жёны без записи отца — фамилия восстановлена от мужа, девичья в большинстве случаев неизвестна.
- Хвостовые опечатки фамилий могут проскочить в одиночные персоны (n=1). Полный AI-проход ловит варианты с edit-distance ≤ 2.
- Иерархия в ревизских сказках — em-dash в именах иногда означает «член домохозяйства», а не «сын / внук». Парсер этого не различает.
- Эпоха — 1795–1922. До 1860 покрытие тонкое (только три ревизии и перепись 1764), после — плотное (метрические книги почти без пропусков, кроме 1884–85).
Стек и архитектура
Парсеры, нормализация и сборка БД — Python (openpyxl, sqlite3, openai). Веб — Next.js 16 + React 19 + Tailwind 4 + shadcn/ui, рендер серверный, прямой SQL поверх SQLite (better-sqlite3). Граф фамилий — d3-force/d3-zoom/d3-drag. AI-нормализация написаний — gpt-5-mini, ответы кешируются в JSON.
Всё умещается в один git-репозиторий и деплоится одной командой vercel deploy. БД (~2 МБ) упаковывается в Vercel-бандл как статический ассет — никакого API-слоя и никаких внешних сервисов на runtime.