Получи случайную криптовалюту за регистрацию!

Моё первое впечатление от базы проиндексированных архивных док | ГенЭкспо. Интересно о генеалогии🌳

Моё первое впечатление от базы проиндексированных архивных документов Генотек (https://genotek.ru/archives/) было нейтральным. Вбил фамилию искомого предка и ничего не нашёл.

Спустя несколько месяцев, как по озарению, я решил ещё раз попытать счастья. И случайным образом поменял методику поиска. Удалось получить новые данные по двум веткам семьи.

Что же изменилось?

Формат записей в метрических книгах всегда содержит информацию
о родном приходе человека.

Имея бекграунд в IT, я обратил внимание на то,
что искусственный интеллект достаточно часто ошибается
с именами, но более качественно распознаёт губернию и уезд. С волостью и населенным пунктом вероятность ошибок распознавания больше. Что если пойти путем просмотра всех записей, содержащих искомый приход? И эта стратегия сработала.

Ещё одна проблема - выдача результатов на странице поиска ограничена десятью. Даже если у вас нашлось несколько сотен записей. Решить её можно используя фильтры по названию дел и годам. Например, "Москва. Пречистенский сорок." и период с 1900 по 1901. В большинстве случаев результат менее десяти ссылок. Если нет, то добавляем какой-либо другой фильтр.

Поиск по населенным пунктам осложнён как ошибками распознавания, так и попаданием то в деревню, то в село. То есть условное село Покровское может быть деревней в индексе.

Подводя итог: если идти в поисках от общего к частному, то результат может быть!

А разработчикам большая благодарность и пожелания убрать ограничение по числу выводимых записей, новых индексов и совершенствовать алгоритм.

Автор текста генеалог Роман Дронов, Австралия.