🧬 Как работает калькулятор G25
Содержание
- Простым языком: как это работает?
- Что значат цифры (дистанции)?
- Категории (Где мы сравниваем?)
- Разбор реальных примеров (Орша, Житомир и др.)
- Что такое Oracle (Смешанное происхождение)
- Почему калькуляторы показывают много "Прибалтики"?
- Что вообще такое ДНК-тест, K36 и метод G25?
- FAQ: Зачем мне это для генеалогии?
- Достоверность и ограничения
1. Простым языком: как это работает?
Наш калькулятор работает с вашим генетическим профилем, основываясь на методе главных компонент (PCA). Представьте себе сложную, многомерную генетическую карту, где каждый народ занимает своё уникальное место в пространстве. Калькулятор берёт ваши координаты (точку на этой карте) и математически сравнивает её с тысячами других точек (эталонных популяций из базы). Алгоритм ищет: к кому из них ваша точка ближе всего?
Откуда берутся данные для сравнения (эталоны)?
- Академическая наука: координаты современных и древних народов опубликованы учёными-генетиками в открытых статьях.
- Наша микрорегиональная база: в нашей базе есть эталоны, собранные вручную. Если 10 человек подтвердили документами, что все их предки из-под Лепеля — мы вычисляем их "среднее генетическое лицо" и добавляем как 🧬 Эталон из БД.
2. Что значат цифры (Дистанции)?
В результатах вы видите таблицу, отсортированную по дистанции (Distance). Дистанция — это евклидово расстояние между вашим «генетическим рецептом» и эталонным. Чем меньше число, тем сильнее сходство.
Примечание: приведенные ниже пороги актуальны исключительно для масштабированных (scaled) координат G25. У сырых (unscaled) координат порядок цифр будет другим.
| Дистанция (scaled) | Интерпретация |
|---|---|
| Меньше 0.01 (Очень близко) |
Если так: Вы генетически практически идентичны этому среднему профилю. Скорее всего, ваши предки из этого этно-региона, либо регион исторически крайне генетически однороден. |
| 0.01 — 0.03 (Близко) |
Если так: Хорошее попадание. Это ваш макрорегион. Например, предки из-под Минска, а показало Барановичи или Витебск. Это стандартная норма. |
| 0.03 — 0.05 (Умеренно) |
Если так: Это соседние или родственные народы. Вы можете иметь с ними общие древние корни. |
| Больше 0.05 (Далеко) |
Если так: Дистанция значительна. Маловероятно, что ваши недавние предки происходят из этой конкретной популяции, хотя исторические или макроэтнические связи исключить нельзя. |
Важно: Популяционное сходство — это НЕ родство.
G25 определяет не ваше древо, а популяционное сходство. Ваша дистанция до Лепеля 0.005 не означает, что там живут ваши троюродные братья.
| 🧬 Родство | 🌍 Популяционное сходство (G25) |
|---|---|
| «Этот человек — мой троюродный брат» | «Твоя ДНК похожа на людей из этого региона» |
| Определяется через IBD-сегменты (зоны совпадения) | Определяется математически (расстояние PCA) |
Для поиска именно прямых родственников загружайте тесты на GEDmatch, MyHeritage или используйте списки совпаденцев (DNA Relatives) в 23andMe и FamilyTreeDNA.
3. Категории: что значит выпадающий список?
Перед расчётом вы выбираете Базу данных для сравнения. Не все категории понятны с первого взгляда. Давайте разберём:
- Современные народы (Modern scaled averages) — Основная база. Сюда входят усреднённые профили национальностей (Belarusian, Polish, Lithuanian и т.д.). Галочка ☑ Эталоны из БД подмешивает сюда наши точные районные замеры (к ним приписан значок 🧬).
- Машина времени: 🪨 Палеолит, 🏺 Неолит, 🟤 Бронзовый век... — Это базы, собранные из останков древних людей, найденных археологами (aDNA). Сравниваясь с ними, вы можете увидеть, на кого из участников «Троянской войны» или живших во времена ВКЛ вы похожи больше.
4. Разбор реальных примеров
Пример: ДНК отца (Орша/Лепель + Украина)
«Посмотрел по калькулятору отцовскую ДНК, неплохо: показал Орша, Лепель (а это бабушкина часть!), на 3-ем месте Украина (Ровно) и на 7-ом Житомир (а это отцовская часть по дедушке!»
Что здесь произошло математически:
ДНК вашего отца — это ровно 50% от его матери (которая из Орши/Лепеля) и ровно 50% от его отца (который корнями из Украины, Житомир/Ровно).
Калькулятор увидел этот набор мутаций. Поскольку "смешанного" усреднённого человека (наполовину лепельчанина, наполовину житомирца) в базе нет как отдельного народа, калькулятор в Топ-10 просто выдал оба полюса происхождения.
Именно поэтому он показал на первых позициях Север Беларуси (Орша/Лепель), а чуть ниже — Север Украины (Ровно/Житомир). Алгоритм великолепно почувствовал составные части «рецепта»!
Пример: Идеальное совпадение
Если бы все 4 бабушки и дедушки человека были бы из глухой деревни под Круглым (Могилёвская область), то в Топ-10 не было бы ни Литвы, ни Украины. На первых 5 местах стояли бы исключительно 🧬 Восточная Беларусь, Поднепровье, Смоленск. Дистанция была бы рекордно низкой (меньше 0.005).
Пример: «Почему вдруг Пинск и Орёл?»
«У меня абсолютно все предки из-под Пинска, а калькулятор выдал на высоких позициях Орёл из РФ. Это ошибка?»
Это не ошибка — это история. Границы появились недавно, а гены накапливались тысячелетиями. Представьте, что генетика — это диалект. Житель Пинска и житель Орла говорят на разных диалектах («языках»), но они выросли из одного общего праславянского корня. Так и с ДНК: внешне разные люди несут абсолютно одинаковые древненаследованные генетические пласты (героев Троянской войны, восточноевропейских охотников, ямников). Ваша ДНК одинаково хорошо «рифмуется» с обоими регионами.
Важно помнить: G25 показывает не «откуда вы», а «на кого вы генетически похожи сегодня». Если вы похожи на современных жителей Орла — это значит лишь то, что в Орел исторически пришли люди с таким же генетическим фоном, что и ваши предки на Полесье. Общий источник, разные пути.
5. Что такое Oracle (Смешанное происхождение)?
Галочка ☑ Oracle 2-pop включает математический «симулятор миксера».
Если вы её включили: Программа берет топ-N ближайших к вам популяций из базы и начинает математически комбинировать (усреднять) их координаты попарно (Например: 50/50, 70/30). Если такая виртуальная "смесь" двух профилей оказывается математически ближе к вашей ДНК (сокращает дистанцию), чем любой одиночный чистый народ — Oracle выдаст её как лучший ответ.
(Обратите внимание: в целях оптимизации алгоритм полного перебора всех возможных пар не применяется — это вычислительно нецелесообразно; мы проверяем комбинации наиболее вероятных "соседей").
В случае с примером отца (Лепель + Житомир), если включить Oracle, он бы с вероятностью 99% объединил два полюса и выдал результат:
52% 🧬 Восточное Поозерье (Лепель) + 48% Ukrainian_North (Житомир)
Oracle — прекрасный любительский инструмент для оценки недавнего смешения, однако он не является строго академически верифицированным методом (в отличие от формальной статистики, такой как qpAdm). Oracle лишь ищет минимальное эвклидово расстояние между смежными PCA точками.
6. Почему ДНК-калькуляторы показывают перекос в Прибалтику у славян?
Глубокие "балтские" корни ранних славян
Исследование новейших палеогенетических данных дает исчерпывающий ответ на вопрос о происхождении так называемого "балтского субстрата" и алгоритмах работы ДНК-калькуляторов (таких как G25).
Согласно масштабному исследованию на основе 555 древних геномов, носители раннеславянского генофонда (восточногерманские и польско-северо-украинские образцы VII–VIII вв.) получили около 71% предковой базы балтийского происхождения (95% ДИ: 66.5–76%) и около 29% компонента ранних европейских земледельцев (EEF). (Gretzinger, J. et al. Nature, 2025. DOI: 10.1038/s41586-025-09437-6)
Балто-славянская генетическая близость
Анализ протяжённых совпадающих участков ДНК (IBD-сегментов) демонстрирует, что носители раннеславянского генофонда (VII–VIII вв. н. э.) разделяют больше и длиннее IBD-фрагментов с восточноевропейскими и балто-славянскими популяциями, чем с любой другой евразийской группой (Gretzinger et al., Nature 2025).
Присутствие по отцовской линии гаплогруппы N1c у белорусов объясняется общностью происхождения Y-хромосом с их северными соседями — литовцами и латышами (Kushniarevich et al., PLOS Genetics 2015).
Как всё это видит калькулятор?
Алгоритмы популярных ДНК-тестов сравнивают результаты пользователя с референсными панелями современных народов.
Современные балтийские популяции в меньшей степени подверглись последующему смешению с южными группами и сохранили древний предковый генетический профиль Восточной Европы в наиболее "чистом" виде. Например, геном современных литовцев до сих пор примерно на 71% состоит из вклада популяций балтийского бронзового века.
Когда калькулятор анализирует геном беларуса (или другого восточного славянина), он "видит" огромный пласт древней ДНК, который исторически был общим для предков балтов и славян. Так как современные жители Прибалтики являются генетически наиболее близкими из ныне живущих представителей к этой древней предковой популяции, алгоритмы автоматически маркируют совпадающие участки генома как "Прибалтику" или "Балтский компонент".
- Gretzinger, J. et al. (Nature, 2025). "Ancient DNA connects large-scale migration with the spread of Slavs". DOI: 10.1038/s41586-025-09437-6
- Speidel, L. et al. (Nature, 2025). "High-resolution genomic history of early medieval Europe". В исследовании математически смоделировано происхождение восточноевропейских популяций с использованием предкового источника балтийского железного/бронзового века. DOI: 10.1038/s41586-024-08275-2
7. Что вообще такое ДНК-тест, K36 и метод G25?
Когда вы плюёте в пробирку (AncestryDNA, 23andMe, MyHeritage), лаборатория достаёт из слюны вашу ДНК и считывает около 700 000 точек (SNP). Это просто огромная таблица букв A, T, G, C. Сама по себе она ничего не говорит.
Калькулятор Eurogenes K36 (на сайте GEDmatch) берёт эти 700 000 меток и сжимает их до 36 процентов по регионам (например, 14% Iberian, 25% Eastern_Euro и т.д.).
Что такое метод G25 технически?
Метод Global25 (G25) создал Давид Весоловски (Davidski) — независимый исследователь и автор известного блога Eurogenes. G25 берёт те же 700 000 генетических меток и, с помощью математического метода главных компонент (PCA), сжимает их до 25 чисел-координат — так, чтобы сохранить максимум полезной информации. Это как сжать фотографию в JPG: она меньше весит, но всё ещё отлично узнаваема.
На сегодняшний день G25 считается продвинутым открытым инструментом для изучения происхождения популяций в генеалогическом сообществе. Его главные плюсы:
- Гибкость: можно свободно сравнивать себя с любыми группами — хоть с ямной культурой бронзового века, хоть с современными районами.
- Точность: результаты хорошо согласуются с профессиональными академическими инструментами (например, qpAdm).
- Открытость: вокруг метода выросла огромная бесплатная экосистема из десятков программ (Vahaduo, Genoplot и т.д.).
Если вам критически важна максимальная научная точность, подлинные координаты можно заказать у разработчика метода (Davidski) на g25requests.app (около €15).
Эти 25 чисел — ваш генетический портрет. Точка в 25-мерном пространстве. То же самое мы делаем с эталонами-народами. А вся работа нашего калькулятора — это просто рассчитать расстояние от вашей точки до эталонной древней или современной точки математически, по теореме Пифагора.
8. FAQ: Зачем мне это для генеалогии?
Один из самых частых вопросов от исследователей корней: "Даст ли мне калькулятор фамилии прадедов или назовет ли он точную деревню?"
Честный ответ: Нет. Аутосомные алгоритмы (как G25) показывают усредненную генетическую "смесь", сформировавшуюся у ваших предков примерно 200–300 лет назад (6–10 поколений). Он не покажет ваших предков из бронзового века напрямую, а математически вычислит, *на какие современные или исторические популяции больше всего похож ваш сегодняшний микс*.
Что этот инструмент ДАСТ вам на практике:
- Распознавание "неочевидных" примесей: Если по документам все предки из-под Витебска, а калькулятор выдает дистанцию ближе к татарам или полякам из Силезии — это сильнейший сигнал для поиска. В дереве есть неучтенная ветка (переселенец, смена фамилии), которую стоит поискать в архивах.
- Подтверждение семейных легенд: Инструмент невероятно чувствителен. Если прадед действительно был турком (около 12.5% вашей ДНК), калькулятор моментально "вытянет" ваши координаты в сторону Балкан и Анатолии, а расстояние до местных белорусов резко вырастет. Если дистанции идеальны — легенда, увы, остается легендой.
- Региональная привязка: Жители изолированных регионов (например, Полесья) веками женились "внутри своих", образуя плотные генетические кластеры. Калькулятор покажет: ваш генофонд веками варился в одной деревне или вы — результат недавнего смешения мигрантов?
Чего калькулятор дать НЕ СМОЖЕТ:
- Он не ищет родственников. G25 — это калькулятор популяций. Он скажет "вы генетически похожи на жителей Минска", но не найдет там вашего троюродного брата.
- Алгоритм "глуп" к недавним смешениям. Если мама — шведка, а папа — грек, калькулятор математически усреднит координаты PCA и с высокой вероятностью назовет вас "венгром". Это не ошибка алгоритма, это следствие правильного математического усреднения расстояний: "венгры" на генетической карте действительно находятся ровно между шведами и греками. Чтобы увидеть два изначальных полюса (Швеция + Греция), нужно использовать галочку Oracle 2-pop.
- Славяне генетически очень близки. Генетически поляк из-под Люблина, белорус из-под Пинска и украинец из Луцка — почти один и тот же человек в рамках макро-кластера. Калькулятор не прочертит границу между их деревнями, он лишь очертит макро-регион.
9. Достоверность и ограничения
Нужно честно понимать границы возможностей метода:
- Калькулятор — это компас, а не GPS. Он укажет направление (север или юг, Полесье или Поозерье), но никогда не назовёт вам точную деревню.
- Эффект усреднения. Если мама из Москвы, а папа из Варшавы, калькулятор дистанций (без Oracle) поставит вас в «Минск», прямо посередине. Поэтому всегда включайте Oracle, если предки жили далеко друг от друга.
- Точность синтетических данных. Конвертация данных из K36 в G25 — это математическая модель, имеющая небольшую погрешность. Настоящие координаты G25 всегда будут точнее синтезированных. Впрочем, по мере накопления базы "чистых" G25-китов мы сможем вычислить паттерн этой погрешности и нивелировать её алгоритмически для всех участников проекта.