Перейти до основного вмісту

Публікації

Показано дописи з міткою "Аналіз даних"

Динаміка приросту збіженців за країнами з травня 2024 по травень 2025

Ось зафіксував розподіл збіженців за країнами у травні 2024 та порівняв через рік. Всі підросли, всі молодці (крім самі знаєте кого). Збіженців з України виросло на чверть. Але найбільше, з відчутним відривом підросло число збіженців з Польщі. Треба сказати, що серед збіженців з Польщі було багато українців. Видно, що США вже сильно покрите тестами, потенціал для зростання знижується. А от для України потенціал ще дуже великий. Потрібно агітувати інших та тестувати старших людей. На даний момент можна купити тести MyHeritage за ціною $29.7 (врахована знижка -10%), та ще й до цього отримати додаткову знижку через кешбек.

Візуалізація графа збіженців у GEPHI

Я вже писав , як побудувати карту збіженців і зібрати дані з сайту MyHeritage. Скрипт , що малює карту збіженців також експортує їх у вигляді графу matches.gexf . Його можна відкрити у безкоштовному додату GEPHI і працювати як з графом. Отже, ви витягнули збіженців із сайту MyHeritage, виконали скрип і завантажили на локальний комп'ютер файл matches.gexf, а також інсталювали і запустили саму програму GEPHI. Відкрийте ваш matches.gexf, при цьому зніміть галку "Auto-scale": GEPHI покаже ось таку кашу. Щоб виглядало гарніше, виберіть одне з можливих розташувань графа, найкращий layout для графа збіженців буде схема "Fruchterman Reingold" Вже трохи кращий вигляд Далі можна відсіяти далеких збіженців, щоб легше було працювати з графом. Для цього потрібно Перетягнути в Queries фільтр "Topology/Degree Range" Натиснути кнопку Filter Перетягнути трішки нижню планку Граф стане більш читабельним Інші способи аналізу збіженців у GEPHI (англійською мовою)

Ймовірність зв'язку зі збіженцем через прямі батьківські лінії

Ймовірність того, що певний збіженець є родичем за прямими батьківськими лініями з вами приблизно залежить від значення спільного ДНК в сантиморганах. Чим ближчий родич, ти більша така ймовірність. Доречі, всі ці міркування вірні і якщо брати прямі материнські лінії, але для простоти будемо говорити тут про батьківські. На цьому зображенні всі блакитні люди - родичі за прямими батьківськими лініями, чоловіки з цієї групи мають спільну з вами Y-гаплогрупу. Всі рожеві люди - родичі за прямими материнськими лініями і всі вони (чоловіки і жінки) мають спільну з вами Mt-гаплогрупу. P(x) - це така ймовірність, вона вираховується за формулою: M - константа, число спільного ДНК між дитиною і батьком/матір'ю. Наприклад для 40 сМ наша ймовірність буде 1.16% . Знаючи формулу ймовірності можемо порахувати скільки всього приблизно серед ваших збіженців таких, з ким ви пов'язані батьківськими лініями. Для цього нам потрібно знати загальну кількість збіженців ( N ) та розмір медіального ...

Оцінка частки збіженців з певною кількістю ДНК

Нехай потрібно оцінити скільки потрібно мати збіжеців, щоб принаймні 2 з них мали не менше 60 сМ, якщо на даний момент у мене всі збіженці зі спільною ДНК менше 60 сМ. Розрахунки робляться на основі збігів MyHeritage. Знайдемо функцію F(x) - частка збіженців із спільною ДНК >= x. Наприклад F(8)=1 бо 100% збіженців на MyHeritage мають спільну ДНК не менше ніж 8 сМ. Зі своїх збігів для різних відсотків я зібрав мінімальну кількість спільного ДНК і вийшов ось такий результат. Для розрахунків я використовую дуже зручний інструмент Desmos . Зверніть увагу, що при цих вибірках потрібно відкидати близьких родичів, яких ви самі протестували, інакше картинка буде необ'єктивною. Ця вибірка добре апроксимується Логістичною регресією і дає хороші результати при малих значеннях x , менше 30 сМ, проте гірше працює для оцінки вищих спільних ДНК, які нам потрібні. Щоб це вирішити ми будемо логарифмувати x . Я взяв 12 точок, на практиці ж достатньо взяти точку (8, 1) - яка завжди однакова (д...

MDS карта збіженців

Пропоную вашій увазі спосіб розміщення збіженців в системі координат. Використовується метод Multidimensional Scaling з бібліотеки sklearn. Аналогічно, як у Ancient Origins карта генетичних відстаней у МyHeritage, тільки тут показують зв'язки між вами і збіженцями. Що можна сказати про це представлення Ви знаходитесь у центрі координат (оранжева крапка) Можна задати одного зі своїх батьків (або когось з близьких родичів цих батьків), і відстань до нього (наприклад 1.0 - одне покоління для когось з батьків), наприклад це буде мати. Тоді мати буде в точці (1;0) З великою натяжкою можна стверджувати, що права половина точок - збіги пов'язані з матір'ю, а ліва половина з батьком. В реальності це представлення є неближенням, тому в реальності межа може бути трохи іншою (див нижче приклад для мого випадку)  В системі координат 4 квадранти і кожен з них (приблизно) може відповідати комусь із ваших дідусів-бабусь Теоретично можна побудувати 3-вимірне (чи навіть більше представлен...