Нехай потрібно оцінити скільки потрібно мати збіжеців, щоб принаймні 2 з них мали не менше 60 сМ, якщо на даний момент у мене всі збіженці зі спільною ДНК менше 60 сМ.
Розрахунки робляться на основі збігів MyHeritage.
Знайдемо функцію F(x) - частка збіженців із спільною ДНК >= x. Наприклад F(8)=1 бо 100% збіженців на MyHeritage мають спільну ДНК не менше ніж 8 сМ.
Зі своїх збігів для різних відсотків я зібрав мінімальну кількість спільного ДНК і вийшов ось такий результат.
Для розрахунків я використовую дуже зручний інструмент Desmos.
Зверніть увагу, що при цих вибірках потрібно відкидати близьких родичів, яких ви самі протестували, інакше картинка буде необ'єктивною.
Ця вибірка добре апроксимується Логістичною регресією і дає хороші результати при малих значеннях x, менше 30 сМ, проте гірше працює для оцінки вищих спільних ДНК, які нам потрібні. Щоб це вирішити ми будемо логарифмувати x.
Я взяв 12 точок, на практиці ж достатньо взяти точку (8, 1) - яка завжди однакова (для 100%), та ще дві контрольні точки для 50% і 1%, на графіку вище вони помаранчеві. У мене вийшли такі результати
Для 1% (p) трохи важче. Якщо у вас всього 6000 (T) зібгів, з них 5 (r) протестованих вами самими, то потрібний збіг матиме номер ((T-r)*p+r)/10+1=((6600-5)*1%+5)/10+1=7.495~7.5.
Робимо логістичну регресію для цієї таблички. Копіюємо формулу у окрему функцію F(x), але заміняємо x на ln(x). Отримуємо таке наближення нашої вибірки
Як видно звідси при малих сантиморганах апроксимація дуже погана з логарифмом, зате краща при великих, які якраз нас більше цікавлять:
Далі введемо функцію N(m,x) - скільки потрібно мати збіженців, щоб m з них мали спільну з вами ДНК не менше за x.
Отже у моєму випадку, щоб мати 5 збіженців із спільною ДНК не менше 50 сМ потрібно, щоб загальна кількість збіженців зросла до 21 тис. Оскільки в мене на даний момент 5 тис. зібженців і ця кількість зростає щороку на 1 тис, то через 16 років у мене буде 5 хороших збігів.
Коментарі
Дописати коментар