Огляд повногеномного секвенування (Whole Genome Sequencing, WGS)
Як випливає з назви, тест WGS спрямований на аналіз усього геному. Однак, так само як і з читанням книги, рівень розуміння залежить від того, скільки часу та уваги ви приділяєте читанню. Тому важливо усвідомлювати, яку саме частину вашого геному фактично «прочитує» WGS-тест, адже це напряму залежить від глибини прочитування (read depth).
Глибина прочитування WGS визначається заздалегідь і означає середню кількість разів, коли кожна конкретна позиція в геномі зчитується під час секвенування. Зазвичай її виражають у вигляді кратності (наприклад, 30×). Вона безпосередньо пов’язана з упевненістю в точності визначення алелів: чим більша глибина, тим частіше одна й та сама позиція секвенується, а отже, тим надійніше можна відрізнити справжні генетичні варіанти від помилок секвенування.
WGS-тести з малою глибиною прочитування також «пропускають» більші ділянки геному — тобто мають більше зон із нульовою кількістю зчитувань — порівняно з тестами з високою глибиною.
Хоча ці терміни не прив’язані жорстко до конкретних значень, зазвичай WGS із глибиною 0,4×, 1×, 2× тощо вважають низькопокривними (low-pass або low-coverage). Тести WGS із глибиною 30× і вище зазвичай відносять до високопокривних або «глибоких» (high-coverage, deep coverage).
Вартість секвенування, обсяг отриманих даних, складність їх аналізу та витрати на зберігання безпосередньо залежать від глибини прочитування (а отже, і від рівня покриття).
Схема, що порівнює низькопокривне та високопокривне повногеномне секвенування, демонструє різницю в глибині прочитування та покритті геному.
Хоча реальні WGS-тести можуть дещо відрізнятися від математичних моделей, відсоток геному, який видаєтьс на різних рівнях глибини, можна змоделювати. Наприклад, WGS із глибиною 2× має видавати приблизно про 86% геному на рівні 1× або вище, близько 14% геному людини — на рівні 4× або вище, і відповідно ще менше — на більших глибинах.
Варто зазначити, що статистична імпутація може підвищити ефективний відсоток покриття, «заповнюючи» ділянки з нульовим або ненадійним покриттям.
Водночас необхідна глибина прочитування залежить від мети тесту. Повертаючись до аналогії з читанням книги: якщо вам потрібен лише загальний огляд, достатньо поверхневого перегляду — умовно, читання на рівні 1× або 2×. Легкий художній роман для поїздки не потребує такої ж уваги, як повторне вивчення підручника перед важливим іспитом. Так само й у WGS не існує «найкращої» глибини прочитування — усе визначається тим, для чого ви плануєте використовувати дані.
Наступний графік моделює очікуваний відсоток геному, що видається на різних рівнях глибини, для WGS-тестів із різним рівнем покриття. Як видно, відсоток покриття геному швидко зростає зі збільшенням глибини прочитування, і на рівні 30× практично весь геном ефективно покритий навіть на 10×. Втім, завжди залишатимуться певні повторювані або складні для читання ділянки, які не вдається коректно секвенувати.
Графік очікуваного покриття геному при різних глибинах прочитування для низько- та високопокривного WGS.
Зверніть увагу: Коли кажуть "30x WGS" - мається на увазі заявлена глибина покриття секвенціонування, або інакше - середня. На практиці при цьому деякі ділянки будуть прочитані 10x (10 разів), деякі - 4x, а деякі - 1x. Графік показує який відсоток з ДНК буде прочитаний наприклад 4 рази при різних глибинах WGS тестування.
Аналогія ДНК з книгою: WGS
Якщо порівнювати читання ДНК із читанням книги, то низькопокривне WGS — це ніби швидко переглянути всю книгу, щоб отримати загальне уявлення про її зміст.Вищі рівні покриття означають менше «перегляду» і більше уважного читання, аж поки WGS на рівні 30× не стає аналогією повного, ретельного прочитання книги від першої до останньої сторінки для глибшого розуміння.
Варто також пам’ятати, що, як і у випадку з мікрочипами, навіть такий «поверхневий» перегляд книги може бути цілком достатнім, щоб відтворити узагальнений зміст, подібний до того, який дають мікрочипні тести.
Переваги та недоліки низькопокривного WGS
Низькопокривне WGS має перевагу у вигляді нижчої вартості та меншого обсягу даних. Крім того, воно може видавати ті самі приблизно 700 000 SNP, що й мікрочипні тести, забезпечуючи порівнюваний вихід даних зі стандартними аутосомними тестами.Водночас таке WGS не забезпечує достатнього покриття геному на вищих рівнях глибини, щоб зрівнятися з високопокривним WGS або з даними, отриманими за допомогою таргетних NGS-панелей.
Переваги та недоліки високопокривного WGS
Високопокривні WGS-тести залишаються дорогими й генерують великі обсяги даних, які потрібно зберігати та аналізувати. Проте саме вони забезпечують найвищу на сьогодні роздільну здатність аналізу всього геному.Водночас важливо розуміти, що навіть високопокривне WGS не є ідеальним представленням геному «алель за алелем». Воно все ще має обмеження, притаманні стандартному NGS: зокрема, труднощі з надійним фазуванням нових SNP за батьківськими хромосомами та з коректним визначенням великих структурних варіантів, таких як довгі STR.
Коментарі
Дописати коментар