„Většina klinických vzorků a vzorků tkáňových kultur, používaných pro sekvenování virových genomů, JE BĚŽNĚ KONTAMINOVÁNA LIDSKÝMI BUŇKAMI, DALŠÍMI MIKROORGANISMY A OBNAŽENOU DNA A RNA Z POŠKOZENÝCH BUNĚK.“ Dále uvádím hlavní body z několika studií, které na rozšířený problém s kontaminací genomů poukazují.
Článek z Nature z července 2020:
To Steineggera a Salzberga motivovalo k tomu, aby zahájili projekt hodnocení kontaminace v databázích GenBank, RefSeq a NR. Pomocí nových rychlých algoritmů vyvinuli nástroj s názvem Conterminator, který umožňuje lineární vyhledávání kontaminace napříč taxonomickými říšemi. ‚Verze GenBank, kterou jsme vyhodnotili, měla velikost 3,3 terabytů a obsahovala 400 milionů sekvencí. Vzájemné srovnání všech sekvencí pomocí klasických metod by vyžadovalo stovky let,‘ uvedl Steinegger. ‚Na zpracování celé GenBank na jediném 32jádrovém serveru potřeboval náš algoritmus pouhých 12 dní.‘
Shrnutí 1. části:
„Použili jsme taxonomický filtr k odstranění kontaminantů z více než 4000 bakteriálních vzorků z 20 různých studií a provedli jsme komplexní vyhodnocení rozsahu a dopadu kontaminující DNA při celogenomovém sekvenování. ZJISTILI JSME, ŽE KONTAMINACE JE VELMI ROZŠÍŘENÁ A PŘI ANALÝZE VARIANT MŮŽE ZPŮSOBIT ZKRESLENÍ VÝSLEDKŮ. UKÁZALI JSME, ŽE TOTO ZKRESLENÍ MŮŽE MÍT ZA NÁSLEDEK STOVKY FALEŠNĚ POZITIVNÍCH VÝSLEDKŮ A NEGATIVNÍCH JEDNONUKLEOTIDOVÝCH POLYMORFISMŮ (SNP), DOKONCE I U VZORKŮ S NEPATRNOU KONTAMINACÍ.“
JE ZNÁMO, ŽE GENOMOVÉ DATABÁZE OBSAHUJÍ KONTAMINOVANÉ SEKVENCE A SESTAVENÉ GENOMY, KTERÉ MOHOU OBSAHOVAT VELKÉ ČÁSTI GENOMU Z NECÍLOVÝCH ORGANISMŮ [16, 17]. Nedávná studie překvapivě odhalila, že ULOŽENÉ BAKTERIÁLNÍ A ARCHÁLNÍ SOUBORY JSOU KONTAMINOVÁNY LIDSKÝMI SEKVENCEMI, KTERÉ VYTVOŘILY TISÍCE CHYBNÝCH PROTEINŮ [18]. I když byl potenciální dopad kontaminantů zvažován v oblastech, jako je metagenomika nebo transkriptomika, většina analytických postupů celogenomového sekvenování bakterií postrádá konkrétní kroky zaměřené na nakládání s kontaminovanými daty. TATO SITUACE PRAVDĚPODOBNĚ VZNIKLA Z PŘEDPOKLADŮ, ŽE MIKROBIOLOGICKÉ KULTURY VĚTŠINOU NEOBSAHUJÍ NECÍLOVÉ ORGANISMY A ŽE I KDYŽ JSOU PŘÍTOMNY, TAK KONTAMINUJÍCÍ SEKVENCE SE PRAVDĚPODOBNĚ NEOBJEVUJÍ V REFERENČNÍCH GENOMECH NEBO JSOU ODSTRANĚNY POMOCÍ STANDARDNÍCH METOD ODFILTROVÁNÍ. ROZSAH KONTAMINACE A JEJÍ DOPAD na opětovné sekvenování bakterií NEBYL DOSUD KOMPLEXNĚ POSOUZEN.“
„ZJISTILI JSME, ŽE KONTAMINACE JE BĚŽNÁ TAKÉ U STUDIÍ SE SOUBORY DAT MYCOBACTERIUM TUBERCULOSIS (obr. 1b). PŘÍMÉ SEKVENOVÁNÍ Z KLINICKÝCH VZORKŮ a pozitivní zkumavky pro indikaci množství namnožených mykobakterií (MGIT), které jsou naočkovány primárními klinickými vzorky, podle očekávání PŘEDSTAVUJÍ VYŠŠÍ STUPEŇ KONTAMINACE, POKUD JDE O POČET KONTAMINOVANÝCH VZORKŮ A PODÍL ČTENÍ NECÍLOVÝCH ÚSEKŮ V NICH. Tyto vzorky jsou běžně kontaminovány lidskou DNA a bakteriemi, které se obvykle nacházejí v ústní dutině a v dutinách dýchacích cest, jako jsou Pseudomonas, Rothia, Streptococcus nebo Actinomyces a v NĚKTERÝCH VZORCÍCH MOHOU PŘEDSTAVOVAT PRAKTICKY VŠECHNA ČTENÍ. Nicméně, jak bylo pozorováno u souboru dat z bakterií, KONTAMINACE BYLA ZJIŠTĚNA TAKÉ VE STUDIÍCH, VE KTERÝCH SEKVENOVANÁ DNA POCHÁZELA Z IZOLÁTŮ ČISTÝCH KULTUR. Například Bacillus, Negativicoccus a Enterococcus představovaly ve studii KwaZulu až 68%, 58% a 32% různých vzorků. Je překvapivé, že 17 ze 73 vzorků Mycobacterium tuberculosis z nigerijské studie bylo identifikováno jako Staphylococcus aureus (92 až 99% čtení). Datový soubor s vysokou hloubkou čtení byl většinou bez kontaminace, s výjimkou dvou vzorků, u nichž byly v 3,32% případů identifikovány A. baumannii a v 2,83% případů netuberkulózní mykobakterie (NTM) (což představuje 795 887 a 920 379 čtení).“
„UKAZUJEME, ŽE PŘÍTOMNOST SEKVENAČNÍCH ČTENÍ Z KONTAMINUJÍCÍCH ORGANISMŮ JE ČASTÁ, I KDYŽ SE SEKVENOVÁNÍ PROVÁDÍ Z IZOLÁTŮ Z ČISTÝCH KULTUR (obr. 1). Kromě NEVHODNÝCH LABORATORNÍCH POSTUPŮ existuje několik potenciálních zdrojů kontaminace, které závisí na různých faktorech, jako je DRUH ZPRACOVANÉHO VZORKU A JEHO PŮVOD nebo PROTOKOLY POUŽÍVANÉ PRO KULTIVACI, EXTRAKCI DNA A SEKVENOVÁNÍ. Např. Salter a kol. prokázali, že KONTAMINACE DNA V LABORATORNÍCH ČINIDLECH MŮŽE KRITICKY OVLIVNIT ANALÝZU MIKROBIOMŮ ZE VZORKŮ S NÍZKOU BIOMASOU [19]. Postupy sekvenování bez použití kultur pro nekultivovatelné nebo pomalu rostoucí patogeny, jako je T. pallidum nebo Mycobacterium tuberculosis, MAJÍ ZA NÁSLEDEK PŘÍTOMNOST VELKÉHO MNOŽSTVÍ KONTAMINUJÍCÍ DNA Z HOSTITELNÉHO ORGANISMU. Možné jsou i jiné zdroje, které nesouvisí se zpracováním vzorků. Například vzorky Mycobacterium tuberculosis, v nigerijské studii chybně označené jako vzorky S. aureus, jsou s největší pravděpodobností CHYBOU PŘI ODESÍLÁNÍ DAT DO GENOMICKÉHO ÚLOŽIŠTĚ. Bez ohledu na zdroj kontaminace je společným důsledkem PŘÍTOMNOST NECÍLOVÝCH ČTENÍ V SEKVENAČNÍCH SOUBORECH, KTERÉ BY MOHLY OVLIVNIT VÝSLEDKY GENOMOVÉ ANALÝZY.“
https://bmcbiol.biomedcentral.com/articles/10.1186/s12915-020-0748-z
Shrnutí 2. části:
„VĚDCI OBVYKLE POUŽÍVAJÍ SEKVENAČNÍ DATA GENEROVANÁ OSTATNÍMI, A JSOU PROTO ZÁVISLÍ NA SPOLEHLIVOSTI DOSTUPNÝCH GENOMICKÝCH ZDROJŮ. Z tohoto důvodu je problém kvality veřejných dat v molekulární biologii dlouhodobě považován za zásadní problém (Lamperti a kol. 1992; Mistry a kol. 1993; Binns 1993). PROBLÉM JE JEŠTĚ NALÉHAVĚJŠÍ V DNEŠNÍ DOBĚ S PŘÍCHODEM VYSOCE VÝKONNÝCH SEKVENAČNÍCH TECHNOLOGIÍ, KDY VĚTŠINA DATOVÝCH SOUBORŮ GENEROVANÝCH V GENOMICKÉM VÝZKUMU JEDNODUŠE NENÍ PŘÍSTUPNÁ MANUÁLNÍMU ZPRACOVÁNÍ LIDMI. To přináší novou výzvu pro současné metodologie v genomických vědách, konkrétně vývoj automatizovaných přístupů k detekci a zpracování chyb (např. Andorf a kol. 2007; Schmieder a Edwards 2011; Parks a kol. 2015; Delmont a Eren 2016 ; Drăgan a kol. 2016; Tennessen a kol. 2016; Laetsch a Blaxter 2017; Lee a kol. 2017).
https://academic.oup.com/g3journal/article/10/2/721/6026299
Shrnutí 3. části:
Problémy se spolehlivostí a přesností týkající se genomů:
https://m.facebook.com/story.php?story_fbid=10158343881003576&id=502548575
Argumenty proti buněčným kulturám:
https://m.facebook.com/story.php?story_fbid=10158078047703576&id=502548575