Det finns ett enormt problem med kärnan i det mänskliga genomprojektet

$config[ads_kvadrat] not found

How language shapes the way we think | Lera Boroditsky

How language shapes the way we think | Lera Boroditsky

Innehållsförteckning:

Anonim

Human Genome Project, som började på 1990-talet, var Homo sapiens "Framgångsrikt försök att kartlägga hela vår DNAs DNA. Det producerade det mänskliga referensgenomet, en finpolerad samling av humant DNA som är avgörande för genetikforskning och genetisk testningstjänster runt om i världen. Integrerat som det har varit för vetenskapssamfundet har två forskare vid Johns Hopkins University upptäckt att referensgenomet saknar en bit eller två - väl 296.485.284 baspar av DNA, för att vara exakt.

Referensgenomet är en väsentlig karta över mänskligt genetiskt material som används som underlag för jämförelse. När vi sekvenser vårt eget DNA för insikt i hälsa, familjehistoria och framtida sjukdomsrisk, höjer vi upp sekvensen i massor av små bitar och jämför sträckor av det till referensgenomet, letar efter områden där vi skiljer oss. Det grundläggande problemet med detta skriver forskarna i en ny tidning i Naturgenetik, är att referensgenomet är baserat i stor utsträckning på en enda person. Med tanke på de otaliga genetiska skillnaderna mellan de 7,7 miljarder som lever idag är det uppenbarligen inte idealiskt.

Professor i datavetenskap och biostatistik Steven Salzberg, Ph.D., och Rachel Sherman, en doktorand kandidat, gör det fallet att detta enda referensgenomet inte tar upp mångfalden av human genetik. Vissa populationer, lägger de till, skiljer sig åt för mycket från detta referensgenom. För att göra sitt fall hänvisar de till genomerna av 910 individer från tjugo olika länder, hela panafrikanska härkomst.

I DNA: n av dessa individer hittade laget 300 miljoner DNA-vanliga som inte existerar i vårt "referens" genom. Om vi ​​bortse från det här materialet, säger Salzberg, skulle vi oundvikligen sakna nyckelfärdigheter i specifika befolkningers hälsa och historia. De också är mänskliga, så borde de inte vara representerade i det "mänskliga" referensgenomet?

"Dessa regioner är väsentligen osynliga för genetiksamhället tills vi har ett referensgenom som inkluderar de här regionerna, säger Salzberg. Omvänd.

Problemet med referensgenomen.

Under åren har vi kontinuerligt arbetat med referensgenomet. Men den senaste analysen indikerar det nästan sjuttio procent av materialet avgick från en enskild afroamerikansk individ, som endast kallas RPCI-11, förklarar Salzburg.

Det betyder att när forskare utför genetisk analys för att identifiera skillnader mellan olika populationer från hela världen, jämför de de flesta av dessa genomer till det genetiska materialet från, mestadels en person. Detta leder oss att ofta ignorera material som kan vara för annorlunda än denna referens, säger Sherman. Hon kallar dem "saknade bitar".

"När du linjer upp saker kommer det att finnas bitar som inte stämmer överallt eftersom de är för olika för att matcha allt från referensgenomet." Sherman säger. "Då ignorerar du alla saker som inte stämmer upp som inte riktigt relevanta eller inte riktigt värda att titta på, när det kanske är dessa är de bitar som är mest intressanta eftersom de är mest annorlunda än referensgenomet."

I studien tog Sherman och Salzberg stora bitar av detta "annorlunda" material (cirka 1000 baspar lång) och försökte bestämma huruvida de bara representerade oavsiktliga strängar av sekvenseringsfel - eller hade verkligen användbar information om oexplorerat humant DNA.

Teamet kom fram till att detta "nya" DNA är av tillräckligt hög kvalitet för att motivera ett andra pass, även om de inte vet vad dess betydelse för människokroppen kan vara just än.

Vad är följderna?

Hittills säger Sherman, vi vet inte riktigt vad vi saknar genom att ignorera DNA som inte är representerat i referensgenomet. Men vem vet vad vi kan hitta där om vi tittar?

Salzberg föreslår att vi föreställer oss en fiktiv befolkning som har en extra kromosom - 24 istället för den vanliga 23 i varje cell. Ingenting i den extra kromosomen från denna population skulle stämma överens med referensgenomet. Kanske, säger hon, någonstans på den dolda kromosomen, är anledningen till att den fiktiva befolkningen tenderar att utveckla en viss sjukdom - och varför resten av världen inte gör det. Men för att vi inte har rätt referens att jämföra det med, skulle vi aldrig veta att det finns där.

Originalannonsering som tog in donorerna för Human Genome Project (Buffalo News, 3/23/1997), h / t Pieter de Jong, som lade annonsen pic.twitter.com/gNB7mMv3Yu

- Jay Shendure (@JShendure) 28 oktober 2017

"Om en gång i taget fanns mutationer i den kromosomen som orsakade problem skulle du aldrig kunna studera dem", säger Salzberg. "Du skulle aldrig kunna observera dem om du bara lita på detta referensgenom."

Låt oss vara tydliga: Denna forskning ger inga bevis för någon oupptäckt kromosom. Men det tyder på att vi förmodligen saknar mycket när vi använder ett enda referensgenom från någon person som heter RPCI-11 som grund för alla våra analyser på DNA hos hela vår art.

Hur kan vi fixa det?

I stället för att sträva efter ett enda universellt referensgenom, argumenterar laget, vi borde ha en knippa av referensgenomgångar - kanske en för varje befolkning av intresse.

"Det som vi tycker om förespråkar här med detta resultat är att vi verkligen behöver bygga referensgenom för varje befolkning", säger Sherman. "Om det saknas så mycket DNA från referensen i denna population, behöver modellen förändras."

Vissa länder har tagit det på sig för att åtminstone försöka skapa egna referensgenomgångar. Danmark sammanställer till exempel genetiskt material från 150 danar i ett försök att göra ett sant "dansk" referensgenom. En 2016 papper i Natur beskriver ett försök att sammanställa en referens för koreanska individer, även om det också författar bara forskning som utförs på en enda person. Men andra projekt, som 1000 Genomes Project, försöker också få igång processen, men det är mycket arbete att skapa ett referensmaterial som polerat som den nuvarande versionen, så kallad GRCh38.

"Du måste göra mer än bara gå och sekvensera en annan person från en annan befolkning för att skapa ett referensgenom", tillägger han. "Du måste göra lite mer."

Det är inte att forskare inte är medvetna om att vi behöver fler referensgenomgångar. Salzberg hoppas bara att det skulle finnas fler av dem nu, och att de åtminstone skulle bli allmänt antagna som standardreferensgenomgångar. Papperet beklagar att ingen av dessa försök har uppnått samma status och klagomål som GRCh38 - men det är målet för det danska projektet.

Framöver tar Sherman och Salzberg sig för att få projektet att starta, genom att bygga flera ytterligare referensgenom, som de hoppas kunna släppa om ett till två år. De letar efter att börja skapa ett bibliotek med referensgener för att hjälpa människor att få så mycket insikt utifrån deras genetiska material, oavsett hur "annorlunda" det är.

"Vad vi verkligen behöver ha är hundratals referensgenomgångar," tillägger han. "Det kommer att hända en dag."

$config[ads_kvadrat] not found