Üks bioloogia põhiülesandeid on lahendatud

Üks bioloogia põhiülesandeid on lahendatud
Üks bioloogia põhiülesandeid on lahendatud
Anonim

Valgu struktuur on üks peamisi müsteeriume, mille teadus peab avastama, näiteks plastjäätmete ringlussevõtuks või pärilike haiguste raviks. Kuid selgus, et loodus on kavalam kui ükski arvuti: maailmas on üle 200 miljoni valgu struktuuri ja igaüks neist on individuaalne. Tehisintellekt (AI) viis teadlased nende saladuste lahendamisele lähemale.

Tehisintellekt (AI) on lahendanud bioloogia ühe olulisema probleemi: nüüd saab selle abil ennustada valgu kolmemõõtmelise struktuuri aminohappejärjestust. Sõltuvalt selle järjestuse täiuslikkusest või ebatäiuslikkusest täidab valk oma ülesandeid. Struktuuribioloogia juhtivad eksperdid ja iga kahe aasta tagant toimuva valgu voltimise (voltimise) katse korraldajad teatasid täna sellest silmapaistvast saavutusest tehisintellekti (AI) valdkonnas areneva Briti ettevõtte DeepMind teadlaste poolt. On öeldud, et DeepMindi meetodil on kaugeleulatuvad tagajärjed. Näiteks võib see oluliselt kiirendada uute ravimite väljatöötamist.

"DeepMindi meeskond on suutnud saavutada fantastilise tulemuse, mis muudab dramaatiliselt struktuuribioloogia ja proteiiniuuringute arendamise väljavaateid," ütleb Euroopa Bioinformaatika Instituudi emeriitdirektor Janet Thornton. "See väljakutse on 50 aastat vana," lisab John Moult, Shady Grove'i Marylandi ülikooli struktuuribioloog; Moult on teadusvõistluse Critical Assessment of Protein Structure Prediction (CASP) kaasasutaja. "Ma poleks kunagi arvanud, et elan seda hetke," lisab Moult.

Millest see räägib? Inimese kehas on kümneid tuhandeid erinevaid valke, millest igaüks on paljude aminohapete ahel - kümnetest kuni sadadeni. Aminohapete järjestus määrab lugematu arvu interaktsioone nende vahel ja viib seega keerukate kolmemõõtmeliste struktuuride tekkimiseni, mis omakorda määravad valkude omadused. Teave nende valgu struktuuride kohta võimaldab teadlastel luua uusi ravimeid. Ja võime sünteesida soovitud struktuuriga valke kiirendab ensüümide (kiirendite) arengut, mille abil on näiteks võimalik toota biokütuseid ja täielikult plastjäätmeid lagundada.

Aastakümneid on teadlased dešifreerinud kolmemõõtmelisi valgustruktuure, kasutades selliseid eksperimentaalseid meetodeid nagu röntgenkristallograafia või krüoelektronmikroskoopia (krüo-EM). Selliste meetodite kasutamine võtab aga kohati, kuid või aastaid; pealegi ei tööta need meetodid alati. Rohkem kui 200 miljonist teadaolevast valgustruktuurist on dešifreeritud vaid umbes 170 tuhat.

1960. aastatel jõudsid teadlased järeldusele, et kui oleks võimalik kindlaks määrata kõik antud valgujärjestusele iseloomulikud seosed, siis oleks võimalik ennustada valgu ruumilist struktuuri. Kuna aga iga valk sisaldab sadu aminohappeühikuid, mis toimivad üksteisega erineval viisil, leiame lõpuks, et selliste struktuuride koguarv ühe aminohappejärjestuse kohta on lihtsalt hiiglaslik. Arvutiteadlased asusid sellele probleemile lahenduse leidma, kuid asjad läksid aeglaselt.

1994. aastal käivitas John Moult ja tema kolleegid laiaulatusliku CASP eksperimendi, mis viiakse läbi iga kahe aasta tagant. Selles katses osalejatele antakse aminohappejärjestused, mis koosnevad umbes sajast valgust, mille struktuur on teadmata. Mõned teadlaste rühmad arvutavad iga järjestuse struktuuri, teised aga katseliselt. Seejärel võrdlevad katse korraldajad ennustatud ennustusi laboritulemustega, kasutades hinnangu täpsuse (GDT) hinnangut, mis jääb vahemikku null kuni sada. Kui hinnangud on üle 90 GDT, loetakse arvutatud ennustused eksperimentaalsete lähedasteks, ütles Moult.

Juba 1994. aastal saavutasid teadlased, et nende poolt ennustatud väikeste lihtsate valkude struktuurid võivad vastata katsetulemustele. Suuremate ja keerukamate valkude puhul olid aga arvutuste tulemused umbes 20 GDT -d - "täielik ebaõnnestumine", nagu ütles üks CASP -kohtunikest, arengubioloogia instituudi evolutsioonibioloog Andrei Lupas. Max Planck. Aastaks 2016 olid konkureerivad teadlaste meeskonnad värvanud umbes 40 GDT -d kõige keerukamate valkude jaoks, peamiselt CASP -ga tuntud valkude struktuuride analüüsimisel.

Kui DeepMind 2018. aastal esimest korda konkursile astus, tugines selle pakutud algoritm nimega AlphaFold teoreetiliste ja praktiliste tulemuste võrdlemisel ülalkirjeldatud meetodile. Kuid AlphaFold kasutab ka süvaõppe meetodeid: tarkvara õpib tohututest andmehulkadest (antud juhul teadaolevate valkude järjestustest ja struktuuridest) ning õpib mustreid tuvastama. DeepMind võitis kergelt, edestades konkurentsi iga valgu struktuuri puhul keskmiselt 15% ja kogudes kõige väljakutsuvamate ülesannete jaoks umbes 60 GDT punkti.

Sellegipoolest olid DeepMindis AlphaFoldi algoritmi väljatöötamise eest vastutava John Jumperi sõnul tehtud ennustused liiga toored, et neid praktilistel eesmärkidel kasutada. "Me teadsime, et oleme bioloogia praktilisest kasutamisest veel kaugel," ütles Jumper. Paremate tulemuste saavutamiseks ühendasid Jumper ja tema kolleegid sügava õppimise "tähelepanu algoritmiga", mis jäljendab inimese võimet puslesid kokku panna. See juhtub järgmiselt: esiteks valmistatakse väikesed killud väikestest tükkidest (antud juhul aminohappeühikute fragmendid) ja seejärel püütakse neid fragmente kombineerida, moodustades ühtse terviku suurematest suurustest. See töö hõlmab arvutivõrku, mis koosneb 128 masinõppe protsessorist; neil õnnestus algoritmi koolitada umbes 170 tuhande tuntud valgustruktuuri kohta.

Ja see töötas! Sel aastal sai AlphaFoldi algoritm CASP -is analüüsimiseks välja pakutud valkude keskmise punktisumma 92,4 GDT. Kõige keerulisemate valkude analüüsimisel sai AlphaFoldi algoritm keskmiselt 87 punkti, mis on 25 punkti kõrgem kui varem tehtud kõige täpsemad ennustused. Algoritm sai isegi hakkama rakumembraanides paiknevate ja paljude inimeste haiguste eest vastutavate valkude struktuuride analüüsiga, kuid samal ajal on seda raske uurida röntgenkristallograafia abil. Struktuuribioloog Venki Ramakrishnan meditsiiniuuringute nõukogu molekulaarbioloogia laborist nimetas tulemust "hämmastavaks saavutuseks valgu struktuuri ennustamise probleemis".

John Moult sõnul on tänavusel võistlusel kõik teadlaste rühmad näidanud veelgi täpsemaid tulemusi. Aga kui me räägime AlphaFoldi algoritmist, siis Andrey Lupase sõnul "on olukord radikaalselt muutunud". CASP eksperimendi korraldajad kahtlesid isegi DeepMind algoritmi terviklikkuses. Ja Lupas seadis endale eraldi ülesande: välja selgitada arheea liikide (iidsete mikroorganismide rühma esindaja) membraanvalgu struktuur. Tema uurimisrühm on juba kümme aastat püüdnud saada selle valgu kristallstruktuurist röntgenipilti. Kuid Lupase sõnul ei saanud seda probleemi lahendada.

AlphaFoldi algoritmiga aga probleeme ei tekkinud. Väljundiks oli kolmekomponendilise valgu üksikasjalik pilt, mille keskel oli kaks spiraalset haru. Algoritmi koostatud mudel võimaldas Lupasel ja tema kolleegidel mõista röntgenkiirte abil saadud andmeid; poole tunni pärast võrdlesid nad oma katseandmeid AlphaFold algoritmiga ennustatud struktuuriga. "Tulemus on peaaegu täiuslik," ütleb Lupas. - Andmetega manipuleerimine oli võimatu. Ma ei saa aru, kuidas neil see õnnestus."

Üks CASP katses osalemise tingimustest nõustus DeepMind koos kõigi teiste rühmadega avaldama oma meetodi olulised üksikasjad, et teised rühmad saaksid seda korrata. See on kingitus eksperimenteerijatele, kuna valgu struktuuri täpne ennustamine aitab neil õigesti tõlgendada röntgenuuringute ja krüoelektronmikroskoopia (krüo-EM) abil saadud hämaraid andmeid. Lisaks võimaldab Moulti sõnul AlphaFoldi algoritm ka ravimiarendajatel kiiresti määrata uute ja ohtlike patogeenide, näiteks SARS-CoV-2, moodustavate valkude struktuuri, mida tuleks omakorda pidada üheks olulised sammud molekulide otsimise protsessis, millega neid patogeene saab blokeerida.

Kuid AlphaFoldi algoritm ei ole kõigi ülesannete jaoks võimeline. Näiteks CASP katses aeglustus selle töö ühe valgu analüüsimisel märgatavalt (see oli segu 52 väikesest korduvast segmendist, mis moonutavad üksteise asukohti kokkupanekul). John Jumper ütleb, et uurimisrühm sooviks nüüd AlphaFoldi koolitada, et see saaks analüüsida ülalmainitud struktuure, aga ka valgukomplekse, mis koos täidavad rakus olulisi funktsioone.

Kuid varsti pärast ühe kõige raskema probleemi lahendamist ilmuvad kahtlemata teised. "See pole veel lõppenud," ütleb Janet Thornton. "Meie ees on palju uusi ülesandeid."

Soovitan: