Królewska Szwedzka Akademia Nauk ogłosiła nazwiska laureatów tegorocznej nagrody Nobla w dziedzinie chemii. To Amerykanin David Baker z University of Washington w Seattle, wyróżniony za opracowanie narzędzi do komputerowego projektowania białek, a także Brytyjczycy Demis Hassabis i John M. Jumper z Google DeepMind w Londynie za metody przewidywania kształtu białek. Białka mają kluczowe znaczenie dla funkcjonowania żywych organizmów. Opracowane przez tegorocznych noblistów narzędzia mają absolutnie fundamentalne znaczenie nie tylko dla zrozumienia mechanizmów funkcjonowania organizmu, ale też przyspieszenia poszukiwań nowych leków...

Jak podkreśla w swym komunikacie Akademia, białka to chemiczne narzędzia życia i chemicy od dawna marzyli o pełnym zrozumieniu i opanowaniu tych narzędzi. To marzenie zaczyna się spełniać. Demis Hassabis i John M. Jumper z powodzeniem wykorzystali sztuczną inteligencję do przewidywania struktury niemal wszystkich znanych białek. David Baker nauczył się, jak opanować cząsteczki z których białka powstają i tworzyć zupełnie nowe. Potencjał ich odkryć jest ogromny. Odkryli tajemnice białek dzięki komputerom i sztucznej inteligencji.

Białka zbudowane są z 20 aminokwasów, które można łączyć na nieskończone sposoby. Korzystając z informacji zapisanych w DNA, aminokwasy są łączone w naszych komórkach, tworząc długie łańcuchy. Łańcuchy te skręcają się i zwijają w charakterystyczną trójwymiarową strukturę. To właśnie ta struktura nadaje białkom ich funkcję. Niektóre stają się chemicznym budulcem tak różnych tkanek, jak mięśnie, rogi lub pióra, podczas gdy inne mogą stać się hormonami lub przeciwciałami. Wiele z nich tworzy enzymy, które napędzają reakcje chemiczne życia z zadziwiającą precyzją. Białka, które znajdują się na powierzchniach komórek, są również ważne i działają jako kanały komunikacyjne między komórką a jej otoczeniem.

Trudno przecenić potencjał zawarty w chemicznych budulcach życia, w tym w 20 aminokwasach. Tegoroczna Nagroda Nobla w dziedzinie chemii dotyczy zrozumienia i opanowania ich na zupełnie nowym poziomie. Połowa nagrody trafia do Demisa Hassabisa i Johna Jumpera, którzy wykorzystali sztuczną inteligencję do skutecznego rozwiązania problemu, z którym chemicy zmagali się przez ponad 50 lat: przewidywania trójwymiarowej struktury białka na podstawie sekwencji aminokwasów. Pozwoliło im to przewidzieć strukturę niemal wszystkich 200 milionów znanych białek. Drugą połowę nagrody przyznano Davidowi Bakerowi. Opracował on skomputeryzowane metody osiągania tego, co wielu ludzi uważało za niemożliwe: tworzenia białek, które wcześniej nie istniały i które w wielu przypadkach mają zupełnie nowe funkcje. Ta nagroda docenia dwa różne odkrycia, ale ściśle powiązane.

Dawno, dawno temu...

Aby zrozumieć wyzwania, które pokonali tegoroczni laureaci, musimy cofnąć się do początków nowoczesnej biochemii. Chemicy wiedzieli, że białka są ważne dla procesów życiowych od XIX wieku, ale dopiero w latach 50. XX wieku narzędzia chemiczne stały się na tyle precyzyjne, że badacze mogli zacząć badać białka bardziej szczegółowo. Badacze z Cambridge, John Kendrew i Max Perutz, dokonali przełomowego odkrycia, gdy z powodzeniem zastosowali metodę krystalografii rentgenowskiej, by przedstawić pierwsze trójwymiarowe modele białek. W uznaniu tego odkrycia otrzymali Nagrodę Nobla w dziedzinie chemii w 1962 roku. Z pomocą tej metody pokolenia naukowców uzyskały obrazy około 200 tysięcy różnych białek, co dało podwaliny pod tegoroczną Nagrodę Nobla w dziedzinie chemii.

Istotne znaczenie miały też odkrycia Amerykanina Christiana Anfinsena, który z pomocą różnych sztuczek chemicznych sprawił, że istniejące białko rozwinęło się, a następnie ponownie zwinęło. Co ważne, białko przyjmowało za każdym razem dokładnie ten sam kształt. W 1961 roku doszedł więc do wniosku, że trójwymiarowa struktura białka jest całkowicie determinowana przez sekwencję aminokwasów w białku. To doprowadziło do przyznania mu Nagrody Nobla w dziedzinie chemii w 1972 roku.

Inny Amerykanin, Cyrus Levinthal, w 1969 roku policzył, że nawet jeśli białko składa się tylko ze 100 aminokwasów, teoretycznie może przyjąć co najmniej 10^47 różnych trójwymiarowych struktur. Gdyby łańcuch aminokwasów miał zwijać się losowo, znalezienie poprawnej struktury białka zajęłoby więcej czasu niż wiek wszechświata. W komórce zajmuje to tylko kilka milisekund. Jak więc łańcuch aminokwasów faktycznie się zwija? Odkrycia Anfinsena i Levinthala sugerowały, że zwijanie jest procesem z góry określonym. I - co ważne - cała informacja o tym, jak białko się zwija, musi być zawarta w sekwencji aminokwasów.

Twórcy gier i geniusze...

Powyższe spostrzeżenia doprowadziły do kolejnego decydującego zrozumienia - jeśli chemicy znają sekwencję aminokwasów białka, powinni być w stanie przewidzieć trójwymiarową strukturę białka. Był to ekscytujący pomysł. Jeśli by się udało, nie musieliby już używać skomplikowanej krystalografii rentgenowskiej i mogliby zaoszczędzić masę czasu. Mogliby również generować struktury dla wszystkich białek, w których krystalografia rentgenowska nie była możliwa. Aby zachęcić do szybszego rozwoju w tej dziedzinie, w 1994 roku badacze rozpoczęli projekt o nazwie Krytyczna Ocena Przewidywania Struktury Białek (CASP), który przekształcił się w konkurs. Co dwa lata badacze z całego świata mieli dostęp do sekwencji aminokwasów w białkach, których struktury właśnie zostały określone. Jednak struktury były utrzymywane w tajemnicy przed uczestnikami. Wyzwanie polegało na przewidywaniu struktur białek na podstawie znanych sekwencji aminokwasów.

CASP przyciągnął wielu badaczy, ale rozwiązanie problemu przewidywania okazało się niezwykle trudne. Zbieżność między przewidywaniami badaczy wprowadzonymi do konkursu a rzeczywistymi strukturami prawie się nie poprawiła. Przełom nastąpił dopiero w 2018 roku, kiedy na scenie pojawił się mistrz szachowy, ekspert w dziedzinie neuronauki i pionier sztucznej inteligencji. Demis Hassabis zaczął grać w szachy w wieku czterech lat i osiągnął poziom mistrzowski jako trzynastolatek. W wieku nastoletnim rozpoczął karierę jako programista i odnoszący sukcesy twórca gier. Zaczął badać sztuczną inteligencję i zajął się neuronauką, gdzie dokonał kilku rewolucyjnych odkryć. Potem wykorzystał to, czego nauczył się o mózgu, by rozwijać lepsze sieci neuronowe dla sztucznej inteligencji (AI).

W 2010 roku współzałożył DeepMind, firmę, która opracowała mistrzowskie modele AI dla popularnych gier planszowych. Firma została sprzedana Google w 2014 roku, a dwa lata później DeepMind zyskał światową uwagę, gdy firma osiągnęła to, co wielu wtedy uważało za święty Graal AI: pokonanie mistrza jednej z najstarszych gier planszowych na świecie, Go.

Dla Hassabisa Go nie było jednak celem, lecz środkiem do rozwijania lepszych modeli AI. Po tym zwycięstwie jego zespół był gotowy do podjęcia problemów o większym znaczeniu dla ludzkości, więc w 2018 roku zarejestrował się na trzynasty konkurs CASP. W poprzednich latach struktury białek, które badacze przewidywali dla CASP, osiągały dokładność na poziomie maksymalnie 40 procent. Zespół Hassabisa z modelem AlphaFold, osiągnął niemal 60 procent. Ich zwycięstwo  zaskoczyło wielu, ale rozwiązanie wciąż nie było wystarczająco dobre. Aby uznać to za prawdziwy sukces, przewidywanie musiało mieć w porównaniu do struktury docelowej dokładność 90 procent. Hassabis i jego zespół kontynuowali prace nad AlphaFold - ale oczekiwanych postępów nie było.

Wtedy na scenie pojawił się John Jumper, który miał doświadczenia w symulacji białek i po doktoracie z fizyki teoretycznej wysłał do zespołu Hassabisa aplikację o pracę. Z jego pomocą stworzono nową wersję modelu: AlphaFold2, którą trenowano na ogromnej ilości informacji w bazach danych wszystkich znanych struktur białek i sekwencji aminokwasów.

Jej twórcy zdążyli na czternasty konkurs CASP, który w 2020 roku pokazał, że AlphaFold2 działa prawie tak dobrze jak krystalografia rentgenowska.

... i humaniści

Akademia przypomina, że laureat drugiej połowy tegorocznej Nagrody Nobla David Baker zaczął studiować na Uniwersytecie Harvarda... filozofię i nauki społeczne. Jednak podczas kursu z biologii ewolucyjnej natknął się na pierwsze wydanie teraz klasycznego podręcznika Biologia Molekularna Komórki. I to skłoniło go do zmiany kariery życiowej. Zaczął badać biologię komórki i ostatecznie zafascynował się strukturami białek. W latach 90-tych jako lider grupy na University of Washington w Seattle eksperymentalnie badał procesy zwijania się białek i zaczął opracowywać oprogramowanie do przewidywania struktury białek: Rosetta. Baker zadebiutował w konkursie CASP w 1998 roku, używając Rosetty i w porównaniu do innych uczestników, wypadł naprawdę dobrze.

Ten sukces doprowadził do pomysłu, że można byłoby używać oprogramowania w odwrotny sposób. Zamiast wprowadzać sekwencje aminokwasów do Rosetty i otrzymywać struktury białek, powinno dać się wprowadzić pożądaną strukturę białka i uzyskać sugestie dotyczące jego sekwencji aminokwasów. To pozwoliłoby im tworzyć zupełnie nowe białka.

Dziedzina projektowania białek, gdzie badacze tworzą na zamówienie białka o nowych funkcjach, zaczęła się rozwijać pod koniec lat 90. W wielu przypadkach badacze po prostu modyfikowali istniejące białka, by mogły potem przydać się do rozkładania niebezpiecznych substancji, albo posłużyć jako narzędzie w przemyśle chemicznym. Jednak zakres naturalnych białek jest ograniczony. Aby zwiększyć potencjał uzyskania białek o zupełnie nowych funkcjach, grupa badawcza Bakera chciała tworzyć je od podstaw. Jeśli chcesz zbudować samolot, nie zaczynasz od modyfikacji ptaka; zamiast tego rozumiesz podstawowe zasady aerodynamiki i budujesz maszyny latające na podstawie tych zasad - przekonywał Baker.

Jak to konkretnie miało wyglądać? Grupa Bakera proponowała białko o zupełnie nowej strukturze, a następnie Rosetta liczyła, jaka sekwencja aminokwasów mógłby skutkować pożądanym białkiem. Aby to zrobić, Rosetta przeszukiwała bazę danych wszystkich znanych struktur białek i szukała krótkich fragmentów, które miały podobieństwa do pożądanej struktury. Korzystając z podstawowej wiedzy o mechanizmach energetycznych w cząsteczce białka Rosetta następnie optymalizowała te fragmenty i proponowała sekwencję aminokwasów. Aby zbadać, jak skuteczne było oprogramowanie, grupa badawcza Bakera wprowadziła gen dla proponowanej sekwencji aminokwasów do bakterii, które produkowały pożądane białko. Następnie określili strukturę białka za pomocą krystalografii rentgenowskiej. I okazało się, że białko, które badacze opracowali, Top7, miało prawie dokładnie strukturę, którą zaprojektowali. Baker opublikował to odkrycie w 2003 roku. Udostępnił również kod Rosetty, dzięki czemu globalna społeczność badawcza kontynuuje rozwijanie oprogramowania, znajdując nowe obszary zastosowania.

AlphaFold2 działa

Praca, która kiedyś zajmowała lata, teraz zajmuje tylko kilka minut. Kiedy Demis Hassabis i John Jumper potwierdzili, że AlphaFold2 naprawdę działa, obliczyli strukturę wszystkich ludzkich białek. Następnie przewidzieli strukturę praktycznie wszystkich 200 milionów białek, które badacze odkryli do tej pory podczas mapowania organizmów Ziemi. Google DeepMind również udostępnił kod AlphaFold2 publicznie, i każdy może mieć do niego dostęp. Model AI stał się kopalnią złota dla badaczy. Do października 2024 roku AlphaFold2 został użyty przez ponad dwa miliony ludzi z 190 krajów. Wcześniej przewidywanie struktury białka, jeśli w ogóle było możliwe, zajmowało lata. Teraz można to zrobić w kilka minut.

Model AI nie jest doskonały, ale szacuje poprawność struktury, którą wygenerował, więc badacze wiedzą, jak wiarygodne jest przewidywanie. Po konkursie CASP w 2020 roku, kiedy David Baker zdał sobie sprawę z jego potencjału dodał go do Rosetty, co również ułatwiło projektowanie białek. Jak podkreśla Akademia, fakt że można teraz tak łatwo wizualizować strukturę białek jako narzędzi chemicznych pozwala lepiej zrozumieć, jak funkcjonuje życie, dlaczego niektóre choroby się rozwijają, jak powstaje oporność na antybiotyki lub dlaczego niektóre bakterie mogą rozkładać plastik. Zdolność do tworzenia białek, które realizują nowe funkcje, jest równie zdumiewająca. Może to prowadzić do nowych nanomateriałów, ukierunkowanych farmaceutyków, szybszego rozwoju szczepionek, czujników i bardziej ekologicznego przemysłu chemicznego. Wszystko to - i znacznie więcej - dla jak największych korzyści ludzkości.

Opracowanie: