AI sprawdziła pół miliarda związków chemicznych w jeden dzień. To może być przełom
Białka to molekularne „maszyny” wytwarzane przez organizm według instrukcji zapisanych w naszych genach. Gdy działają wadliwie, mogą wywoływać choroby. Dlatego naukowcy poszukują leków wchodzących w interakcje właśnie z proteinami: blokują je, modyfikują ich aktywność lub przywracają prawidłowe funkcjonowanie. Problem w tym, że ludzkie DNA zawiera ok. 20 tys. genów kodujących białka. Dotychczas udało się opracować leki oddziałujące z proteinami, których budowa została zapisana tylko w ok. 10 proc. spośród nich. Reszta pozostaje terra incognita, dlatego potencjalnie stanowi ogromne pole dla poszukiwań nowych terapii.
Czytaj też: Nowy model AI diagnozuje choroby płuc trafniej niż lekarze
DrugCLIP szuka prędko
Jednak sprawdzenie, które związki chemiczne mogłyby wchodzić w lecznicze interakcje z białkami, wymaga olbrzymich nakładów czasu i potężnej mocy obliczeniowej. Dotychczas naukowcy wykorzystywali w tym celu komputerowe symulacje, by przewidzieć, czy dana cząsteczka chemiczna „pasuje” do konkretnej proteiny – niczym klucz do zamka. Proces ten trwał bardzo długo. Wymagał np. dwóch tygodni nieprzerwanej pracy potężnych superkomputerów, by przeanalizować miliard związków chemicznych pod kątem tylko jednego białka. Przebadanie całego genomu takimi metodami zajęłoby wieki.
Dlatego zespół chińskich naukowców opracował system AI o nazwie DrugCLIP, którego istota działania polega na zmianie „filozofii” dopasowywania leków. Tradycyjne metody przypominają próby fizycznego włożenia tysięcy różnych kluczy do jednego zamka, co wymaga skomplikowanych obliczeń dla każdej takiej pary. DrugCLIP działa natomiast bardziej jak internetowa wyszukiwarka grafik lub system rozpoznawania twarzy. Innymi słowy, tradycyjna metoda to symulacja procesu fizycznego (dokładne odwzorowanie oddziaływań atomów), natomiast nowa to wyszukiwanie informacji (porównanie cech zapisanych liczbowo w przestrzeni matematycznej).
Wyniki działania DrugCLIP opublikowane w najnowszym wydaniu „Science” są imponujące. System przeanalizował możliwość wiązania ponad pół miliarda substancji chemicznych z niemal 10 tys. ludzkich białek. Ta operacja – obejmująca ponad 10 bln par cząsteczka-białko – zajęła niecałą dobę na pojedynczym komputerze wyposażonym tylko w osiem procesorów graficznych (są potrzebne do wykonywania mnóstwa obliczeń przez algorytm AI). Oznacza to osiągnięcie tempa ponad 10 mln razy szybszego niż tradycyjne metody.
Co najważniejsze, przewidywania systemu potwierdzono w laboratorium. Dla transportera norepinefryny – białka będącego celem leków przeciwdepresyjnych – DrugCLIP znalazł związki chemiczne, z których 15 proc. okazało się substancjami skutecznie hamującymi funkcjonowanie tego białka. A 12 spośród nich działało silniej niż bupropion, popularny lek stosowany w depresji.
Czytaj także: Czy AI zastąpi lekarzy? Pomoże wykrywać nowotwory? Nadciąga rewolucja
Tysiące kandydatów na leki
Jeszcze większym sukcesem zakończyły się testy przeprowadzone na białku TRIP12, łączonym z nowotworami i chorobami neurodegeneracyjnymi. To cel wyjątkowo trudny, gdyż nie znamy żadnych wiążących się z nim leków, a jego struktura po połączeniu z jakąkolwiek cząsteczką leczniczą pozostaje nieznana. DrugCLIP musiał więc sięgnąć po pomoc słynnego modelu AlphaFold2 (jego twórców uhonorowano w 2024 r. Noblem), który potrafi przewidywać kształt przestrzenny białek. Ponieważ jednak takie komputerowe „prognozy” bywają niedokładne w kluczowych detalach, konieczne okazało się użycie modułu „GenPack”, który precyzyjnie definiował miejsce, gdzie lek powinien się przyłączyć do proteiny. Dzięki temu system trafnie wytypował kandydatów: 17,5 proc. spośród nich potrafiło połączyć się z białkiem TRIP12, a dwie cząsteczki skutecznie zablokowały jego działanie.
Efektem pracy chińskiego zespołu jest publicznie dostępna baza GenomeScreenDB, zawierająca ponad 2 mln potencjalnych kandydatów na leki dla ok. 10 tys. ludzkich białek. To ponaddwukrotnie więcej protein niż w dotychczas największych bazach danych tego typu.
Autorzy podkreślają jednak, że ich wyniki to dopiero punkt wyjścia. Zidentyfikowane związki wymagają dalszych badań, zanim będą mogły dotrzeć do etapu testów klinicznych. Niemniej DrugCLIP otwiera nowe możliwości systematycznej eksploracji tysięcy protein, z którymi dotąd nie umiano powiązać żadnych substancji leczniczych.