Половина пациентов с редкими заболеваниями годами ждут диагноза. Модель искусственного интеллекта popEVE ученых из Гарварда может изменить ситуацию
Половина людей с редкими заболеваниями никогда не получает четкого диагноза. Они совершают паломничество между больницами, и их геномы содержат ключ к разгадке тайны, скрытой среди тысяч генетических вариантов. Врачи не могли решить, какие мутации безвредны, а какие смертельны. Ученые из Гарвардской медицинской школы и Центра геномной регуляции в Барселоне только что опубликовали в журнале Nature Genetics модель искусственного интеллекта, которая может изменить ситуацию.
Целью было создание модели, классифицирующей генетические варианты в зависимости от тяжести заболевания, дающей приоритетную, клинически значимую картину генома пациента — проф. Дебора Маркс, Гарвардская медицинская школа.
Измерить пульс человека удаленно? Вот Pulse-Fi, который использует для этой цели Wi-Fi и машинное обучение.
Модель popEVE (название относится к более ранней EVE, т.е. Эволюционная модель Вариантного Эффекта) была создана путем объединения данных сотен тысяч видов и информации о генетической изменчивости всей человеческой популяции. Звучит сложно, но механизм удивительно элегантен. Представьте себе, что эволюция на протяжении миллиардов лет проводила бесчисленные эксперименты, проверяя, какие изменения в белках организмы могут переносить, а какие слишком разрушительны, чтобы выжить. Модель искусственного интеллекта popEVE учится на этом огромном справочном материале. Он анализирует белковые последовательности у разных видов и определяет, какие части нашего генома имеют решающее значение для жизни. Прорыв – это нечто большее, чем просто классификация «плохое-хорошее». Предшественник EVE, представленный командой проф. Дебора Маркс в 2021 году смогла оценить влияние мутаций внутри одного гена, но не позволила сравнить мутации между разными генами. Это все равно, что пытаться судить, хуже ли зубная боль, чем сломанная нога: в медицине нужна общая шкала. popEVE решает эту проблему, объединяя эволюционные данные с информацией из Британского биобанка и gnomAD, двух гигантских репозиториев, показывающих, какие варианты встречаются у здоровых людей. Это позволяет инструменту точно настраивать свои прогнозы в соответствии с тем, что действительно важно для человеческого тела.
В космос летят три польских военных наноспутника PIAST и первый спутник MikroSAR. Это только начало
Результат? Врачи наконец-то могут ответить на вопрос, какая мутация опаснее, даже если она затрагивает разные белки. Это позволяет нам в первую очередь сосредоточиться на наиболее потенциально разрушительных вариантах. Проверка данных более чем 31 000 семей с детьми, страдающими тяжелыми нарушениями развития, показала, что в 98% случаев, когда причинная мутация уже была выявлена, popEVE правильно идентифицировал этот вариант как наиболее опасный в геноме ребенка. Более того, модель превзошла своих ближайших конкурентов, в том числе нашумевшую модель DeepMind AlphaMissense, вызвавшую настоящий ажиотаж в 2023 году своей публикацией в журнале Science. Команда также обнаружила 123 гена, никогда ранее не связанных с нарушениями развития. Что особенно интригует, так это то, что 104 из этих генов были обнаружены всего у нескольких людей, максимум у одного или двух. Для таких ультраредких состояний даже секвенирование всего населения планеты не даст ориентиров. Классический подход, использующий статистический анализ больших групп, здесь беспомощен. Именно здесь помогает эволюционный подход popEVE.
МКС в реальном времени – это четверть века Международной космической станции в одном месте. Архив создан к 25-летию
Модель также устраняет проблему этнической предвзятости, от которой страдают многие геномные инструменты, которые называют мутации вызывающими заболевания просто потому, что они ранее не наблюдались в базах данных, в которых доминирует европейское население. popEVE рассматривает все человеческие варианты одинаково, задавая только вопрос, произошла ли данная мутация уже у людей, один раз в конкретной популяции или тысячу раз в европейских популяциях. Исследователи подчеркивают, что никто не должен получать тревожные результаты только потому, что их сообщество недостаточно представлено в глобальных базах данных.
Источник: Medical Xpress, Гарвардская медицинская школа, Природная генетика, Институт Броуда.