Взгляд на облачную геномику Microsoft

Опубликовано: 6 Марта, 2023
Взгляд на облачную геномику Microsoft

Как часто вы благодарите свои гены за свою внешность, социальные навыки или интеллект? Или, если уж на то пошло, вините свои гены в своих недугах или болезнях? Задумывались ли вы, что на самом деле представляют собой эти гены и почему они так сильно на вас влияют?

Добро пожаловать в мир геномики — раздела молекулярной биологии, который глубоко занимается созданием, эволюцией, функциональностью и картированием различных генов во всех живых организмах. И так же, как вы, как ИТ-специалист, вероятно, обнаружите, что Azure может помочь вам лучше выполнять свою работу, те, кто работает в области геномики, также обнаружат, что облачная платформа Microsoft делает их исследования лучше.

Давайте потратим несколько минут, чтобы получить общее представление о генах и их роли в организме человека.

ДНК и геномика

Дезоксирибонуклеиновая кислота (ДНК) является основой всех живых организмов. Это химическое соединение, которое содержит инструкции, необходимые для управления деятельностью и физической структурой живого существа. У человека ДНК состоит из двух скрученных и спаренных нитей, часто называемых двойной спиралью.

ДНК каждого человека состоит из четырех химических единиц, которые несут инструкции, необходимые для производства определенного белка в организме. Поскольку белки составляют структуры нашего тела, такие как органы и ткани, а также контролируют внутренние химические реакции, эта ДНК определяет нашу предрасположенность к определенным заболеваниям. Полный набор ДНК называется геномом, и у человека эта ДНК расположена на 23 парах хромосом. Именно эти 23 пары придают нам уникальный внешний вид и индивидуальность. Удивительно, правда?

Это еще не все. Исследователи во всем мире объединяют свои глубокие знания с передовыми технологиями, чтобы найти решения для многих сложных заболеваний, которые преследуют нас сегодня, и, что более важно, изучить новые возможности для их лечения.

Одной из технологий, которая находится на переднем крае изучения геномики, является облако. Ведущие облачные компании, такие как Microsoft, помогают исследователям хранить и анализировать петабайты данных, чтобы получить ценную информацию о генах. На самом деле Microsoft придумала несколько проектов, которые предоставляют критически важную информацию за счет сокращения времени, необходимого для секвенирования ДНК.

Вот подробный обзор усилий Microsoft в области геномики.

ФаСТ-ЛММ

Факторированные спектрально-преобразованные линейные смешанные модели (FaST-LMM) — это набор инструментов, разработанных Microsoft для наиболее эффективного проведения полногеномных ассоциативных исследований (GWAS).

В частности, этот инструмент помогает исследователям выполнять GWAS как с одним SNP, так и с набором SNP на огромных объемах наборов данных. SNP обозначает однонуклеотидный полиморфизм и относится к возможности наличия определенного основания в положении. Например, предположим, что основание С встречается в определенном месте человеческого генома у большинства людей, а основание А встречается в редких случаях. Это можно интерпретировать как вариации нуклеотидов, которые могут возникать в этом конкретном положении. Это изменение в SNP является причиной того, что мы более восприимчивы к одним заболеваниям, чем к другим, поэтому понимание этого различия может помочь специалистам в области здравоохранения определить правильное лечение для каждого человека.

Но выявить эту вариацию совсем не просто, так как вычисления могут занять годы. С облаком то, на что раньше уходили годы, можно сделать за день. Например, анализ 500 000 SNP для 15 000 человек может составить колоссальные 62 миллиарда наборов SNP, и это можно проанализировать за день в Azure. Это сила технологий!

[tg_youtube video_id="lZ48LXsXjTo"]

Буквально

Быстрый прогресс в области медицины, особенно в области секвенирования ДНК и геномики, мешает исследователям оставаться в курсе растущих научных знаний. В то же время важно понимать эти разработки, поскольку они позволяют выявлять и лечить заболевания лучше и быстрее, чем раньше.

Чтобы помочь исследовательскому сообществу быть в курсе событий, Microsoft разработала кураторскую систему под названием Literome, которая извлекает геномную информацию из PubMed и делает ее доступной в облаке для удобного просмотра и поиска. Этот репозиторий содержит все последние разработки в области направленных взаимодействий и ассоциаций генотип-фенотип, которые касаются SNP, взаимодействия генов и многого другого.

Партнерство и сотрудничество

Помимо разработки собственных инструментов, Microsoft также сотрудничает и сотрудничает с геномными компаниями DNAnexus и Codigo, а также с Гамбургским университетом Эппендорф.

DNAnexus предоставляет совместную платформу геномной информатики и управления данными для улучшения приложений генома для здравоохранения и исследований. Эта платформа теперь работает в Azure, чтобы обеспечить более быструю обработку и лучшие возможности обработки данных. Такие организации, как Стэнфордский центр геномики и персонализированной медицины (SCGPM), уже начали использовать DNAnexus в Azure.

Точно так же BC Platforms и Microsoft объединились, чтобы создать облачное решение для управления геномными данными для Codigo, коммерческой лаборатории в Мексике, целью которой является создание крупнейшего биобанка генетической информации в латиноамериканском регионе.

Такое партнерство помогает Microsoft расширить свою платформу Azure для компаний, занимающихся геномными исследованиями, а через нее — для тысяч исследователей, которые работают над выявлением и лечением сложных заболеваний, таких как рак и серповидноклеточная анемия.

Облачная геномика в реальном мире

Облачные инструменты Microsoft для геномики оказали огромное влияние на реальный мир, и во многом это можно объяснить тем фактом, что идея этих инструментов исходит от биологов, которые проявили интерес к информатике, потому что анализ и вычисления приобретали все большее значение. большую часть своего драгоценного времени. Эти идеи были дополнены и реализованы учеными-компьютерщиками, проявляющими большой интерес к биологическим наукам.

Такое сочетание биологов и специалистов по информатике дает Microsoft преимущество перед другими облачными провайдерами, работающими в том же пространстве. В настоящее время инструменты Microsoft гарантируют, что запуск набора инструментов для анализа генома (GATK) в Azure выполняется в семь раз быстрее по сравнению с другими облачными системами. В результате это позволяет врачам намного быстрее диагностировать и лечить редкие и опасные заболевания, тем самым увеличивая выживаемость пациентов. Стоимость проведения этих геномных тестов также доступна.

Геномная революция

Из-за вышеперечисленных факторов количество запросов от больниц и научно-исследовательских институтов на обработку геномных тестов быстро растет. В этом смысле Microsoft подпитывает революцию в области геномики, которая может изменить то, как мы понимаем свое тело. Кроме того, это также может ускорить исследования растений и животных, поскольку секвенирование генома может быть выполнено за гораздо более короткое время, чем раньше. Эти события, в свою очередь, могут решить некоторые из насущных проблем, с которыми мы сталкиваемся, таких как нехватка продовольствия, возобновляемые источники энергии, глобальное потепление, угроза со стороны новых вирусных нитей и многое другое.

Короче говоря, облачная геномика, вероятно, станет следующей большой волной в сфере медицины и здравоохранения. Эта технология, разработанная такими компаниями, как Microsoft, может помочь нам лучше понять живые организмы в целом и человека в частности, чтобы можно было заранее прогнозировать редкие заболевания и как можно раньше назначить соответствующее лечение. И все это означает, что мы на шаг ближе к более здоровой и долгой жизни.