Облако Amazon открывает доступ к данным проекта 1000 Genomes
В настоящее время в Amazon Web Services (AWS), публичный облачный сервис компании Amazon.com, хранится 200 терабайт данных, состоящих из последовательностей ДНК около 1700 человек. Облако предлагает бесплатный доступ к этим данным. Это данные из 1000 Genomes Project, международного исследовательского проекта, созданного усилиями 75 компаний и организаций и имеющего своей целью создания наиболее подробного каталога генетической изменчивости человека.
Американский национальный институт здравоохранения играл важную роль в перемещении этих данных в 'Облако' и открытия их для общего пользования. Организация будет продолжать добавлять данные из 1000 Genomes в облако Amazon, так как задачей участников проекта является секвенирование геномов более 2600 человек из 26 мировых популяций. По словам Лизы Брукс, руководителя программы в Национальном институте генома человека, раньше исследователям, которые хотели получить доступ к наборам данных 1000 Genomes приходилось загружать их из правительственных дата-центров в свои системы или доставлять их на дисках. Этот процесс занимает много времени и это при условии, что лаборатория в состоянии загрузить эти данные и располагает соответствующими хранилищами данных и вычислительной инфраструктурой для их размещения и анализа. И в институте довольны, что теперь данные проекта 1000 Genomes Project находятся в облачных хранилищах AWS, что обеспечивает исследователей в любой точке мира простым доступом к этим данным, которые они смогут использовать в своих исследованиях.
Массивы данных хранятся в Amazon Simple Storage Service (S3) и ее Elastic Block Store (EBS). Пользователи смогут получать доступ к этим данным с помощью Amazon Elastic Compute Cloud (ES2) и его сервиса Elastic MapReduce (EMR). Это означает, что исследователям больше не нужно будет перемещать данные в свою систему и иметь доступ к дорогостоящему оборудованию способному хранить и обрабатывать такой большой объем данных. Для получения доступа к этой информации используйте каталог Amazon Public Data Sets.

Сообщения, вопросы и ответы
Вы можете задать вопрос, написать комментарий, обсудить данную новость или статью.