このデータベースの初期バージョンには 85 億個の遺伝子変異に関するアノテーションが含まれています。情報源には次のものが含まれています。
- ClinVar および GWAS カタログの臨床的なアノテーション
- 1000 Genomes Project から得られる人口頻度
- アミノ酸やタンパク質の置換など遺伝子および転写モデルのアノテーション
- およびエクソン遺伝子変異の機能シーケンス
さらにこのデータベースには、Conservation スコアと Evolutionary スコア、また、メンデリアン表現型に関連する確率を予測するスコアリングも含まれています。
基礎研究と同様にゲノム シーケンシングが臨床ケアにとってますます一般的になっていくに従い、正確かつ包括的な遺伝子変異データベースが遺伝子情報を理解するうえで不可欠なものとなるでしょう。我々は、遺伝子変異の詳細なアノテーションが Google BigQuery を用いたビッグデータ処理に適合することを理解しました。このことを強く確信したので、
Google Cloud Platform を通じて、この先例のないデータベースをゲノミクス コミュニティに寄贈したのです。
なにかご質問があれば、Tute Genomics の
こちら からお問い合わせください。
Posted by Bryce Daines, Reid Robison, Chris London, Brendon Beebe, David Mittelman, and Kai Wang of Tute Genomics
0 件のコメント :
コメントを投稿