No.3ベストアンサー
- 回答日時:
実験的にやる方法はもちろんいろいろありますが、質問の趣旨は、ゲノム配列がわかったところで、どうやって遺伝子がいくつあると推定されるなんてことが言えるのかという事ではないでしょうか。
遺伝子領域の推測は、実際にいろいろな遺伝子がクローニングされ実験的に明らかにされてきたデータの蓄積から、法則性が見つけ出され、それをゲノム配列から見つけ出すプログラムを作って使っているわけです。
原理的には、
1.オープンリーディングフレーム(ORF)の抽出と確からしさの推測
タンパク質をコードしている配列は、コドン(アミノ酸1個をコードする3塩基の並び)がある程度連続しているはずです。コドンフレーム(枠組み)は1塩基ずつずれた3通りがあり得るのですが、正しいフレームは連続するのに対し、誤ったフレームは停止コドンが頻繁に入って有意なフレームを為すことができないことがほとんどです。もちろんタンパク質をコードしていない配列はどのフレームをとってもそうなります。
翻訳可能なフレーム(オープンリーディングフレーム)を見つけて、その連続性やコドンの使い方の法則性にあっているかなどで、それが遺伝子であるかを判別します。
2.スプライシングの予測
真核生物の一つの遺伝子はmRNAになるところ(エクソン)がとびとびにあって、その間にmRNAになるときに捨てられる配列(イントロン)があります。当然、タンパク質をコードしている配列はエクソンにあります。
イントロンが切り離されエクソン同士がつなげられることをスプライシングといいますが、エクソン・イントロンの境界の配列は規則性があります。これを見つけ出して、とびとびに現れるORFのどれが一つの遺伝子のエクソンに相当するかを予測します。
この回答への補足
ご回答を頂きながらご返事がたいへん遅くなり申し訳ありません。ご教示いただいた内容が知らない言葉ばかりで意味が全く分からず、遺伝とゲノムに関する書籍を購入し勉強するのに今日までかかってしまいました。やっと、ご教示いただいた内容が概ね分かるようになりました。そのような事情ですので、何卒お許し賜りますようお願い申し上げます。
「質問の趣旨は、ゲノム配列がわかったところで、どうやって遺伝子がいくつあると推定されるなんてことが言えるのかという事」とのご指摘、そのとおりです。舌足らずな言い方でご迷惑をおかけしました。申し訳ありません。
ご教示いただいた内容は概ね理解できたように思うのですが、何分素人のため分からない言葉が多く、完全には理解できておりません。お手数をおかけして誠にもし訳ありませんが、あと少しお教えいただけないでしょうか。
(1)「コドンフレーム」とは何でしょうか。「塩基3つの並び」「順番を有する塩基3つを入れることができる大きさを持つ枠」というような意味でしょうか。
(2)「1塩基ずつずれた3通りがあり得る」とはどういう意味でしょうか。ゲノムの塩基の並びがあったときに、そのうちのある特定の1つの塩基Xを含むコドンとしては「X**」「*X*」「**X」の3とおりが考えられるということでしょうか。
(3)「正しいフレームは連続する」とはどういう意味でしょうか。「ゲノム上の検討している箇所が遺伝子であれば、「開始コドンまたは終止コドン」以外のアミノ酸に対応したコドンがある程度連続している」という意味でしょうか。
(4)「エクソン・イントロンの境界」とは、文字どおり「エクソンとイントロンの境界」という意味でしょうか。つまり、「ここまでがエクソンでここからがイントロンという場合の「ここ」にあたる位置」でしょうか。そのような意味であれば、「エクソン・イントロンの境界」は塩基を含まないと思いますが、そのような理解でよろしいでしょうか。
(5)「エクソン・イントロンの境界の配列」とは何でしょうか。
たくさんお尋ねして申し訳ありません。ご教示いただけましたらたいへん有り難く存じます。
よろしくお願いいたします。
No.5
- 回答日時:
補足します
遺伝子の開始(転写開始点またはプロモーター)の予測から遺伝子の存在を予測するのは困難です。なぜなら、
・転写開始のコンセンサス配列は短かく、バリエーションも多いので、偽者も多数ひっかかってくる。
・ひとつの遺伝子に対し、複数の転写開始点があることがまれではない。
・翻訳領域は第二エクソン以下にあることが多い。転写開始点直下の第一エクソンは、ORFを持たない一見無意味な配列であることが多く、ORFをもつエクソンから大きく離れていることもまれではないので、遺伝子としての一貫性が予測困難。
ということで、ゲノム配列からの遺伝子予測は、翻訳開始メチオニンコドン(ATG)から停止コドンまでを単位に行うのが普通です。
転写開始点予測は、ある興味のある遺伝子について、転写開始点がどこにあるのかを予測したり、候補を絞り込んだりするのには有効なんですけれどね。
この回答への補足
ご回答を頂きながらご返事がたいへん遅くなり申し訳ありません。ご教示いただいた内容が知らない言葉ばかりで意味が全く分からず、遺伝とゲノムに関する書籍を購入し勉強するのに今日までかかってしまいました。やっと、ご教示いただいた内容が概ね分かるようになりました。そのような事情ですので、何卒お許し賜りますようお願い申し上げます。
さて、ご教示いただいた内容は概ね理解できたように思うのですが、何分素人のため分からない言葉が多く、完全には理解できておりません。お手数をおかけして誠にもし訳ありませんが、あと少しお教えいただけないでしょうか。
(1)「コンセンサス配列」とは何でしょうか。
(2)第一エクソンは常に翻訳開始コドンであると理解しておりましたが、「転写開始点直下の第一エクソンは、ORFを持たない一見無意味な配列であることが多い」とはそのような理解が間違っているということでしょうか。
たくさんお尋ねして申し訳ありません。ご教示いただけましたらたいへん有り難く存じます。
よろしくお願いいたします。
No.4
- 回答日時:
>「同じ種に属する多くの固体のゲノムを解読し、固体間で差のある塩基対を見つけて、それを遺伝子であると推定する」
というのはちょっと違います。
なぜならば、ゲノム上では全ての塩基配列において突然変異が起こりえます(領域によって変異率には差があるのですが、ここでは割愛で・・・)。もし、遺伝子領域内のタンパクをコードしている領域や転写調節に重要な領域であった場合、生存に不利になるか致死になる場合が多くなります。一方、遺伝子のない領域ですと、突然変異が起こっても生存に関係しないことが多いのです。そのため、遺伝子外領域の方が個体差は大きくなります。
遺伝子かどうかの判別は原理的に#3の方のおっしゃる通りだと思います。古典的にはストップコドンの出現や、スプライシングのAG-GT則を参考にします。
ただ、現在では実験動物として使用されているものの多くはゲノム配列が解読されており、配列データベースが利用できるようになっています。そのため、20bp程度の配列がわかれば、ゲノム上のどこに位置する配列なのかがわかります。そして、ヒトやマウスにおいては、かなりの割合の遺伝子(EST)が既に同定されています。また未知の遺伝子であっても、そのようなデータベースには遺伝子予測情報もありますので、それを利用することが多いと思います。そのようなデータベースの遺伝子予測アルゴリズムは、他種生物の遺伝子との相同性や既知遺伝子の一部であるドメインとの相同性、その生物種で好んで使われるコドン傾向(一つのアミノ酸に対して多くは3種のコドンがありますが、どれを使用するかは生物種によって偏っています)などなど非常に様々な情報を元に予測しています。現在有名な遺伝子予測アルゴリズムとしてはGeneScanなどが知られています。
この回答への補足
ご回答を頂きながらご返事がたいへん遅くなり申し訳ありません。ご教示いただいた内容が知らない言葉ばかりで意味が全く分からず、遺伝とゲノムに関する書籍を購入し勉強するのに今日までかかってしまいました。やっと、ご教示いただいた内容が概ね分かるようになりました。そのような事情ですので、何卒お許し賜りますようお願い申し上げます。
さて、ご教示いただいた内容は概ね理解できたように思うのですが、何分素人のため分からない言葉が多く、完全には理解できておりません。お手数をおかけして誠にもし訳ありませんが、あと少しお教えいただけないでしょうか。
(1)「遺伝子外領域の方が個体差は大きくなる」とのご指摘は、意外でした。そうなんですね。「固体間で差のある塩基対を見つけて、それを遺伝子であると推定する」方法は全く見当違いということなんですね。よく分かりました。
(2)「ドメイン」とは何でしょうか。
(3)「予測しています」とのことですが、これを文字どおりに理解すると「遺伝子ではないかと思われるものを推定して、それを「遺伝子である」としている」というような意味ではないかと思いますがそのような理解でよろしいでしょうか。
もしよい場合は、現在ヒトには20,000個程度の遺伝子があると言われていますが、このうちには遺伝子であることが確実なものと恐らく遺伝子であろうと推定されるものとの2つが含まれているのではないかと思われますが、そのような理解でよろしいでしょうか。
たくさんお尋ねして申し訳ありません。ご教示いただけましたらたいへん有り難く存じます。
よろしくお願いいたします。
No.2
- 回答日時:
まず遺伝子の開始と終わりの配列は決まっていますから、大体、配列を見ただけで、どこに遺伝子があるか見当はつくのかもしれません。
あと個体(「固体」ではないです。毎度なので念のため。)のゲノムを解読を比較には、とんでもなく時間がかかりますから現実的ではないです。
アバウトな説明ですが、ほどかれて部分的に一本鎖になったDNAが一本鎖RNAに転写され、それがさらにタンパク質に翻訳される、基本的にはそのようなDNA配列が遺伝子と呼ばれるのだと思います。いちいち個体同士のゲノムを比較しなくてもいいと思います。
DNAから写し取られた転写産物であるRNAの配列をもとに、もととなるDNAの配列は推定可能だと思います。
そこを遺伝子の配列とするのでしょう。
遺伝子以外にも転写される部位はありますから一概にそうだといえませんが。
ご回答を頂きながらご返事がたいへん遅くなり申し訳ありません。ご教示いただいた内容が知らない言葉ばかりで意味が全く分からず、遺伝とゲノムに関する書籍を購入し勉強するのに今日までかかってしまいました。やっと、ご教示いただいた内容が概ね分かるようになりました。そのような事情ですので、何卒お許し賜りますようお願い申し上げます。
「開始と終わりの配列」が決まっているというのは開始コドンと終止コドンのことでしょうか。まずチェックしてみるのは開始コドンと終止コドンですね。
また、mRNAから逆に遺伝子を判別できるとのご指摘、確かにそうですね。
ご懇切なご回答有り難うございました。
今後ともよろしくお願いいたします。
No.1
- 回答日時:
遺伝子とはタンパク質をコードしている塩基配列のことです。
タンパク質はDNA情報を元に転写されてmRNAができ、
それが翻訳されてタンパク質ができます。
つまり、mRNAを塩基配列を調べてそれをコードしているDNAは遺伝子(遺伝情報)を保持していることが分かると思います。(厳密には違うと思いますが、そうお考えて結構だと思います。)
ご回答を頂きながらご返事がたいへん遅くなり申し訳ありません。ご教示いただいた内容が知らない言葉ばかりで意味が全く分からず、遺伝とゲノムに関する書籍を購入し勉強するのに今日までかかってしまいました。やっと、ご教示いただいた内容が概ね分かるようになりました。そのような事情ですので、何卒お許し賜りますようお願い申し上げます。
mRNAから逆に遺伝子を判別できるとのご指摘、確かにそうですね。とても確実な方法ですね。
有り難うございました。
今後ともよろしくお願いいたします。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- その他(ニュース・時事問題) コロナワクチンについて 3 2022/12/09 16:13
- 生物学 高校生物の質問です。 タンパク質の平均分子量をアミノ酸の平均分子量で割ってタンパク質を構成するアミノ 1 2023/01/07 16:10
- 生物学 イントロンについて 1 2022/07/24 21:27
- 生物学 ゲノム論文 2 2023/06/05 08:06
- 生物学 塩基配列を解析する意味は? 1 2023/02/02 00:51
- その他(ニュース・社会制度・災害) 出生前診断や遺伝子検査については様々な意見がありますが、皆さんは賛成反対のどちらですか? 2 2022/04/10 19:48
- 出会い・合コン 恋愛結婚って弊害が大きすぎませんか? 7 2022/04/10 16:17
- 倫理・人権 法の下の平等という概念の必要性の有無についてどう思いますか? 4 2022/04/02 14:41
- 運転免許・教習所 酒気帯び運転違反(飲酒運転)について質問です。 6 2022/07/17 11:16
- 運転免許・教習所 酒気帯び運転違反(飲酒運転)について質問です。 5 2022/04/01 19:51
おすすめ情報
- ・「みんな教えて! 選手権!!」開催のお知らせ
- ・漫画をレンタルでお得に読める!
- ・【選手権お題その2】この漫画の2コマ目を考えてください
- ・2024年に成し遂げたこと
- ・3分あったら何をしますか?
- ・何歳が一番楽しかった?
- ・治せない「クセ」を教えてください
- ・【大喜利】看板の文字を埋めてください
- ・【大喜利】【投稿~12/17】 ありそうだけど絶対に無いことわざ
- ・【選手権お題その1】これってもしかして自分だけかもしれないな…と思うあるあるを教えてください
- ・【穴埋めお題】恐竜の新説
- ・我がまちの「給食」自慢を聞かせてっ!
- ・冬の健康法を教えて!
- ・一番好きな「クリスマスソング」は?
- ・集合写真、どこに映る?
- ・自分の通っていた小学校のあるある
- ・フォントについて教えてください!
- ・これが怖いの自分だけ?というものありますか?
- ・スマホに会話を聞かれているな!?と思ったことありますか?
- ・それもChatGPT!?と驚いた使用方法を教えてください
- ・見学に行くとしたら【天国】と【地獄】どっち?
- ・これまでで一番「情けなかったとき」はいつですか?
- ・この人頭いいなと思ったエピソード
- ・あなたの「必」の書き順を教えてください
- ・10代と話して驚いたこと
- ・14歳の自分に衝撃の事実を告げてください
- ・人生最悪の忘れ物
- ・あなたの習慣について教えてください!!
- ・都道府県穴埋めゲーム
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
イントロンについて
-
Oct3/4、Sox2、Klf4、c-Mycはど...
-
修飾 modify と調節 modulate ...
-
高校生物についてです。2
-
アミノ酸置換と発現量の関係
-
コザック配列の必要性
-
遺伝子の領域について
-
転写、翻訳にかかる時間について
-
c-mycとアポトーシス
-
遺伝 関連解析 F0、F1、F2
-
pUCベクターについて
-
親の血液型で生まれる子供の血...
-
Expressed Sequence Tag (EST...
-
天孫降臨の神武天皇のY染色体の...
-
制限酵素地図の作成
-
酵素が入っている身近な製品は?
-
ゾウリムシの走化性と洗浄について
-
なぜ生体内にカタラーゼがあるのか
-
DNA複製について
-
電気泳動によりDNAの分子量を求...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
Oct3/4、Sox2、Klf4、c-Mycはど...
-
親の血液型で生まれる子供の血...
-
ゲノムDNAライブラリーとcDNAラ...
-
DNA塩基配列の「相同性」?
-
プロモーター領域
-
転写調節領域、オペレーター、...
-
コザック配列の必要性
-
なぜDNAのT(チミン)に対応す...
-
転写、翻訳にかかる時間について
-
トランスポーターの親和性って...
-
真核細胞と原核細胞のmRNAの違...
-
ORF、オペロン、クラスターって...
-
修飾 modify と調節 modulate ...
-
DH5αはサブクローニング用、JM1...
-
controlとregulateの違いについて
-
pUCベクターについて
-
カサノリの実験
-
DNAとゲノムDNAの違い
-
Expression Costructとは
-
クローニングとサブクローニン...
おすすめ情報