Skip to content

アライメント

MEGAによるアライメント②

アミノ酸配列をコードしている領域の場合は,

DNA配列をアミノ酸配列に変換することで,

正しく配列が得られているか確認できます.
 

こちらは,アミノ酸をコードしているミトコンドリアのCOI領域

のDNA配列をアライメントしたものです.



ちなみに,このOTUの名前の付け方は長すぎる上に,

()とか系統解析状優しくない記号が使われている悪い例です.



各配列の一番上の行にアスタリスク(*)が示してある列は,

全てのOTUで塩基置換が同じ事を示しています.

従って,*が無い列はどこかのOTUで塩基置換が起きています.

この*を見ると,二列おきに無くなっている傾向が見られると思います.

これは,この配列がアミノ酸をコードするコドンは塩基3つで一組となっており,

その三番目が置換しやすい事を表しています.



左上の方のDNA Sequencesの横のTranslated Protein Sequencesのタブをクリックすると,



このようなウィンドウがポップアップするので,

Yesを選択するとDNA配列がアミノ酸配列に変換されます.

Noを選択すると,
 

このように,コドンがコードするアミノ酸の遺伝コードを選択する事ができます.

分類群に合わせて変更しましょう.



遺伝子コード表は,Data→Select Genetic Code Tableからも選択できます.
 

これが置換後のアミノ酸配列です.色付きの文字は全てアミノ酸です.

灰色の*は,ストップコドンでこれが見られる場合は,

アミノ酸変換が上手くいっていない事がほとんどです

(勿論,複数の遺伝子が発現するためのストップコドンの場合もあります).



というわけで,一番左の列を削除してもう一度アミノ酸変換してみました.

うーん,まだストップコドンがみられます.
 

更にもう一列削除してアミノ酸変換しました.

ストップコドンもみられず,配列も結構「揃って」います.

恐らく,これで正しくアミノ酸配列に変換できたものと思われます.
 

今日はここまで.


MEGAによるアライメント

MEGA (Molecular Evolutionary Genetics Analysis software)は,

アライメント,モデルテスト,系統解析までを一手にこなせる優れた系統解析ソフトウェアです.

昔はアライメントや簡単な系統解析が出来るくらいでしたが,現在はver. 7までアップデートを重ね,

モデルテスト,最尤法,祖先解析,分子分岐年代測定などが行えるようになっています.

また,開発者が日本人という事で,日本語でも扱えるため,大変有用なツールとなっています.

DLはこちら
 

備忘録的に,このMEGAの使い方を記録していきます.

MEGAをインストールしたら,MEGAのアイコンをダブルクリックすると,以下のウィンドウが起動します.
 

これがMEGAの基本画面です.
 

まずアライメントです.”Align”→”Edit/Built Alignment”を選択.
 

Creat a new alignmentをチェックし,OKをクリックすると,以下のようなExplorerが起動します.
 

“Edit”→”Insert Sequence From File”を選択します.
 

DNA(もしくはアミノ酸)配列のファイルをPCから読み込みます.読み込める形式は色々ありますが,

このように,メモ帳に直接塩基配列をペーストしただけのものでもOKです.
 

配列が読み込めました.色が付いている部分が塩基配列です.A, T, G, Cでそれぞれ色分けされています.
 

“Alignment”から,”Clustal W”と”Muscle”の二つのアライメント方式が選べます.

今回はClustal Wを選択してみます.
 

ここでは,アライメントのパラメータの設定ができます.

Gap Opening PenaltyやGap Extension Penaltyの値を高く設定すれば,なるべくギャップが少なく,連続しないアライメントになります.

DNA Weight Matrixでは,塩基とアミノ酸の置換に対するスコアを選択できます.

Transition Weightで,転位と転換の差を設定できます.

他にも,Keep Predefined Gapsでギャップを完全に無視したアライメントや,

Specify Guide Treeで,アライメントの指標となる系統樹を指定できるようです.
 

もしデフォルトのセッティングでアライメントが上手くいかない場合は,この値などをいじってみましょう.
 

とりあえずデフォルトの設定でOKを押すと,アライメントが始まります.
 

アライメントができました.うまく揃っている部分と,ごちゃごちゃになっている部分があります.

これはリボソームRNAの配列なので,立体構造をとったときの活性部位と不活性部位です.

ごちゃごちゃの部分はギャップが多いエリアを除いてしまうか,

立体構造を考慮して系統解析を行います.
 

今日はここまで.