MIRA

はじめに

　私がmiraを使って454で読んだリードをアセンブルした感じだと，celeraより長く繋がる事は確かです。しかし，理研の方からmiraはミスアセンブルが多いとのこと。なので私はceleraを使ってます。手元にNewblerがあればいんですけどね。

インストール方法

ここでダウンロードする

操作方法

データの種類や機種によって異なるので以下のサイトで確認してください。

http://sourceforge.net/apps/mediawiki/mira-assembler/index.php?title=Main_Page

私は454で解析したので，その方法を紹介します。

①入力するデータを成型する。これに注意しないとエラーがでて中断されます。
1）FASTA名は40文字以内
2）同じFASTA名は使えない
3）入力するデータの名前は(プロジェクト名_in.454.fasta)で指定

②sffファイルからfasta, fasta.qual, xmlファイルを取りだす
sff_extract　-s name_in.454.fasta -q name_in.454.fasta.qual -x name_traceinfo_in.454.xml ファイル１.sff ファイル2.sff ファイル3.sff

のような感じでやるが，付属のsff_extractでは動かなかったので，最新ver.をここでインストールした。
例では3つ用意したが，一つでもできる。ファイルが増えただろうか？

③アセンブルする
コマンド例は
mira --project=name --job=denovo,genome,normal,454 >&log_assembly.txt

jobオプションでgenomeを選択したがある程度配列がないとエラーが起きる。その場合はestに変更する。

例外

どこかのデータベースなどを利用する場合，fastaファイルだけの事が多くqualファイルが手に入らない。その場合はfastaファイルだけでアセンブルするようにコマンドをたたかないといけない。

mira --job=denovo,est,normal,454,sanger -SK:mmhr=1 --project=name --fasta
454_SETTINGS -LR:wants_quality_file=off,mxti=no -AS:epoq=no
SANGER_SETTINGS -LR:wants_quality_file=off,mxti=no -AS:epoq=no

これはさらに454のデータとサンガーのデータを合わせたい時のコマンド。もしどちらか一方の場合はSTETTINGSの行を削除して使ってください。

参考資料

manual

このページの先頭へ