本文へスキップ

MIRA

はじめに

 私がmiraを使って454で読んだリードをアセンブルした感じだと,celeraより長く繋がる事は確かです。しかし,理研の方からmiraはミスアセンブルが多いとのこと。なので私はceleraを使ってます。手元にNewblerがあればいんですけどね。

インストール方法

ここでダウンロードする


操作方法


データの種類や機種によって異なるので以下のサイトで確認してください。

http://sourceforge.net/apps/mediawiki/mira-assembler/index.php?title=Main_Page



私は454で解析したので,その方法を紹介します。

@入力するデータを成型する。これに注意しないとエラーがでて中断されます。
1)FASTA名は40文字以内
2)同じFASTA名は使えない
3)入力するデータの名前は(プロジェクト名_in.454.fasta)で指定




Asffファイルからfasta, fasta.qual, xmlファイルを取りだす
sff_extract -s name_in.454.fasta -q name_in.454.fasta.qual -x name_traceinfo_in.454.xml
ファイル1.sff ファイル2.sff ファイル3.sff


のような感じでやるが,付属のsff_extractでは動かなかったので,最新ver.をここでインストールした。
例では3つ用意したが,一つでもできる。ファイルが増えただろうか?



Bアセンブルする
コマンド例は
mira --project=name --job=denovo,genome,normal,454 >&log_assembly.txt

jobオプションでgenomeを選択したがある程度配列がないとエラーが起きる。その場合はestに変更する。

例外

どこかのデータベースなどを利用する場合,fastaファイルだけの事が多くqualファイルが手に入らない。その場合はfastaファイルだけでアセンブルするようにコマンドをたたかないといけない。

mira --job=denovo,est,normal,454,sanger -SK:mmhr=1 --project=name --fasta
454_SETTINGS -LR:wants_quality_file=off,mxti=no -AS:epoq=no
SANGER_SETTINGS -LR:wants_quality_file=off,mxti=no -AS:epoq=no

これはさらに454のデータとサンガーのデータを合わせたい時のコマンド。もしどちらか一方の場合はSTETTINGSの行を削除して使ってください。

参考資料

manual

inserted by FC2 system