データの種類や機種によって異なるので以下のサイトで確認してください。
http://sourceforge.net/apps/mediawiki/mira-assembler/index.php?title=Main_Page
私は454で解析したので,その方法を紹介します。
@入力するデータを成型する。これに注意しないとエラーがでて中断されます。
1)FASTA名は40文字以内
2)同じFASTA名は使えない
3)入力するデータの名前は(プロジェクト名_in.454.fasta)で指定
Asffファイルからfasta, fasta.qual, xmlファイルを取りだす
sff_extract -s name_in.454.fasta -q name_in.454.fasta.qual -x name_traceinfo_in.454.xml
ファイル1.sff ファイル2.sff ファイル3.sff
のような感じでやるが,付属のsff_extractでは動かなかったので,最新ver.をここでインストールした。
例では3つ用意したが,一つでもできる。ファイルが増えただろうか?
Bアセンブルする
コマンド例は
mira --project=name --job=denovo,genome,normal,454 >&log_assembly.txt
jobオプションでgenomeを選択したがある程度配列がないとエラーが起きる。その場合はestに変更する。
どこかのデータベースなどを利用する場合,fastaファイルだけの事が多くqualファイルが手に入らない。その場合はfastaファイルだけでアセンブルするようにコマンドをたたかないといけない。
mira --job=denovo,est,normal,454,sanger -SK:mmhr=1 --project=name --fasta
454_SETTINGS -LR:wants_quality_file=off,mxti=no -AS:epoq=no
SANGER_SETTINGS -LR:wants_quality_file=off,mxti=no -AS:epoq=no
これはさらに454のデータとサンガーのデータを合わせたい時のコマンド。もしどちらか一方の場合はSTETTINGSの行を削除して使ってください。