ABySSのインストール前に
ABySSを実行させるにはgccのバージョンを4.3.0以上にする必要があります。
$ gcc -v
でバージョンの確認をしてください。
アップグレードは
gccのインストール方法を見てください
ABySSのインストール方法
- ABySS
1.2.7をダウンロードして展開します。
- google sparsehash
1.10もダウンロードして展開します。ABySSとsparsehashのバージョン相性がありそうなので注意して下さい。
- sparsehashを先にインストールします。
cd sparsehash-1.10/ ; ./configure && make && sudo make install
- 画面に、install -c コマンドのログが表示されていればsparsehashが入っていますので、次の作業に進めます。
- configureの時にABySSの挙動を指定します。詳しくはREADMEを読んで見て下さい。
cd abyss-1.2.7; ./configure --enable-maxk=128
- makeします。make一発だとなぜか上手くいかないので、警告オプションを付加します。
make AM_CXXFLAGS=-Wall && sudo make install
- abyssが動いてそうなのがチェックできたら、終わりです。
/usr/local/bin/abyss --version
ABySSの実行
Single-end assemblyの時
assemblしたい配列 reads.fa
アウトプットしたい名前 contigs.fa
ABYSS -k25 reads.fa -o contigs.fa
パラメーターでk値を指定するがどの値がいいか一概に言えない。
その為,一度K値を以下の方法で振ってみる。
for k in {65..96}; do
ABYSS -k$k reads.fa -o contigs-k$k.fa
done
K値を65から96に振ってみて,そのN50やSumを確認してどれが一番繋がるのか
確認する。
確認方法は以下のコマンドで確認できる。
abyss-fac contigs.fa
感想
454で1run分の140万readの配列をアセンブルさせましたが,所要時間は約30分で終わって,
メモリも6GBぐらいで済みました。他のアセンブラーを使った事ないので結果は分かりませんが・・・
参考文献
ABySS - SEQwiki