My Perl code snippets

(my)로 표기한 것은 내가 직접 짠 코드들이다. Perl이 아닌 스크립트도 있다. 실무에서 충분히 테스트하였으나 항상 완벽한 동작을 보장하지는 않으므로 주의하시기 바람. Perl의 기본 정신에 따라서 매우 자유롭게 작성되었으므로 문법적으로는 틀리지 않았을지 모르나 권장하는 코딩 스타일을 엄격히 준수하지는 않았다. 코드 내부에는 되도록 많은 코멘트를 넣기 위해 노력하였다.
  • (my) fastaSplit.pl - Multiple FASTA file을 분리하여 각각을 별도의 single FASTA  파일로 쓴다.
  • FastaToTbl - Multiple FASTA file을 읽어서 <seq ID> <한 줄의 sequence>로 표준출력하는 awk 스크립트이다. 필드 구분자는 tab이다. 인터넷에 돌아다니는 코드를 살짝 수정하였다. 반대의 역할을 하는 스크립트는 TblToFastaFile인데, 전부 단일 FASTA 파일로 써버린다.
  • (my) fastaOut.pl - <id> <sequence>로 되어 있는 파일을 읽어서 multple FASTA 형태로 표준 출력한다. 
  • n50.pl - contig 서열을 읽어서 total contig length,  contig 수, N50 등 기본적인 수치를 출력한다. 인터넷에 돌아다니는 코드를 살짝 수정하였다. 여기서는 N50 contig lengthN50 value를 별도로 출력해 준다. 우리가 보통 관심을 갖는 N50 값은 후자이다. 전자(N50 contig length)는 contig 길이를 큰것부터 더해 나갔을 때 total length의 절반과 같거나 초과하는 시점의 합을 말한다.
  • (추가 예정...)
ċ
FastaToTbl
(0k)
Haeyoung JEONG,
2015. 2. 16. 오전 2:26
ċ
TblToFastaFile
(0k)
Haeyoung JEONG,
2015. 2. 16. 오전 2:26
ċ
fastaOut.pl
(0k)
Haeyoung JEONG,
2015. 2. 16. 오전 12:53
ċ
fastaSplit.pl
(1k)
Haeyoung JEONG,
2015. 2. 16. 오전 12:39
ċ
n50.pl
(1k)
Haeyoung JEONG,
2015. 2. 16. 오전 2:04
Comments