생명정보 분석 기법 노트

우리말로 생명정보학 또는 생물정보학이라고 번역되는 "bioinformatics"란 용어를 Oxford English Dictionary에서는 다음과 같이 정의하고 있다.

bioinformatics is conceptualising biology in terms of molecules and applying "informatics techniques" (derived from disciplines such as applied maths, computer science and statistics) to understand and organise the information associated with these molecules, on a large scale. In short, bioinformatics is a management information system for molecular biology and has many practical applications.

2000년대에 접어들면서 국내 학계와 바이오벤처업계를 중심으로 생물정보학 '광풍'이 불었던 적이 있다. 대학에서는 앞다부터 관련 학과를 개설하였고, 많은 IT 기반 소규모 기업들이 생겨나서 제각각의 솔루션을 개발하여 곧 수익을 올릴 수 있을 것이라는 기대에 부풀고는 하였다.  그러나 지금은 그러한 거품이 상당히 많이 가라앉았다. 대신 생명정보학은 NGS에 기반하여 대용량의 데이터를 생산하는 생명과학자에게 반드시 필요한 도구로서 착실하게 자리를 잡았다고 생각한다(이 의견에 동의하지 않는 사람도 있을 것이다). 십년 전 bioinformatics가 그러했듯이, 지금은 big data가 새로운 화두로 떠올랐다. 생명정보학은 어디까지나 생물학의 레벨이라 한다면, 빅 데이터는 사회 전반과 경제 시스템 자체에 근본적인 변혁을 가져다 줄 것으로 큰 기대를 받고 있다. 이것이 단기간적인 열풍으로 끝날지, 혹은 다소간의 거품을 걷어내고 하나의 대세로 자리를 잡을지는 좀 더 지켜봐야 할 것이다.

이 페이지는 어떤 생명정보 분석의 전반을 아우를 수 있는 어떤 강좌를 제공하고자 함을 목적으로 하는 것이 아니다. 서열 데이터를 다루는 것이 생명정보 분석에서 가장 기초가 되는 것이긴 하지만, 현재의 생명정보학은 그 범위가 매우 방대해졌기 때문이다. 쉽게 이야기해서 microarray 데이터를 잘 다루는 사람이 단백질 구조 분석도 잘 할 수 있는 것은 아니다. 이 페이지는 내가 주로 genome sequencing 분야에서 15년 정도 종사하면서 체득한 잔 기술들을 정리하고, 필요하다면 타인에게 공유하기 위함을 목적으로 작성해 나가고자 한다.
하위 페이지 (2): BioPython 설치 My Perl code snippets
Comments