Categories
코드를 공유하게 된 이유
연구실에서 수 없이 실험을 하며, 데이터를 기록하고 또 기록했다. 실험이 끝난 후에는 기록한 데이터들과 실험 방법을 바탕으로 결론을 내려야한다. 즉 대조군과 실험군을 비교했을 때 데이터의 차이가 있는지, 그 차이는 유의미한지, 편차의 크기가 큰 지, 편차의 크기가 크다면 이러한 편차를 만들게 된 오차요인은 무엇인지, 이러한 오차요인을 해결하기 위해서 다음 실험은 어떻게 계획해야 하는지 등등 데이터를 여러 방식으로 다루며 의미를 찾아야 한다.
따라서 실험실에서 제일 많이 했던 일이 실험이고, 두 번째로 많이 했던 일이 컴퓨터로 데이터를 정제하고 분석하는 것이었다. 이것은 아마 다른 연구자 분들도 비슷할 것이라 생각한다. 데이터를 분석할 때 엑셀과 SPSS를 가장 많이 사용했다. 이런 류의 프로그램에 대해서 깊게 공부하지 않는 한, 아무리 엑셀과 SPSS를 사용한다고 해도 그 프로그램의 능력치를 100 % 사용하지 않는 것이다. 이런 생각이 들었을 때부터 컴활과 프로그래밍 수업을 듣기 시작하였다. 내가 다루는 컴퓨터에 대하여 좀 더 알고자 했다.
프로그래밍 언어를 이용하면 단순한 계산부터 엑셀 파일을 양식에 따라 자동으로 작성해 주는 것과 같은 유용한 프로그램을 만들 수 있다. 이런 프로그램을 사용하면 Wet lab 연구자 분들의 경우 컴퓨터에 앉아있는 시간을 줄이고 다른 실험에 더 시간을 쏟을 수 있을 것이다. 따라서 연구자들이 코딩을 몰라도 좋은 프로그램을 쉽게 사용할 수 있도록 공유하려고 한다.
앞으로 여기에 다른 분들이 만든 오픈 소스 코드나, 본인이 만든 코드를 올릴 예정이다. 코딩을 몰라도 괸찮다. 주어진 코드를 쉽게 사용할 수 있도록 수정하고 주석을 달아서 이 곳에 포스팅할 것이다.
빠른 속도로 대용량의 데이터를 처리할 수 있는 google colab 을 소개한다. google colab은 자기자신의 컴퓨터가 아닌 google의 컴퓨터를 이용해 데이터 분석을 할 수 있는 유용한 도구이다.
첫 번째 코드로 DNA 서열에 대한 전반적인 내용을 출력하는 간단한 프로그램을 google colab에 올려두었다.
링크를 통해 접속해보자.