在mutation calling的过程中,最常使用的一个软件就是GATK,我想要弄明白:
(1)GATK能够做什么?
(2)GATK如何使用?
链接:https://www.plob.org/article/11698.html
这个作者实在是太强了。
他在文末有分享了这样的一段话:
在这里,整篇文章就结束了。如你所见,文章非常长,这里基本包含了WGS最佳实践中的所有内容,但其实我想说的还远不止如此(包括CNV和SV的检测),只是暂时只能作罢了,否则恐怕就没人愿意看下去了,呵呵。在这个WGS主流程的构建过程中,我并非只是硬邦邦地告诉大家几条简单的命令就了事了,因为我认为那种做法要么是极其不负责任的,要么就是作者并非真的懂。而且如果都觉得只要懂得几条命令就可以了的话,那么我们就活该被机器和人工智能所取替,它们一定会操作得更好更高效。我想掌握工具和技术的目的是为了能够更好地发现并解决问题(包括科研和生产),所有的数据分析流程本质上是要服务于我们所要解决的问题的。
毕竟工具是死的,人是活的,需求总是会变的。理解我们所要处理的问题的本质,选择合适的工具,而不是反过来被工具所束缚,这一点很重要。个人的能力不能只是会跑一个流程,或者只是会创建流程,因为那都是一个“术”的问题,我觉得我们真正要去掌握的应该是如何分析数据的能力,如何发现问题和解决数据问题等的能力。
让我觉得好像是在说自己一样。生信不仅仅是跑流程,而且还需要对这个流程的每一步做了什么,有什么样的生物学意义进行思考和理解。觉得这篇文章像是在讽刺自己的基础不扎实。如果我自己,下定决心说,一定要成为这个领域的人才,那我也应该向前辈这样,自己培养自己。我觉得很惭愧。
对于这样的前辈,我只能是敬佩。
截止到目前,已经达成今年给自己制定的小目标(本年度完成50篇笔记的书写),当然其中有“水”了一部分。5月是我目前产出最多的一个月了。如果不是接触这个课题,不会有这些收获。未来前途未卜,希望自己能够更加坚定的向着成为更好的生物信息学专业人员的路线前进,不断的精进自己的能力。我知道自己现在是有很大的漏洞与不足的。我要更加的努力才是。