bcbio-nextgen是一个Python工具,它为全自动高通量测序分析提供了最佳的实践管道。当用户编写一个高级配置文件指定输入和分析参数后,该用户的输入可以驱动处理分布式运算、幂等进程重启以及安全事务步骤的并行管道。bcbio的目标是提供一个能够进行数据测序分析处理组件的资源共享社区,以此能够让研究人员更专注于下游生物科学的研究。
目标
bcbio-nextgen实现全自动高通量测序数据分析的目标主要包含以下方面:
可量化性:优秀的科学研究需要能够准确地评估结果的质量,新的算法和软件成为可用。
可分析性:将结果导入工具使得查询结果与可视化结果更加容易。
可扩展性:在分布式异构计算环境中处理大数据集以及样本数据。
可复用性:跟踪配置,版本,来源以及命令行以便对结果的调试、扩展以及复用。
社区开发:开发过程是完全开放的并且由来自多个社区的贡献者来共同维护。通过在共享框架上的协作,我们可以克服在迅速变化的研究领域维护复杂管道的挑战。
易理解性:生物信息学家、生物学家和公众能够将研究材料、个人基因组的临床样本数据等各种数据作为输入来运行整个工具。
下面,我们将会回顾常见的安全原则,并介绍在使用 Yii 开发应用程序时,如何避免潜在安全威胁。 大多数这些原则并非您独有,而是适用于网站或软件开发, 因此,您还可以找到有关这些背后的一般概念的进一步阅读的链接。 基本准则 无论是开发何种应用程序,我们都有两条基本的安全准则: 过滤输入 转义输出 过滤输入 过滤输入的意思是,用户输入不应该认为是安全的,你需要总是验证你获得的输入值是在允许范围内。 比
Overview The term “production” refers to the stage in the software lifecycle when an application or API is generally available to its end-users or consumers. In contrast, in the “development” stage, y
行为管理最佳实践 TODO
本篇文档的目的在于如何让系统管理员或开发者用尽可能少的时间部署一个安全的 web 站点或应用,即 SSL 和 TLS 部署最佳实践。
我需要存储一些应该在我的应用程序上随处可见的数据。到目前为止,我知道三种方法来做到这一点: < li >创建一个特殊文件使变量成为全局变量(Dart中的全局变量) < li >使用共享首选项(这里我只想访问数据,不一定要永久存储) 和InheritedWidget 我想知道哪个解决方案(或另一个我不知道的解决方案)在性能和易于实现方面是最好的。
我们有一个用例,希望将数百行json规范传递给我们的apache beam管道。?一种直接的方法是创建自定义管道选项,如下所述。有没有其他方法可以将输入作为文件传递? 我想在Google数据流引擎中部署管道。即使我将规范作为filepath传递并在启动管道之前读取波束代码中的文件内容,我如何捆绑管道的规范文件部分。注意,我不想在我的波束代码可用的地方提交源代码的规范文件(在资源文件夹中)部分。它需