WEBVTT

00:00:00.000 --> 00:00:03.629
在许多科学领域（例如生物信息学，医学成像和天文学）

00:00:03.629 --> 00:00:06.299
中，需要分析大量的数据。

00:00:06.299 --> 00:00:10.769
在很长的流水线中运用不同的工具会涉及许多大规模和重复性流程

00:00:10.769 --> 00:00:15.240
（称为工作流程）。

00:00:15.240 --> 00:00:18.930
手动导入数据到这些不同工具的数据，

00:00:18.930 --> 00:00:21.949
并将其输出转换为不同的格式使其与下一步兼容，将会非常耗时。

00:00:21.949 --> 00:00:26.130
工作流管理系统旨在通过允许这些工作流程有条理的表达并提供基础设施来设立，

00:00:26.130 --> 00:00:30.090
执行和监视这些工作流来缓解此问题。

00:00:30.090 --> 00:00:34.290
这种工作流的正式表达允许科学家轻松地共享和重用它们。

00:00:34.290 --> 00:00:38.399
关键的是，它们也可用于去验证那些已发布工作的计算结果。

00:00:38.399 --> 00:00:43.110
然而，

00:00:43.110 --> 00:00:46.579
有许多相互争论的方法来描述工作流程，这是对目标实现的障碍。

00:00:46.579 --> 00:00:50.399
目前，有超过一百种不同的数据分析工作流系统之间没有互操作性。

00:00:50.399 --> 00:00:55.020
我们需要有一个共同的标准，

00:00:55.020 --> 00:00:58.469
因此创建了“通用工作流程语言”项目：

00:00:58.469 --> 00:01:02.430
一个开放标准，

00:01:02.430 --> 00:01:05.539
旨在表达工作流程及其在YAML结构化文本文件组中的工具。
