WEBVTT

00:00:00.000 --> 00:00:03.629
バイオインフォマティクス、医療用画像、天文学など多くの科学分野で、

00:00:03.629 --> 00:00:06.299
大量のデータを分析する必要があります。

00:00:06.299 --> 00:00:10.769
データ分析では、

00:00:10.769 --> 00:00:15.240
ワークフローと呼ばれる複数のツールからなるパイプライン処理を大規模なデータに対して反復的に実行することがあります。

00:00:15.240 --> 00:00:18.930
データに対して異なるツールを手作業で実行することや、 各ツールの出力を次のツールの入力形式に変換する作業は、

00:00:18.930 --> 00:00:21.949
非常に時間がかかる作業です。

00:00:21.949 --> 00:00:26.130
ワークフロー管理システムは、ワークフローを形式的に表現し、

00:00:26.130 --> 00:00:30.090
ワークフローのセットアップ、実行、監視を行うことで、これらの問題を軽減します。

00:00:30.090 --> 00:00:34.290
ワークフローを形式的に表現することで、研究者の間でワークフローを共有、

00:00:34.290 --> 00:00:38.399
再利用することが簡単になります。
さらに、この形式化されたワークフローは、

00:00:38.399 --> 00:00:43.110
論文で発表された計算結果の検証にも使用できます。

00:00:43.110 --> 00:00:46.579
しかしワークフローを記述する表現方法は数多くあるため、この目的は達成できていません。

00:00:46.579 --> 00:00:50.399
現在、数百種類以上のデータ解析ワークフローシステムがありますが、

00:00:50.399 --> 00:00:55.020
それらの間には相互運用性がありません。

00:00:55.020 --> 00:00:58.469
単一の共通の規格が必要なため、「Common Workflow Language」プロジェクトが始まりました：

00:00:58.469 --> 00:01:02.430
Common Workflow Language は、 YAML フォーマットのファイル群で

00:01:02.430 --> 00:01:05.539
ワークフローとツールを表現するオープンな規格です。
