WEBVTT

00:00:00.000 --> 00:00:03.629
Dans de nombreux domaines scientifiques tels que
bio-informatique, l'imagerie médicale, et

00:00:03.629 --> 00:00:06.299
l'astronomie
de grandes quantités de données doivent être

00:00:06.299 --> 00:00:10.769
analysées. Celà peut impliquer des processus répétitifs
et à grande échelle dans des enchaînements

00:00:10.769 --> 00:00:15.240
longs de différents outils - appelés workflows. Il peut être très long de traiter de telles données avec tous

00:00:15.240 --> 00:00:18.930
ces différents outils et convertir les données produites en divers formats, afin de les rendre compatibles avec

00:00:18.930 --> 00:00:21.949
l'étape suivante.

00:00:21.949 --> 00:00:26.130
Les systèmes de gestion de workflow sont conçus pour atténuer ce problème, en permettant de les définir

00:00:26.130 --> 00:00:30.090
formellement et de fournir des infrastructures pour les installer, les exécuter et de les monitorer.

00:00:30.090 --> 00:00:34.290
Cette formalisation des workflows permet aux scientifiques de les partager facilement et de les

00:00:34.290 --> 00:00:38.399
réutiliser. Leur utilisation est également très importante pour vérifier les résultats de calcul pour les travaux

00:00:38.399 --> 00:00:43.110
publiés. Cependant, il existe de nombreuses approches différentes pour décrire ces workflows, ce qui constitue

00:00:43.110 --> 00:00:46.579
un obstacle à ces objectifs.

00:00:46.579 --> 00:00:50.399
Actuellement, il y a plus d'une centaine de différents systèmes de workflow d'analyse des données

00:00:50.399 --> 00:00:55.020
non-interopérables.Le besoin d'une seule norme commune est apparu, et le projet

00:00:55.020 --> 00:00:58.469
« Common Language Workflow » a été créé pour y répondre: un standard ouvert, conçu pour décrire les

00:00:58.469 --> 00:01:02.430
workflows et les outils qu'ils utilisent, dans des groupes

00:01:02.430 --> 00:01:05.539
de fichiers texte structurés au format YAML.
