Présentation de l'école thématique BDA 2014
L’école MDD s’est attachée durant ses deux premières sessions à aborder des thèmes en lien avec ces nouvelles problématiques, selon une méthodologie qui s’est affinée d’une session à l’autre. La première session, en 2010, a ainsi traité des systèmes distribués de gestion de données, du Web sémantique, de la protection des informations personnelles ; la seconde session, en 2012, s’est consacrée à des opérateurs de traitement de requêtes à l’échelle du Pétaoctet, aux nouvelles sources d’information (réseaux sociaux), à l’intégration de données issus d’environnement indépendants.
Tutoriels 2014
La session en 2014, dans la continuité des précédentes, se donne le double objectif d’actualiser les thèmes présentés et de compléter ceux des sessions précédentes. La session 2014 sera centrée autour de trois problématiques.
Analyse de grands volumes de données.
Ce premier thème est essentiel dans un contexte où le but est de construire de la connaissance à partir d’éléments d’information produits de manière atomique, sans lien entre eux, et sans souci préalable d’organiser ces éléments en vue de les interpréter. L’analyse de données, conçue pour passer à l’échelle, répond à ce besoin. Elle doit permettre de comprendre de quoi parle un blog, d’établir comment l’information se diffuse dans un réseau social, de détecter des motifs récurrents dans le comportement d’une masse d’utilisateurs, tel qu’il est mesuré par des capteurs, etc.
Benchmarks et expérimentations.
Le second thème est particulièrement important pour notre communauté, dont la qualité des résultats est souvent établie par les expérimentations qui doivent être conçues, évaluées et présentées de manière extrêmement rigoureuse pour convaincre de leur pertinence. Les cours présentés pour ce thème seront particulièrement utiles aux doctorants qui assistent nombreux à l’école MDD et doivent se préparer à confronter leurs travaux à un environnement très concurrentiel.
Acquisition participative et qualité des données.
Enfin, le troisième thème présentera les défis scientifiques soulevés par des pratiques de production et de gestion de données fondée sur une participation collective d’utilisateurs-producteurs.
Les exposés complémentaires, plus courts, donnent soit une vision plus en profondeur sur une question spécifique, soit une ouverture sur des aspects sociaux ou économiques liés à la thématique du jour. Nous ferons en sorte, pour chaque journée, et dans la mesure du possible, que les exposés des participants soient également en cohérence avec cette thématique.