Publié le 07/09/2016
rdv-plateau-inria

Le 22 septembre 2016, de 10h00 à 11h30

A propos :

Places disponibles : 30


Nous contacter : gregoire.maurice@inria.fr

R&DV du Plateau Inria : « big data, comment traiter des cas particuliers ? »

Chaque mois, de 10h00 à 11h30, ne manquez pas « Les R&DV du Plateau » organisés sur le Plateau Inria situé à EuraTechnologies. Une équipe de recherche Inria viendra à la rencontre des entreprises afin de soutenir le transfert de technologies vers l’écosystème régional. Inscrivez-vous à la session du jeudi 22 septembre 2016 consacrée au big data : comment traiter des cas particuliers ?

Venez découvrir un type particulier de « Big data »

Courbes de températures, courbes de croissance (à la bourse ou en médecine), spectres, données historiques, … Voici quelques objets dont l’analyse statistique essaie de répondre aux objectifs les plus divers : visualisation, prédiction, typologie (clustering), régression.

Le traitement de telles données fait appel à des techniques spécifiques connaissant un grand essor notamment depuis une vingtaine d’années : lissage, réduction de la dimension, modélisation stochastique. Ces données sont clairement un type particulier de “big data”. Dans cette présentation, nous allons illustrer à l’aide d’exemples les techniques de base pour l’analyse statistique de ce type de données avec le logiciel R.

Le principal objectif de l’équipe-projet Modal (commune avec le CNRS, l’Université Lille 1 et l’Université Lille 2*) est de concevoir des modèles traitant des données multi-variées complexes et / ou des données hétérogènes. Les cas types de données sont :

  • Des co-variables nominales avec des positions multi-variées ;
  • Des combinaisons de variables continues et nominales avec des positions hétérogènes.

D’autres co-variables complexes et répandus sont également source d’intérêt telles que les données ordinales, les données de rangs, et les intervalles de données.

A partir des modèles générés, une analyse statistique pratique et efficace reste à effectuer, ce conduisant au traitement des données (visualisation, clustering) et à son apprentissage (classification supervisée et semi-supervisée, estimation de densité).

L’intervenant : Cristian Preda

Cristian Preda est professeur en mathématique à l’Université de Lille 1 et enseignant-chercheur au sein de l’équipe-projet Modal.

À la fin de cette présentation, Cristian Preda sera heureux de répondre à vos questions et de partager vos réflexions autour d’un café.

Inscrivez-vous vite, le nombre de place est limité !

Plateau Inria - EuraTechnologies

165 Avenue de Bretagne, Lille

Entreprises concernées