Optimisation dynamique de requêtes réparties à grande échelle
En environnement à grande échelle parallèle et distribué (Cluster, Grille, Cloud Computing), nous nous focalisons sur les principaux problèmes de traitement et d’optimisation de requêtes faisant référence à des grands volumes de données distribuées à grande échelle (“Big Data”).
Actuellement, nos activités de recherche se concentrent sur la conception et le développement de nouveaux modèles d’allocation élastique de ressources pour l’optimisation de requêtes, tout en exploitant au maximum les résultats fondamentaux obtenus dans les systèmes parallèles et distribués, notamment les aspects relatifs aux types de parallélisme (i.e., intra-opération, indépendant et pipeline) et à la minimisation des coûts de communication inter-opération.
Notre approche repose sur le meilleur compromis entre : (i) efficacité (satisfaction de plusieurs locataires en terme de Qualité de Service QdS) et (ii) rentabilité (fournisseurs de services de type PaaS). L’originalité de ces nouveaux modèles d’allocation élastique de ressources réside dans : (i) l’introduction d’un modèle économique intégrant la dimension de rentabilité (prenant en compte la tarification des fournisseurs) dans la fonction objectif, (ii) la décentralisation du contrôle pour assurer le dimensionnement évolutif (i.e. Scalability) par l’intégration d’une politique de migration proactive à base d’agents mobiles et (iii) la révision des méthodes d’estimation des coûts et des stratégies de recherche de plan d’exécution optimal ou proche de l’optimal.
Les 2 principaux problèmes de recherche traités par l’équipe PYRAMIDE sont décrits ci-dessous :
P1 : Allocation élastique de ressources pour l’optimisation de requêtes
L’objectif est de concevoir et de développer des modèles d’allocation élastique de ressources pour l’optimisation de requêtes. En environnement Cloud Computing, la capacité des ressources allouées (coté fournisseur) doit augmenter ou diminuer à la demande des services (coté locataires) pour maintenir une QdS et respecter les SLA. Les principaux critères de QdS sont les performances (e.g. temps de réponse des requêtes) et la disponibilité des services. Quant au SLA, contrat de type Producteur (Fournisseur)-Consommateur (Locataire), il indique précisément un ensemble de contraintes, de conditions et d’objectifs à respecter en termes de ces principaux critères de QdS. Le défi majeur est de trouver le meilleur compromis entre la satisfaction des locataires en termes de QdS et le profit des fournisseurs en termes d’une gestion rentable des ressources.
P2 : Réplication de données dans les systèmes Cloud
Les stratégies de réplication de données proposées pour les systèmes parallèles, distribués et de grilles sont difficiles à adapter aux systèmes Cloud. Le but est de proposer des stratégies de réplication de données devant intégrer un modèle économique en terme de rentabilité du fournisseur qui tient compte des éventuelles pénalités. Le défi majeur est de définir un mécanisme d’ajustement du nombre de répliques optimal permettant une gestion élastique des ressources.