Invitation soutenance de thèse M. Hugo Deléglise

Le Mercredi 15 décembre 2021 à 9h30

à la maison de la télédétection (salles Saltus et Ager) à Montpellier

 

L’intitulé de ma thèse (Cirad et #DigitAg) en science des données est « Mise en relation de données hétérogènes pour le renforcement des systèmes de sécurité alimentaire. Cas de la production agricole en Afrique de l’Ouest ».

La présentation sera également accessible en visio via un lien que je vous enverrai ultérieurement.

Vous êtes également invités au pot de thèse qui aura lieu après la soutenance en début d’après-midi.

Lien vers la valorisation de son travail : https://www.cirad.fr/espace-presse/communiques-de-presse/2021/alerte-precoce-insecurite-alimentaire

 

Vous trouverez ci-dessous deux résumés de la thèse (un court et un long) ainsi que la composition du jury.

Résumé court  :

Les progrès dans la lutte contre la faim ont été significatifs au Burkina Faso entre 2000 et 2014 avant que la situation alimentaire ne se détériore à nouveau. L'objectif de cette thèse est de fournir un cadre innovant pour l’estimation d’indicateurs de sécurité alimentaire (SA) en utilisant des données hétérogènes, afin d’appuyer les systèmes de suivi, d’analyse et d’alerte de la SA existants. Pour y répondre, cette thèse propose trois contributions, chacune centrée sur un type de données spécifique : les indicateurs de SA issus d’enquêtes ménages, les données environnementales et socio-économiques (e.g., séries temporelles climatiques, prix des marchés, images d’occupation des sols) pour estimer la SA de manière numérique. Enfin, nous examinons des données textuelles pour estimer la SA de manière qualitative. Des cadres méthodologiques fondés sur l’intégration et la combinaison d’approches de fouille de données et d’apprentissage automatique et profond sont proposés pour le traitement des données hétérogènes en considérant leurs dimensions spatio-temporelles et thématiques. Nos résultats indiquent le potentiel des nouvelles méthodes de science des données dans le contexte de la SA et pavent la voie à de futurs travaux.

Résumé long  :

Les progrès dans la lutte contre la faim ont été significatifs en Afrique de l’Ouest et au Burkina Faso entre 2000 et 2014, avant que la situation alimentaire ne se détériore à nouveau. Les raisons sont multiples et interdépendantes : des phénomènes météorologiques extrêmes plus fréquents et l'augmentation de la population tendent à réduire la disponibilité alimentaire par habitant ; les déplacements de population dus aux conflits ont pour conséquence la chute de la production agricole et la désorganisation des circuits de distribution ; la pauvreté structurelle des populations est aggravée par un contexte économique mondial difficile. Pour suivre, analyser et prévoir les situations d'insécurité alimentaire aux échelles locales à sub-nationales, les systèmes de sécurité alimentaire (SSA) intègrent principalement des données agroclimatiques issues d’images satellites et des indicateurs de nutrition, de production et d’économie issus d’enquêtes ménages. Ces enquêtes sont essentielles à la production d’indicateurs clés pour mesurer la sécurité alimentaire (SA), mais sont coûteuses économiquement et en temps.

L'objectif de cette thèse est de fournir des approches innovantes pour l’estimation d’indicateurs de SA et de leurs déterminants, en utilisant des données hétérogènes publiquement accessibles et des approches fondées sur l’intelligence artificielle, dans la perspective d'appuyer les méthodes utilisées par les SSA. Pour cela, plusieurs questions de recherche sont traitées : sur quels indicateurs s’appuyer pour mesurer la SA et quelles en sont les limites ? Comment traiter l’hétérogénéité thématique, temporelle et spatiale des données ? Comment extraire des données leur aspect explicatif, i.e., être capable d’identifier les facteurs d’augmentation ou de diminution de la SA à partir des données ? Pour répondre à ces problématiques, cette thèse propose trois contributions.

Premièrement, nous faisons un état des lieux des nombreux indicateurs utilisés pour quantifier cette notion complexe qu’est la SA. Puis, nous nous concentrons sur des indicateurs de SA issus d’enquêtes ménages (i.e., le score de consommation alimentaire, le score de diversité alimentaire des ménages et l’indice des stratégies de survie réduit) et étudions ce qu’ils nous révèlent sur la SA, leur validité spatiale et temporelle, ainsi que les biais auxquels ils peuvent être sujets. Nous montrons que malgré leurs biais inhérents, ces indicateurs contiennent des informations spatiales et interannuelles cohérentes qui peuvent être exploitées pour le suivi des crises alimentaires au niveau sub-national.

Deuxièmement, nous proposons des approches originales combinant des méthodes d'apprentissage automatique et profond (i.e., forêts aléatoires, réseaux de neurones convolutifs, réseaux de neurones récurrents à mémoire court-terme et long terme) pour obtenir des approximations d’indicateurs de SA issus d’enquêtes ménages. Ces approches intègrent et combinent des données explicatives hétérogènes. Les données explicatives sont des variables quantitatives (e.g., données météorologiques), des images (e.g., densités de population, occupation des sols), des points GPS (e.g., hôpitaux, écoles, événements violents) et des vecteurs (cours d’eau) avec différentes granularités temporelles et spatiales (e.g., séries temporelles, images à haute résolution spatiale). Nous mettons en évidence la pertinence des approches d'apprentissage automatique selon les données à traiter et constatons l’apport significatif de variables issues de nombreux domaines dans une approche globale.

Troisièmement, nous étudions l’apport des données textuelles, possédant un fort potentiel explicatif, pour effectuer une analyse qualitative de la SA en nous basant sur un corpus de journaux burkinabés. Nous examinons la capacité des méthodes de fouille de textes à extraire automatiquement des informations qualitatives sur la situation alimentaire globale, régionale et annuelle à partir de ce corpus. Ce travail a permis d'obtenir des informations qualitatives spécifiques sur la thématique de la SA et sur ses caractéristiques spatiale et temporelle.
A travers ces trois contributions, cette thèse considère la problématique de l’hétérogénéité des données liées à la SA en mettant l’accent sur les dimensions spatio-temporelles et thématiques qu’elles véhiculent. Les cadres méthodologiques génériques proposés pourront être étendus et adaptés à d’autres domaines.


Composition du jury et de l’équipe encadrante :

Josiane Mothe, Professeur, Université de Toulouse. Rapporteure
Stan Matwin, Professeur, Dalhousie University, Canada. Rapporteur
Pierre Gançarski, Professeur, Université de Strasbourg. Examinateur
Isabelle Mougenot, Maître de conférences, Université de Montpellier. Invitée
Mathieu Roche, Chercheur HDR, CIRAD - UMR TETIS. Directeur
Maguelonne Teisseire, Directrice de Recherche, INRAE - UMR TETIS. Co-Directrice
Elodie Maître d’Hôtel, Chercheuse HDR, CIRAD - UMR MOISA. Encadrante
Roberto Interdonato, Chercheur, CIRAD - UMR TETIS. Encadrant principal
Agnès Bégué, Chercheuse HDR, CIRAD - UMR TETIS. Encadrante

Bien cordialement,
Hugo Deléglise

Dernière mise à jour : 06/12/2021