Première Expérience en Analyse de Données

Auteur·rice·s

Renaud Florentin Azanma

Inès Shili-Touzi

Antoine Géré

Date de publication

30 novembre 2025

Présentation

L’exercice PEAD (Première Expérience en Analyse de Données) a été introduit en 2021-2022 pour les étudiants de 2A.

Cet exercice a pour objectifs de :

  • vous initier à la recherche bibliographiques dans le but de comprendre des données

  • mobiliser la démarche scientifique à travers l’identification de questions liées à ces données

  • utiliser R et RStudio afin d’analyser et tester les données dans le but de répondre aux questions posées

  • interpréter vos résultats afin de dégager des conclusions et une vision critique

 

Thématique

Thématique 2025-2026

Pour cette année, nous avons choisi de travailler avec vous sur la culture du coton dans le contexte agricole du Benin. Les données sont issues du travail de thèse de Renaud Florentin Azanma.


Filière du coton et présentation de la thèse


flowchart TD
    A[Producteurs] --> B{Coopératives}
    B --> C(Union communale<br> de coopératives)
    C --> D(Fédération<br>nationale)
    D --> E(AIC)
    B --> G[Usines] ---> E(AIC)
Figure 1: Organisation de la filière coton au Bénin. L’AIC désigne l’association interprofessionnelle du coton.

La thèse de Renaud s’inscrit dans le cadre de la filière cotonnière au Bénin. Elle est menée conjointement à l’Université de Parakou et à l’ISTOM.

Titre de la thèse

Analyse et caractérisation des systèmes de culture du coton à haute performance pour une conception de systèmes plus durables et économiquement viables au Bénin.

Encadrants

  • Prof. Hugues Kossi BAIMEY – Université de Parakou
  • Marc Oswald – ISTOM
  • Ines SHILI-TOUZI – ISTOM

Défis majeurs de la filière

  • Assurer une amélioration durable de la fertilité des sols et des rendements en coton.
  • Réduire l’usage des engrais et pesticides chimiques afin de limiter les impacts environnementaux.
  • Adapter les systèmes de production cotonniers aux changements climatiques.

Objectifs et positionnement de la thèse

  • Caractériser les systèmes agricoles cotonniers à haute productivité
  • Identifier et analyser les exploitations les plus performantes

Pourquoi se concentrer sur les exploitations à haute performance ?

Les exploitations à haute performance représentent un potentiel encore peu exploité au Bénin :

  • Selon la litérature certaines exploitations atteignent des rendements presque doublés (jusqu’à 2000 kg/ha ou plus) (Westerberg et al., 2017 ; Aifa, 2022).

  • Ces exploitations restent marginales et peu étudiées, mais elles sont considérées comme des modèles de production au sein des coopératives cotonnières.

  • Les pratiques mises en œuvre par ces agriculteurs méritent d’être analysées pour :

    • Identifier les pratiques les plus performantes, tant sur le plan économique qu’agro-environnemental.
    • Comprendre les facteurs de réussite et les stratégies permettant de maintenir ces performances dans le temps.

Les résultats visent à concevoir des systèmes de culture du coton durables et économiquement viables, capables de répondre aux principaux défis de la filière cotonnière au Bénin.

Progression

Step 1 - Bases de données

Vendredi 28 Novembre 2026

Travail à faire.

Il vous est demandé de synchroniser votre base de données sur votre ordinateur personel, comme indiqué à ce lien.


Elaboration des bases de données

Bases de données par coopératives

  • Référencement selon la carte administrative.
  • Intégration des données issues des sondages réalisés dans les coopératives.

Objectifs du sondage

  • Évaluer la dynamique de production des cotonculteurs.
  • Identifier les différents profils de bons producteurs de coton.
  • Comprendre la diversité des exploitations cotonnières dans la zone d’étude.

Données utilisées

  • Cahiers de 79 coopératives sur 83 de la commune de Bembèrèkè (11 ont été choisies).
  • Cahiers de crédits intrants : quantités d’engrais, herbicides, insecticides, et superficies en coton.
  • Cahiers d’achats de coton-graine : production, prix des intrants, revenus et dettes.

Zone de sondage : Bembèrèkè

  • Située entre 8°30’ et 10°45’ de latitude Nord.
  • Climat soudano-sahélien avec une seule saison des pluies de 80 à 110 jours.
  • Pluviométrie annuelle : 600 à 950 mm.
  • Cultures dominantes : céréales (maïs, sorgho, mil), coton, soja et igname.
  • Deuxième zone de production de coton du pays.
  • Terres cultivées généralement peu fertiles et très sensibles au lessivage.
  • 481 coopératives recensées (AIC, 2019).

Constitution de la base de données

  • Collecte et photographie des différents cahiers des coopératives.
  • Sélection de 11 coopératives sur la base de la disponibilité des cahiers couvrant les trois dernières campagnes cotonnières (2022, 2023 et 2024).
  • Saisie des données des cahiers dans Excel pour traitement et analyse.

 

Step 2 - Motiver votre travail

Vendredi 28 Novembre 2026

Pour la rédaction de votre étude bibliographique, vous utiliserez Quarto avec RStudio.

Une première vidéo vous présente Quarto : son rôle, son fonctionnement et la manière de créer et organiser un document (structure, sections, export en PDF/HTML, etc.).

Une deuxième vidéo explique comment gérer les citations et la bibliographie (fichier .bib, insertion de références, format des citations dans le texte, génération automatique de la bibliographie).

Quelques bases de Quarto :

  • Un document Quarto porte l’extension .qmd (Quarto Markdown).
  • Il commence par un en-tête (YAML) où l’on définit le titre, l’auteur, la date et le format de sortie (HTML, PDF, Word…). \(\to\) déjà fait !
  • Le texte est rédigé en Markdown (titres avec #, listes, tableaux, etc.)
  • Le code R peut être inséré dans des chunks pour produire des graphiques ou des analyses.
  • Les références bibliographiques sont gérées à partir d’un fichier .bib.
Travail pour février 2026.

Réaliser une étude bibliographique sur la filière coton afin de justifier et contextualiser votre travail.

La recherche devra être menée de manière progressive, en commençant par une analyse à l’échelle mondiale, puis en se focalisant sur la situation en Afrique, avant de terminer par le cas spécifique du Bénin.

L’objectif est d’obtenir une vision globale de l’état actuel de la filière coton ainsi que des principaux enjeux économiques, sociaux et environnementaux associés.

Step 3 - Statistique descriptive

Vendredi 28 Novembre 2026

Travail pour février 2026.

À partir de votre base de données, vous devez réaliser une analyse statistique descriptive, à la fois univariée et multivariée, afin de mettre en évidence les caractéristiques principales du jeu de données et de comprendre les dynamiques qui y sont présentes.

Vous trouverez ci-dessous quelques ressources pour le traitement statistiques de données avec R sur RStudio.

Step 4 - Entretien autour d’une problématique

Prenière séance PEAD – Février 2026

Travail pour février 2026.

Vous présenterez votre revue bibliographique et votre analyse statistique descriptive à Mme Shili-Touzi lors d’une rencontre d’environ 30 minutes, prévue en février 2026, afin d’échanger avec elle et de préciser la problématique à retenir.

Step 5 - Tests statistiques

more details coming soon.

Step 6 - Mise en forme d’une synthèse

more details coming soon.

Ressources

Voici quelques sites qui porposent des base de données open source :



Mise en forme par Antoine Géré.