H. LUBES, J.M. MASSON, E. SERVAT, J.E. PATUREL, B. KOUAME, J.F. BOYER, 1994. "Caractérisation de fluctuations dans une série chronologique par application de tests statistiques. Etude bibliographique." Programme ICCARE. Rapport n°3. ICCARE. ORSTOM, Montpellier, France. Juin 1994

La caractérisation d'éventuelles fluctuations d'ordre climatique en Afrique de l'Ouest non Sahélienne repose entre autres analyses sur l'étude de séries chronologiques de données de pluie et de débit à différents sites de mesures, les plus nombreux possibles, sur des périodes les plus longues possibles.

Le présent rapport qui s'inscrit dans la première phase du programme Iccare a pour but de spécifier les traitements statistiques qui sont a priori envisagés pour analyser les séries chronologiques de données hydro-pluviométriques des différents postes répertoriés pour le programme. Ces méthodes seront appliquées pour étudier les précipitations sur le pas de temps de l'année, de la saison (humide et sèche), voire de la décade. Ces traitements pourront également être préconisés pour l'étude de débits moyens annuels et éventuellement d'autres grandeurs de débit à définir.

Les variations au sens le plus général du terme qui seront éventuellement décelées ne seront pas systématiquement qualifiées de climatiques. Une interprétation prudente des résultats devra être donnée, et ce d'autant plus que les séries étudiées seront de courte durée.

Les méthodes statistiques dont il est fait état dans ce rapport concernent l'exploitation d'une série de données et une seule. Ce type d'analyse sera qualifié de ponctuel ou "par site".

Les techniques statistiques relatives à une analyse "régionale" ou "zonale" c'est-à-dire impliquant plusieurs postes feront l'objet d'une deuxième synthèse.

La nature des données traitées et les termes du problème posé étant ainsi rappelés, la première partie de ce rapport est consacrée à une synthèse bibliographique. Dans un deuxième temps, les méthodes retenues sont précisées.

SYNTHESE BIBLIOGRAPHIQUE

La littérature consacrée à l'approche statistique de séries chronologiques de variables hydro-météorologiques est particulièrement abondante.

D'après Kendall et Stuart (1943), l'analyse d'une série temporelle a pour but d'améliorer la compréhension des mécanismes statistiques générateurs de cette série d'observations. Cet objectif ne peut être atteint en considérant une seule série de données. En effet toute série chronologique peut n'être qu'une représentation partielle d'un phénomène complexe générant un nombre substantiel de séries différentes.

Il n'en demeure pas moins qu'une exploitation "par site" s'impose avant de procéder à des interprétations prenant en compte la dimension spatiale des phénomènes générateurs des dites séries ponctuelles.

Tous les auteurs s'accordent pour décomposer une série temporelle typique en quatre parties :

Toute série peut être représentée par l'un ou plusieurs de ces constituants.

L'étude des séries temporelles est consacrée en grande partie à isoler et à analyser séparément chacune des composantes constitutives de la série.

La décomposition d'une série est très souvent utile. Toutefois elle ne peut se faire que compte tenu d'hypothèses fortes, et a priori, concernant le caractère linéaire ou non du système générateur de ladite série chronologique. Cette phase de modélisation ne paraît pas s'imposer dans le cadre du présent programme. Elle est surtout utilisée dans le cas de variables de type économique.

Il semble préférable de lui substituer la mise en oeuvre de tests statistiques, les plus robustes possibles, spécifiques de l'une ou l'autre des composantes précitées.

Les tests qui vont être présentés sont extraits en grande partie de la note technique n°79 "Climatic change" de l'Organisation Mondiale de la Météorologie (WMO, 1966), et de Kendall et Stuart (1943).

La première catégorie de tests concerne le caractère aléatoire des séries. Dans l'hypothèse où la série est déclarée non aléatoire des tests sont requis pour tenter de caractériser la nature "non aléatoire" présente dans la série. Les tests relatifs à la détection de point de rupture a priori à date inconnue termineront cette présentation.

CARACTERE ALEATOIRE DES SERIES

Les tests les plus répandus portent sur la constance de la moyenne de la série tout au long de sa période d'observations.

Ces tests sont en général assez puissants pour faire une distinction entre le caractère aléatoire et le caractère non aléatoire de la série. En revanche tous ne permettent pas d'identifier une alternative à la constance du type tendance, discontinuité brutale, oscillations... Seuls quelques-uns sont relativement puissants vis à vis d'une alternative spécifique, qui le plus souvent relève d'un changement brutal.

Quelques tests ont pour objet la constance de la dispersion de la série, c'est-à-dire qu'ils étudient si la variabilité de la série est uniforme dans le temps.

Les tests non paramétriques ne font pas d'hypothèse sur la nature de la distribution de probabilité de la variable définissant la série des observations. Les tests, paramétriques ou non, sont dits robustes lorsque leurs conditions d'application sont peu strictes (Kotz et al., 1981).

Soit la série chronologique (xi), i=1,N, les xi désignent les réalisations de la variable X observées à des pas de temps successifs égaux (Kotz et al., 1981).

L'hypothèse nulle est donc : "la série des (xi), i=1,N, est aléatoire".

TEST DU RAPPORT DE VON NEUMANN (WMO, 1966 ; BUISHAND, 1982)

Il s'agit du rapport de la moyenne du carré des différences successives des valeurs observées à la variance.

TEST DES POINTS DE REBROUSSEMENT (KENDALL ET STUART, 1943)

TEST DES CHANGEMENTS DE SIGNE (KENDALL ET STUART, 1943)

TEST DE CORRELATION SUR LE RANG (KENDALL ET STUART, 1943 ; WMO, 1966)

STATISTIQUE DE RANG DE SPEARMAN (WMO, 1966)

TEST T DE STUDENT DE LA DIFFERENCE DE DEUX MOYENNES (WMO, 1966 ; CERESTA, 1986)

TEST DE CRAMER (CRAMER, 1946 ; WMO, 1966)

Ce test peut être répété autant de fois que de sous-périodes sont définies. Dans le cas où des périodes se chevauchent une attention toute particulière doit être portée sur l'interprétation du test.

TEST DE CONSTANCE DE LA VARIABILITE (TEST DE BARTLETT, WMO, 1966)

AUTOCORRELOGRAMME (WMO, 1966 ; CHATFIELD, 1989)

Une importance particulière doit être donnée au comportement de l'autocorrélogramme pour de faibles valeurs de k, notamment pour k = 1 (WMO, 1966). En effet sur les vingt premières valeurs de rk, il n'est pas rare qu'une valeur sorte de la région de confiance même lorsque la série est réellement aléatoire. Ceci souligne les difficultés d'interprétation de l'autocorrélogramme, indépendamment des conditions d'application relatives à la linéarité des liaisons, et à la structure des écarts à ces liaisons.

TESTS DE DETECTION DE RUPTURES

Les tests qui vont être présentés ci-après sont plus particulièrement adaptés à la détection de ruptures dans une série chronologique. Une rupture peut être définie de façon générale par un changement dans la loi de probabilité de la série chronologique à un instant donné, le plus souvent inconnu.

TEST DE MANN-WHITNEY (PETTITT, 1979 ; CERESTA, 1986)

Le fondement du test de Mann-Whitney est le suivant (Ceresta, 1986).

La série étudiée est divisée en deux sous-échantillons respectivement de taille m et n.

Les valeurs des deux échantillons sont regroupées et classées par ordre croissant. On calcule alors la somme des rangs des éléments de chaque sous-échantillon dans l'échantillon total. Une statistique est définie à partir des deux sommes ainsi déterminées, et testée sous l'hypothèse nulle d'appartenance des deux sous-échantillons à la même population.

TEST DU RAPPORT DE VRAISEMBLANCE (BUISHAND, 1982, 1984)

STATISTIQUE U (BUISHAND, 1982, 1984)


Remarque : Les tests basés sur les écarts cumulés ont des propriétés optimales dans le cas de changements brutaux de moyenne.

ELLIPSE DE CONTROLE


PROCEDURE BAYESIENNE (KOTZ ET AL., 1981, VOL. 1)


PROCEDURE DE SEGMENTATION DES SERIES HYDROMETEOROLOGIQUES

Une procédure de segmentation des séries hydrométéorologiques a été présentée par Hubert et al. (1989)

Le principe de cette procédure est de "découper" la série en m segments (m>1) de telle sorte que la moyenne calculée sur tout segment soit significativement différente de la moyenne du (ou des) segment(s) voisin(s). Une telle méthode est appropriée à la recherche de multiples changements de moyenne

La segmentation est définie de la façon suivante


Par conséquent si lors du processus de segmentation d'ordre m+1, aucune segmentation produite n'est valide au sens du test de Scheffé, la segmentation de la série qui est retenue en tant que meilleure segmentation est la segmentation optimale d'ordre m.

D'après les auteurs (Hubert et al., 1989), cette procédure de segmentation peut être regardée comme un test de stationnarité, "la série étudiée est stationnaire" constituant l'hypothèse nulle de ce test. Si la procédure ne produit pas de segmentation acceptable d'ordre supérieur ou égal à 2, l'hypothèse nulle est acceptée. Aucun niveau de signification n'a été attribué à ce test.

METHODES RETENUES DANS ICCARE

Les divers tests qui viennent d'être présentés ne constituent en aucun cas une liste exhaustive des procédures qui ont pour objectif d'analyser "les traits" d'une série chronologique. Toutefois ont été recensés les tests les plus utilisés et les plus argumentés dans la littérature.

Parmi les méthodes présentées au paragraphe précédent, ont été retenus pour l'étude des séries chronologiques du programme Iccare, les tests suivants.

TEST DE CORRELATION SUR LE RANG

Ce test est intéressant du point de vue de son hypothèse alternative qui est celle d'une tendance. De plus ce test s'est révélé satisfaisant pour détecter un changement de moyenne sur des séries aléatoires générées artificiellement avec perturbations (Bonneaud, 1994).

Il a en outre déjà été appliqué dans le contexte africain (Olaniran, 1991).

DETERMINATION DE L'AUTOCORRELOGRAMME

L'estimation de l'autocorrélogramme est incontournable comme première exploitation de toute série chronologique.

TEST DE PETTITT (VERSION MODIFIEE DE MANN-WHITNEY)

La réputation de ce test de détection de rupture dont il existe de multiples applications (Demarée, 1990 ; Sutherland et al., 1991 ; Vannitsem et Demarée, 1991) justifie qu'il soit ici retenu.

STATISTIQUE U DE BUISHAND

La robustesse de ce test et l'originalité de son fondement à partir d'une approche Bayesienne le rendent intéressant.

ELLIPSE DE CONTROLE

L'ellipse de contrôle est un complément graphique original au test de Buishand.

PROCEDURE BAYESIENNE DE LEE ET HEGHINIAN

La procédure Bayesienne de Lee et Heghinian a été appliquée à l'étude de la structure de la saison des pluies en Afrique Soudano-Sahélienne (Chaouche, 1988). Il semble tout à fait justifié de la mettre en oeuvre dans le cadre d'Iccare.

PROCEDURE DE SEGMENTATION DES SERIES HYDROMETEOROLOGIQUES

Déjà appliquée à des séries de précipitations et de débits de l'Afrique de l'Ouest (Hubert et Carbonnel, 1993), son utilisation est intéressante dans le programme Iccare.


Parmi les raisons pour lesquelles certaines méthodes n'ont pas été retenues, il faut citer :


PAGE PRECEDENTE

DEBUT DE LA PAGE