Résumé

Cette étude examine la possibilité de prédire la répartition spatiale des éclosions des feux de forêts dans la région de Chefchaouen-Ouazzane (Nord-ouest du Maroc). Le système d’information géographique a été utilisé pour la localisation de 613 feux de forêt, enregistrés entre 2002 et 2015. La construction du modèle de prédiction dichotomique a été développée sur la base des résultats de la régression logistique binaire en utilisant 20 variables explicatives anthropiques et biophysiques. Un échantillon aléatoire de 2141 observations (60%) a été utilisé pour la construction du modèle et 1427 observations exogènes (40 %) ont été réservées pour la réalisation d’un test indépendant de la capacité du modèle à prédire les éclosions des feux. Les variables explicatives incluses dans le modèle, font état de l’impact des facteurs (1) anthropiques, représentés par les voies d’accès (pistes et routes) et les lieux de grande récurrences d’incendies, (2) topo-climatiques, dont la température maximale journalière, l’humidité relative de l’air et les pentes, et enfin (3) biologiques, à savoir le type de combustible à base notamment de chêne-liège de faible densité, d’une part, et du Matorral, du Lentisque, de l’Erica, du Cistus et du Kermès, d’autre part. Le modèle logistique binaire classe correctement 88,1% de l’échantillon d’étalonnage du modèle (2141 observations) et de 86,9% des cas de validation (test de validation avec 1427 observations). La carte produite pourrait, sur le plan opérationnel, améliorer les processus d’alertes et le positionnement des postes de guets et des unités d’interventions chargées des attaques initiales des feux naissants. Des voies d’amélioration sont également proposées pour augmenter sa précision.


Mots clés: SIG, Modélisation spatiale, Éclosion des feux de forêt, Carte de prévision, Régression logistique

INTRODUCTION

Les incendies de forêts, bien que considérés communément comme un risque naturel, sont, au contraire, largement conditionnés par des facteurs biophysiques et anthropiques, qui en sont les précurseurs. Selon le Forest Fire News, environ 15 millions d’hectares de la forêt mondiale sont incendiés par an. A l’échelle de la Méditerranée, les estimations des dommages oscillent entre 600 000 et 700 000 ha/an (Jappiot, 2003). Le développement incontrôlé des activités agricoles et touristiques, ainsi que l’utilisation croissante des forêts pour des activités récréatives mettent en danger les vies humaines et les ressources naturelles. La destruction des forêts et des infrastructures et le coût de la lutte contre les incendies sont estimés à plusieurs milliards de dollars chaque année (FAO, 2006).

Au Maroc, et bien que limitée par rapport aux moyennes des superficies incendiées dans d’autres pays à conditions similaires, notamment du pourtour méditerranéen, la superficie moyenne endommagée durant la dernière décennie (2002-2015) de 3549 ha/an est importante eu égard au taux de boisement variable selon les régions du pays (3 à 43%), aux rôles majeurs joués par les forêts et aux difficultés de leur reconstitution et régénération dans le contexte socio-économique et environnemental national. Le nombre moyen annuel de feux correspondant à cette même période est de 463 éclosions (HCEFLCD, 2015).

Les nouvelles sciences et technologies proposent aujourd’hui un grand éventail d’outils et méthodes susceptibles de permettre une appréhension globalisante du risque d’incendie de forêts. Il pourrait être considéré, dans certains cas et pour certains pays, qu’un regard scientifique fédérateur fait défaut pour synthétiser, uniformiser et contextualiser les démarches et les concepts à mettre à la disposition des autorités pour les aider à prendre les décisions les plus appropriées en matière de gestion (Mangiavillano, 2008). Ainsi, plusieurs types de modèles, indices et algorithmes mathématiques décrivant le danger d’incendies, aussi bien le risque affèrent aux probabilités de propagation et/ou d’intensité qu’à celui de l’éclosion, ont été développés à travers le monde (Van Wagner et al., 1987; Forestry Canada Fire Danger Group, 1992; Illera et al., 1996; Chuvieco et al., 1999; Bovia et Camia, 2000; San-Miguel-Ayanz et al., 2002; Sebastian et al., 2002; Syphard et al., 2008). Parmi les modèles les plus connus, on peut citer FWI (Canadian Forestry Service, 1987), BEHAVE (Andrews, 1986; Andrews et al., 2003) et FARSITE (Finney, 1998).

Cependant, il faut souligner la complexité et la diversité des données relatives à l’environnement qui exigent une adaptation de ces modèles aux conditions spécifiques de chaque pays voire même pour chaque région et ce, en s’appuyant sur les bases de données disponibles (Faour et al., 2006). Le comportement des feux, en termes de propagation et d’intensité, est un phénomène majoritairement physique lié principalement aux composantes traditionnelles du triangle du feu à savoir, le climat, le combustible et la topographie (Countryman, 1972). D’autre part, il ne faut pas omettre que les régimes naturels des feux de forêts ont été de plus en plus modifiés par l’homme depuis les derniers milliers d’années, de sorte que dans la plupart des régions du monde, les activités humaines sont devenues beaucoup plus responsables que les sources naturelles d’éclosions d’incendies (Crutzen et Goldammer, 1993).

Durant les deux dernières décennies, des chercheurs et scientifiques à travers le monde, ont commencé à s’intéresser davantage à des études prospectives sur des milieux forestiers connaissant une grande fréquence d’éclosion des feux en relation avec les activités humaines (agriculture, récolte de produits forestiers, campement, récréations, loisirs, ouverture de voies d’accès …). Ainsi, et à titre d’exemple, plusieurs études aux USA (Californie et Arizona) et au Canada (Vancouver) se sont focalisées sur la cartographie des points d’éclosions et des lieux de probabilité d’incendies (Pew et Larsen, 2001; Dickson et al., 2006; Syphard et al., 2008). Les équations développées dans ces études permettent d’identifier les lieux de susceptibilité d’éclosion des feux et de cerner les facteurs liés aux pressions humaines favorisant la mise à feu (Pew et Larsen, 2001). Souvent, les informations relatives à la nature et à la charge du combustible sont les seuls facteurs considérés dans les opérations de gestion des activités relatives à la réduction du risque d’incendies de forêts (Dickson et al., 2006). La détermination des questions ‘où, quand et pourquoi’ des éclosions des feux de forêts peut permettre aux décideurs d’améliorer, sur les plans de la prévention et de la détection, leur capacité de gestion du fléau, et par suite, faciliter l’allocation efficace des moyens d’interventions de manière à être proactif contre les feux naissants (Sande Silva et al., 2010).

Le présent travail est focalisé sur l’analyse, en régression logistique binaire, et par le biais d’un Système d’Informations Géographiques (SIG), de l’historique des points d’éclosion des incendies, couvrant la période 2002 à 2015, et leur relation avec les données écologiques (types de végétation forestières incendiées et leur degré d’inflammabilité, NDVI), topo-climatiques (pente, exposition, direction et vitesse du vent, température maximale, humidité relative, pluviométrie) et anthropiques (secteurs de forte pression de mise à feu) au nord-ouest du Maroc (région de Chefchaouen-Ouazzane). Les forêts de Chefchaouen-Ouazzane connaissent un niveau élevé d’actes de mise à feu (47 incendies/an en moyenne) par comparaison aux autres régions forestières du pays. Aussi et en l’absence actuellement de modèle d’éclosion élaboré et testé sous les conditions locales et même nationales, nous avons décidé d’appréhender ce paramètre d’éclosion grâce à la démarche présentée ci-après. L’objectif final est d’élaborer pour cette région, la carte de probabilité d’éclosion d’incendies de forêt qui permettra, sur le plan opérationnel, d’améliorer les processus d’alertes et le positionnement sur le terrain, des postes de guets et des unités d’interventions chargées des attaques initiales des feux naissants.

MATÉRIEL ET MÉTHODOLOGIE 

Zone de l’étude

La zone d’étude de Chefchaouen-Ouazzane (Figure 1), d’une superficie de près de 6000 km², est localisée dans la partie nord-ouest du Maroc entre les parallèles 34°25’14’’ et 35°32’25’’N, et les méridiens 04°19’33’’ et 05°53’53’’W. Le domaine forestier de la zone d’étude s’étend sur une superficie d’environ 229 000 ha.

Il est constitué par des formations à Chêne-liège (26%), Chêne vert (10%), Cèdre (2%), Thuya (2%), Sapin (1%), Chêne zéen (1%), Pin maritime du Maghreb, Pin noir, Pin d’Alep, Chêne tauzin, Genévrier oxycèdre, ainsi qu’un grand nombre d’espèces arbustives et herbacées (39%) (Tableau 1). Ces ressources forestières sont marquées par de très fortes pressions anthropiques. En fait, les populations riveraines considèrent que toute terre à végétation naturelle même arborée constitue un patrimoine collectif qui peut être mobilisé et par suite, défriché et mis en culture à tout moment (HCEFLCD, 2010).

Tableau 1: Taux du couvert forestier dans la région de Chefchaouen-Ouazzane (IFN-Maroc, 2006)

Type de formations Type d’essences Superficie (ha) Taux du couvert (%)

Résineuses naturelles Cèdre 4 000 2

Thuya 3 500 2

Pins 10 000 4

Sapin 3 000 1

Feuillues naturelles Chêne vert 24 000 10

Chêne liège 60 000 26

Chêne zéen 3 000 1

Autres essences (+ reboisement) 31 500 14

Matorral 90 000 39

Total 229 000 100

Les incendies constituent pour la région de Chefchaouen-Ouazzane l’un des principaux facteurs de dégradation et de destruction des forêts. A titre indicatif, la moyenne annuelle du nombre de feux et des superficies endommagées, durant la période 2002-2015 s’élèvent respectivement à 47 incendies et à 733 ha/an, avec toutefois des pics ayant atteint 3484 ha en 2004 et 1734 ha en 2006. Les éclosions des feux sont majoritairement concentrées au cours des mois de juin, juillet, août et septembre. Ces mois enregistrent 71% des incendies déclarés dans la région et 95% des superficies endommagées (HCEFLCD, 2015).

La zone d’étude est constituée par 45 communes dont 33 sont touchées par les incendies de forêts (Figure 2); 54% des incendies déclarés et 66% de la superficie touchée par les feux sont localisés dans les 6 communes de Bab Taza, Talambote, Bab Berred, Zoumi, Iounane et Tanaqoub. Les rapports d’enquêtes du département des eaux et forêts du Maroc (HCEFLCD, 2015) signalent que la quasi-totalité (99%) des départs des feux en forêts dans la zone d’étude résulte de l’action de l’homme soit par imprudence soit intentionnellement pour le défrichement des espaces forestiers en vue de leur mise en culture.

Description des données

Variable dépendante - éclosion des feux de forêts

Les données d’éclosions des feux de forêts en nombre de 613 points, couvrant la période 2002-2015 (14 ans), ont été étudiées (Tableau 2 et Figure 3). Ces données numériques ont été récupérées à partir du Service de la Protection des Forêts (SPF) du Haut-Commissariat aux Eaux et Forêts et à la Lutte Contre la Désertification (HCEFLCD). Il n’est pas inclus dans cette base de données les feux enregistrés dans les terrains forestiers privés ou dans les espaces naturels ou agricoles. La localisation de chaque point d’éclosion de feu de forêt (en domaine forestier) est donnée dans le système de coordonnées Lambert Conique Conforme. Aussi chaque incendie recensé possède ses propres métadonnées relatives à l’heure d’éclosion, le jour, le mois, l’année, la superficie brûlée, l’espèce végétale endommagée et la cause présumée.

Les superficies forestières endommagées par chacun de ces 613 incendies varient de quelques mètres carrés à presque 3500 ha. La précision de localisation du point coordonnée de chaque incendie est estimée entre 5 à 10 m de rayon (Erreur de précision du GPS). La majorité des 613 incendies répertoriés sont d’origines humaines soit d’une manière volontaire ou involontaire. Les incendies d’origines naturelles (foudre) sont quasiment nuls.

Variables explicatives – actions humaines

L’espace forestier anthropisé est générateur d’incendies; plus cet espace est fréquenté, plus la probabilité d’éclosion augmente. En effet, il est possible de spatialiser la pression anthropique qui n’est pas homogène dans l’espace; généralement, elle est fonction de la répartition des objets sources (routes, habitat) et de leur niveau respectif de pression. La pression anthropique d’un territoire est donc la synthèse des artefacts des pressions qu’il renferme. A travers ces pressions, ce sont les pratiques sociales qui sont observées.

La localisation d’une éclosion n’est pas aléatoire et n’est pas non plus exclusivement liée au bon vouloir d’un pyromane. L’occupation humaine imprime sur l’espace des pressions qui, lorsqu’elles s’appuient sur un type de végétation adaptée avec des conditions climatiques propices, provoque une éclosion d’incendie. Le feu est ainsi le produit d’un système de forces sociales et environnementales en interaction (Mangiavillano, 2008)

Les éclosions des feux de forêts apparaissent généralement le long des abords des routes et dans des sites où les activités humaines sont concentrées (Keeley et Fotheringham, 2003; Stephens, 2005). Pour notre cas, il semble, à première vue, que les incendies de forêts prennent naissances près des routes et des agglomérations (Figure 2). La connaissance exacte de la cause est très rare, et dans l’immense majorité des cas ce n’est qu’une supposition. En effet, dans la zone d’étude, 92% des incendies déclarés ont une cause inconnue.

Nous avons utilisé, comme variables explicatives de l’action humaine, les données cartographiques, issues de la base de données géo-spatiale du Recensement Général de la Population et de l’Habitat (Anonyme, 2004), traduisant les éventuels effets de 7 paramètres, à savoir: la distance aux routes et aux pistes forestières (accessibilité aux peuplements forestiers), la distance aux douars, le nombre de la population dans un rayon de 1 km et de 5 km et enfin le nombre de ménages dans un rayon de 1 km et de 5 km (Tableau 2). Le but recherché de cette composante est de mettre en lumière la relation distance/feux pour chaque type d’infrastructure (piste, route, habitation, agglomération). Nous considérons que le réseau le plus proche du point d’éclosions est le plus susceptible d’être à l’origine du sinistre. Il s’agit donc d’attribuer chaque feu au réseau le plus proche pour empêcher les redondances qui masqueraient éventuellement la répartition spatiale des feux.

Aussi, nous avons intégré dans l’analyse, le paramètre de pression annuelle de mise à feu (PAMF). En effet, pour notre cas d’étude, les données initiales présentaient différentes échelles et résolution. Par souci de leur uniformisation, l’ensemble du territoire de la zone d’étude a été subdivisé en unité de carreaux à surface égale de 4 km², qu’on a appelé cellule de grille. La résolution spatiale de la cartes finale est donc de 2 km (Assali et al., 2016). Le choix de cette surface de 4 km² est lié au fait que lorsqu’on distribue aléatoirement le total des feux enregistrés sur l’ensemble du territoire boisé, on aurait un seul incendie par unité de surface égale (distribution de l’espace en grille). Cette surface de grille a donc été obtenue en divisant la surface totale boisée de la zone d’étude (soit 229 000 ha) par le nombre total des incendies enregistrés durant 14 ans, entre 2002 et 2015 (soit 613 incendies de forêts).

Ensuite, nous avons calculé au niveau de chaque cellule de grille de 4 km², la surface boisée correspondante et le nombre moyen annuel de feux durant les 14 années (2002-2015). Ces deux paramètres ont été utilisés pour calculer la Pression Annuelle de Mise en Feu pour chaque cellule de grille de 4 km² (PAMFp), selon la formule:

Avec:

- PAMFp: pression annuelle de mise à feu par cellule de grille de 4 km²;

- Sbp: surface boisée de la cellule de grille de 4 km²;

- Mf: moyenne annuelle du nombre de feux durant les 15 années par cellule de grille de 4 km².

Nous avons attribué aux cellules de la grille sans feu de forêts, mais possédant des surfaces boisées, la valeur minimale de la PAMF de la zone d’étude. Ceci est justifié par le fait qu’aucune surface boisée ne possède le risque d’éclosion d’incendies égal à ‘0’ (Alexandrian, 2007).

Variables explicatives – Biophysiques

Du point de vue biophysique, l’expression du feu dans un espace naturel est une fonction de son environnement, y compris, bien évidemment, le climat, la nature du terrain et le combustible présents dans l’espace concerné (Pyne et al., 1996). Par conséquent, les modèles spatiaux qui simulent le comportement feu, utilisent souvent comme données d’entrées les variables mesurées comme l’altitude, la pente, l’exposition, la météo et la végétation (Anderson, 1982; Andrews et al., 2005).

Comme variables biophysiques potentiellement explicatives (Tableau 2 et Figure 4), nous avons sélectionné des variables climatiques et topographiques, ainsi que celles afférentes au type de végétation et à son degré d’inflammabilité. En effet, les facteurs biophysiques qui influencent l’éclosion de feu et sa propagation peuvent produire des conséquences multiples directes et indirectes sur le régime de feu (Whelan, 1995). Par exemple, l’angle de la pente affecte l’humidité et la conservation du sol, qui à son tour affecte la distribution de la végétation et sa composition, et par suite les caractéristiques du combustible et son inflammabilité (Franklin 1998). Aussi, la pente produit un effet physique direct sur les fronts actifs d’un incendie, parce qu’une fois les flammes sont plus près du sol, le feu brûle et progresse plus rapidement en amont (Whelan, 1995). Pour notre cas d’étude au niveau de la zone de Chefchaouen-Ouazzane, nous espérons à ce que la variabilité spatiale et la distribution de l’influence de ces variables biophysiques, à travers l’espace forestier, permettraient l’apport d’un faisceau d’explication pour prédire et cartographier les lieux potentiels d’éclosions des feux.

Topographie

Les variables que nous avons utilisées et qui traduisent l’aspect du terrain sont le pourcentage de pente et l’exposition (Tableau 2 et Figure 4). Les données des pentes et des expositions (en dizaines de degrés), récupérés de chez l’Agence Nationale de la Conservation Foncière, du Cadastre et de la Cartographie (ANCFCC, 2010), ont été extraites à partir du modèle numérique de terrain (30 m). Comme déjà explicité précédemment, ces facteurs topographiques expliquent la variation du climat local, fournissent l’effet des coupures de combustibles naturelles et influent indirectement sur l’humidité du combustible, la distribution de la végétation, et l’humidité relative de l’air (Whelan, 1995).

Climat

L’humidité de l’air et la température influent la répartition et la productivité de la végétation forestière, ainsi que le taux d’accumulation du combustible et l’humidité du sol, et par suite les phénomènes d’inflammabilité et de combustibilité, en l’occurrence l’éclosion et la vitesse de propagation de l’incendie (Whelan, 1995).

Du fait que nous n’avons pas pour but de simuler ni le comportement des feux ni les données météorologiques, nous avons utilisé les variables climatiques journalières spatialement interpolés (précipitations journalières, cumul des précipitations, température maximale de la journée, l’humidité relative de l’air, la vitesse et la direction du vent), et qui s’adaptent parfaitement aux conditions spatiales et temporelles de notre zone d’étude (grand espace forestier couvrant 229 000 ha). Aussi, il est à préciser que le cumul annuel des précipitations a été effectué depuis le mois de septembre de l’année en question jusqu’à la date d’éclosion de l’incendie. De même, nous avons intégré les valeurs de la température moyenne issues des valeurs des températures minimales et maximales. Les données climatiques sus-indiquées, extraite sur une grille de point de 5 km², ont été récupérées de la direction de la météorologie nationale (DMN, 2015). Le modèle spectral de prévision météorologique de la DMN-Maroc appelé ‘’ALBACHIR’’ est couplé avec le modèle global ARPEGE de Méteo-France sur une fréquence de 03 heures (Tableau 2).

Type de végétation

La probabilité qu’un feu éclose puis se propage dans une végétation forestière n’est jamais nulle. Cependant, les types et les caractéristiques de la végétation, en interférence bien évidemment avec le climat, peuvent créer des conditions plus ou moins favorables à l’éclosion et à la propagation des feux.

La composition et la structure des peuplements forestiers, en l’occurrence la distribution verticale et horizontale des espèces, déterminent leur inflammabilité et combustibilité, et conditionnement les processus de mise à feu et la puissance avec lesquels le feu va se maintenir et se propager (Colin et al., 2001).

Syphard et al. (2008), a cité que plusieurs systèmes sophistiqués ont été développés pour créer des modèles de combustibles à utiliser dans la prédiction du comportement du feu (par exemple le Groupe Canadien en charge du Danger des incendie de forêts, en anglais Forestry Canada Fire Danger Group 1992). Cependant, seulement trois des treize modèles standards du combustible utilisés aux États-Unis (par le Laboratoire national des incendies de forêt des USA) sont considérés comme applicables aux espace forestier de type ‘’terres d’arbustes chaparral’’ (Anderson, 1982). Dans les terres d’arbustes du sud de la Californie, le régime des feux (éclosion et propagation) est fortement différenciée selon le type et la structure des peuplements ; mais, généralement, le feu a tendance à se comporter de manière uniforme au sein des ‘’terres d’arbustes chaparral’’ (Wells et al., 2004).

Certaines espèces végétales sont plus vulnérables au feu que d’autres. Le matorral et les maquis sont plus disposés à être endommagés par les feux que les formations forestières arborées. Cette situation s’explique assez facilement par la différence de composition de ces formations et par les conditions climatiques auxquelles elles sont soumises. La prédisposition des formations végétales aux incendies est, en effet, très liée à leur teneur en eau. Celle-ci est fortement influencée par les conditions générales de sécheresse (température et sécheresse de l’air, absence de précipitations, épisodes de vents secs et violents). Ces conditions de prédisposition ne sont pas constantes dans le temps. Elles évoluent, par exemple, en fonction de l’état de la végétation qui est le résultat à la fois de sa dynamique naturelle, de la sylviculture qui lui est appliquée et des passages éventuels du feu (MATE, 2002).

Pour notre cas d’étude, l’intégration du facteur de la végétation a été appréhendée dans la modélisation du risque d’éclosion des feux de la zone d’étude, à travers 3 angles de vue, à savoir:

- La typologie de combustible: En effet, nous nous sommes basés, non pas sur les types d’IFN (Inventaire Forestier National), mais, sur les données cartographiques des modèles des types de combustibles élaborés en 2007, pour le compte du HCEFLCD, dans le cadre du projet de convention UTF/MOR/028 (Benabid, 2007). L’avantage de ces modèles de combustibles, c’est qu’ils renferment, en plus de la description horizontale du type de végétation, des données pertinents sur la continuité verticale des espèces y représentées, telles que, par exemple, les hauteurs et les taux de recouvrement et de biomasse de la litière, de la nécrosasse et des strates herbacées et arbustives qui contribuent directement et significativement aux processus d’éclosion des feux de forêts.

- Le degré d’inflammabilité des formations forestières présentes: Les données cartographiques de cette composante d’inflammabilité, ont été eux aussi collectées de chez le HCEFLCD. Chaque modèle de combustible lui a été attribuée une note moyenne d’inflammabilité à partir des différentes espèces qui le compose et ce proportionnellement à leur recouvrement (Alexandrian, 2007).

- L’indice différentiel normalisé de végétation (en anglais NDVI: Normalized Difference Vegetation Index). L’objectif d’intégration de ce facteur NDVI dans l’analyse du risque d’éclosion d’incendies de forêts est l’appréhension des paramètres liés à la sécheresse du sol et de la végétation forestière, notamment en période estivale. L’activité photosynthétique du couvert peut être estimée à partir de l’indice NDVI décrit par Rouse et al. (1974), qui combine les réponses radiométriques de la surface visée par le satellite dans les bandes spectrales du visible (VIS) et du proche infrarouge (PIR): NDVI = (PIR-VIS)/(PIR+VIS).

Effet, les mesures satellitales permettent de suivre avec régularité la végétation dans le temps et à des échelles spatiales variées. Diverses caractéristiques du couvert peuvent être estimées à partir des mesures radiométriques, en particulier son activité photosynthétique (par combinaison des mesures dans le visible et le proche infrarouge), le taux de recouvrement, la nature et la structure du couvert, l’état hydrique de la surface (à partir de mesures dans l’infrarouge thermique ou dans le domaine des micro-ondes), etc. Dès lors, la réponse spectrale de la végétation est modifiée pendant la période sèche de l’été. En effet, en période de stress hydrique, l’activité photosynthétique du couvert régresse plus ou moins fortement et la surface présente une réponse spectrale élevée, caractéristique de son dessèchement, dans l’infrarouge thermique ou les micro-ondes (Posper Laget, 1993). Plus précisément, cet indice corrélé avec la surface foliaire et la biomasse; les zones à risque correspondant à celles où l’on observe une baisse importante du NDVI dans le temps (Colin et al., 2001).

Traitement statistique des données

Un grand éventail de méthodes allant, de la régression logistique aux réseaux neuronaux, à des algorithmes de classification et d’arbres de régression, ont été utilisées à travers le monde pour modéliser l’occurrence des feux de forêts. La régression logistique est une des méthodes les plus fréquemment utilisées (Andrews et al., 2003, Vasconcelos et al., 2001, Chuvieco et al., 2003, Amatulli et al., 2007, Brosofske et al., 2007, Zhang et al., 2010). Elle a été utilisé pour développer des modèles régionaux et même nationaux sur de grandes espaces forestiers (Chuvieco et al., 1999, Martinez et al., 2009), ainsi que, pour le développement de modèles à l’échelle locale (Vega-Garcia et al., 1995, Vasconcelos et al., 2001). Dans d’autres études, la régression logistique a été utilisée pour développer des modèles temporels de prédiction quotidienne d’occurrence des feux d’origine humaine (Martell et al., 1987, Loftsgaarden et Andrews, 1992, Vega-Garcia et al., 1995).

Les événements des modèles avec des variables binaires ou dichotomiques, tels que la présence ou l’absence d’éclosion de feu, sont mieux décrites au moyen de la régression logistique. Pour notre cas d’étude, nous avons choisis la régression logistique binaire ou ‘’modèle logit’’ pour identifier l’influence d’un groupe de variables de prédiction (présumées explicatives) en rapport avec l’occurrence des feux de forêts dans la région de Chefchaouen-Ouazzane. En effet, elle se définit comme étant une technique permettant d’ajuster une surface de régression à des données, lorsque la variable dépendante est dichotomique ou binaire 0 ou 1 (absence de feu ou présence de feu) (Rakotomalala, 2009).

Approche de modélisation des éclosions des feux

Pour prédire la probabilité estimée d’éclosion des feux, Pi, d’une cellule i, dans la zone d’étude, nous avons développé un modèle en utilisant la régression logistique binaire. Pour la régression logistique, si nous considérons Pi la probabilité d’éclosion dans la cellule i, et Xj.i la valeur de la covariable j dans la cellule i, le modèle de régression logistique est:

Où βo est une constante et βn sont des coefficients de régression pour les variables explicatives humaines, climatiques et biophysiques, Xni. Nous avons 613 points d’éclosions de feu de forêt durant la période 2002-2015. Pour déterminer si les variables explicatives affectent les emplacements des dits points d’éclosions différemment de ce qui serait attendu suite à une distribution au hasard, nous avons également généré un échantillon aléatoire témoin, ‘’sans feu’’, de 2955 points de contrôle dans la zone d’étude de Chefchaouen-Ouazzane. Par conséquent, notre modèle prédit la probabilité d’occurrence des événements d’éclosions des feux de manière disproportionnée en fonction de plusieurs caractéristiques du terrain et par rapport aux 2955 emplacements témoins choisis aléatoirement au sein de la zone d’étude. En effet, et en référence aux travaux similaires de Syphard et al. (2008) et Brillinger et al. (2003), le choix des 2955 points de contrôle a été effectué pour tester suffisamment de sites, et ce en vue de capturer convenablement la variabilité dans les prédicteurs sur l’ensemble de l’espace de la zone d’étude, sans qu’il y est une baisse de façon significative des ratios de un à zéro. Le ratio du [1:5 ou 1:4] [Nombre d’incendies/points de contrôles] [613 feux : 2955 points de contrôle] que nous avons adopté est similaire à celui retenu par les auteurs précités.

En concordance également avec les travaux de Syphard et al. (2008), il est à préciser que les 3568 observations (613 feux et 2955 points de contrôle ‘’témoin’’) constituent un échantillon choisi aléatoirement à partir d’une population de 6,9 millions de points (1368 points de grille x 14 ans x 365 jours). Il est à rappeler que la génération et le traitement des données numériques et cartographies se sont effectués au niveau de chaque cellule de grille de 4 km². Les points ‘’avec feu’’ et ‘’sans feu’’ ont été codés dans un format binaire (0: pas de feu; 1: feu) représentant la variable dépendante.

En référence aux travaux de Martinez et al. en 2009, et avant le lancement de l’opération de modélisation, il a été procédé à la subdivision aléatoire des 3568 observations en deux bases de données. Un échantillon aléatoire de 2141 (60%) observations ont été utilisées pour la construction du modèle et le reste, constitué de 1427 observations (40%) ont été réservés pour la réalisation d’un test indépendant de la capacité du modèle à prédire les éclosions des feux de forêts dans la zone d’étude (test exogène de validation du modèle de prédiction) (Tableau 3).

Les 20 variables exogènes choisies et supposées être caractéristiques des conditions propices d’éclosions des feux de forêts dans la zone d’étude sont regroupés dans le tableau 2. L’analyse de régression logistique a été réalisée en utilisant le logiciel SPSS®, version 22.0.

Recherche exploratoire, diagnostic et validation du modèle

Nous avons commencé le traitement des données par une analyse statistique exploratoire univariée de la variable dépendante par rapport et ses principales variables explicatives. Puis l’étude de recherche s’est poursuivie par une analyse multivariée dont le but principal était de développer une explication causale du phénomène d’éclosions des feux de forêts dans la zone d’étude. A l’étape finale de l’analyse nous avons confronté les résultats exploratoires par l’inférence statistique (Pétry, 2003). Les principes de base suivis lors de cette analyse statistique exploratoire sont détaillés comme suit:

- Réalisation d’une analyse univariée pour explorer les données de la variable à prédire (éclosion des feux) en fonction de certaines variables explicatives pertinentes. Dans cette partie, les graphiques sont d’une importance capitale, non seulement, pour la présentation et la visualisation du phénomène d’éclosion, mais également pour la recherche de caractéristiques contextuelles et d’hypothèses d’explication novatrices.

- Intégration des données descripteurs possédant des indices de corrélation numériques fiables dans le processus de calcul de l’algorithme de prédiction du phénomène d’éclosion des feux.

- Une fois le modèle de prévision d’éclosion des feux a été obtenu, nous testons sa précision et sa fiabilité à travers l’application de méthodes dites ‘’d’évaluation externes’’ très connues dans la littérature des statistiques (Rakotomalala, 2009), à savoir:

a- la matrice de confusion;

b- le diagramme de fiabilité;

c- le test de Hosmer-Lemeshow;

d- la courbe de ROC-AUC (Area Under Curve ou

Aire Sous la Courbe).

- Puis en fin, réalisation d’un test de validation exogène par l’échantillon des 1427 observations choisi au hasard. Cet échantillon à part, dit échantillon test, n’ayant pas participé à la construction du modèle, est constitué de 245 points d’éclosion de feux réels et 1182 emplacements ‘’sans feu’’.

Bien que la régression logistique fournisse une bonne estimation des quantités, la réalisation de ces tests d’évaluation de l’efficacité du modèle, en confrontant les vrais valeurs observées de la variable dépendante avec les valeurs de prédictions, est d’une importance capitale, parce qu’ils garantissent une rigueur dans la méthodologie suivi et dans la robuste des résultats.

ANALYSE DES DONNÉES, RÉSULTATS ET DISCUSSIONS 

Analyse univariée

L’analyse univariée en régression logistique binaire des variables explicatives permet de déduire, à travers le tableau récapitulatif IV, les principaux éléments suivants:

Pour le type de combustible

Les types de combustible qui ont un effet sur les éclosions des feux sont à base de Pin Brutia avec litière et nécromasse (TC2), de Chêne liège de faible densité (TC3), de Matorral de lentisque, Erica, Cistes et du chêne Kermès (TC5), de Chêne-liège avec de l’Erica et du Cistes (TC6) et enfin de Pin Radiata et l’Erica (TC7). En revanche, les types de combustibles constitués de Chêne vert et de strate herbacée (TC1) et de Pin maritime avec de l’Erica et du Cistes (TC4) n’ont pas d’effet significatif sur les éclosions des feux. Le paramètre d’inflammabilité des types de combustibles n’a aucun effet significatif sur les éclosions des feux.

La relation est très significative (corrélation négative) entre le NDVI du mois d’avril et les éclosions des feux de forêts dans notre région d’étude. Plus le NDVI du mois d’avril est élevé (c’est-à-dire une végétation abondante), plus le risque d’éclosion, durant la période estivale qui suit, est bas. En d’autres termes, ce paramètre, qui est fonction de l’état de dessèchement de végétation et de la température de la surface du couvert forestier, pourra éventuellement renseigner sur le risque saisonnier d’éclosion des feux de forêts dans la région d’étude.

L’autre aspect qui sort de l’ordinaire est, le fait qu’il n’y a aucune relation entre les éclosions des feux et le NDVI de la végétation à la date de l’éclosion. On s’attendait à ce que plus le NDVI diminue (végétation sèche: pas de photosynthèse) plus le risque d’éclosion augmente.

Pour le climat

L’analyse en régression logistique binaire de la série de données correspondant aux variables relatives à la température maximale de la journée et au cumul des précipitations montre une corrélation positive de ces paramètres au facteur d’éclosion des feux de forêts. C’est-à-dire plus les valeurs de la température maximale de la journée et du cumul des pluies enregistrées durant l’année, augmentent, plus le risque de départs de feux augmente à son tour. En revanche, l’humidité relative de l’air, la vitesse du vent et les précipitations journalières sont négativement corrélés au risque d’éclosion du feu. Par ailleurs la direction du vent n’a aucun effet sur les départs de feu déclarés dans notre zone d’étude.

Pour la pression anthropique

Le traitement des données montre que les feux sont déclarés à proximité des routes et des pistes forestières. Plus on s’éloigne de ses infrastructures, tout en s’introduisant à l’intérieur des peuplements forestiers, plus les actes de mise à feux diminuent. Cependant, il est constaté l’inverse pour le cas des douars; plus on s’éloigne des douars plus la probabilité d’éclosion augmente. Il est également déduit que le nombre de la population et de ménages présents dans un rayon de 1 km du lieu de départ de l’incendie, sont négativement corrélés à la probabilité d’éclosion des feux. Cependant, il a été trouvé qu’il n’y pas d’impact statistiquement significatif, du nombre de la population et de ménages à 5 km sur le déclenchement des feux. Le paramètre de pression annuelle de mise à feu (PAMF), qui signifie le nombre de feu déclenché annuellement par la surface boisée (en ha) de la cellule de grille de 4 km², est positivement corrélé à la probabilité d’éclosion.

Pour les données topographiques

Le traitement des données relatives aux expositions et aux pentes a montré qu’il n’existe aucune corrélation significative entre ces deux paramètres et l’éclosion des feux de forêts dans la zone d’étude.

Analyse multivariée

Il est à rappeler que la variable binaire à prédire dans notre cas d’étude, est l’éclosion de l’incendie représenté par la valeur 1; tandis que la non éclosion de l’incendie (ou grille témoin) est identifiée par 0. L’importation des données (Tableau 2) et leur analyse et traitement en appliquant la méthode ascendante conditionnelle (Stepwise) de la régression logistique binaire (SPSS) a permis d’avoir les résultats présentés dans le tableau récapitulatif V ci-après.

Les variables significatives (Case Sig) incluses dans l’équation du modèle sont mentionnées dans la première colonne du tableau 5. Il est à noter que les rapports de cote, qui se situent dans la case Exp (β), correspondent au nombre de fois d’appartenance à un groupe lorsque la valeur du prédicteur augmente de 1. Plus précisément, un rapport de cote plus grand que 1 indique une augmentation des chances de faire partie du groupe ‘’avec incendie’’, tandis qu’un rapport de cote de moins de 1 diminue les probabilités d’appartenance à ce groupe.

L’équation du modèle de prévision du risque d’éclosion des incendies dans la région de Chefchaouen-Ouazzane (2002-2015), ainsi que les indices y correspondants sont les suivants:

z = -4,477 - 0,284 X1 + 0,025 X2 + 0,901 X3 + 0,096 X4 – 0,02 X5 – 0,467 X6 – 0,592 X7

La robustesse et la précision de ce modèle de prévision d’éclosion des feux seront testés à travers l’application de 5 protocoles dits ‘’d’évaluation externes’’ à savoir, la matrice de confusion, le diagramme de fiabilité, le test de Hosmer-Lemeshow, la courbe de ROC-AUC (Area Under Curve), puis enfin le test de validation exogène par l’échantillon aléatoire des 1427 observations constitué de 245 points d’éclosion de feux réels et 1182 emplacements ‘’sans feu’’.

La matrice de confusion

Le modèle logistique obtenu à partir de l’utilisation de la classification ascendante conditionnelle pas à pas (Stepwise), et qui semble le plus approprié, est constitué de 7 variables significatives (p-value<0,05). Le R² de Nagelkerke s’élève à 0,488 ; ce qui est jugé très satisfaisant compte tenu du caractère exploratoire de cette nouvelle étude sous les conditions marocaines. De même, cette étude a été confrontée à la difficulté de prédiction d’actes humains de mise à feu dans le domaine forestier, surtout qu’ils sont présumés volontaires. Ainsi le modèle explique 49% de la variance de la variable dépendante (Tableau 6).

Il est plus judicieux de construire ce que l’on appelle une matrice de confusion (en anglais error matrix). Elle confronte les valeurs observées de la variable dépendante avec celles qui sont prédites, puis comptabilise les bonnes et les mauvaises prédictions. Son intérêt est qu’elle permet à la fois d’appréhender la quantité de l’erreur (le taux d’erreur) et de rendre compte de la structure de l’erreur (la manière de se tromper du modèle).

Dans ce test à 2 classes (Échantillon ‘’sans incendie’’ vs. Échantillon ‘’avec incendie’’), à partir de la forme générique de la matrice de confusion (Tableau 6), plusieurs indicateurs peuvent être déduits pour rendre compte de la concordance entre les valeurs observées et les valeurs prédites. Nous nous concentrons sur les ratios suivants:

(a). sont les vraies valeurs ‘’sans incendies’’ (ou Témoin) c’est-à-dire, les observations ou les individus qui ont été classées ‘’sans incendie’’ et qui le sont réellement.

(c). sont les fausses valeurs ‘’sans incendie’’; c’est-à-dire, les individus classés ‘’sans incendie’’, mais qui sont en réalité des individus ‘’avec incendie’’.

(b). sont les fausses valeurs ‘’avec incendie’’; c’est-à-dire, les observations classées ‘’avec incendie’’, mais qui ne le sont pas en réalité.

(d). sont les vraies valeurs ‘’avec incendie’’, c’est-à-dire, les individus classés ‘’avec incendie’’ et qui le sont réellement.

Tableau 6: Table de classification du modèle

Prévisions

Incendie Pourcentage correct

0+ 1-

Incendie 0+ 1 705 (a) 68 (b) 96,2

1- 187 (c) 181 (d) 49,2

Pourcentage global 88,1

A partir du tableau 7, il ressort les principaux éléments suivants:

Le taux d’erreur est égal à 12%. Ce taux représente le nombre de mauvais classements rapporté à l’effectif total. Il estime la probabilité de mauvais classement du modèle. Le taux de succès de notre modèle est de 88%; c’est le complémentaire à 1 du taux d’erreur (c’est-à-dire que le modèle est vrai dans 88% des cas).

Le ratio correspondant à la sensibilité du modèle (ou le rappel, ou encore le taux de vrais positifs [TVP]), est de 96%, indique la capacité du modèle à retrouver les individus ‘’sans incendie’’. La superficie de la zone d’étude est relativement grande (229 000 ha) et c’est un succès de pouvoir détecter les localités où la probabilité d’éclosion d’incendies est quasiment nulle ou relativement très faible.

La précision de prédiction de notre modèle a été évaluée à deux niveaux:

Le 1er niveau concerne les individus sans incendies. En effet, la précision a atteint 90% et qui indique la proportion des vrais individus ‘’sans incendies’’ parmi les individus qui ont été classés ‘’sans incendie’’. Elle estime la probabilité d’un individu d’être réellement ‘’sans incendie’’ lorsque le modèle le classe comme tel; c’est ce qui est appelé communément dans la science de la régression logistique ‘’Valeur Prédictive Positive’’ (VPP).

Le 2ème niveau concerne les individus ‘’avec incendie’’ ou ce qu’on appelle la Valeur Prédictive Négative (VPN). La précision de classement de ce groupe d’individus a atteint 73%. Il représente la proposition des vrais individus ‘’avec incendie’’ parmi les individus qui ont été classés ‘’avec incendie’’.

Le ratio relatif à la spécificité du modèle de prédiction est de 49%. A l’inverse de la sensibilité, la spécificité indique la proportion des individus ‘’avec incendies’’ détectés.

Parfois dans les analyses statistiques, il est utilisé ce qu’on appelle le taux de faux positifs (TFP), qui pour notre cas a atteint un pourcentage de 51%. Il correspond à la proportion des individus ‘’avec incendies’’ classés, par erreur du modèle, parmi les ‘’sans incendies’’.

Tableau 7: Ratios de la matrice de confusion

Ratio Formule Résultat

Taux d’erreur = E (b+c)/n 12%

Taux de succès = θ (a+d)/n = 1 - E 88%

Sensibilité = TVP = Rappel = Se a/(a+b) 96%

Précision 1 = VPP a/(a+c) 90%

Précision 2 = VPN d/(b+d) 73%

Spécificité = Sp d/(c+d) 49%

Taux des Faux Positifs c/(c+d) 51%

Un «bon» modèle doit présenter des valeurs faibles de taux d’erreur et de taux de faux positifs (proche de 0 %); des valeurs élevées de sensibilité, précision et spécificité (proche de 100%). Le taux d’erreur est un indicateur symétrique, il donne la même importance aux faux positifs (c) et aux faux négatifs (b). La sensibilité et la précision sont asymétriques, ils accordent un rôle particulier aux positifs (Rakotomalala, 2011).

Cependant, selon Hosmer et Lemeshow (2000), la matrice de confusion présente un point faible ; en effet, elle repose essentiellement sur les prédictions y(ω), sans tenir compte des probabilités estimées P(ω). Se baser uniquement sur les prédictions (0 ou 1) est un peu réducteur. En effet, un individu avec P(ω)=0,499 sera désigné «négatif», un autre avec P(ω′)=0,501 sera désigné «positif». Pourtant, si l’on se réfère aux probabilités, ils sont finalement assez proches. La matrice de confusion ne nous rapporte pas ce type d’information (Hosmer and Lemeshow, 2000).

Diagramme de fiabilité (Reliability diagram)

Contrairement à certaines méthodes supervisées, la régression logistique produit une bonne approximation de la quantité Pi (Rakotomalala, 2011). Ainsi, il a été jugé utile de comparer les probabilités d’éclosions des feux estimées par notre modèle et celles observées dans le fichier de données renfermant notre échantillon d’analyse de 2141 individus ‘’sans incendie’’ et ‘’avec incendie’’. C’est pour cela que nous avons élaboré le diagramme de fiabilité (en anglais reliability diagram).

La construction du diagramme de fiabilité repose sur le classement des scores des probabilités d’éclosions du modèle par ordre croissant et leur subdivision en données d’intervalles (en dix classes pour notre cas): 0-0,1; 0,1-0,2; …; jusqu’à 0,9-1,0. Puis dans chaque intervalle (ou classe) on calcule la proportion des individus ‘’avec incendie’’ et la moyenne des scores des probabilités d’éclosions des feux (Pi). On pourra dire que notre modèle est de bonne qualité, s’il est prouvé la concordance et ou la similitude entre les chiffres de chaque intervalle (ou classe de Pi). L’information de cette concordance ou non peut être représentée dans un graphique nuage de points appelé diagramme de fiabilité, avec en abscisse la moyenne des scores Pi et en ordonnée la proportion des individus «avec incendie». Nous constatons, pour notre cas d’étude, que le modèle produit une bonne estimation des probabilités d’éclosions du fait que les points sont quasiment alignés sur une droite, la première bissectrice (Figure 5).

Test de Hosmer-Lemeshow

Le test de Hosmer-Lemeshow (Hosmer and Lemeshow, 2000) relève à peu près de la même logique que le diagramme de fiabilité. A la différence qu’au lieu de se baser simplement sur une impression visuelle, on extrait du tableau de calcul un indicateur statistique qui permet de quantifier la qualité des estimations des probabilités d’éclosions des feux (Pi).

En effet, il est procédé dans ce test au regroupement des probabilités prédites par le modèle en dix groupes (déciles). Pour chaque groupe, on observe l’écart entre les valeurs prédites et observées. L’importance de la distance entre ces valeurs est évaluée grâce une statistique du Khi-deux à 8 ddl qui teste l’adéquation du modèle:

Ho: Distance faible

H1: Distance élevée

Pour notre cas, les étapes de traitement dans le logiciel SPSS de nos données, sont comme suit:

- le classement par ordre croissant des probabilités d’éclosion données par notre modèle;

- la subdivision des données en G groupes en se basant sur les quantiles (ex. les quantiles d’ordre 4 correspondent aux quartiles, les quantiles d’ordre 10 aux déciles … etc.). Les auteurs proposent prioritairement les déciles (G=10) et c’est ce que fait par défaut le logiciel SPSS. Il semble par ailleurs plus judicieux d’utiliser ce seuillage en G groupes plutôt que les seuils sur les probabilités d’éclosions (Pi), comme cela a été fait pour le diagramme de fiabilité (ou bien pour le seuil de Mann Whitney dans le chapitre qui suit). L’approximation de la loi de distribution de la statistique du test sous H0 est de meilleure qualité (Hosmer and Lemeshow, 2000).

- Puis dans chaque groupe ‘’G’’ (pour notre cas 10), d’effectif ‘’EG’’ (pour notre cas 302), nous calculons plusieurs rapports (Tableau 8), à savoir:

. le nombre des individus ‘’avec incendie (1)’’ observés;

. le nombre des individus ‘’sans incendie (0)’’ observés;

. la somme des scores des observations situées dans le groupe G. On la désigne comme la fréquence théorique des individus ‘’avec incendie (1)’’ dans le groupe G;

. la moyenne des scores des probabilités d’éclosions observés dans le groupe G;

. la fréquence théorique des individus ‘’sans incendie (0)’’.

En effet, il est procédé dans ce test au regroupement des probabilités prédites par le modèle en dix groupes (déciles). Pour chaque groupe, on observe l’écart entre les valeurs prédites et observées. L’importance de la distance entre ces valeurs est évaluée grâce une statistique du Khi-deux à 8 ddl qui teste l’adéquation du modèle: Ho: distance faible ou bien H1: Distance élevée

- Ensuite, il est calculé la statistique de Hosmer-Lemeshow (=8,395) qui suit approximativement une loi du khi2 à G−2 (=8) degrés de liberté. Pour notre cas d’étude, la probabilité critique du test (p-value = 0,396) est plus grand que le risque usuel que nous avons choisi et qui est de 0,05. Ainsi, nous pouvons conclure que notre modèle issu de la régression logistique est accepté; c’est-à-dire qu’il est compatible avec les données (Tableau 9 et Figure 6).

Tableau 9: Test de Hosmer et Lemeshow

Pas Khi-deux ddl Sig.

7 8,395 8 0,396

Courbe de ROC-AUC (Receiver Operating Characteristic-Area Under Curve)

La courbe ROC est une représentation graphique de la relation qu’il existe entre la sensibilité et la spécificité d’un test pour chaque valeur seuil considérée. L’inverse de la spécificité (1-Sp) se place en abscisse tandis que la sensibilité se trouve en ordonnée de ce graphique. La difficulté relative à un test de diagnostique réside dans la valeur du seuil limite qui va décider si le test est déclaré positif ou négatif. Il y a lieu d’indiquer qu’il est associé à la courbe de ROC, un indicateur synthétique aisément interprétable, appelé le critère AUC (Aire Sous la Courbe).

Pour notre cas d’étude, si on place le seuil trop bas, on va pouvoir déterminer beaucoup de points de grille de l’espace forestier ‘’avec feu’’, la sensibilité du test sera élevée, pourtant la spécificité du test sera très mauvaise car un grand nombre de points de grille seront des ‘’Faux Positifs’’ et on risque de les inclure à tort dans l’espace à surveiller de près. A l’inverse, un seuil trop élevé offrira au test une bonne spécificité (peu de point de grille de l’espace forestier ‘’sans feu’’ risqueront d’être affectés comme points ‘’avec feu’’), mais une mauvaise sensibilité car il laissera ‘’échapper’’ un grand nombre de points de grille ‘’avec feu’’ qui n’entreront donc pas parmi les points de grille à surveiller, du fait qu’ils connaîtront une grande pression de mise à feu.

En effet, pour notre cas d’étude, la meilleure valeur seuil d’un test de diagnostique (celle qui rend le test le plus efficace) est celle qui maximise en même temps la sensibilité et la spécificité du test, c’est à dire qui détectera un maximum de point de grille à fort risque d’éclosion d’incendie et écartera un maximum de points à faible risque de mise à feu. Le traitement de nos données a permis de conclure que notre modèle est performant du fait que l’AUC est significativement différente de 0,5. En effet, la p-value calculée (Tableau X) est inférieure au niveau de signification alpha = 0,05; on doit rejeter l’hypothèse nulle Ho, et retenir l’hypothèse alternative, Ha (l’AUC est significativement différente de 0,5). Le risque de rejeter l’hypothèse alternative Ho, alors qu’elle vraie, est inférieur à 0,01%.

La valeur de l’AUC obtenue à partir des TFP et TVP est de 0,897 (Tableau 11). En utilisant notre modèle, nous avons 89,7% de chances de placer un vrai individu ‘’avec incendie’’ devant un individu ‘’sans incendie’’, à comparer avec les 50% de la situation de référence. Ce résultat nous permet de déduire que notre modèle nous confère un pallier de discrimination du niveau ‘’excellent’’ (Tableau 11). On pouvait d’ailleurs facilement le deviner en observant le graphique (Figure 7).

Tableau 10: Zone sous la courbe

Zone Erreur standard Sig. asymptotique Intervalle de confiance asymptotique à 95 %

Inférieure Supérieure

0,897 0,008 0,000 0,881 0,914

Tableau 11: Zone sous la courbe (Hosmer and Lemeshow, 2000)

Valeur de l’AUC Commentaire

AUC = 0,5 Pas de discrimination

0,7 < AUC < 0,8 Discrimination acceptable

0,8 < AUC < 0,9 Discrimination excellente

AUC > 0,9 Discrimination exceptionnelle

Figure 7: Courbe de ROC/AUC du modèle logistique

Validation exogène du modèle par un échantillon aléatoire test

La validation exogène du modèle a été effectuée par le recours à l’échantillon test des 1427 observations choisies au hasard (40% de l’échantillon global). Cet échantillon est constitué de 245 points d’éclosion de feux réels et de 1182 emplacements ‘’sans feu’’.

En effet, l’application du modèle de prévision du risque d’éclosion des incendies à nos données de test, permet de constater que le taux de succès de classement des observations est de 86,89% (Tableau 12). Le ratio relatif à la ‘’spécificité du modèle’’ de prédiction a augmenté d’un point (en pour-cent) en passant d’un pourcentage de 49% à presque 50%; en d’autres termes, il nous a été possible de détecter 122 incendies sur les 245 réellement déclarés (50%). De même, il est discriminé les individus ‘’sans incendie’’ (emplacement avec un risque d’éclosion faible) avec un taux de précision de 94,58% appelé ‘’ratio de sensibilité du modèle’’ (Cf au chapitre 2.2.1 relatif à la Matrice de confusion).

Tableau 12: Table de classification du modèle relative aux données de validation

Prévisions

Incendie Pourcentage correct

0+ 1-

Incendie 0+ 1118 (a) 64 (b) 94,58

1- 123 (c) 122 (d) 49,79

Pourcentage global 86,89

Carte de probabilité d’éclosion des feux de forêts issue du modèle logistique

La carte de probabilité d’éclosion issue du modèle de régression logistique est présentée dans la figure 8.

Il est remarqué à travers le tableau 13 que 88% de la superficie de la zone d’étude possède une probabilité d’éclosion des feux très faible à modérée. Seulement 12% du territoire possède une probabilité d’éclosion moyenne à très forte. Par mesure de sécurité et afin de couvrir convenablement le risque d’éclosion dans la zone d’étude, il pourrait être préconisé aux unités d’opérations (aménagiste des forêts…) d’adopter toute la fourchette de risque [0,2-1], c’est-à-dire du niveau modéré à très fort (soit 61830 ha de la zone concernée; 27%), pour implémenter dans les sites sensibles les ouvrages de coupes feux et les infrastructures et équipements de surveillance, d’alerte et de premières interventions.

Tableau 13: Répartition des superficies forestière de la zone d’étude en fonction des niveaux de risque d’éclosion (Modèle de régression logistique)

Classe_Pro-Eclo-Logistic Sup. (ha) Sup. (ha) %

0 - 0,2: Très faible 168 087 73%

0,2 - 0,4: Modérée 34 496 15%

0,4 - 0,6: Moyenne 12 329 5%

0,06 - 0,8: Forte 11 122 5%

0,8 – 1: Très forte 2 966 2%

Total 229 000 100%

CONCLUSION ET PERSPECTIVES 

L’analyse en régression logistique binaire de nos données a fourni des indications pertinentes pour appréhender les facteurs biophysiques, climatiques et humains affectant les processus d’éclosion des feux dans notre zone d’étude. Le modèle logistique classe correctement 88,1% de l’échantillon d’étalonnage du modèle (2141 observations) et de 86,9% des cas de validation (test de validation avec 1427 observations). Il est à préciser que la classification du modèle a été réalisée en utilisant le point médian (0,5 valeur) de la fonction logistique, qui est habituellement appliqué dans la plupart des analyses. Un niveau de probabilité différent (point médiane) pourrait être utilisé (Jamnick et Beckett, 1988) pour améliorer la discrimination de risque, qui, lui-même, est fonction des objectifs de gestion et des décisions de financement relatives à la prévention des feux de forêts dans une zone donnée.

Les variables explicatives incluses dans le modèle et qui affectent les processus d’éclosion des feux dans la zone d’étude, font état de l’impact des facteurs:

- Anthropiques, représentés par les voies d’accès (notamment les pistes forestières) et les lieux de grande pression annuelle de mise à feu (lieux où les actes de mise à feu sont récurrents);

- Topo-climatiques, à travers notamment la température maximale journalière (T°max), l’humidité relative de l’air (%H) et les pentes;

- Biologiques, à savoir la typologie de combustible, principalement le TC3 à base de chêne-liège de faible densité, et le TC5 constitué par le Matorral, du Lentique, de l’Erica, du Cistus et du Kermès.

Ces résultats d’étude des liens de causalités concordent avec ceux trouvés par plusieurs auteurs dont principalement, Vazquez et Moreno (1998), Syphard et al. (2008) et Martinez et al. (2009).

Près de 93% des incendies déclarés sur la période 2002-2015 ont des causes inconnues (HCEFLCD, 2015). Si on avait une bonne connaissance des causes de mise à feu, il aurait été possible de reporter sur une carte les éléments liés à l’activité humaine, qui sont le plus souvent à l’origine des incendies (routes, pistes, carrières, travaux agricoles, lieux de campement…), en fonction de leur contribution au risque d’éclosion des feux de forêts (Colin et al., 2001). La pression anthropique d’un territoire est la synthèse des pressions qu’il renferme. A travers ces pressions, ce sont les pratiques sociales qui sont observées (Mangiavillano, 2010). Ce travail, conduit dans la région de Chefchaouen-Ouazzane, pourrait donc être complété par une analyse statistique de corrélation entre les lieux des points d’éclosion et les facteurs anthropiques potentiellement susceptibles d’être à l’origine des feux, en l’occurrence, l’empreinte sociale …; sans pour autant omettre que la connaissance exacte de la cause d’un incendie demeure difficile et rare, et dans l’immense majorité des cas, reste juste une supposition.

En effet, il faut tenir compte que l’approche des risques d’éclosions doit être étudiée en lien avec les sciences sociales. Il faut privilégier l’analyse d’éclosion des feux basée sur l’organisation de l’espace et qui se démarque totalement des approches traditionnelles basées sur la connaissance utopique des causes des feux. Le lieu d’éclosion est particulier parce qu’il rassemble des susceptibilités qui se combinent et qui répondent à une pression sociale sur un environnement particulier (Mangiavillano, 2010).

D’autres aspects pourraient être abordés pour affiner cette carte de risque d’éclosion et notamment ceux se rapportant à la prise en compte des moyens de défense (tels que le temps d’accès pour la première intervention, la difficulté de lutte, la densité de points de réapprovisionnement en eau, le cloisonnement des massifs forestiers par les coupures de combustible,…), et également des enjeux forestiers (tels que les peuplements remarquables, les peuplements porte graines, les terrains sensibles à l’érosion,…) (Assali et al., 2016).

Pour améliorer l’appréhension des expositions sèches et ventées à travers la carte du topo-climat, il serait aussi pertinent d’améliorer sa précision en utilisant un modèle de simulation de vent sur le relief, au lieu des données ponctuelles extrapolées par la méthode DIP. Le facteur du topoclimat devrait être renforcé par une analyse multicritère -en essayant d’intégrer d’autres paramètres comme la température, l’humidité de l’air, la réserve en eau du sol ou l’évapotranspiration (Carrega, 1988).

La carte du risque d’éclosion de feu de forêt aura un intérêt capital pour les aménageurs et pour les services de lutte, du fait qu’elle va leur permettre de mieux négocier la priorisation d’implémentation dans les peuplements forestiers concernés, des postes de surveillance, des lieux de pré-positionnements des véhicules d’interventions, des itinéraires de patrouille, des pistes d’accès ou des points d’eau (Assali et al., 2016).

Aussi, il est évident que l’approche ‘’logistique’’ a montré sa pertinence pour le suivi statique et dynamique du risque d’éclosion d’incendie, cependant certaines améliorations de ces méthodes sur le plan technique existent et nécessitent une attention particulière. Si l’on considère la prédiction du risque d’éclosion d’incendie comme un problème d’apprentissage automatique (Machine learning), il est à noter que certaines nouvelles approches (comme les Techniques d’ensemble ou Ensemble Learning) sont à explorer pour une meilleure prédiction et qui peuvent répondre à certaines limites posées par la méthode la régression logistique binaire (Friedman, 2001).

RÉFÉRENCES BIBLIOGRAPHIQUES

Alexandrian D. (2007). Élaboration des cartes de risques aux incendies de forêts du Nord du Maroc. Appui à la mise en œuvre du programme forestier national. Projet UTF/MOR, FAO-Rabat, Maroc.

Amatulli G, Pérez-Cabello F, de la Riva J (2007). Mapping lightning/human-caused wildfire occurrence under ignition point location uncertainty. Ecological Modelling 200: 321-333.

Anderson HE (1982). Aids to determining fuel models for estimating fire behavior. USDA Forest Service, Intermountain Research Station, General Technical Report INT-167. (Ogden, UT).

Andrews P (1986). Behave: Fire behavior prediction and fuel modelling system-burn subsystem, part 1. U.S. Forest Service, General Technical Report INT-194.

Andrews P, Bevins C, SELI R (2003). Behave Plus fire modelling system. Version 2.0. Systems for Environmental Management, PO Box 8868, Missoula, MT 59807 (www.fire.org).

Andrews PL, Bevins CD, Seli RC (2005). Behave Plus Fire Modeling System, version 3.0: user’s guide. USDA Forest Service, Rocky Mountain Research Station, General Technical Report RMRS-GTR-106WWW Revised. (Ogden, UT).

Anonyme (2004). Recensement Général de la Population et de l’Habitat (RGPH). Haut-Commissariat aux Plan.

Assali F, Mharzi Alaoui H, Rouchdi M, Badraoui M (2016). Modélisation et cartographie du risque d’éclosion d’incendie de forêt dans le nord-ouest du Maroc (Région de Chefchaouen-Ouazzane). Revue d’Écologie (Terre et Vie) 71: 111-128.

Benabid A. (2007). Description de la composition et de la structure des types de combustibles. Appui à la mise en œuvre du programme forestier national. Élaboration des cartes de risques aux incendies de forêts du Nord du Maroc. Projet UTF/MOR, FAO-Rabat, Maroc.

Bovia G, Camia A (2000) Computation of meteorological fire danger indices for Southern Europe. Contract N. 145261998-11 SF1P1 ISP IT, Final Report.

Brillinger DR, Preisler HK, Benoit JW (2003). Risk assessment: a forest fire example. In ‘Science and Statistics: a Festschrift forTerry Speed’. (Ed. DR Goldstein) pp. 177–196. (Institute of Mathematical Statistics: Beachwood, OH).

Brosofske K.D, Cleland D.T, Saunders S.C (2007). Factors influencing Modern Wildfire Occurrence in the Mark Twain, National Forest, Missouri. South J. Appl. For. 31:73-84.

Canadian Forestry Service (1987). Tables for the Canadian Forest Fire Weather Index System. Environ. Can., Can. For. Serv., For. Tech. Rep. 25 (4th ed.), 48 p.

Carrega P (1988). Une formule améliorée pour l’estimation des risques d’incendie de forêt dans les Alpes Maritimes. Revue D’Analyse Spatiale, quantitative appliquée, Nice, n°24, Laboratoire de Géographie. Université de Nice.

Chuvieco E, Allgöwer B, Salas FJ (2003). Integration of physical and human factors in fire danger assessment. In: “Wildland Fire Danger Estimation and Mapping - the Role of Remote Sensing Data” (Chuvieco E ed). World Scientific Publishing, Singapore, pp. 197-218.

Chuvieco E, Salas, FJ, Carvacho L, Rodriguez- Silva F (1999). Integrated fire risk mapping. In: “Remote Sensing of Large Wildfires in the European Mediterranean” (Chuvieco E ed). Springer-Verlag, Berlin, pp. 61–84.

Colin P, Jappiot M, Mariel A (2001). Protection des forêts contre l’incendie; Fiches techniques pour les pays méditerranéen. CEMAGREF (département de gestion des territoires, Groupe d’Aix en Provence) Cahier FAO conservation 36. Rome. Italy.

Countryman C.M (1972). The fire environment concept. USDA Forest Service, Pacific Southwest Forest and Range Experiment Station, General Technical Report PSW-7, (Berkeley, CA).

Crutzen P.J, Goldammer J.G (1993). Fire in the environment: The ecological, atmospheric, and Climatic importance of vegetation fires. John Wiley & Sons, West Sussex, United Kingdom.

Dickson B.G, Prather J.W, XU Y, Hampton H.M, Aumack E.N, Sisk T.D (2006), Mapping the probability of large fire occurrence in northern Arizona, USA. Landscape Ecology 21:747–761.

DMN -Direction de la Météorologie Nationale (2015). Interpolation du modèle de prévision météorologique Al-Bachir. Rapport Interne, Direction de la Météo-rologie Nationale, Casablanca.

FAO (2006). Global Forest Resources Assessment 2006. Progress towards sustainable forest management. FAO Forestry Paper n°.147. Rome.

Faour G, Bou Kheir R, Verdeil E (2006). Caractérisation sous système d’information géographique des incendies de forêts: l’exemple du Liban. Forêt méditerranéenne T. XXVII, 4: 339- 352.

Finney M (1998). FARSITE users guide and technical documentation. USDA Forest Service General, Technical Report RMRS-RP-4, 88p.

Forestry Canada Fire Danger Group (1992). Development and structure of the Canadian Forest Fire Behavior Prediction System. ST-X-3, Canadian Forest Service, Ottawa, Ontario, Information Report ST-X-3, 63 p.

Franklin J (1998). Predicting the distribution of shrub species in Southern California from climate and terrain-derived variables. Journal of Vegetation Science 9:733–748.

HCEFLCD (2010). Rapport interne sur la monographie de la région de Chefchaouen, Direction Provinciale des Eaux et Forêts de Chefchaouen, Haut-Commissariat aux Eaux et Forêts et à la Lutte contre la Désertification, Rabat-Chellah, Maroc.

HCEFLCD (2015). Rapports annuel d’incendies de forêts et bases de données du Service de la Protection des Forêts, Bilan interne, Haut-Commissariat aux Eaux et Forêts et à la Lutte contre la Désertification, Rabat-Chellah, Maroc, 2015.

Hosmer D.W, Lemeshow S (2000). Applied Logistic Regression, Second Edition, Wiley, 2000.

Illera P, Fernandez A, Calle A, Casanova,J.L (1996). Temporal evolution of the NDVI as an indicator of forest fire danger. International Journal of Remote Sensing 17:1093-1105.

Jamnick M.S, Beckett D.R (1988). A logit anal sis of private woodlot owner’s harvesting decisions in New Brunswick. Canadian Journal of Forest Research 18:330–336.

Jappiot M, Blanchi R, Alexandrian D (2003. Cartographie du risque d’incendie de forêt: besoins, méthodes et données. Essai de normalisation. Forêt Méditerranéenne, n°4 sur ‘Les travaux du GIS Incendies de Forêt’, 427-434.

Keeley JE, Fotheringham CJ (2003). Impact of past, present, and future fire regimes on North American Mediterranean shrublands. In ‘Fire and Climatic Change in Temperate Ecosystems of the Western Americas’. (Eds TTVeblen, WLBaker, GMontenegro, TWSwetnam)pp.218–262. (Springer-Verlag: NewYork).

Loftsgaarden D, Andrews PL (1992). Constructing and testing logistic regression models for binary data: applications to the National Fire Danger Rating System. General Technical Report 286, USDA Forest Service, Ogden, UT, USA.

Mangiavillano A (2010). L’éclosion du feu de forêt: comprendre et spatialiser l’aspect humain de l’aléa. Rapport Interne, Centre d’Essais et de Recherche de l’Entente, Sécurité Civile, Valabre, Gardanne.

Mangiavillano A (2008). Multi-scalarité du phénomène feu de forêt en régions méditerranéennes française de 1997-2006. Document d’une thèse de Doctorat. Université d’Avignon et des Pays de Vaucluse (Spécialité Géographie). École Doctorale 379, 484 pages.

Martell DL, Otukol S, Stocks BJ (1987). A logistic model for predicting daily people-caused fire occurrence in Ontario. Canadian Journal of Forestry Research 17: 394-401.

Martinez J, Vega-Garcia C, Chuvieco E (2009). Human-caused wildfire risk rating for prevention planning in Spain. Journal of Environmental Management 90: 1241-1252.

MATE. Ministère de l’Aménagement du territoire et de l’Environnement, ministère de l’Équipement, du Logement et des transports, 2002, Plans de prévention des risques naturels (PPR) – risques d’inondation: guide méthodologique, La Documentation française, Paris, 2002 – ISBN 2-11-005035-7.

Pétry F (2003). Guide pratique d’introduction à la régression en sciences sociales. Les presses de l’Université Laval. Canada. ISBN: 978-2-7637-8622-9. https://books.google.fr/

Pew KL, Larsen CPS (2001). GIS analysis of spatial and temporal patterns of human-caused wildfires in the temperate rainforest of Vancouver Island, Canada. Forest Ecology and Management 140:1–18.

Prosper-Laget V, Douguedroit A, Guinot J.-P (1993). Mapping the risk of forest fire departure using NOAA satellite information. International workshop “Satellite technology and GIS for Mediterranean forest mapping and fire management”, 4-6 nov. 1993, Thessalonique, Grèce.

Pyne S.J, Andrews PL, Laven RD (1996). ‘Introduction to Wildland Fire.’(Wiley: NewYork).

Rakotomalala Ricco, 2011. Pratique de la Régression Logistique - Régression Logistique Binaire et Polytomique (Version 2.0).

Rouse JW, Haas RH, Schell JA, Deering DW, Harlan JC (1974). Monitoring the vernal advancement of retrogradation of natural vegetation. NASA/GSFC Type III, Final Report, Green belt, États Unis, 371 p.

Sande Silva J, Rego F, Fernades P, Rigolot E (2010). Towards Integrated Fire Management –Outcomes of the European Project Fire Paradox. European Forest Institute Research Report 23, 2010, Torikatu Joensuu, Finland.

San-Miguel-Ayanz J, Annoni A, Schmuck G (2002). Towards a coherent forest fire information system in Europe: The European Forest Fire Information System (EFFIS). In Viegas X. (ed.). Forest Fire Research and Wildland Fire safety. Millpress, Rotterdam, ISBN 90-77017-72-0.

Stephens SL, ‎2005. Forest fire causes and extent on United States Forest Service lands. International Journal of Wildland Fire 14:213–222.

Syphard AD, Radeloff VC, Keuler NS, Taylor RS, Hawbaker TJ, Stewart SI, Clayton MK (2008). Predecting spatial patterns of fire on a southern California landscape. International Journal of Wildland Fire 17:602-613.

Van Wagner C.E (1987). Development and structure of the Canadian Forest Fire Weather Index System. Canadian Forestry Service, Ottawa, Ontario, Forestry Technical Report 35, 37p.

Vasconcelos M.J.P, Silva S, Tome M, Alvim M, Cardoso-Pereira J.M (2001). Spatial prediction of fire ignition probabilities: comparing logistic regression and neural networks. Photogrammetric Engineering and Remote sensing 67:73-81.

Vaszquez A, Moreno J.M (1998). Patterns of lightning and people-caused fires in Peninsular Spain. International Journal of Wildland Fire 8:103–115.

Vega-Garcia C, Woodard T, Adamowicz WL, Lee B (1995). A logit model for predicting the daily occurrence of human caused forest fires. International Journal of Wildland Fire 5:101-111.

Wells ML, O’Leary JF, Franklin J, Michaelson J, McKinsey DE (2004). Variations in a regional fire regime related to vegetation type in San Diego County, California (USA). Landscape Ecology 19:139–152.

Whelan RJ (1995). ‘The Ecology of Fire.’ (Cambridge University Press: Cambridge, UK).

Zhang ZX, Zhang HY, Zhou DW (2010). Using GIS spatial analysis and logistic regression to predict the probabilities of human-caused grassland fires. Journal of Arid Environments 74: 386-393.