Document de travail n°821 : Enrichissement de l’Enquête Mensuelle de Conjoncture de la Banque de France : enseignements de l’analyse textuelle des commentaires des chefs d’entreprise

Dans le cadre de l’enquête mensuelle de conjoncture de la Banque de France, ce document tire les principaux enseignements de l’analyse textuelle des commentaires des chefs d’entreprise. Tout d’abord, la richesse de ces données est illustrée via un indice de sentiment élémentaire et l’identification des principaux mouvements sociaux depuis 2009 par listes de mots-clés. L’article présente ensuite deux applications statistiques dont la reproductibilité est discutée. La première, appliquée aux gilets jaunes de 2018 et aux grèves de 2019, a pour objectif d’estimer l’impact sur le PIB d’un évènement dont l’effet est sans équivoque. La seconde, adossée à l’étude du Brexit, vise à caractériser à partir d’un modèle d’apprentissage supervisé et de word vectors les effets d’un évènement complexe avec des incidences multiples.

graphique représentant les mentions des mouvements sociaux dans les commentaires l'enquête mensuelle de conjoncture en fonction des années

Réalisée par entretien téléphonique semi-dirigé, la collecte de l’enquête mensuelle de conjoncture est retranscrite à la fois sous forme d’échelles d’opinion et d’un résumé synthétique reprenant sous forme textuelle le contenu des informations communiquées lors de l’entretien. Ces commentaires permettent de préciser les réponses par des éléments de contexte utiles à l’analyse conjoncturelle (données chiffrées, informations factuelles sur l’actualité de l’entreprise et sur ses marchés). Ce document de travail fait le point sur les principaux résultats obtenus via l’exploitation de ces données textuelles complémentaires, depuis le développement de cet axe d’analyse en septembre 2018. Un corpus de plus de 500 000 documents a ainsi été constitué, correspondant aux déclarations des entreprises aux enquêtes industrie, services marchands et bâtiment, recueillies entre 2009 et 2021.

La richesse et le contenu informationnel de ces données est en premier lieu illustré grâce à la construction d’un indice textuel de sentiment (IS). Construit sur la base d’un dictionnaire de mots polarisés (positifs, neutres, négatifs), l’IS présente des corrélations avec l’indice du climat des affaires (ICA) comprises entre 0,6 et 0,9 selon les enquêtes et le mode de calcul. Ce résultat dénote une capacité forte des données textuelles à recomposer les informations quantitatives des soldes d’opinion, et suggère une utilité possible de l’IS pour le nowcasting du PIB. Ensuite, l’article présente une méthode d’identification par mots-clés permettant de retracer les occurrences dans les commentaires de certaines thématiques au cours du temps. Sa pertinence est démontrée dans le cadre de l’étude des différents mouvements sociaux qui ont émaillé les dix dernières années (voir graphique), et dont la méthode permet de comparer l’ampleur relative dans les préoccupations des entreprises interrogées.

Un tel comptage peut dans un deuxième temps être dérivé en un calcul économétrique permettant d’en estimer l’impact sur le PIB. À titre d’illustration, 20% des entreprises auraient ainsi vu leur activité perturbée par le mouvement des gilets jaunes en novembre et décembre 2018, conduisant à une perte estimée à -0,15 points de PIB au T4 2018. Cette méthode d’évaluation peut être aisément mobilisée pour toute autre application se ramenant à l’étude de deux groupes d’entreprises, affectées et non affectées par un évènement.

Un cas plus complexe ne correspondant pas à cette partition dichotomique est développé dans la dernière partie de l’article et mis en application pour apprécier les effets du Brexit. À partir de la restriction du corpus aux documents évoquant le Brexit, nous identifions 6 catégories de réactions non exclusives des entreprises. Après labellisation et projection des documents dans un espace de plongement lexical de type word2vec, un modèle logit-lasso est entrainé. Les prévisions de ce dernier permettent de retracer de manière quantifiée la chronologie et la nature des préoccupations des entreprises françaises vis-à-vis du Brexit depuis 2016. Cette analyse met notamment en évidence un premier pic des préoccupations immédiatement après le référendum à l’été 2016, caractérisé par des effets monétaires liés à la dépréciation de la livre. Par la suite, deux autres pics dans les préoccupations, au printemps et à l’automne 2019, correspondent aux dates butoirs successivement repoussées pour la sortie du Royaume-Uni de l’Union Européenne : par crainte d’une fermeture des frontières, ces périodes sont caractérisées par un niveau élevé d’incertitude et par des ajustements d’offre et de demande des deux côtés de la Manche. Avec un travail d’adaptation de la typologie et de la labellisation, cette méthodologie a vocation à être reproduite pour l’analyse d’un évènement futur où la nature de l’impact est multiple et où il y a un besoin de suivre l’évolution et la magnitude des effets au cours du temps.

Télécharger la version PDF du document

publication
Document de travail n°821 : Enrichissement de l’Enquête Mensuelle de Conjoncture de la Banque de France : enseignements de l’analyse textuelle des commentaires des chefs d’entreprise
  • Publié le 02/07/2021
  • 59 page(s)
  • FR
  • PDF (2.55 Mo)
Télécharger (FR)

Mis à jour le : 02/07/2021 14:07