La méthode statistique

Qu’est-ce que se cache derrière l’analyse statistique ?

Le schéma de dégustation que j’utilise décrit l’impression sensorielle de chaque vin avec des valeurs exprimées en chiffres. Le vin sent-il fortement le bois, ou plutôt les herbes, ou le fruit domine-t-il ? Et pour le fruit : dans quelle mesure présente-t-il des composants végétaux, des arômes de fruits frais ou de surmaturité ?

Cette tentative de créer une image quantitative précise de chaque vin pourrait sembler une ambition démesurée, étant donné l’état notoirement instable des échantillons durant la semaine des Primeurs. Mais c’est précisément là que la méthode statistique intervient : dans une première étape, avant de commencer les analyses proprement dites, elle élimine toutes les informations pour lesquelles il n’existe aucune corrélation, aucun lien avec d’autres caractéristiques. Ce que la méthode statistique présente, c’est une réduction des données à un maximum de corrélations significatives. En d’autres termes, à la fin du processus d’analyse, seules les caractéristiques qui déterminent la structure du vin à long terme sont conservées.

Faut-il comprendre les statistiques pour lire les résultats de la dégustation ?

Heureusement, non ! L’avantage de l’analyse statistique est que ses résultats peuvent être retraduits dans le langage courant. Voici un exemple tiré des analyses sur les primeurs 2018 de Bordeaux :

GROUPE 1: les «agréablement amples»

Description : Avec près d’un tiers des échantillons, ce type est le plus répandu du millésime 2018. La fraîcheur et la finesse ne sont pas les caractéristiques les plus remarquables des vins du groupe 1 ; leurs acidités sont très discrètes, mais en même temps, ils ne sont que peu touchés par les effets sensoriels du stress hydrique. Leur teneur en alcool se situe dans la moyenne, tandis que l’expression de la souplesse enrobée est légèrement supérieure à la moyenne du millésime.

Interprétation : On pourrait dire que ces producteurs de vins ont réussi à contenir les effets négatifs du millésime, mais qu’ils ont également laissé le millésime s’exprimer. Si l’on regarde vers le «centre du cluster» – comme disent les statisticiens – c’est-à-dire vers les vins qui représentent le plus précisément le type d’un point de vue arithmétique – il s’agit de la classe moyenne solide, principalement de la rive droite ou des Graves. Les descriptions typiques sont «a un bon équilibre dans son ample volume» (Clos des Jacobins), «une densité moyenne, des tanins un peu secs, mais aussi un peu de sève» (de Sales), «de la fermeté intérieure malgré l’extérieur souple, une bonne longueur homogène» (Clos Marsalette). Les vins les mieux notés du groupe mettent l’accent sur la densité et la puissance : «encore plus de générosité, encore plus de tanins, et une structure pour l’éternité, l’alcool n’est pas un problème, l’acidité est discrète, mais les tanins sont tout de même juteux» (Haut Bailly), «une teneur en tanins à couper le souffle, qui disparaît presque complètement dans le fond moelleux» (Trotanoy). Enfin, il est intéressant de noter que le Médoc est sous-représenté dans ce groupe en termes de nombre de vins, mais qu’il est bien représenté dans les meilleurs vins.

La description et l’évaluation d’un vin ressemblent à ceci :

Lilian Ladouys 91-93

Type 1 (agréablement ample) ∂ 0,37

Le château a considérablement augmenté sa superficie : Grâce à l’acquisition de parcelles appartenant auparavant aux châteaux Tour de Pez et Clauzet, le vignoble s’étend désormais sur 80,5 hectares. Les parcelles nouvellement acquises sont principalement situées sur des graves, ce qui explique que la proportion de cabernet y ait fait un grand bond en avant et dépasse désormais celle du merlot. Vendanges du 29 septembre au 13 octobre. 59 % de cabernet sauvignon, 37 % de merlot, 4 % de petit verdot, pH 3,82, alcool 14,41 % en volume. Fruits macérés, griotte, tabac, fraise des bois. Des herbes aromatiques. En bouche, un peu de fougue en arrière-plan, avec une impression tannique granuleuse, mais sans astringence. Une acidité discrète, un bon extrait et également un accompagnement fruité très convenable (cependant avec des arômes légèrement cuits en finale). Bonne densité et longueur homogène. Charnu, ferme, non desséchant.

Les détails des analyses factorielles et des analyses des groupes stylistiques

La typologie utilisée par «Weinverstand» pour la dégustation des vins en primeur est basée sur les méthodes d’«analyse factorielle» et d’«analyse de clusters». Les «clusters», c’est-à-dire les groupes de vins de style similaire, sont décrits et interprétés en détail, et tous les vins sont classés dans l’un des groupes qui ont pu être formés en tant qu’unité cohérente dans l’analyse statistique.

Pour parvenir aux groupes, les données sensorielles brutes sont d’abord collectées : Je note donc, lors de la dégustation de chaque vin, une pondération quantitative de l’impression laissée par les différentes caractéristiques sensorielles, comme la quantité de tanins : un zéro correspondrait à un vin qui ne déclenche aucune perception de tanin en bouche, un 100 à un jus dont l’impression tactile en bouche est exclusivement déterminée par le tanin. Ces données brutes (je note pour chaque vin les valeurs d’environ 15 à 20 dimensions sensorielles) sont ensuite utilisées pour créer ce que l’on appelle des «facteurs».

Les facteurs peuvent être considérés comme des thèmes de base qui structurent la quantité de données. Par exemple, si l’on analysait des données statistiques sur le climat dans les vignobles, on obtiendrait peut-être un facteur exprimant la corrélation entre la température moyenne annuelle et l’altitude au-dessus du niveau de la mer. Pour ce facteur, on pourrait calculer une valeur de facteur, comme sur une échelle, qui indiquerait s’il s’agit d’une situation plus basse et plus chaude ou d’une situation plus haute et plus fraîche.

Dans l’analyse sensorielle des vins, les relations exprimées par les facteurs sont souvent moins évidentes et beaucoup plus complexes que dans l’exemple simple des températures moyennes des vignobles décrit ci-dessus. Par exemple, l’analyse factorielle des données associées aux vins de Bordeaux 2018 a révélé les trois facteurs suivants :

Ces trois facteurs permettent de calculer des groupes de vins similaires. Le programme statistique détermine le centre de chaque groupe comme une combinaison idéale de caractéristiques. Les lignes 1-4 (correspondant aux groupes 1-4) contiennent les valeurs des facteurs (new.x.F1-new.x.F3).

Pour la caractérisation d’un vin, il est possible de déterminer à quel groupe il appartient et à quelle distance du centre du groupe il se trouve. La valeur «delta» (∂) qui exprime cela indique pour chaque vin s’il remplit les caractéristiques du type de manière complète ou plutôt marginale. Par exemple, ∂ 0,31 indique que le vin est assez proche du centre du groupe, un ∂ 2,85 indiquerait que le vin ne partage que partiellement les caractéristiques du groupe. S’il appartient tout de même à ce groupe, c’est parce que les caractéristiques des autres groupes sont encore moins applicables. De telles «aberrations» extrêmes sont cependant rares.