Was steckt hinter der statistischen Analyse?
Das von mir angewandte Verkostungsschema beschreibt den sensorischen Eindruck jedes Weins mit Zahlenwerten. Riecht der Wein stark nach Holz, oder eher nach Kräutern, oder dominiert die Frucht? Und bei der Frucht: Wie stark weist sie vegetale Komponenten auf, wie stark frischfruchtige und wie stark hoch- bis überreife Aromen?

Dieser Versuch, ein präzises quantitatives Abbild des jeweiligen Weins zu schaffen, könnte angesichts des notorisch instabilen Zustands der Fassmuster als übertriebener Ehrgeiz erscheinen. Doch die statistische Methode hilft genau an diesem Punkt: indem sie in einem ersten Schritt vor Beginn der eigentlichen Analysen alle Informationen aussondert, für die sich keine Korrelation, kein Zusammenhang zu anderen Eigenschaften ergibt. Was die statistische Methode am Ende präsentiert, ist eine Reduktion des Datenmaterials auf ein Maximum an sinnvoll deutbarem Zusammenhang. Heisst: Am Ende des Analysevorgangs sollten nur diejenigen Eigenschaften übrig bleiben, die auch langfristig für die Struktur des Weins bestimmend sind.
Muss ich die Statistik verstehen, um die Resultate der Verkostung zu verstehen?
Zum Glück nein! Das Gute an der statistischen Analyse ist, dass sich ihre Ergebnisse gewissermaßen zurück in die Alltagssprache übersetzen lassen. Hier ein Beispiel aus den Analysen zu den 2018er Primeurweinen aus Bordeaux:
CLUSTER 1: die »gutmütig Breiten«.
Beschreibung: Mit nahezu einem Drittel der verkosteten Weine ist dieser Typus der am häufigsten vorkommende des Jahrgangs 2018. Frische und feinnervige Saftigkeit sind nicht die hervorragenden Merkmale der Cluster-1-Weine, ihre Säuren sind sehr dezent, sie sind aber zugleich auch nur in vergleichsweise geringem Ausmass von den sensorischen Auswirkungen des Trockenstress betroffen. In ihrem Alkoholgehalt liegen sie im Mittelfeld, in der Ausprägung des Weichteils etwas überm Durchschnitt des Jahrgangs.
Interpretation: Man könnte sagen: Diese Produzenten dieser Weine haben sich erfolgreich darum bemüht, die negativen Folgen des Jahrgangs in Schach zu halten, sie haben es aber auch zugelassen, dass sich der Jahrgangstyp ausdrückt. Schaut man ins Clusterzentrum – also zu denjenigen Weinen, die den Clustertypus rechnerisch am genauesten abbilden, dann handelt es sich um die solide Mittelklasse überwiegend vom rechten Ufer oder aus den Graves. Typisch sind Beschreibungen wie »hat eine gute Ausgewogenheit in seinem breiten Volumen« (Clos des Jacobins), »mittlere Dichte, etwas trockenes Tannin, dennoch auch etwas Saftigkeit« (de Sales), »innere Festigkeit trotz des weichen Äußeren, homogene gute Länge« (Clos Marsalette). Bei den hoch bewerteten Weinen des Clusters stehen Dichte und Kraft im Vordergrund: »noch mehr Großzügigkeit, noch mehr Tannin, und eine Struktur für die Ewigkeit, Alkohol kein Thema, Säure dezent, aber dennoch löst das Tannin saftig auf« (Haut Bailly), »ein geradezu atemberaubender Tanningehalt, der sensorisch fast völlig im mollig-weichen Untergrund verschwindet« (Trotanoy). Interessant zuletzt, dass das Médoc in diesem Cluster nach Anzahl der Weine stark unterrepräsentiert ist, bei den Top-Weinen dann aber doch vergleichsweise stark verteten ist.
Die Beschreibung und Bewertung eines konkreten Weines sieht dann so aus:
Lilian Ladouys 91–93
Typ 1 (gutmütig breit) ∂ 0,37
Das Château hat seine Fläche stark ausgeweitet: Durch den Erwerb von Parzellen, die zuvor zu den Châteaux Tour de Pez und Clauzet gehörten, umfasst der Weinberg jetzt 80,5 Hektar. Die neu zugegangenen Parzellen liegen vor allem auf Kies, weshalb der Cabernet-Anteil hier einen großen Satz gemacht und den Merlot-Anteil jetzt überholt hat. Lese von 29. September bis 13. Oktober. 59 Prozent Cabernet Sauvignon, 37 Prozent Merlot, 4 Prozent Petit Verdot, pH 3,82, Alkohol 14,41 Volumenprozent. Mazerationsfrucht, Sauerkirsche, Tabak, Walderdbeere. Kräuter. Am Gaumen etwas feurig im Hintergund, aber mit mürb-körniger Gerbstoffüllung, dezente Säure, guter Extrakt und auch eine sehr adrette Fruchtbegleitung (allerdings zuletzt leicht gekocht). Gute Dichte und homogene Länge. Fleischig, fest, nicht trocknend.
Die Details der Faktor- und Clusteranalysen
Die Typisierung, die WEINVERSTAND BRIEF für die Verkostung der en-Primeur-Weine nützt, beruht auf den Verfahren der Faktoren- und der Clusteranalyse. Die „Cluster“, also Gruppen stilistisch ähnlich gearteter Weine, werden im Brief ausführlich geschildert und interpretiert, überdies sind alle Weine einem der Cluster zugeordnet, die in der statistischen Analyse als zusammengehörige Einheit gebildet werden konnten.
Um zu den Clustern zu gelangen, werden zunächst sensorische Rohdaten gesammelt: Ich notiere mir also bei der Verkostung jedes Weins eine quantitative Gewichtung des Eindrucks, den die diversen sensorischen Merkmale hinterlassen, etwa die Tanninmenge: Eine Null würde für einen Wein stehen, der überhaupt keine Gerbstoff-Wahrnehmung im Mund auslöst, eine 100 für eine Flüssigkeit, deren taktiler Gaumeneindruck komplett und ausschließlich von Gerbstoff bestimmt ist. Diese Rohdaten (ich notiere zu jedem Wein Werte zu rund 15-20 sensorischen Dimensionen) werden nun zunächst zur Bildung so genannter „Faktoren“ genützt.
Die Faktoren kann man sich wie Grundthemen vorstellen, die die Datenmenge gliedern. Würde man beispielsweise statistische Daten zum Klima in Weinbergen auswerten, würde man vielleicht einen Faktor erhalten, der die Korrelation von Jahresdurchschnittstemperatur und Höhenlage über Meer zum Ausdruck bringt. Für diesen Faktor ließe sich wie auf einer Skala ein Faktorwert errechnen, der dann anzeigt, ob es sich um eine tiefere und wärmere Lage handelt, oder um eine höher gelegene und kühlere.
Bei den sensorischen Analysen der Weine sind die in den Faktoren zum Ausdruck kommenden Zusammenhänge oft weniger anschaulich und sehr viel komplexer als in dem geschilderten einfachen Beispiel durchschnittlicher Weinbergstemperaturen. Bei der Faktoranalyse der zu den 2018er Bordeaux-Weine gehörigen Daten ergaben sich zum Beispiel folgende drei Faktoren:
Mithilfe dieser drei Faktoren lassen sich nun Gruppen, so genannte „Cluster“ ähnlicher Objekte (in unserem Fall Weine) berechnen. Das Statistik-Programm ermittelt dabei das „Clusterzentrum“ jedes Typus als eine idealtypische Kombination von Eigenschaften. Nachfolgend die sieben Clusterzentren 2018. In den Zeilen 1-4 (korrespondierend den Clustern 1-4) stehen die Faktorwerte zu den vier Faktoren (new.x.F1-new.x.F3).
Für die Charakterisierung eines einzelnen Weins lässt sich nun bestimmen, welchem Cluster er angehört, und zudem, wie weit er vom Clusterzentrum entfernt im Eigenschaftsraum liegt. Der dies ausdrückende „delta“-Wert (∂) gibt für jeden einzelnen Wein an, ob er die Typuseigenschaften besonders genau oder eher randständig erfüllt. So zeigt beispielsweise die Angabe ∂ 0,31 an, dass der Wein recht nah am Clusterzentrum liegt, ein ∂ 2,85 würde darauf hin deuten, dass der betreffende Wein die Clustereigenschaften nur bedingt teilt. Wenn er dann trotzdem zum betreffenden Cluster gehört, dann nur darum, weil die Eigenschaften der alternativen Cluster noch weniger zutreffen. Solche extremen „Ausreißer“ sind aber selten.

