Articles

Going Deep: Der wahre Wert der Statcast-Daten Teil I

August 15, 2021 by admin

Kürzlich schrieb ich über die ordnungsgemäße Verwendung von ERA-Indikatoren basierend auf ihrem relativen Vorhersagewert angesichts der Tatsache, dass ich sie ohne ein tieferes Verständnis dafür verwendete, warum. Ich denke, das ist etwas, was viele Casual Fantasy Baseball-Spieler zu schätzen wissen. Ein Freund beleidigt einen Krug, den du magst, basierend auf einer hohen ÄRA, also rennst du zu seiner Fangraphs-Seite, findest die SIERA, xFIP oder FIP (je nachdem, was am niedrigsten ist) und spuckst sie wieder auf deinen Freund aus. Schlimmer noch, Sie werden es auf Twitter mitten in einem Streit tun.

Ich für meinen Teil bin daran schuld.

Aber es sind nicht nur ERA-Indikatoren. Das machen wir auch mit unseren Statistiken. Zuerst, es war schwer% von Baseball Info Solutions. Ein Spieler erfüllt nicht die Erwartungen? Keine Angst, seine harte Arbeit ist astronomisch!

Die neueste Modeerscheinung in der Fantasy-Community ist es, Statcast-Metriken von Baseball Savant zu zitieren, die im Mittelpunkt dieses Artikels stehen werden. Zunächst ist es wichtig zu verstehen, woher diese Daten stammen:

Statcast ist eine Kombination aus zwei verschiedenen Tracking—Systemen – einem Trackman-Doppler-Radar und hochauflösenden Chyron-Hego-Kameras. Das Radar, das in jedem Baseballstadion in erhöhter Position hinter der Home Plate installiert ist, erfasst die Pitchgeschwindigkeit, die Spinrate, die Pitchbewegungsaustrittsgeschwindigkeit, den Startwinkel, die Schlagballentfernung, die Armstärke und vieles mehr. Separat, Jeder Baseballstadion verfügt auch über ein Chyron Hego-Kamerasystem, Hier sind sechs stereoskopische Kameras in zwei Bänken mit jeweils drei Kameras entlang der Foullinie installiert. Das Kamerasystem verfolgt die Bewegung der Personen auf dem Spielfeld, wodurch die Geschwindigkeit, Entfernung, Richtung und mehr des Spielers bei jedem Spiel gemessen werden können.

Dort gibt es viel zu entpacken, aber dies ist kein Artikel über die Genauigkeit des Dopplerradars oder Kamerasystems. Stattdessen möchte ich eine kuratierte Liste der beliebtesten Statcast-Treffermetriken testen, die aus dem Radar und den Kameras generiert wurden, um festzustellen, welche die Leistung eines Hitters am besten vorhersagen.

Um diese Bestimmungen zu treffen, werde ich diese Metriken gegen HR / FB% und ISO regressieren. Ersteres ist aus einer Fantasy-Baseball-Perspektive relevanter, weil wir wissen wollen, ob ein Hitter weiterhin Homeruns schlagen wird. Anfangs habe ich überlegt, Statcast-Metriken gegen rohe Homerun-Summen zu regressieren, aber sie stellen kein genaues Maß für die Schlagkraft dar, da diese Summen basierend auf der Anzahl der Plattenauftritte eines Schlägers variieren. Dementsprechend habe ich HR / PA% in Betracht gezogen, aber das führt zu vielen Ergebnissen des Plattenauftritts, die nicht von Statcast-Leistungsmetriken wie Strikeouts und Walks beeinflusst werden. Ich bin schließlich auf HR / FB% gelandet, da diese Metrik nur Bälle im Spiel berücksichtigt, speziell Fly Balls, und die meisten Homeruns kommen sowieso auf Fly Balls.

ISO ist aus einer echten Baseball-Perspektive nützlicher als HR / FB%, da es Doppel- und Dreifach enthält. Die andere Metrik, die ich in Betracht zog, war SLG, aber ISO ist besser für die Messung der Rohleistung eines Spielers als SLG, da es Singles ausschließt. Infolgedessen werde ich auch Statcast-Metriken gegen ISO regressieren.

Für meine Analysen habe ich lineare und multiple Regressionen durchgeführt. Mit „Regression“ meine ich, ich habe den Bestimmungskoeffizienten oder r ^ 2 gefunden, der angibt, inwieweit eine unabhängige Variable (z. B. Startwinkel) die Variation in der Stichprobe einer abhängigen Variablen (z. B. HR / FB) erklärt%). Je höher das r ^ 2 (das immer zwischen 0 und 1 liegt), desto größer sagt die abhängige Variable Abweichungen in der unabhängigen Variablen voraus.

Für meine Stichprobe habe ich alle Spieler mit mindestens 150 Batted-Ball Events (BBEs) in jeder Saison von 2015-18 ausgewählt. Zuerst habe ich jede Statcast-Metrik Jahr für Jahr zurückgeführt, um zu sehen, welche „klebrig“ waren und in welchem Ausmaß. Als nächstes habe ich Statcast-Metriken gegen HR / FB% und ISO regressiert. Schließlich habe ich ein wenig mehr graben, um Ihnen einige Bonus-Analyse.

Los geht’s.

Definitionen

Zu Beginn sollte ich einige praktische Definitionen aus dem Statcast-Glossar für die Metriken bereitstellen, die ich testen werde, damit Sie einen Referenzrahmen haben:

Batted Ball Event (BBE): repräsentiert jeden geschlagenen Ball, der ein Ergebnis erzeugt. Dazu gehören Outs, Hits und Fehler. Jeder faire Ball ist ein geschlagenes Ballereignis. So sind auch Foulbälle, die zu einem Out oder einem Fehler führen.
Exit Velocity (EV): Exit Velocity misst die Geschwindigkeit des Baseballs, wenn er vom Schläger kommt, unmittelbar nachdem ein Schlagmann Kontakt aufgenommen hat. Dies wird für alle geschlagenen Ballereignisse verfolgt – Outs, Treffer und Fehler.
Startwinkel (LA): stellt den vertikalen Winkel dar, in dem der Ball den Schläger eines Spielers verlässt, nachdem er getroffen wurde. Der durchschnittliche Startwinkel wird berechnet, indem die Summe aller Startwinkel durch alle geschlagenen Ballereignisse dividiert wird.
Trefferquote (HH%): Statcast definiert einen „Hard-Hit-Ball“ als einen Treffer mit einer Austrittsgeschwindigkeit von 95 Meilen pro Stunde oder höher, und die „Hard-Hit-Rate“ eines Spielers zeigt einfach den Prozentsatz der geschlagenen Bälle an, die mit 95 Meilen pro Stunde oder mehr getroffen wurden.
Barrel: Um gerannt zu werden, benötigt ein geschlagener Ball eine Austrittsgeschwindigkeit von mindestens 98 mph. Bei dieser Geschwindigkeit erhalten Bälle, die mit einem Startwinkel zwischen 26 und 30 Grad getroffen werden, immer eine Laufklassifizierung. Für jeden Tick über 98 mph erweitert sich der Bereich der Startwinkel. Die Laufklassifizierung wird Schlagballereignissen zugeordnet, deren vergleichbare Trefferarten (in Bezug auf Austrittsgeschwindigkeit und Startwinkel) zu einem Minimum geführt haben .500 Schlagdurchschnitt und 1.500 Slugging Prozentsatz.

Unten werde ich average EV , average LA und HH% zurückbilden. Darüber hinaus werde ich EV auf Fly Balls und Line Drives (EV auf FB / LD), Barrels pro Batted-Ball Event (Brls / BBE%) und Barrels pro Plate Appearance (Brls / PA%) untersuchen.

Klebrigkeit im Jahresvergleich

Wie gut übersetzt sich beispielsweise die HH% eines Hitters in einem Jahr in das nächste? Inwieweit können wir den EV eines Hitters auf FB / LD betrachten und sagen, dass er in der folgenden Saison ähnlich aussehen wird? Die Antwort auf diese und weitere Fragen finden Sie unten.

Statcast-Metrik	2015-18 r^ 2
Durchschnittlicher LA	0,6434
Durchschnittlicher EV	0,61519
EV auf FB/LD	0,6674
HH%	0,6185
Brls/BBE%	0,6344
Brls/PA%	0.5735

Aus diesen Zahlen können wir einige Schlüsse ziehen. Erstens sind sie alle ziemlich ähnlich und liegen nur zwischen 0.5735 und 0.6674. Wir wissen, dass die Vorhersagbarkeit von Jahr zu Jahr dementsprechend für jede Metrik relativ stark ist. Zweitens wird EV auf FB / LD in einem Jahr mehr Variation in EV auf FB / LD im nächsten Jahr erklären als alle anderen Statcast-Metriken. Es ist das „klebrigste“ von allen.

Drittens, obwohl Brls/BBE% und Brls/PA% ähnlich erscheinen, sind sie eigentlich ganz anders. Diese Unterschiede spiegeln sich in der Tatsache wider, dass Brls / BBE% über die Jahreszeiten hinweg besser vorhersagbar ist. Brls / BBE% berücksichtigt nur Fässer bei geschlagenen Ballereignissen, während Brls / PA% Fässer als Funktion aller Plattenauftritte berücksichtigt. Da es deutlich mehr Plattenauftrittsergebnisse als nur geschlagene Ballereignisse gibt, ist es nicht verwunderlich, dass Brls / PA% über die Jahreszeiten hinweg stärkeren Schwankungen unterliegt. Wenn ein Hitter seine Strikeout- oder Walk-Raten verbessert, ändern sich seine Brls / PA% im folgenden Jahr, während seine Brls / BBE% davon unberührt bleiben.Viertens stabilisiert sich jede dieser Statistiken, obwohl sie nicht in der obigen Tabelle enthalten ist, nach etwa 50 Bällen im Spiel. Wir wissen das aus einigen großartigen Recherchen von Russel Carleton, die Sie hier und hier lesen können. Diese Statcast-Metriken sind alle Ableitungen von LA, EV und Barrels. Russel Carleton fand heraus, dass sich diese drei Statistiken nach 50 Bällen im Spiel stabilisieren (ungefähr 18 gespielte Spiele).

Jetzt, da wir wissen, wie klebrig jede Metrik ist und wie schnell sie sich stabilisiert, wissen wir, inwieweit wir sicher sein können, sie einzusetzen. Es ist Zeit, sie gegen HR / FB% und ISO zurückzubilden.

Hard%

Zuerst brauchte ich eine Steuervariable. Eine, mit der wir die Ergebnisse unserer Regressionen vergleichen konnten, um den relativen Vorhersagewert von Statcast-Leistungsmetriken zu bestimmen. Ich habe mich für Hard% entschieden, das auf Fangraphs-Spielerseiten gemeldet und von Baseball Info Solutions gesammelt wird. Nach Fangraphs:

Seit 2010 zeichneten die Video-Scouts die Zeit auf, in der sich der Ball in der Luft befand, den Landeplatz und die Art des geschlagenen Balls (Fliegenball, Bodenball, Liner usw.) und der BIS-Algorithmus bestimmt, ob der Ball weich, mittel oder hart getroffen wurde. Leider ist der genaue Algorithmus (die genauen Schnittpunkte / Methodik) Eigentum von BIS und wir können nicht genau teilen, was harten Kontakt ausmacht, aber die Berechnung basiert auf Hangzeit, Ort und allgemeiner Flugbahn.

Seit Jahren wird Hard% angegeben, um zu bestimmen, ob ein Spieler hohe Homerun-Summen beibehält. Für dieselbe Stichprobe von Schlägern von 2015-18 habe ich Hard% gegen HR / FB% und ISO regressiert, um die Richtigkeit dieser Annahme zu testen.

Wie Sie sehen können, hat Hard% eine relativ starke Beziehung zu HR/FB% und ISO. Denken Sie daran, wir erkennen den Bestimmungskoeffizienten, der niedriger sein wird als der Pearson-Korrelationskoeffizient (r). Angesichts der Anzahl unbekannter Variablen, die sich auf die HR / FB% oder ISO eines Spielers auswirken (z. B. Baseballstadion, Startwinkel, Qualität des gegnerischen Pitchers usw.), ein r ^ 2 von 0,44 oder 0,48 ist ziemlich stark. Anders ausgedrückt, 44% der Varianz in HR / FB% ist beispielsweise von Hard% vorhersehbar.

Durchschnittlicher Startwinkel

Jetzt, da wir eine Kontrollgruppe haben, können wir messen, inwieweit Statcast-Metriken unsere Rohleistungsmetriken vorhersagen.

Auf der einen Seite sehen wir, dass die durchschnittliche LA für sich genommen keine Vorhersage von HR / FB% angesichts des r ^ 2 von 0,05852 ist. Intuitiv macht das Sinn. Ob ein Batter mehr oder weniger anhebt, ist irrelevant, ob er in der Lage ist, seine Fliegenbälle aus dem Park zu ziehen. Die Quadratwurzel von 0,05852 ergibt einen Pearson-Korrelationskoeffizienten von 0,2419, was bedeutet, dass der durchschnittliche LA und HR / FB% bis zu einem gewissen Grad positiv korreliert sind. Das macht auch Sinn. Hitter, die mehr erhöhen, neigen dazu, Power-Hitter zu sein, die die Fähigkeit haben, aus ihren Fliegenbällen Homeruns zu erstellen. Aber das Anheben von selbst verursacht nicht mehr Homeruns auf Fliegenbällen.

Auf der anderen Seite ist die durchschnittliche LA prädiktiver für ISO. ISO ist ein Maß für die Gesamtzahl der zusätzlichen Basistreffer über die Gesamtzahl der Fledermäuse. Ein Hitter, der mehr erhöht, hat mit größerer Wahrscheinlichkeit einen höheren Prozentsatz seines Gesamtbetrags bei Fledermäusen, was zu einem zusätzlichen Basisspiel führt.

Durchschnittliche Austrittsgeschwindigkeit

Durchschnittliche EV ist eine andere Geschichte. Ich habe erwartet, dass es HR / FB% und ISO besser vorhersagen kann, da es ein Maß für die rohe Kraft des Hitters ist, im Gegensatz zum durchschnittlichen LA, das ein Maß für den Ansatz eines Hitters ist.

Es überrascht nicht, dass sich meine Erwartung in den Regressionen bestätigt. Bei ähnlichen r ^ 2-Werten wie Hard% ist average EV für die Vorhersage der Rohleistung (gemessen in HR / FB% und ISO) ungefähr so nützlich wie Hard%. Ich vermute, der Grund, warum es nicht besser als Hard% ist, ist, dass es wie Hard% den EV eines Hitters auf Bodenbällen sowie auf Fliegenbällen und Linienantrieben misst. Dies wiederum drückt den Vorhersagewert des durchschnittlichen EV als Leistungsmetrik.

Unabhängig davon ist es wahrscheinlich, dass average EV eher ISO als HR / FB% vorhersagt, da die Einbeziehung von EV in Bodenbälle tatsächlich nützlich ist, um Doppel vorherzusagen, da hart getroffene Bodenbälle Gras im Außenfeld für Doppel finden können. Im Gegensatz zu HR / FB% enthält ISO Doppel- und Dreifach.

Austrittsgeschwindigkeit auf Fly Balls und Line Drives

Als nächstes wollte ich EV auf FB / LD untersuchen. Von Anfang an erwartete ich, dass EV auf FB / LD eines der besten, wenn nicht das Beste ist, um HR / FB% und ISO vorherzusagen. Und warum nicht? Es ist einfach ein Maß dafür, wie schnell die Fliegenbälle und Linienantriebe eines Schlägers seinen Schläger verlassen. Je schneller sie reisen, desto wahrscheinlicher ist es, dass sie zu Homeruns werden. Daher sollte die Metrik mindestens HR / FB% vorhersagen, was nur ein Maß dafür ist, wie oft Fliegenbälle zu Homeruns werden.

Meine Erwartung spiegelt sich teilweise in den obigen r ^ 2-Werten wider. Zum einen ist 0.6175 ein starkes Ergebnis. Insbesondere im Vergleich zu unserer Kontrollmetrik (Hard%) und den anderen Statcast-Metriken, die wir bisher getestet haben. So können Sie sich bequem den EV eines Hitters auf FB / LD ansehen, um zu sehen, ob sich sein HR / FB% zurückbildet.

Dennoch kann das gleiche nicht so zuverlässig für ISO gesagt werden. Der Grund ist wahrscheinlich, dass der Nenner von ISO alle Fledermäuse umfasst und daher Strikeouts und Groundballs fegt. Dennoch ist ein r ^ 2 von 0,5160 eine schöne Erinnerung daran, dass der EV eines Hitters auf FB / LD sowohl für Fantasy-Baseball als auch für Real-Life-Baseball wichtig ist. Andrew Perpetua hat es vor zwei Jahren am besten gesagt: Die Austrittsgeschwindigkeit übertrumpft den Startwinkel.

Hard-Hit Rate

Ich habe viele Diskussionen über HH% und seinen Wert als Werkzeug zur Schätzung des Leistungspotentials eines Hitters gesehen. Ich war skeptisch, weil HH%, wie der durchschnittliche EV, in allen Schlagballtypen enthalten ist, einschließlich Bodenbällen.

Wie Sie sehen können, ist HH% mit einem r ^ 2 von 0,5343 prädiktiver für HR / FB% als Hard%, average LA und average EV aber nicht so prädiktiv für HR / FB% wie EV auf FB / LD. Es ist sogar weniger prädiktiv für ISO als Hard%.

Ich habe die Behauptung gehört, dass HH% nützlich ist, denn wenn ein Hitter eine Swing-Änderung vornehmen und mehr erhöhen würde, würden wir wissen wollen, was mit diesen Bodenbällen passiert ist, die jetzt zu Fliegenbällen und Linienantrieben werden, und HH% fängt den EV auf diesen Bodenbällen ein. Meine Erwiderung darauf wäre, dass wir uns nur EV auf FB / LD ansehen sollten, weil es eine bessere Darstellung dessen ist, was passieren würde, wenn sich diese Bodenkugeln in Fliegenkugeln oder Linienantriebe verwandeln würden. Dies spiegelt sich in den Regressionen wider.Das heißt, ich habe auch die Behauptung gehört, dass HH% stark mit xwOBA und xwOBAcon korreliert und daher ein besseres Maß für das wahre Talent eines Hitters aus einer echten Baseball-Perspektive sein kann. Diese Behauptung geht jedoch über den Rahmen dieses Artikels hinaus.

Brls/BBE% & Brls/PA%

Ich habe beschlossen, Brls/BBE% und Brls/PA% zusammen zu behandeln, da es sich um ähnliche Messungen mit leicht unterschiedlichen Nennern handelt. Ersteres betrachtet nur Fässer auf Bällen im Spiel, während letzteres sie als Funktion aller Plattenerscheinungen betrachtet. Welches ist das bessere Maß für rohe Kraft?

Beginnend mit Brls / BBE% sehen wir, dass das r ^ 2 sowohl für HR/ FB% als auch für ISO sehr hoch ist. Es ist höher als jedes Ergebnis, das wir bisher hatten. Wie Sie in einer Minute sehen werden, ist es unsere beste einzelne Metrik, um vorherzusagen, wie gut ein Hitter seine Fliegenbälle aus dem Park herausmuskeln kann oder ob sich sein HR / FB% zurückbilden wird.

Der Grund, warum es besser ist als EV auf FB / LD, ist, dass es nur die Bälle im Spiel erfasst, die so hart getroffen werden, dass sie extrem wahrscheinlich zu Homeruns werden, während EV auf FB / LD ein Maß für die durchschnittliche Leistung ist und daher durch Ausreißer verzerrt werden kann schlecht oder stark getroffen FB / LD.

Wie uns die Regression sagt, ist es also wahrscheinlicher, dass ein Schlagmann Homeruns sprengt, je mehr Bälle er bei den perfekten LA- und EV-Kombinationen im Spiel produzieren kann (dh je mehr Fässer er produziert). Und das von Brls / BBE% betrachtete LA-Band ist eng auf die besten Power-Launch-Winkel zugeschnitten, so dass es nicht in allen Flyballs und Line-Drives wie EV auf FB / LD fegt. Ich hasse es zuzugeben, wenn ich falsch liege, aber Brls / BBE% sagt sowohl HR / FB% als auch ISO besser voraus als EV auf FB / LD.

Das gleiche gilt für Brls/PA%. Es ist etwas weniger prädiktiv für HR / FB%, da es im Gegensatz zu Brls / BBE% mehr als nur Bälle im Spiel berücksichtigt, und HR / FB% ist nur ein Maß für die Leistung von Fly Balls (einer Art Ball im Spiel). And it’s more predictive of ISO because, unlike Brls/BBE%, it considers strikeouts, and ISO does too.

In sum, we have the following r^2 values:

Statcast Metric	HR/FB%	ISO
Hard%	0.4400	0.4807
Average LA	0.0585	0.2706
Average EV	0.4408	0.4056
EV on FB/LD	0.6176	0.5160
HH%	0.5343	0.4577
Brls/BBE%	0,7269	0,70199
Brls/PA%	0,7071	0,7319

Nachdem Sie die Stabilisierungspunkte für den 50-Ball im Spiel erreicht haben, sollten Sie sich Brls / BBE% ansehen, um festzustellen, ob HR / FB% eines Hitters nachhaltig ist, und Brls /PA% für ISO. Denken Sie daran, dass HR / FB% und ISO die besten Ausgänge sind, um die Stromproduktion eines Hitters zu messen, da sie einen Großteil des Rauschens eliminieren (z. B. Spaziergänge, Foul-Outs, HBPs; Strikeouts werden auch aus HR / FB%) anderer Leistungsmetriken (z. B. HR / XBH-Summen oder HR / PA%) eliminiert. Somit sind Brls / BBE% und Brls / PA% die besten verfügbaren Rohleistungseingänge.

Mehrere Regressionen

Nachdem das alles gesagt war, wollte ich meine Arbeit mit mehreren Regressionen überprüfen. Mit anderen Worten, Testen von zwei oder mehr unabhängigen Variablen (z. B. durchschnittlicher LA und durchschnittlicher EV) gegen eine abhängige Variable (z. B. HR / FB%). Vielleicht waren zwei Statcast-Metriken zusammen prädiktiver für HR / FB% und ISO als einzeln.

Zu Beginn habe ich alle sechs Statcast-Metriken zusammen untersucht, um ihren kombinierten prädiktiven Effekt für HR / FB% und ISO zu sehen. Das ergab ein r ^2 von 0,7615 mit HR/FB% und 0,7634 mit ISO. Mit anderen Worten, in Kombination sagten alle sechs Statcast-Metriken etwa 76% der Varianz in den HR / FB% – und ISO-Stichproben voraus.

Da Brls / BBE% und Brls / PA% etwa 73% der Varianz in HR / FB% – und ISO-Stichproben vorhersagten, fügte keine andere Statcast-Metrik allein einen großen Vorhersagewert hinzu. Durch Hinzufügen des durchschnittlichen Startwinkels zu diesen beiden Metriken wurde beispielsweise das r ^ 2 mit HR / FB% und ISO auf 0,7510 und 0 erhöht.7578, beziehungsweise. Aber das ist wirklich nicht viel besser. Keine andere Kombination von zwei Statcast-Metriken bewegte die Nadel auch nur so hoch.

Daher sind Brls/BBE% und Brls/PA% leistungsstarke Metriken. Sie sind auch von Jahr zu Jahr ziemlich klebrig. Wenn Sie sich den Rest der Statcast-Bestenlisten ansehen, erfahren Sie möglicherweise nichts, was Sie nicht von ihnen erhalten würden, und kann irreführend sein. Da wir wissen, dass wir uns nur Brls / BBE% ansehen müssen, um HR / FB% vorherzusagen, wollen wir das Gelernte in die Praxis umsetzen.

Ein paar Hitter, die wir identifizieren können, die für HR / FB% Verbesserung fällig sind, sind: Adalberto Mondesi (9,1 Stunden / FB%, 17,3 Stunden / BBE%), Avisail Garcia (11,8 Stunden / FB%, 16,7 Stunden / BBE%) und Freddie Freeman (5,6 Stunden / FB%, 15,1 Stunden / BB%). Einige der überraschenden HR / FB% -Führer, von denen ich glaube, dass sie ihre erhöhten HR / FB-Raten verdient haben, sind: Mitch Moreland (27.8 HR / FB%, 20.9 Brls / BBE%), Luke Voit (26.7 HR / FB%, 20.9 Brls / BBE%) und Yoan Moncada (22.7 HR / FB%, 19.2 Brls / BBE%).

Swing-Änderungen und Statcast

Schließlich wollte ich untersuchen, welche Statcast-Metrik am nützlichsten ist, um einen Power Breakout basierend auf einer Swing-Änderung anzuzeigen. Wie wir gerade erfahren haben, hängt der Erfolg in der Energieabteilung von besseren Brls / BBE% – und Brls / PA% -Noten ab. Gibt es eine Möglichkeit, Hitter zu identifizieren, die diese verbessern und wiederum HR / FB% und ISO verbessern könnten? Wenn ja, welche Spieler würden am meisten von einer solchen Änderung profitieren?

Wir wissen, dass Fässer aus LA und EV bestehen. Nur ersteres ist wirklich unter der Kontrolle eines Hitters. Sicher, er könnte mehr Muskeln aufbauen und den Ball härter schlagen. Aber das können wir nicht wirklich vorhersagen. Wenn wir stattdessen annehmen würden, dass er mehr erhöhen wird, was eher eine Frage bewusster Entscheidung ist, wird er dann erfolgreich sein, nachdem er dies getan hat? Vielleicht hat ein Spieler gegenüber den Medien erklärt, dass er beabsichtigt, den Ball zu erhöhen. Würde ihm das tatsächlich nützen? Um all diese Fragen zu beantworten, habe ich ermittelt, welche Nicht-LA-Statcast-Metriken Brls / BBE% und Brls / PA% am besten vorhersagen, indem Sie lineare und multiple Regressionen ausgeführt haben.

Statcast Metric	Brls/BBE%	Brls/PA%
Average EV	0.5374	0.5737
EV on FB/LD	0.6936	0.7024
HH%	0.6178	0.6447
HH% + EV on FB/LD	0.6999	0.71226
EV on FB/LD + Average EV	0.6186	0.6459

Anstatt jedes Diagramm zu erstellen und die Länge dieses Artikels erheblich zu verlängern, habe ich beschlossen, nur die r ^ 2-Werte in eine umfassende Tabelle aufzunehmen. Dementsprechend können Sie sehen, dass EV auf FB / LD die prädiktivste von Brls / BBE% und Brls / PA% ist. So sehr, dass das Hinzufügen von HH% oder durchschnittlichem EV der Stichprobe keinen Wert verleiht und in einigen Fällen sogar weniger prädiktiv ist. Dieses Ergebnis macht mich auch schwindlig, weil EV auf FB / LD nicht nur prädiktiv ist, sondern auch die klebrigste unserer Statcast-Metriken. Es ist eine großartige Möglichkeit, Ihre Swing-Change-Ausbrüche zu finden.

Dies ist am wertvollsten in dem hypothetischen Szenario, in dem ein Schlagmann einen hervorragenden EV auf FB / LD beibehielt, aber nicht viele Fliegenbälle und Linienantriebe getroffen hat, was ihm Raum zur Verbesserung lässt. Aber stattdessen wird alles am besten anhand eines Beispiels veranschaulicht.

Nehmen wir zum Beispiel Josh Bell. Ich war mit ihm in die Saison gegangen, teilweise, weil er nicht erhöhte. Letztes Jahr lag seine durchschnittliche Temperatur bei 9 Grad und er traf nur 34,6% der Bälle und 41.7% gemahlene Bälle, was seine Brls / BBE% auf 7% (insgesamt 151. von denen mit 150 BBEs) und seine Brls / PA% auf 4,8% (insgesamt 150.) beschränkte. Dies war trotz seines viel besseren EV auf FB / LD von 94,2 Meilen pro Stunde (84. insgesamt). In diesem Jahr scheint er konzertierte Anstrengungen zu unternehmen, um sich zu erheben, und angesichts seiner latenten Kraft könnte dies einen Ausbruch unterstützen. Jetzt schlägt er 37,5% Fly Balls und 41,7% Ground Balls auf eine durchschnittliche LA von 12 Grad. Seien Sie nicht überrascht, wenn seine Barrel-Raten bei 14.6 Brls / BBE% und 10.3 Brls / PA% erhöht bleiben (und dies wiederum bei 16.7 HR / FB%) .276 ISO).

Wenn wir also wissen, wer mehr erhöhen wird, können wir leicht die Spreu vom Weizen trennen. Schauen Sie sich nicht ihren HH% oder durchschnittlichen EV an. Werfen Sie stattdessen einen kurzen Blick auf ihren EV auf FB / LD.

Fazit

Hoffentlich werden die Leute anfangen, Statcast-Metriken angemessen zu verwenden. Wenn Sie sehen, dass ein Fantasy-Baseball-Analyst die Hard%, HH% oder Average EV eines Hitters angibt, um einen Power-Breakout vorzuschlagen, überprüfen Sie seine Barrel-Raten. Sie wissen, dass sie HR / FB% und ISO vorhersagen und dass sie klebrig sind. Dann überprüfen Sie seine EV auf FB / LD. Sie wissen, dass das mehr in der Energieabteilung bedeuten könnte, wenn er anfängt zu erhöhen, und dass es auch bleiben wird. Nehmen wir nicht nur an, dass Metriken wie Hard%, HH% oder average EV am besten sind, weil wir Zugriff darauf haben.

Das ist erst der Anfang. In Teil II überprüfe ich den relativen Wert von Statcast-Metriken anhand von BABIP. Bleiben Sie dran für mehr.

Ausgewähltes Bild von Justin Paradis (@freshmeatcomm auf Twitter)

Company Pride

Going Deep: Der wahre Wert der Statcast-Daten Teil I

Schreibe einen Kommentar Antworten abbrechen

Archive

Meta