Articles

Going Deep:The Real Value of Statcast Data Part I

最近、私は理由を深く理解せずにそれらを使用していることに照らして、相対的な予測値に基づ 私はこれがカジュアルなファンタジー野球選手の多くが理解できるものだと思います。 友人はあなたが高い時代に基づいて好きな投手を侮辱するので、あなたは彼のFangraphsページに走り、SIERA、xFIP、またはFIP(どちらか低い方)を見つけて、あなたの友人に さらに悪いことに、あなたは議論の真っ只中にTwitterでそれをやります。

私は、一つのために、これの罪を犯しています。しかし、それは時代の指標だけではありません。

私達は統計量を打つこととのこれを余りにする。 まず、野球情報ソリューションからハード%でした。 プレイヤーは期待に実行されていませんか? 決して恐れることはありません、彼のハード%は天文学的です!

ファンタジーコミュニティの最新の流行は、この記事の焦点となるBaseball SavantからStatcast metricsを引用することです。 まず、そのデータがどこから来たのかを理解することが重要です:

Statcastは、二つの異なる追跡システムの組み合わせです—トラックマンドップラーレーダーと高精細カイロンHegoカメラ。 ホームプレートの後ろの高い位置に各球場に設置されたレーダーは、ピッチ速度、スピン速度、ピッチ移動出口速度、発射角度、打球距離、腕の強さなどをキャプチャします。 これとは別に、各球場にはChyron Hegoカメラシステムがあり、ファウルラインの下に三つのカメラの二つのバンクに六つの立体カメラが設置されています。 カメラシステムは、プレイヤーの速度、距離、方向、およびすべてのプレイ上の多くの測定を可能にするフィールド上の人々の動きを追跡します。p>

そこに解凍することがたくさんありますが、これはドップラーレーダーやカメラシステムの精度に関する記事ではありません。 代わりに、レーダーとカメラから生成された最も人気のあるStatcast打撃指標のキュレーションされたリストをテストして、打者のパワーを最も予測しているかどこれらの決定を行うために、HR/FB%とISOに対してこれらの指標を回帰します。

これらの決定を行うために、私はHR/FB%とISOに対してこれらのメトリッ 前者は、打者がホームランを打ち続けるかどうかを知りたいので、ファンタジー野球の観点からより関連性があります。 最初は、私は生のホームランの合計に対してStatcastの指標を後退させることを検討しましたが、それらの合計は打者のプレート出現数に基づいて変化するた したがって、私はHR/PA%を考慮しましたが、それは三振や散歩などのStatcastパワーメトリックの影響を受けない多くのプレート出現結果をスイープします。 私は最終的にHR/FB%に着陸しました。

isoは、DOUBLEとtriplesを含むため、実際の野球の観点からはHR/FB%よりも便利です。 私が考慮した他のメトリックはSLGでしたが、ISOはシングルを除外するため、SLGよりもプレイヤーの生のパワーを測定する方が優れています。 その結果、私はIsoに対してもStatcastメトリックを回帰します。私の分析のために、私は線形回帰と多重回帰を行った。

「回帰」とは、独立変数(例えば、発射角度)が従属変数(例えば、HR/FB%)のサンプルの変動を説明する程度を示す決定係数、またはr^2を見つけたことを意味します。 R^2が高いほど(常に0と1の間になります)、従属変数は独立変数の偏差を予測します。私のサンプルでは、2015-18年の各シーズンに最低150個のバッティングボールイベント(Bbe)を持つすべての選手を選択しました。 まず、各Statcast metricを年々回帰させて、どれが「粘着性」で、どの程度までであるかを確認しました。 次に、Hr/FB%とISOに対するStatcastメトリックを回帰しました。 最後に、私はいくつかのボーナス分析を提供するためにもう少し掘り下げました。

始めましょう。

定義

まず、テストするメトリックのStatcast用語集から便利な定義をいくつか提供して、参照フレームを持つようにする必要があります。

  • Batted ball event(BBE):結果を生成する任意のbatted ballを表します。 これには、アウト、ヒット、エラーが含まれます。 任意のフェアボールは、バッティングボールのイベントです。 だから、あまりにも、アウトやエラーにつながるファウルボールです。
  • Exit velocity(EV):exit velocityは、打者が接触した直後にバットから出てくる野球の速度を測定します。 アウト、ヒットやエラー—これは、すべてのバッティングボールのイベントのために追跡されます。
  • 発射角度(LA):ボールが打たれた後にプレイヤーのバットを離れる垂直角度を表します。 平均発射角度は、すべての発射角度の合計をすべての打球イベントで除算することによって計算されます。
  • ハードヒット率(HH%): Statcastは、95mph以上の出口速度を持つ一つのヒットとして”ハードヒットボール”を定義し、プレイヤーの”ハードヒット率”は、単に95mph以上でヒットした打球の割合を示
  • バレル:バレルされるためには、バットボールは、少なくとも98mphの出口速度を必要とします。 その速度では、発射角度が26度から30度のボールは常に銃身の分類を獲得していた。 98mph上のあらゆるティックのために、進水の角度の範囲は拡大する。 バレルの分類は、同等のヒットタイプ(出口速度と発射角度の点で)が最小になったバットボールイベントに割り当てられます。500試合に出場し、打率1.500を記録した。以下では、平均EV、平均LA、およびHH%を回帰します。 また、フライボールとラインドライブのEV(FB/LDのEV)、バットボールイベントごとのバレル(Brls/BBE%)、プレート外観ごとのバレル(Brls/PA%)についても検討します。

    前年比の粘着性

    例えば、ある年の打者のHH%は次の年にどれくらいうまく翻訳されますか? FB/LDの打者のEVをどの程度見て、次のシーズンに似ていると言うことができますか? これらの質問とそれ以上の答えは以下のとおりです。2015-18r^2

    平均LA 0.6434 平均EV 平均EV 平均EV 平均EV 平均EV 平均EV 平均EV 平均EV 平均EV 平均EV 平均EV 平均EV 平均EV 平均EV 平均EV 平均EV 平均EV 平均EV 平均EV 平均EV 平均EV 平均EV HH% 0.6185 BRLS/BBE% 0.6344 BRLS/PA% BRLS/PA% BRLS/PA% brls/PA% brls/PA% brls/PA% brls/PA% brls/PA% brls/PA% brls/PA% brls/PA% brls/PA% brls/PA% 05735

    これらの数字から引き出すことができるいくつかの結論があります。 まず、それらはすべてかなり似ていて、0.5735と0.6674の間の範囲にすぎません。 したがって、各指標については、前年比の予測性が比較的強いことがわかっています。 第二に、1年間のFB/LD上のEVは、他のStatcast指標のいずれよりも、次のFB/LD上のEVのより多くの変動を説明します。 それはそれらすべての”粘着性”です。第三に、Brls/BBE%とBrls/PA%は似ているように見えますが、実際にはかなり異なっています。 これらの違いは、Brls/BBE%が季節にわたってそれ自体をより予測しているという事実に反映されています。 Brls/BBE%はバッティングボールイベントのバレルのみを考慮し、Brls/PA%はすべてのプレート出現の関数としてバレルを考慮します。 単にバッティングボールのイベントよりもはるかに多くのプレートの外観の結果があるので、Brls/PA%が季節全体でより多くの変動の対象となることは驚く 打者が奪三振率または歩調を改善した場合、彼のBrls/PA%は翌年に変更され、彼のBrls/BBE%は影響を受けません。

    第四に、上記の表には反映されていませんが、これらの統計のそれぞれは、プレイ中の約50ボールの後に安定します。 Russel Carletonの素晴らしい研究からこれを知っていますが、こことここで読むことができます。 これらのStatcastメトリックは、すべてLA、EV、およびBarrelsの派生です。 ラッセル-カールトンは、これらの三つの統計は、プレイ中の50ボール(約18ゲームがプレイ)の後に安定することを発見しました。

    各メトリックがどれくらい粘着性があり、どれくらい速く安定するかを知ったので、それらを使用する自信がある程度を知っています。 HR/FB%とISOに対してそれらを退行させる時が来ました。

    最初に、私は制御変数が必要でした。 これにより、回帰の結果を比較して、Statcast power metricsの相対的な予測値を決定することができます。 私はFangraphsの選手のページで報告され、Baseball Info Solutionsによって収集されたHard%に落ち着きました。 Fangraphsによると:

    2010年以来、ビデオスカウトは、ボールが空中にあった時間の量、着陸地点、バットボールの種類(フライボール、グラウンドボール、ライナーなど)を記録し、BISアルゴ 残念ながら、正確なアルゴリズム(正確な切断点/方法論)はBIS独自のものであり、ハードコンタクトを構成するものを正確に共有することはできませんが、計算はハング時間、位置、および一般的な軌道に基づいて行われます。

    何年もの間、Hard%は、プレイヤーが高いホームランの合計を維持するかどうかを判断するために引用されてきました。 そのため、2015-18の同じサンプルの打者について、私はHR/FB%とISOに対してHard%を退行して、その仮定の真実性をテストしました。ご覧のとおり、Hard%はHR/FB%とISOの両方と比較的強い関係を持っています。 覚えておいてください、私たちは決定係数を識別しています、これはPearson相関係数(r)よりも低くなるでしょう。 プレイヤーのHR/FB%またはISOに影響を与える未知の変数の数(例えば、球場、発射角度、相手の投手の品質など)が与えられた場合、プレイヤーのHR/FB%またはISOに影)、0.44または0.48のr^2はかなり強いです。 別の言い方をすると、たとえば、HR/FB%の分散の44%は、Hard%から予測可能です。

    平均打ち上げ角度

    コントロールグループができたので、Statcastメトリックが生のパワーメトリックを予測する程度を測定できます。一方で、平均LAは、0.05852のR^2を与えられたHR/FB%を予測していないことがわかります。 直感的には、これは理にかなっています。 打者が多かれ少なかれ上昇するかどうかは、彼が公園の外に彼のフライボールを筋肉することができるかどうかとは無関係です。 0.05852の平方根を取ると、0.2419ピアソン相関係数が得られ、平均LAとHR/FB%はある程度正の相関があることを意味します。 これも理にかなっています。 より多くを上げる打者は彼らのはえの球からホームランを作成する機能がある力の打者でありがちである。 しかし、それ自体で上昇しても、フライボールでより多くのホームランを引き起こすことはありません。一方、平均LAはISOをより予測しています。

    一方、平均LAはISOをより予測しています。 ISOは、バットでの合計に対する合計余分なベースヒットの尺度です。 より多くを上げる打者は、バットで彼の合計のより大きな割合を持っている可能性が高く、余分なベースこれになります。平均出口速度

    平均EVは別の話です。 私はそれが打者のアプローチの尺度である平均LAとは対照的に、打者の生のパワーの尺度であるため、HR/FB%とISOをより予測することを期待していました。当然のことながら、私の期待は回帰で負担されています。

    当然のことながら、私の期待は回帰で負担されています。

    Hard%と同様のr^2値を使用すると、平均EVは、Hard%と同じくらい生の電力(HR/FB%およびISOによって測定される)を予測するのに役立ちます。 私の推測では、Hard%よりも優れていない理由は、Hard%のように、飛球やラインドライブだけでなく、グラウンドボールで打者のEVを測定しているからです。 これは、パワーメトリックとしての平均EVの予測値を低下させています。これとは別に、平均EVはHR/FB%よりもISOを予測する可能性が高い可能性があります。 HR/FB%とは異なり、ISOにはdoubleとtriplesが含まれています。

    フライボールとラインドライブでの出口速度

    次に、FB/LDでEVを調べたいと思いました。 最初から、HR/FB%とISOを予測する際に、FB/LDのEVが最高ではないにしても最高のものの1つであることを期待していました。 そして、なぜですか? それは単に打者のフライボールとラインドライブが彼のバットを残すどのくらいの速の尺度です。 より速く彼らが移動すればするほど、彼らはホームランになる可能性が高くなります。 したがって、メトリックは、フライボールがホームランになる頻度の単なる尺度である、少なくともHR/FB%を予測する必要があります。私の期待は、上記のr^2値に部分的に反映されています。 一つには、0.6175が強い結果です。 特に、コントロールメトリック(Hard%)とこれまでにテストした他のStatcastメトリクスと比較してください。 したがって、あなたは快適に彼のHR/FB%が退行するかどうかを確認するためにFB/LD上の打者のEVを見ることができます。それでも、同じことはISOのために確実に言うことはできません。

    その理由は、ISOの分母にはバットのすべてが含まれているため、三振とグラウンドボールでスイープする可能性が高いからです。 それでも、0.5160のr^2は、FB/LD上の打者のEVがファンタジー野球と現実の野球の両方にとって重要であることを思い出させます。 アンドリュー Perpetuaは、最高の二年前にそれを言った:出口速度は、打ち上げ角度を切り札。私はhh%と打者の力の可能性を推定するためのツールとしてのその価値について多くの議論を見てきました。 Hh%は、平均的なEVのように、グラウンドボールを含むすべてのバッティングボールの種類でループするので、私は懐疑的でした。ご覧のとおり、r^2が0.5343の場合、HH%はHard%、平均LA、平均EVよりもHR/FB%を予測しますが、FB/LDのEVほどHR/FB%を予測するものではありません。 これは、ハード%よりもISOの予測がさらに少なくなります。

    hh%が有用であるという主張を聞いたことがあるのは、打者がスイングを変更してより高くする場合、フライボールとラインドライブになっているグラウンドボールに何が起こったのかを知りたいからです。HH%はそれらのグラウンドボールにEVをキャプチャします。 それに私のレトルトは、それがフライボールやラインドライブに変わるためにそれらの地上ボールだった何が起こるかのより良い表現であるので、我々は これは回帰に反映されます。そうは言っても、私はHH%がxwOBAとxwOBAconと強く相関しているという主張を聞いたことがあるので、実際の野球の観点から打者の真の才能のより良い尺度にな しかし、その主張はこの記事の範囲を超えています。私はBrls/BBE%とBrls/PA%を扱うことにしました。brls/BBE%とBrls/PA%は、分母がわずかに異なる類似の測定値であるため、タンデムで処理することにしました。brls/BBE%とBrls/PA%は、 前者はプレー中のボールの樽を考慮するだけで、後者はすべてのプレートの外観の関数としてそれらを考慮する。 生の力のより良い尺度はどれですか?Brls/BBE%で始まると、HR/FB%とISOの両方に対するr^2が非常に高いことがわかります。 それは我々がまだ持っていたどの結果よりも高いです。 あなたが分で見るように、それは打者が公園の外に彼のフライボールを筋肉することができますどれだけ予測するために私たちの最高の単一のメ

    FB/LDのEVよりも優れている理由は、FB/LDのEVは平均パワーの尺度であり、外れ値によって歪んだり、FB/LDを強力にヒットしたりする可能性があるのに対し、ホームランになる可能性が非常に高いほど激しく打たれたボールのみをキャプチャするためです。

    したがって、回帰が示すように、打者が完璧なLAとEVの組み合わせでプレー中にボールを生産できるほど(すなわち、彼が生産するバレルが多いほど)、ホームランを爆発させる可能性が高くなる。 そしてBrls/BBE%によって考慮されるLAバンドは最もよい力の進水の角度に狭く合わせられる、従ってFB/LDのEVのようなすべてのフライ-ボールそしてライ 私は間違っているときに認めるのは嫌いですが、Brls/BBE%は、FB/LDのEVよりもHR/FB%とISOの両方をより予測しています。P>

    Brls/PA%についても同じことが言えます。 Brls/BBE%とは異なり、プレイ中のボール以上のものを考慮し、HR/FB%はフライボール(プレイ中のボールの一種)のパワーの尺度に過ぎないため、HR/FB%の予測はわずかに少 And it’s more predictive of ISO because, unlike Brls/BBE%, it considers strikeouts, and ISO does too.

    In sum, we have the following r^2 values:

    レイ安定化ポイントで50ボールに到達した後、あなたの最善の策は、打者のhr/fb%が持続可能であるかどうかを確認するためにbrls/bbe%を見て、IsoのためのBrls/PA%。 HR/FB%とISOは、多くのノイズ(歩行、ファウルアウト、Hbpなど)を排除するため、打者の電力生産を測定するために必要な最良の出力であることを覚えておいて; 三振は、他のパワーメトリクス(例えば、HR/XBHの合計またはHR/PA%)のHR/FB%からも排除されます。 したがって、Brls/BBE%およびBrls/PA%は、利用可能な最良の生の電源入力です。

    複数の回帰

    それはすべて言った、私は複数の回帰で私の仕事をチェックしたかったです。 換言すれば、1つの従属変数(例えば、HR/FB%)に対して2つ以上の独立変数(例えば、平均LAおよび平均EV)を検定する。 おそらく、2つのStatcast指標は、HR/FB%とISOを個別に予測したものよりも多かったでしょう。まず、6つのStatcastメトリックすべてをまとめて調べ、HR/FB%とISOの予測効果を組み合わせて確認しました。 これにより、HR/FB%で0.7615、ISOで0.7634のr^2が得られました。 言い換えると、6つのStatcastメトリックすべてを組み合わせると、HR/FB%およびISOサンプルの分散の約76%が予測されました。Brls/BBE%とBrls/PA%がHR/FB%とISOサンプルの分散の約73%を予測していることを考えると、他のStatcastメトリックはそれ自体で多くの予測値を追加しませんでした。

    Brls/BBE%とBrls/PA%がHR/FB%とISOサンプルの分散の約73%を予測した。 たとえば、これらの2つのメトリックに平均起動角度を追加すると、HR/FB%とISOのr^2が0.7510と0になりました。7578 しかし、それは本当にはるかに良いではありません。 他の2つのStatcastメトリックの組み合わせは、それほど高くても針を動かしませんでした。したがって、Brls/BBE%およびBrls/PA%は強力な指標です。 彼らはあまりにも、年々かなり粘着性があります。 Statcastのリーダーボードの残りの部分を見て、実際にあなたがそれらから取得しないだろう何かを教えていないかもしれないし、誤解を招く可能性があ HR/FB%を予測するためにBrls/BBE%を見る必要があることを知っているので、実際に学んだことを入れてみましょう。私たちはHR/FB%の改善のために予定されている人を識別することができますいくつかの打者は次のとおりです。

    : Adalberto Mondesi(9.1HR/FB%、17.3Brls/BBE%)、Avisail Garcia(11.8HR/FB%、16.7Brls/BBE%)、およびFreddie Freeman(5.6HR/FB%、15.1Brls/BB%)。 MITCH Moreland(27.8HR/FB%、20.9Brls/BBE%)、Luke Voit(26.7HR/FB%、20.9Brls/BBE%)、およびYoan Moncada(22.7HR/FB%、19.2Brls/BBE%)が含まれます。

    Swing Changes and Statcast

    最後に、swingの変更に基づいてパワーブレイクアウトを移植するために最も有用なStatcastメトリックを調べたいと思いました。 私たちが学んだように、電力部門での成功は、より良いBrls/BBE%とBrls/PA%マークに依存します。 それらを改善し、次にHR/FB%とISOを改善できる打者を特定する方法はありますか? もしそうなら、どの打者がそのような変化から最も利益を得るでしょうか?私たちは樽がLAとEVで構成されていることを知っています。

    前者だけが本当に打者のコントロールの中にあります。 確かに、彼はより多くの筋肉を入れて、ボールを難しく打つ開始することができます。 しかし、私たちは本当にそれを予測することはできません。 代わりに、意識的な選択の問題である、彼がより多くを昇格させると仮定すると、彼はそうした後に成功するでしょうか? おそらく、プレイヤーは、彼がボールを昇格させるつもりであることをメディアに声明を出しました。 それは実際に彼に利益をもたらすだろうか? これらすべての質問に答えるために、どの非LA Statcast指標がbrls/BBE%とBrls/PA%を最も予測しているかを判断しました。

    Statcast Metric HR/FB% ISO
    Hard% 0.4400 0.4807
    Average LA 0.0585 0.2706
    Average EV 0.4408 0.4056
    EV on FB/LD 0.6176 0.5160
    HH% 0.5343 0.Tr>
    Brls/BBE% 0.7269 0.70199
    Brls/PA% 0.7071 0.7319
    Statcast Metric Brls/BBE% Brls/PA%
    Average EV 0.5374 0.5737
    EV on FB/LD 0.6936 0.7024
    HH% 0.6178 0.6447
    HH% + EV on FB/LD 0.6999 0.71226
    EV on FB/LD + Average EV 0.6186 0.6459

    各グラフを作成し、この記事の長さを大幅に延長するのではなく、r^2値を包括的なテーブルに入れることにしました。 したがって、FB/LD上のEVは、Brls/BBE%およびBrls/PA%の最も予測的であることがわかります。 HH%または平均EVを追加すると、サンプルに価値がなくなり、場合によっては実際には予測性が低下します。 FB/LDのEVは予測的であるだけでなく、Statcastメトリックの中でも最も粘着性があるため、この結果は私もめまいを起こします。 それはあなたの振動変更のブレイクアウトを見つける大きい方法である。

    これは、打者がFB/LDで優れたEVを維持したが、フライボールやラインドライブを多くヒットしていないという仮説的なシナリオで最も価値があり、改善の余地がある。 しかし、代わりに、すべてが最高の例によって示されています。

    たとえば、ジョシュ・ベルを取る。 私は彼が昇格していなかったので、部分的には、彼がシーズンに入ることに出ていました。 昨年、彼の平均LAは9度であり、彼は唯一の34.6%のフライボールと41を打ちました。7%のグラウンドボールは、彼のBrls/BBE%を7%(150BBEsの全体で151番目)に、彼のBrls/PA%を4.8%(全体で150番目)に制限しました。 これは94.2mph(総合84位)のFB/LDでのEVの方がはるかに優れていたにもかかわらずであった。 今年は、彼が昇格するための協調的な努力をしているように見え、彼の潜在的な力を考えれば、それはブレイクアウトを支えることができます。 今、彼は37.5%のフライボールと41.7%のグラウンドボールを12度の平均LAに打っています。 彼のバレル率が14.6Brls/BBE%と10.3Brls/PA%で上昇したままであれば驚かないでください(そして、順番に、彼の16.7HR/FB%とすることができます。276)。

    したがって、誰がもっと昇格するのか分かっていれば、小麦を籾殻から簡単に分離することができます。

    それは彼らのHH%または平均EVを見ることによってではありません;代わりに、ちょうどFB/LD上の彼らのEVを一目で見てみてください。

    結論

    うまくいけば、人々はStatcastメトリックを適切に使用し始めるでしょう。 ファンタジー野球のアナリストが打者のハード%、HH%、または平均EVを引用してパワーブレイクアウトを示唆している場合は、バレルレートを確認してください。 あなたは彼らがHR/FB%とISOを予測していることを知っています、そして彼らは粘着性があることを知っています。 その後、FB/LDで彼のEVを確認してください。 あなたは彼が上昇を開始した場合、それはパワー部門でより多くを伝えることができ、それはあまりにも周りに固執することを知っています。 Hard%、HH%、平均EVのような指標が最適であると仮定するだけではありません。これは始まりに過ぎません。

    これは始まりに過ぎません。

    ートIIでは、BABIPに対するStatcastメトリックの相対値を確認します。 より多くのためにお楽しみに。

    Justin Paradisによる注目の画像(Twitterの@freshmeatcomm)