大阪とかで働くスタッツ厨

バスケットボールのスタッツとかが好きな人。 Run and gunが大好きなサンズファン。 懐古厨。

スポーツアナリストは三角形の夢を見るか

aoiです。

就職してからというもの,

「休日なにしてるの?」

と訊かれることが物凄く多いんですが,なんて答えるのが正解なのか未だに分かりません。

一度,「アニメ観てます。」と言ったら変な空気になりました。泣きました。

まあ,「旅行してます。」「映画みてます。」あたりがTHE無難なんですが,実際していないので突っ込まれると何も答えられ無くて詰みます。

「バスケしてます。」もかなり無難なんですが,バスケの知名度の低さが相まって会話が続かないことが多々あります。

話題のコンテンツ力という点においては,サッカー・野球にバスケはまだまだ遠く及ばないことを痛感する日々です。。。

 

スポーツへ統計学を持ち込んだのは野球がその嚆矢となっていることは有名です。

いわゆるセイバーメトリクスと言われるものですが,その中に"ピタゴラス勝率"(Pythagorean Expectation)と呼ばれる概念があります。

本稿ではピタゴラス勝率について解説していきたいと思います。

 

 

 

 

ピタゴラス勝率(Pythagorean Expectation)とはBill Jamesによって考案されたスポーツチームの勝率の予測値です。

コンセプト自体は単純で「チームの総得点と総失点からそのチームの勝率を予測する」

というものです。

公式は以下の通り。

What is Pythagorean Expectation? Definition from SportingCharts.com

 

{\displaystyle \hat{p} = \left(\frac{runs scored^2}{runs scored^2+runs allowed^2}\right)} \tag{1}

 

これが有名な三平方の定理ピタゴラスの定理)に似ているのでピタゴラス勝率と呼ばれるようです。

http://www.ncsm.city.nagoya.jp/exhibit_files/output/S424-pic1-jp.jpg

簡単な式ですが,これが案外精度よく勝率を予測することで知られています。

ピタゴラス勝率を計算するサイトなんかもあったりします。

vrcard.us

上記の式は野球についての式なので一般的に書くと以下の様になります。 

 

{\displaystyle \hat{p} = \left(\frac{Tm^δ}{Tm^δ-Opp^δ}\right)(×100)} \tag{2}

{\displaystyle \hat{p}} = 勝率

Tm = 総得点

Opp =  総失点

δ = 指数

 

  • バスケットボールへの応用

実際の推定値の導出には,(2)式のパラメータδを求める必要性があります。

あのTS%を考案したDaryl Moreyによってδ = 13.91が提案されています。

また,PER*1を考案したJohn Hollinger によってδ = 16.5も提案されています。

 

  • [検証] 16-17シーズン

では,このピタゴラス勝率を実際に計算してみます。

データはいつものBasketball-Reference.comBasketballnavi.DBからです。

まず,先人たちのパラメータについて検証したいと思います。

16-17シーズンの各チームの総得点・総失点・勝率はかなり容易に入手できるデータだったので,実際にパラメータδを求めてみたいと思います。

(2)式ですと,総得点と総失点で2変数なので,{\displaystyle R = \left(\frac{Tm}{Opp}\right)}として1変数にします。

 

{\displaystyle \hat{p} = \left(\frac{R^δ}{1+R^δ}\right)} \tag{3}

 

予測誤差関数はここでは,平均絶対誤差を用います。*2

平均絶対誤差とは(4)式の誤差関数です。

{\displaystyle E = \frac{1}{n}\sum_{i=0}^n |\hat{p}_i-x_i|} \tag{4}

 

このEを最小化するδを求めます。

 

Bリーグの場合

Bリーグでは,計算の結果δ = 9.89となりました。

f:id:hoops_stats:20171125230419p:plain

 

縦軸は勝率,横軸はR( = 総得点/総失点)

各プロットは昨年のB1リーグの各チーム。凡例はパラメータδの値

 

データから推定したδ = 9.89(赤線)が最も当てはまりが良いのは当然ですが,先行事例の当てはまりがあまりよくありません。

 

 NBAの場合

 NBAではδ = 14.05となりました。

Moreyの推定値にかなり近い値となりました。

f:id:hoops_stats:20171125231207p:plain

 

先行事例ではNBAを対象としていただけあって,Hollingerの推定値も思いのほか当てはまりが良いように見えます。

また,Bリーグよりも各チームのばらつきが少なく,実力格差はNBAのほうが小さいように思えます。

 

次なる疑問は各チームについての精度ですね。

いくつかのNBAチームについて見てみましょう。

 

GSW

f:id:hoops_stats:20171125232914p:plain

縦軸:勝率,横軸:ゲーム数(レギュラーシーズン)

赤線:実際の勝率(勝ち数/ゲーム数),青線:推定値

 

GSWの場合は凄いですね。大体30試合目程度で推定値がほぼ実際の勝率に収斂しました。シーズン通してでは0.1%の誤差でした。出来過ぎな気もしますが。

 

CLE

f:id:hoops_stats:20171125233456p:plain

GSWの場合と比べると大分乖離しています。

30試合目の予測値は72~3%でしたが,徐々に勝率を下げていき結局は10%程下振れました。

主力選手の怪我やトレード等々要因は膨大ですが,得点だけからなされる予測としてはそれほど悪くないのではないでしょうか。

 

HOU

昨年躍進したHOUについても見てみましょう。

f:id:hoops_stats:20171125234057p:plain

GSWと同様に,30試合目前後で推定値が収斂していく様子が分かります。

 

SAS

なんとなくSASについても見てみます。

f:id:hoops_stats:20171125234304p:plain

SASの場合は40試合目程度で乖離が小さくなってきます。

推定値と実際の勝率が前半戦で大きく乖離しているのは接戦勝ち&大負けが重なった結果でしょう。

 

PHO

さて,我らがPHOですが,

f:id:hoops_stats:20171125234845p:plain

・・・・・・うん,知ってた。ツライ。

がんばろう。

 

まとめ

NBABリーグではピタゴラス勝率のパラメータの値が異なるようです。

パラメータδは得失点の比について変動するので,リーグ内での実力格差を測る指標に流用できるかもしれません。

また,チームによってはレギュラーシーズン前半までに推定値と実際の勝率がかなり収斂しシーズンを終える傾向が認められました。全てのチームについて確認した訳ではありませんが,得点と失点という簡易な指標からある程度の精度で予測できる点について,一定の有用性が認められたと思います。

 

  • [予測] 17-18シーズン

さて,前節で求めたδを用いて今シーズンのチームについて見てみましょう。

今日の時点で東西それぞれ上位3位までのチームについて表を作成しました。

 

EAST

BOS

f:id:hoops_stats:20171125235152p:plain

11月25日(日本時間)時点で20試合を消化しています。

現時点の勝率では85%(‼)

いやーつよいですよね。あんなに面白いようにパスが回るバスケットは見ていて楽しいです。

推定値は約75%。

昨シーズンの例を踏まえると,怪我人などアクシデントが無ければ,シーズン終了時には75%-80%の勝率に落ち着くのではないでしょうか。

 

DET

f:id:hoops_stats:20171125235610p:plain

すみません,あんまりNBA見てなくてピストンズが2位なの知りませんでした(汗)

2004年ごろのビラップス・ベン&ラシードウォレス・ハミルトン・プリンス時代はとても好きだったんですけどね。*3

特にBig benはかっこよかった。リバウンド職人感に溢れていたし,そんなに大きいわけでもないのにシャックをブロックしたり飛び込みでボールを攫って行く姿がたまらなく好きでした。(何の話)

ラシードなんかも大好きで,ディフェンス巧いくせに,高打点の3pも打てたりして憧れの選手だったりしましたね。歩くテクニカルファールなんてあだ名もよかったし,一番はバッシュが確か普通のエアフォースであんな靴でよくあんなプレー出来んな!!とか思ってました。(何の話)

脱線しましたが,今シーズンはこのままいけば60%前後で落ち着くのではないでしょうか。(やっつけ)

 

CLE

f:id:hoops_stats:20171126002135p:plain

 正直読めないですよね。

というのも,先日レブロンが狂気じみたスタッツ叩き出していましたが,レブロンの意向次第っていうのがかなりあると思います。

それに加えてアービングの移籍やローズの去就などコート外の話題が多いのでなかなか予測は困難かと思います。

昨年は徐々に勝率を下げていっての勝率62%でした。

今シーズンは良くて60~65%といったところでしょうか。

 

WEST

HOU

f:id:hoops_stats:20171126002151p:plain

強いですよね。そりゃ去年のHOUにCP入れりゃ強いですよね。

こないだのサンズ戦観てて思いましたけど,ハーデンの1on1でまず止められないし(ブッカーもDFよくやってたとは思います)ドライブ~キック~3pの流れも鉄板だし,何よりCPへのハイピックが無理ゲーすぎる。

愚痴はこれくらいにしますが,推定値等を見る限り,トラブル等無ければ75%くらいになるんではないでしょうか。

GSW

f:id:hoops_stats:20171126004330p:plain

 昨年の強さに比して今シーズンは出足躓いた印象がありましたが,しっかり戻してきているあたり流石としか言いようがありません。

現在までほとんど推定値が実際を上回っている状態は珍しいですが,このままいけば75%~程度になるのではないでしょうか。

 

SAS

f:id:hoops_stats:20171126004653p:plain

 スパーズもしぶといですよね。

今年はダメだろって5・6年くらい言っている気がします。いやもっとか。

サンズファンとしてはナッシュがボウエンにやられたりなど,(かつては)因縁のあるチームでしたが,近年全く相手にされないのでもうライバルなんて言える相手ではありませんでした。

問題はチームの高齢化だと思います。何年も言われている事ですけど。

ポポヴィッチのこともありますし,おそらく60%程度の勝率をマークするのではないでしょうか。

 

番外編

PHO

f:id:hoops_stats:20171126005616p:plain

いやーしんどいですね。厳しい。

ルーキーのジョシュ・ジャクソンなんかとてもいい選手だと思うんですけどね。

DFも頑張るし,身体能力高いですし。シュートフォームが独特なので吉と出るか凶と出るかが問題だと思います。

身内でごたごたやってたりうまく組織がガバナンスされていないんでしょうか。

レイオフ出られたらいいですね(遠い目)。

 

  • まとめ

以上,バスケットボールについてのピタゴラス勝率の応用に関してでした。

何度も申上げましたが,ピタゴラス勝率の魅力は得点と失点という単純な数字から勝率を予測しえるという点にあると思います。

本稿では「なぜピタゴラス勝率は(ある程度の精度で)勝率を予測できるのか」については触れませんでした。これについては私の理解がまだ十分でない点が多々ありますので割愛させて頂きました。また追って記事にしたいと思います。

それでは。

 

 

 

*1:Player Efficiency Rating:プレイヤーのパフォーマンス尺度の一つ

*2:二乗誤差でもいいとは思うのですが,精度が良くなかったので止めました。

*3:いわゆる懐古厨です