- 大学時代の戦績からドラフト順位って予測できる?
- ドラフト順位に影響する項目って何?
- どうやって予測するの?
と気になりませんか。
本記事では、大学時代の戦績からNFLのドラフト順位を予測するというテーマで、データ分析を行った結果を解説していきます。
- NFLのドラフトとは
- 分析に使用したデータ
- 3つの項目から読み取れた指名巡の傾向
について説明していきますので、ぜひ参考にしてみてください。
\経験豊富なかっこのデータサイエンティストがまとめました!/
目次
NFLのドラフト制度について
NFLのドラフト制度とは、アメリカのアメリカンフットボールのプロリーグにおけるドラフト制度になります。
日本のプロ野球とは違い、高校を卒業してから最低でも3年経っていないと申し込めないため、NFLでのチームに入るためには大学でプレイすることが必須です。
また、大学で優秀な戦績を残すとCombineという身体測定会のようなものに招待され、測定の結果によっても指名の巡位が上下すると言われています。
そこで今回は、以下のデータからドラフトの何巡目で選手が指名されるのかを予測していきます。
- Combineの結果
- 大学での戦績
また、アメリカンフットボールはポジションによって戦績や必要とされる身体能力が異なるため、今回は分析者のポジションであるワイド・レシーバーの選手に限定しました。
今回のデータ分析の結果
データ分析の結果、以下の特徴がある選手の方が巡位が高い傾向にあることが分かりました。
- 大学時代の戦績が良い
- 40ヤード走のタイムが早い
- 身長が高い
以上の傾向は何となくでも予想がつくことですが、客観的なデータから導き出されたことに価値があります。
また、ドラフトに指名されている選手が多い大学を調べていると、
- 1987年以降のドラフト以降、指名選手が多い大学トップ3がフロリダの大学
- 指名された選手の約10%がフロリダ州の大学出身
であることも把握できました。
しかし、今回の分析ではドラフトで何巡目に選ばれるのかに影響する「決定的」な指標は見つけられませんでした。
以下からは、データ分析の概要や指名巡の傾向について説明していきます。
今回の分析に使用したデータ
今回、分析で使用したデータは、以下の3サイトからスクレイピングを行って取得したものになります。(2020年9月22日時点)
サイト名 | サイトの概要 |
NFL Combine Results |
|
Sports Reference College Football |
|
Pro Football Reference (Draft) |
|
また、今回はドラフト史上全てのデータではなく、Combineの記録が残っている33年分(1987年から)のデータを使用しています。
以上のサイトから取得したデータ項目は以下の通りです。
- 大学
- 指名巡
- 身長
- 40ヤード走
- 最終学年の戦績
- レシービングヤード数の合計
- キャッチ毎のレシービングヤード数
- 大学時代全学年の戦績
- レシービングヤード数の合計
- キャッチ毎のレシービングヤード数
それでは、分析内容について解説していきます。
4つの項目から読み取れた指名巡の傾向とは
今回、指名巡を予測するために、以下の4つの項目について箱ひげ図を作成して傾向を調査しました。
- 大学の戦績
- 40ヤード走のタイム
- 身長
- ドラフト指名選手の大学の特徴
箱ひげ図について詳しく知りたい方は『箱ひげ図を使うメリット・デメリットや実際の作り方を解説』の記事をご参照ください。
また、補足的な内容として、大学の戦績と40ヤード走のタイムの相関の有無についても分析を行いました。
それでは、それぞれ解説していきます。
①大学の戦績とドラフト指名巡の関係
まず、大学の戦績と指名巡に関係があるのかを箱ひげ図で可視化しました。
大学時代の戦績とドラフト指名巡との関係を可視化した箱ひげ図は下図です。
上図の箱ひげ図はそれぞれ、
- 左:大学最終学年の獲得レシービングヤード数
- 右:大学全学年の獲得レシービングヤード数
となっていて、それぞれワイド・レシーバーの選手の戦績の指標になります。
上図を見てもらうと、指名された選手の方が戦績が優秀で、指名された選手の中でも巡数が若い方がさらに戦績が優秀であることが分かります。
最終学年の戦績では、指名されなかった選手と1巡で指名された選手の間で、中央値(箱の真ん中の線)に300ヤードほど差があります。
(1試合100ヤード獲得すると「大活躍」であるため、大活躍した試合3つ分の差です。)
②40ヤード走のタイムとドラフト指名巡の関係
40ヤード走という40ヤード(36メートル)を走り切るタイムを測る種目とドラフト指名巡の関係性も見ていきましょう。
40ヤード走は、アメフトで重要視される「加速力」を見れる種目であることから、指名巡との関係があると仮定しました。
40ヤード走のタイムとドラフト指名巡の関係を表した箱ひげ図は下図の通りです。
y軸の数字が秒数であり、指名されなかった選手と1巡目に指名された選手では中央値に0.1秒程の差があります。
0.1秒と聞くとわずかな数値に聞こえますが、実際の距離に直すと1メートルほどの差がつくので、ドラフトの巡数にも影響しているのです。
③身長とドラフト指名巡の関係
さらに、身長と指名巡の関係性について分析していきます。
日本に今までNFL選手になれた人がいない理由として身体的な違いが考えられており、身長はアメリカ人の方が明らかに高いため、関係性があると仮定しました。
身長とドラフト指名巡の関係を可視化した箱ひげ図は下図です。
上図の箱ひげ図では、指名巡間で大きな差はないものの、それぞれの箱ひげ図の中央値が「72~74 インチ(177~183センチメートル)」内に入っています。
そのため、ドラフトで指名されるには、身長が177~183センチメートルほど必要になる可能性が高いと言えるでしょう。
なので、身長は高ければ高いほど指名されやすいわけではなく、しきい値(177~183センチメートル)さえ越えれば指名巡には関係ない可能性があります。
④ドラフト指名選手の大学の特徴
ドラフトに指名された選手の大学の特徴に関しても調査しました。
ドラフトに指名される選手がどの大学であるかを見ることで、出身大学の情報からドラフト候補の選手がドラフトに指名されるかを予測できると考えたためです。
ドラフトに指名された人数が多い大学トップ5を表した棒グラフが下図になります。
上図で興味深いのが、大学トップ5のうち、上位3大学がすべてフロリダ州にある大学であることです。
また、ドラフト指名選手の約10%がフロリダ州の大学出身であることも分かりました。
優秀なワイド・レシーバーをNFLに輩出している大学はWRU (Wide Receiver University)と呼ばれますが、過去33年分のデータの調査でフロリダ州の大学こそがWRUであることを見つけられたのです。
補足. 大学の戦績と40ヤード走のタイムの相関の有無
大学の戦績と40ヤード走のタイムを見ると、一見40ヤード走が速ければ大学時代の戦績も良いのではないかという仮説が思い浮かぶでしょう。
分析者が実際にプレイをしていても足が速い人の方が有利であると感じているため、補足として大学の戦績と40ヤード走のタイムとの相関を分析していきます。
大学の戦績と40ヤード走のタイムの相関を見てみましょう。
40ヤード走と大学時代全学年の戦績を用いて散布図を作成し、相関を見える化するために回帰直線を引きました。
「回帰直線ってなに?」と気になる方は『回帰分析とは?基礎知識やできること【10分でできる手順付き】』の記事をご参照ください。
真ん中に引かれている線の傾きが大きいほど相関が強いと言えますが、上図から分かる通り、直線はほとんど傾いていません。
そのため、2つのデータに強い相関は見られないと考えられ、指名巡を予想するにはそれぞれのデータをじっくり見る必要があると言えます。
まとめ
今回は、大学時代の戦績からNFLのドラフト順位を予測するというテーマで、データ分析を行いました。
データ分析の結果、以下の特徴がある選手の方が巡位が高い傾向にあることが分かりました。
- 大学時代の戦績が良い
- 40ヤード走のタイムが早い
- 身長が高い
また、ドラフトに指名されている選手が多い大学を調べることで、
- 1987年以降のドラフト以降、指名選手が多い大学トップ3がフロリダの大学
- 指名された選手の約10%がフロリダ州の大学出身
であることも発見できたのです。
ドラフトの指名巡の予測とまではいきませんでしたが、ドラフトに指名されている選手の傾向を読み取れました。
今回の結果は分析をしなくても予想がつくことではありますが、データによって根拠づけられたことに価値があります。
この記事で行ったデータ分析は基礎的な分析ですが、効果的な情報を発見できるので、ぜひこの記事を参考にデータ分析を行ってみてください。
データ分析・データサイエンスの他の活用事例を知りたい方は『データサイエンスの活用事例まとめ|導入事例4選と必要な3つの準備』の記事をご参照ください。