topics

大学時代の成績からNFLのドラフト順位を予測してみた

かっこ株式会社のデータサイエンス事業部でインターンをしながら、アメリカンフットボールのプロを目指している熊田柊太と申します。
アメリカでプロを目指す自分が、ドラフト指名されるにはどの程度の成績を残さなければいけないのかを知りたい、という思いがあって、今回はインターンの入社課題として僕が取組んだ分析について、お話ししようと思います。

NFLのドラフト制度について

アメリカのアメリカンフットボールのプロリーグ、NFLには、日本のプロ野球同様、ドラフト制度が存在します。
しかし、日本のプロ野球とは違い、NFLのドラフトに申し込むには、高校を卒業してから最低でも3年経っていなければいけなく、結果的に大学でプレイすることが必須となっています。
また、大学で優秀な成績を残すと、Combineに招待されます。Combineとは身体測定会のようなもので、ここでの結果によって指名の順位が上下するとも言われています。

そこで、Combineに招待された選手のCombineの結果と大学の結果を集め、それを分析することにより、何巡目で指名されるのか予測できるのではないかと考えました。

アメリカンフットボールはポジションによって成績や必要とされる身体能力が大幅に異なるため、今回は自分がプレイしているワイド・レシーバー(以下WR)というポジションに限定しました。これ以降の情報は全てWRに関する分析であることをご了承ください。

結果

1987年以降のドラフトでは、指名された選手が多い大学のトップ3が全てフロリダの大学(フロリダ大学・フロリダ州立大学・マイアミ大学)である。
割合にすると指名された選手の約10%がフロリダ州の大学出身であった。

大学時代の戦績・成績が良いほど、指名の巡位は高く、指名されやすい

指名の巡位を決める決定的な要素などは見当たらなかった

情報源について

3つのサイトを使用:

スクレーピングを行ったのが2020年9月22日であったため、データはその時点のものを使用しています。また、ドラフト史上全てのデータではなく、Combineの記録が残っている33年分(1987年から)のデータを使用しています。

上記のサイトから取得した一部の情報が下記の通りです:

  • 大学
  • 指名巡
  • 身長
  • 40ヤード走
  • 最終学年の戦績
    • レシービングヤード数の合計・キャッチ毎のレシービングヤード数
  • 大学時代全学年の戦績
    • レシービングヤード数の合計・キャッチ毎のレシービングヤード数

取得したデータの傾向(考察)

ある集団の傾向を、その他集団の傾向と比較する時には箱髭図がとても有効です。
一般的に指名巡に影響があると言われる大学の戦績、40ヤード走、身長に関する箱髭図を作ってみました。

上記のグラフは左から順に、大学最終学年の獲得レシービングヤード数と大学全学年の獲得レシービングヤード数です。
簡単に言い換えると、左のグラフはドラフトが開催される直前の年の成績、右のグラフは大学時代全ての成績を表した物です。
見方として、「ボックスが上にあるほど優秀」と捉えていただいて結構です。
また、X軸の数字が巡数で、0は指名されなかった集団です。
Y軸の数字が獲得ヤード数(単位はヤード)です。

こう見ると、一目瞭然で、やはり指名された選手の方が成績が優秀で、指名された選手の中でも巡数が若い集団の方が優秀です。
最終学年の成績に関して、指名されなかった集団と1巡で指名された集団の間で、中央値に300ヤードほど差がありますね。
一般的に1試合100ヤード獲得すると「大活躍」と称賛されるため、大活躍した試合3つ分の差があります。
中央値だけ比較するとデータサイエンティストのみなさんから怒られますが、記事が長くなりすぎると僕が上司に怒られるので割愛します。
8巡、9巡の指名は、一時的にドラフト制度に追加されたもので、母数が少なく、1~7巡とは違う傾向がありますが、ここでは注目せずにいきます。

次に40ヤード走は、40ヤード(36メートル)を走り切るタイムを測る種目です。
この種目は、アメフトで重要視される「加速力」を定量化していると言われています。
X軸の数字が巡数で、0は指名されなかった集団です。
Y軸の数字が秒数です。明らかに指名された人たちの方が早いですね。
指名されなかった人たちと、1巡目に指名された選手では中央値に0.1秒程の差があります。0.1秒と聞くとわずかな数値に聞こえますが、これを実際の距離に直すと1メートルほどの差がつきます。
敵と距離をとってタックルを回避したり、ボールをキャッチするWRにとってこの1メートルは偉大です。それがドラフトの巡数にも反映されているのがわかります。

余談
上位二つの大学時代の成績と40ヤード走のタイムを見ると、一見40ヤード走が速ければ大学時代の成績も良いのではないか?なんて思ったりするのではないでしょうか。僕はそう思いましたし、実際にプレイをしていて足が速い人の方が有利であると感じます。ですが、二つのデータの相関を散布図でみてみましょう。

40ヤード走と大学時代全学年の成績を用いて作図しました。真ん中に引かれている線の傾きが大きいほど、相関が強いと言えます。僕の仮説の場合、左肩上がりの線が見れたら立証されたのですが、グラフから分かる通りほとんど傾きがありません。
このように、二つのデータに強い相関はみられないため、指名巡を予想するにはそれぞれのデータをじっくりみなければいけないことが分かります。

最後に身長の箱髭図を紹介します。
いまだに日本人でNFL選手になれた人がいない理由として、身体的特徴がよく挙げられます。特に身長はアメリカ人の方が明らかに高いと言われています。
上記の箱髭図では、指名巡間で大きな差はないものの、それぞれの中央値が72~74 インチ内に入っていることがポイントです。
72~74インチはセンチメートルに直すと183~188センチメートル。やはり大きいです。
上記の図から、身長は高ければ高いほど指名されやすいということではなく、閾値(70〜72インチ、177~183センチメートル)さえ越えれば指名巡には関係ないものと思われます。

最後の最後に、箱髭図ではないのですが、興味深かった情報を紹介します。
上記の棒グラフは、大学ごとに指名された人数が多いトップ5を表示しています。興味深いのが、トップ5のうち、3つの学校がフロリダ州にある大学であることです。アメリカの大学アメリカンフットボール界隈では、優秀なWRをNFLに輩出している大学のことをWRU (Wide Receiver University)なんて言います。それぞれの大学が自らWRUと名乗りますが、過去33年分のデータを見ると、フロリダ州の大学こそがWRUであることがわかります。

まとめ

1987年以降のドラフトでは、指名された選手が多い大学のトップ3が全てフロリダの大学(フロリダ大学・フロリダ州立大学・マイアミ大学)である。
割合にすると指名された選手の約10%がフロリダ州の大学出身であった。

大学時代の戦績・成績が良いほど、指名の順位は高く、指名されやすい。

指名の順位を決める決定的な要素などは見当たらなかった。

結果、大学の戦績やコンバインの成績がよければ早く指名される、ということが分析によって明らかになりました。
分析をしなくてもなんとなく予想がつくことではありましたが、改めてデータによって根拠づけられたことに価値があると思います。
みなさんも今後NFLを目指すようでしたら上記のデータを参考にしてみてください。

かっこでは、データ分析を通じて仮説の確からしさを明らかにしたり、判断材料を抽出したりするお手伝いをしています。
データに基づく判断材料が必要なときには、ぜひ、かっこのデータサイエンスまでお問い合わせください。

ピックアップ記事

  1. 優良顧客を見つける「RFM分析」の考え方と使い方
  2. 知っておきたいAIの理想と現実
  3. 多くの人と会話をするきっかけとなる最適な映画をデータサイエンスで選んでみた
  4. こんなときには異常検知
  5. 学生をデータサイエンティストに育てる4つのポイント

関連記事

  1. topics

    大阪のホテル相場は1泊4500円。条件の違いで相場がどれだけ変わるのか見える化してみた

    旅行の計画を立てるとき、ホテルのプラン選びで悩む人は多いのではないでし…

  2. topics

    湘南鎌倉エリアの女性向け物件探しをデータサイエンスのチカラでやってみた

    近頃データサイエンスというワードを耳にすることも増えてきたと思いますが…

  3. topics

    データで判断! エンジニアの沖縄移住、おすすめエリア

    かっこ株式会社のデータサイエンス事業部でインターンをしている長峯です。…

  4. topics

    データ分析を使って、東急東横線沿線で楽器弾きのための家探しをしてみた

     楽器演奏を趣味とする人にとって物件探しは骨の折れ…

  5. topics

    多くの人と会話をするきっかけとなる最適な映画をデータサイエンスで選んでみた

    「コロナのせいで外出できないし、家で出来ることないかな」おうち時間…

カテゴリー

おすすめ記事

  1. 確率を予測する「ロジスティック回帰」とは
  2. データサイエンスを現場の敵にしないために
  3. 優良顧客を見つける「RFM分析」の考え方と使い方
  4. 箱ひげ図 について超カンタンに解説してみた
  5. 知っておきたいAIの理想と現実
  1. 最適化

    人間の経験と勘を越える「数理最適化」で、製造業の生産計画から、ひとを解放したお話…
  2. topics

    大学時代の成績からNFLのドラフト順位を予測してみた
  3. 統計

    利益爆増のためのアクションを発見!「カイ二乗検定」の可能性とは
  4. internship

    研究者を目指すうえでの必要スキルも身に付いた、データサイエンスのビジネス経験
  5. 統計

    データの関係性がパッと見でわかる「散布図」
PAGE TOP