インターン生募集 未来のゲームチェンジャーの「やってみよう」をカタチに!データサイエンスのかっこでインターン生募集中

データ分析例

  •  PR 

大学時代の戦績からNFLのドラフト順位を予測してみた

NFL ドラフト アイキャッチ画像
  • 大学時代の戦績からドラフト順位って予測できる?
  • ドラフト順位に影響する項目って何?
  • どうやって予測するの?

と気になりませんか。

本記事では、大学時代の戦績からNFLのドラフト順位を予測するというテーマで、データ分析を行った結果を解説していきます。

  • NFLのドラフトとは
  • 分析に使用したデータ
  • 3つの項目から読み取れた指名巡の傾向

について説明していきますので、ぜひ参考にしてみてください。

\経験豊富なかっこのデータサイエンティストがまとめました!/ なぜデータサイエンスは必要?

NFLのドラフト制度について

NFLのドラフト制度について

NFLのドラフト制度とは、アメリカのアメリカンフットボールのプロリーグにおけるドラフト制度になります。

日本のプロ野球とは違い、高校を卒業してから最低でも3年経っていないと申し込めないため、NFLでのチームに入るためには大学でプレイすることが必須です。

また、大学で優秀な戦績を残すとCombineという身体測定会のようなものに招待され、測定の結果によっても指名の巡位が上下すると言われています。

そこで今回は、以下のデータからドラフトの何巡目で選手が指名されるのかを予測していきます。

  • Combineの結果
  • 大学での戦績

また、アメリカンフットボールはポジションによって戦績や必要とされる身体能力が異なるため、今回は分析者のポジションであるワイド・レシーバーの選手に限定しました。

ワイド・レシーバーとは攻撃を担当する選手のポジションの1つです。主にパスプレイでボールを受け取り、その後ボールを前進させる役割になります。
それではまず、分析の結果について解説していきます。

今回のデータ分析の結果

今回のデータ分析の結果

データ分析の結果、以下の特徴がある選手の方が巡位が高い傾向にあることが分かりました。

  • 大学時代の戦績が良い
  • 40ヤード走のタイムが早い
  • 身長が高い

以上の傾向は何となくでも予想がつくことですが、客観的なデータから導き出されたことに価値があります。

また、ドラフトに指名されている選手が多い大学を調べていると、

  • 1987年以降のドラフト以降、指名選手が多い大学トップ3がフロリダの大学
  • 指名された選手の約10%がフロリダ州の大学出身

であることも把握できました。

しかし、今回の分析ではドラフトで何巡目に選ばれるのかに影響する「決定的」な指標は見つけられませんでした。

以下からは、データ分析の概要や指名巡の傾向について説明していきます。

今回の分析に使用したデータ

今回の分析に利用したデータ

今回、分析で使用したデータは、以下の3サイトからスクレイピングを行って取得したものになります。(2020年9月22日時点)

スクレイピングとはWebサイトやWebページから情報を収集するための技術のことです。スクレイピングを行うプログラムを作ることで自動的にWebページからデータを収集できます。
サイト名 サイトの概要
NFL Combine Results
  • 過去33年分のNFL Combineの結果を記録しているウェブサイト
Sports Reference College Football
  • 大学アメリカンフットボールの1部リーグの選手の戦績が記録されているウェブサイト
  • 一緒に指名された選手は指名巡も載っている
Pro Football Reference (Draft)
  • 過去のNFLドラフトの記録

また、今回はドラフト史上全てのデータではなく、Combineの記録が残っている33年分(1987年から)のデータを使用しています。

以上のサイトから取得したデータ項目は以下の通りです。

  • 大学
  • 指名巡
  • 身長
  • 40ヤード走
  • 最終学年の戦績
    • レシービングヤード数の合計
    • キャッチ毎のレシービングヤード数
  • 大学時代全学年の戦績
    • レシービングヤード数の合計
    • キャッチ毎のレシービングヤード数

それでは、分析内容について解説していきます。

4つの項目から読み取れた指名巡の傾向とは

4つの項目から読み取れた指名巡の傾向とは

今回、指名巡を予測するために、以下の4つの項目について箱ひげ図を作成して傾向を調査しました。

  • 大学の戦績
  • 40ヤード走のタイム
  • 身長
  • ドラフト指名選手の大学の特徴

箱ひげ図について詳しく知りたい方は『箱ひげ図を使うメリット・デメリットや実際の作り方を解説』の記事をご参照ください。

また、補足的な内容として、大学の戦績と40ヤード走のタイムの相関の有無についても分析を行いました。

それでは、それぞれ解説していきます。

①大学の戦績とドラフト指名巡の関係

まず、大学の戦績と指名巡に関係があるのかを箱ひげ図で可視化しました。

大学時代の戦績とドラフト指名巡との関係を可視化した箱ひげ図は下図です。

大学の戦績とドラフト指名巡の関係

上図の箱ひげ図はそれぞれ、

  • 左:大学最終学年の獲得レシービングヤード数
  • 右:大学全学年の獲得レシービングヤード数

となっていて、それぞれワイド・レシーバーの選手の戦績の指標になります。

番号が若い方が指名巡が良く、0は指名されなかった集団です。

上図を見てもらうと、指名された選手の方が戦績が優秀で、指名された選手の中でも巡数が若い方がさらに戦績が優秀であることが分かります。

最終学年の戦績では、指名されなかった選手と1巡で指名された選手の間で、中央値(箱の真ん中の線)に300ヤードほど差があります。
(1試合100ヤード獲得すると「大活躍」であるため、大活躍した試合3つ分の差です。)

8巡、9巡の指名は一時的にドラフト制度に追加されたもので母数が少ないので、1~7巡とは違う傾向になってしまったと考えてください。

②40ヤード走のタイムとドラフト指名巡の関係

40ヤード走という40ヤード(36メートル)を走り切るタイムを測る種目とドラフト指名巡の関係性も見ていきましょう。

40ヤード走は、アメフトで重要視される「加速力」を見れる種目であることから、指名巡との関係があると仮定しました。

40ヤード走のタイムとドラフト指名巡の関係を表した箱ひげ図は下図の通りです。

40ヤード走のタイムとドラフト指名巡の関係

先ほどと同じように、x軸の数字が巡数で、0は指名されなかった選手です。

y軸の数字が秒数であり、指名されなかった選手と1巡目に指名された選手では中央値に0.1秒程の差があります。

0.1秒と聞くとわずかな数値に聞こえますが、実際の距離に直すと1メートルほどの差がつくので、ドラフトの巡数にも影響しているのです。

③身長とドラフト指名巡の関係

さらに、身長と指名巡の関係性について分析していきます。

日本に今までNFL選手になれた人がいない理由として身体的な違いが考えられており、身長はアメリカ人の方が明らかに高いため、関係性があると仮定しました。

身長とドラフト指名巡の関係を可視化した箱ひげ図は下図です。

身長とドラフト指名巡の関係

上図の箱ひげ図では、指名巡間で大きな差はないものの、それぞれの箱ひげ図の中央値が「72~74 インチ(177~183センチメートル)」内に入っています。

そのため、ドラフトで指名されるには、身長が177~183センチメートルほど必要になる可能性が高いと言えるでしょう。

なので、身長は高ければ高いほど指名されやすいわけではなく、しきい値(177~183センチメートル)さえ越えれば指名巡には関係ない可能性があります。

④ドラフト指名選手の大学の特徴

ドラフトに指名された選手の大学の特徴に関しても調査しました。

ドラフトに指名される選手がどの大学であるかを見ることで、出身大学の情報からドラフト候補の選手がドラフトに指名されるかを予測できると考えたためです。

ドラフトに指名された人数が多い大学トップ5を表した棒グラフが下図になります。

ドラフト指名選手の大学の特徴

上図で興味深いのが、大学トップ5のうち、上位3大学がすべてフロリダ州にある大学であることです。

また、ドラフト指名選手の約10%がフロリダ州の大学出身であることも分かりました。

優秀なワイド・レシーバーをNFLに輩出している大学はWRU (Wide Receiver University)と呼ばれますが、過去33年分のデータの調査でフロリダ州の大学こそがWRUであることを見つけられたのです。

補足. 大学の戦績と40ヤード走のタイムの相関の有無

大学の戦績と40ヤード走のタイムを見ると、一見40ヤード走が速ければ大学時代の戦績も良いのではないかという仮説が思い浮かぶでしょう。

分析者が実際にプレイをしていても足が速い人の方が有利であると感じているため、補足として大学の戦績と40ヤード走のタイムとの相関を分析していきます。

大学の戦績と40ヤード走のタイムの相関を見てみましょう。

大学の戦績と40ヤード走のタイムの相関の有無

40ヤード走と大学時代全学年の戦績を用いて散布図を作成し、相関を見える化するために回帰直線を引きました。

「回帰直線ってなに?」と気になる方は『回帰分析とは?基礎知識やできること【10分でできる手順付き】』の記事をご参照ください。

真ん中に引かれている線の傾きが大きいほど相関が強いと言えますが、上図から分かる通り、直線はほとんど傾いていません。

そのため、2つのデータに強い相関は見られないと考えられ、指名巡を予想するにはそれぞれのデータをじっくり見る必要があると言えます。

まとめ

今回は、大学時代の戦績からNFLのドラフト順位を予測するというテーマで、データ分析を行いました。

データ分析の結果、以下の特徴がある選手の方が巡位が高い傾向にあることが分かりました。

  • 大学時代の戦績が良い
  • 40ヤード走のタイムが早い
  • 身長が高い

また、ドラフトに指名されている選手が多い大学を調べることで、

  • 1987年以降のドラフト以降、指名選手が多い大学トップ3がフロリダの大学
  • 指名された選手の約10%がフロリダ州の大学出身

であることも発見できたのです。

ドラフトの指名巡の予測とまではいきませんでしたが、ドラフトに指名されている選手の傾向を読み取れました。

今回の結果は分析をしなくても予想がつくことではありますが、データによって根拠づけられたことに価値があります。

この記事で行ったデータ分析は基礎的な分析ですが、効果的な情報を発見できるので、ぜひこの記事を参考にデータ分析を行ってみてください。

データ分析・データサイエンスの他の活用事例を知りたい方は『データサイエンスの活用事例まとめ|導入事例4選と必要な3つの準備』の記事をご参照ください。

ピックアップ記事

  1. RFM分析とは?優良顧客を見つけるやり方やメリット【例を用いて解説】
  2. 学生をデータサイエンティストに育てる4つのポイント
  3. 多くの人と会話をするきっかけとなる最適な映画をデータサイエンスで選んでみた
  4. 知っておきたいAIの理想と現実
  5. こんなときには異常検知

関連記事

  1. データ分析で防音物件探し

    データ分析例

    データ分析を使って、東急東横線沿線で楽器弾きのための家探しをしてみた

    「楽器の練習をしたいけど、音を出せる場所がない」「楽器演奏ができる…

  2. バレーボール データ分析のアイキャッチ画像

    データ分析例

    データサイエンスでバレーボールチームの戦術を考えてみた

    近年、ビジネス課題を解決するために、データを用いたアプローチがなされる…

  3. 湘南鎌倉エリアの女性向け物件探しをデータサイエンスのチカラでやってみたのアイキャッチ画像

    データ分析例

    湘南鎌倉エリアの女性向け物件探しをデータサイエンスのチカラでやってみた

    家探しの条件ってどうやって決める? 女性の家探しでどこを…

  4. データサイエンス 活用事例

    データ分析例

    データサイエンスの活用事例まとめ|導入事例4選と必要な3つの準備

    「データサイエンスはビジネスでどのように使われているの?」「データ…

  5. 新宿 バイト 時給

    分析

    新宿区でバイトを募集する企業向けに、 参考時給を提⽰し時給の決定を⽀援する

    「新宿でバイトの募集をしたいけど、時給はいくらに設定すべき?」「新…

  6. データ分析で沖縄移住物件探し

    データ分析例

    データで判断! エンジニアの沖縄移住、おすすめエリア

    「引っ越ししたいけど、住みやすい物件はどれだろう?」「物件探しを始…

おすすめ記事

  1. 就活で話すことには困らないかっこのインターンシップ経験!
  2. 日々、巧妙化する不正取引の対策頻度を10倍に向上!「異常検知…
  3. 全力で食らいついたかっこでの1年間
  4. 確率を予測する「ロジスティック回帰」とは
  5. データサイエンスを現場の敵にしないために
  1. 店舗 どこに出す

    分析

    店舗ってどこに出せばいいの?おすすめの出店場所について解説します!
  2. インターン体験記

    文系学生によるかっこのデータサイエンスインターン体験記
  3. 新宿 バイト 時給

    分析

    新宿区でバイトを募集する企業向けに、 参考時給を提⽰し時給の決定を⽀援する
  4. インターン体験記

    研究者を目指すうえでの必要スキルも身に付いた、データサイエンスのビジネス経験
  5. ヒストグラムのアイキャッチ画像

    統計

    ヒストグラムとは?見方やエクセルでの作り方・経営分析の例を解説
PAGE TOP