近年、ビジネス課題を解決するために、データを用いたアプローチがなされることが多くなってきています。
データ分析の需要が高まっていることに関連して、今回は「データに基づいてバレーボールチームの戦術を考える」という身近なテーマでデータ分析による課題解決を行いました。
直接ビジネスに結びつくわけではないですが、本記事を読むことで、データ分析による課題解決の一連の流れを把握できます。
本記事では、
- 【STEP1】勝利に関係する重要な項目を特定する
- 【STEP2】各チームの弱点を見つけ出す
- 【STEP3】各チームの弱点を補強した場合の勝率を予測する
以上の3ステップでバレーボールチームの戦術の改善を行っていきます。
実際のデータをもとに分析を行っておりますので、ぜひ参考にしてみてください。
\経験豊富なかっこのデータサイエンティストがまとめました!/
目次
課題の内容
今回、課題としたのは「データに基づいてバレーボールチームの戦術を考える」です。
チームの勝率を上昇させるなら弱点を改善する方がより良いと考え、今回はチームの弱点の発見・補強を行うためのデータ分析を行っていきます。
そして、今回はバレーボールリーグの最高峰であるイタリアセリエA1男子のデータを用いて、
- Perugia
- Piacenza
- Padova
以上の3チームについて、実際に戦術を考えていきます。
結論
結論、各チームが弱点を改善するためには以下のような戦術を取るべきであると、データ分析の結果から導かれました。
チーム名 | 弱点改善のための戦術 |
Perugia | 弱点がないため現状維持 |
Piacenza |
|
Padova |
|
また、もし各チームが以上の戦術を取り入れ、実際にプレーを改善した場合、
- Piacenza:15%UP
- Padova:27%
の勝率上昇が予測できました。
このように、データ分析の結果から効果がありそうな戦術が考えることで、勝率の改善を行えるのです。
以下では、どのようにして今回のような戦術にたどり着いたのか、分析の過程を解説していきます。
分析で使用したデータ
今回の分析に使用したデータは、イタリアリーグの公式サイトからスクレイピングで抽出した「試合の各セットにおける勝敗と各プレー成績過去5年分(2017~2021年)」です(2022/3/25時点)。
今回の分析では、イタリアのプロバレーボールリーグであるセリエA1男子のデータを用いたため、以下で行う分析は全てイタリアのリーグ内での話になります。
実際に取得したデータの項目は以下の通りです。
- 勝敗(勝利→1、敗北→0)
- サービスエース率(%)
- サーブミス率(%)
- レセプションミス率(%)
- レセプション成功率(%)
- レセプション完全成功率(セッターがほとんど動かなくてよい返球の割合)(%)
- アタックミス数(本)
- (アタック)被ブロック数(本)
- アタック得点数(本)
- アタック得点率(%)
- ブロック得点数(本)
抽出したデータのうち、5セット目とデュースになったセットのデータを除いて、2356件のデータを分析に用いました。
また、2021/2022シーズンのセリエA1所属チームの表が以下になります。
チーム別の分析は、表で色がついているPerugia, Piacenza, Padovaの順位帯別の3チームで行います。
※5セット目は15点マッチであり、デュースになったセットは25点を超えてしまいます。
データの各項目を可視化【分析のための準備】
分析を行う前に、各項目の分布を確認しておきます。
なぜなら、分析を行う前に各項目の勝敗による違いを可視化しておくことで、データに対する理解が深まるからです。
今回は、各項目について、勝利セット(オレンジ色)と敗北セット(水色)の分布をヒストグラムで表し、赤線で各階級における勝率を示しました。
「ヒストグラムの作り方を知りたい」という方は『ヒストグラムとは?見方やエクセルでの作り方・経営分析の例を解説』の記事をご参照ください。
上図のように可視化した結果、
- 得点に関する項目(サービスエース率など)は、値が大きくなるほど勝率が高くなる
- 失点に関する項目(サーブミス率など)は、値が大きくなるほど勝率が低くなる
という傾向が読み取れました。
以上のような傾向はデータを可視化しなくても予想がつくことですが、データ分析を行う際に可視化は大事な作業なので、必ず行いましょう。
分析の概要
それでは、分析の概要を説明していきます。
今回は、以下の3ステップでバレーボールの戦術を考えることとしました。
- 【STEP1】勝利に関係する重要な項目を特定する
- 【STEP2】各チームの弱点を見つけ出す
- 【STEP3】各チームの弱点を補強した場合の勝率を予測する
それぞれのステップについて、解説していきます。
【STEP1】勝利に関係する重要な項目を特定する
まず、バレーボールの戦術を立てる上で重要な、勝利のために重視しなければならない項目を特定していきます。
なぜなら、勝利のために重要視すべき項目が分からなければ、どこから戦術を改善していけばよいか分からないからです。
勝利に関係する重要な項目を特定するために、以下の2つのことを行いました。
- ロジスティック回帰で勝率を予測するモデルを作成する
- ロジスティック回帰の各項目の偏回帰係数から重要な項目を特定する
それぞれ解説していきます。
ロジスティック回帰で勝率を予測するモデルを作成する
勝利に関係する重要な項目を特定するために、まずはロジスティック回帰分析を用いて勝率を予測するモデル(式)を作成しました。
ロジスティック回帰分析とは、ある事象が起こる確率(ここでは勝利する確率)を予測できる分析手法であり、分析の結果からどの項目が予測に大きく関係したのかを知れます。
ロジスティック回帰分析について詳しく知りたい方は『ロジスティック回帰分析とは?使える場面や実装まで徹底解説!』の記事をご参照ください。
今回は、10個の変数(項目)を標準化(単位を揃える)してから、ロジスティック回帰分析で勝敗を予測するモデルを考えました。
実際にロジスティック回帰分析を行った結果、ロジスティック回帰による予測の精度は0.877となり、実際の勝敗と比較して87.7%一致したと言えます。
そして、勝利に重要な項目を調べるという分析の目的から考え、約9割の精度は十分なものであると判断しました。
ロジスティック回帰の各項目の偏回帰係数から重要な項目を特定する
ある程度モデルの妥当性が確保できたところで、勝利に関係する重要な項目を特定していきます。
以下の表は、モデルの各統計量を、偏回帰係数の絶対値の降順(重要度が高い順)でソートしたものです。
上図の表は以下のように色分けされています。
- 灰色:偏回帰係数が有意にならなかった項目
- オレンジ色:有意になった項目のうち得点に関わる項目
- 水色:有意になった項目のうち失点に関わる項目
実際に表を見ていくと、オレンジ色の項目が重要度の上位に並んでいるため、勝利には得点するための力が重要であることが分かります。
また、有意にならなかった項目を見てみると、レセプションの成功率は勝敗にあまり関係しないことがわかります。
以上の分析によって、どの項目が重要でどの項目が重要でないかを掴めました。
【STEP2】各チームの弱点を見つけ出す
STEP2では、実際に各チームのデータからチームの弱点を調べます。
以下の流れで各チームの弱点を見つけていきます。
- 勝利するために必要な基準(勝利基準)を各項目で設定する
- 勝利基準(基準達成率)から各チームの弱点を見つけ出す
それぞれ解説していきます。
勝利するために必要な基準(勝利基準)を各項目で設定する
まず、勝利するために必要な基準(勝利基準)を各項目で設定することから始めます。
なぜなら、基準を設けなければ、それぞれのチームの各項目が弱点であるか比較できなくなるからです。
『データの各項目を可視化』の章で求めた各項目についてのグラフから、勝率が60%となる時点での各項目の値を求め、勝利基準として以下の表にまとめました。
上図の勝利基準と、各チームの成績を以下の章で比較していきます。
※基準達成率(%) = 100 × チーム平均 / 勝利基準
勝利基準(基準達成率)から各チームの弱点を見つけ出す
それでは、勝利基準(基準達成率)から各チームの弱点を見つけ出していきます。
下図のグラフは、イタリアリーグの3チームの2021/2022シーズンの成績を「基準達成率」で表したものです。(グラフ中の赤線は基準達成率100%を示しています。)
先ほどのロジスティック回帰分析から特定した重要な項目も踏まえた上で、各チームの基準達成率を確認していきます。
まず、該当シーズンの各チームの成績は以下の通りです。
- Perugia(濃い青色):リーグ1位
- Piacenza(水色):リーグ6位
- Padova(薄い青色):リーグ11位
Perugiaは2021/2022シーズンでリーグ1位の成績の強豪チームであり、ほとんどの項目が勝利基準付近にあり、勝利基準から離れていたとしても他のチームと比べて悪い項目はありません。
Piacenzaは2021/2022シーズンでリーグ6位とまずまずの成績ですが、サービスエース率・ブロック得点数が低く、被ブロック数も多いです。
そのため、Piacenzaの弱点は、
- サービスエース率
- ブロック得点数
- 被ブロック数
の3つであることが考えられます。
また、Padovaは2021/2022シーズンでリーグ11位とあまり良い成績ではなく、サービスエース率がかなり高いものの、サーブミス率も同様に高いことが読み取れます。
加えて、ブロック得点数が低く、アタックミス数が多いため、Padovaの弱点は、
- サーブミス率
- ブロック得点数
- アタックミス数
の3つであると言えます。
以上のように、勝利基準を決めておくことで、各チームの弱点を簡単に発見できました。
【STEP3】各チームの弱点を補強した場合の勝率を予測する
それでは、各チームの弱点を補強した場合、勝率がどのように変化するのかを予測してみましょう。
今回の分析で作成したロジスティック回帰モデルを用いて、弱点となった項目の値を改善したと仮定して、勝率をもう1度予測します。
弱点が見つかったPiacenza(6位)とPadova(11位)の2チームについて2021/2022シーズンのデータを用いて、弱点を改善した後の勝率予測を計算した結果が下図の通りです。
Piacenzaは、弱点である「サービスエース率・ブロック得点数・被ブロック数」を1本ずつ改善してみた結果、勝率は約67%となり、勝率15%アップが予測されました。
Padovaでも、見つかった弱点の「ブロック得点数・サーブミス率・アタックミス数」を1本ずつ改善することで、勝率は約61%となり、勝率が27%もアップすると予測されたのです。
このことから、勝率は「弱点のプレーをたった1本ずつ改善するだけでも、大きく上がる」のではないかと考えられます。
実際のプレー構造はより複雑ですし、モデルの精度などいろいろな問題があるため、弱点を補強して同様の勝率が得られるとは言い切れません。
しかし、補強すべき弱点を明確にし「サービスエース数を増やすためにジャンプサーブを打つ選手を増やそう」などの具体的なアクションに繋げられるので、今回の分析は意味があるものになります。
まとめ
今回は「データに基づいてバレーボールチームの戦術を考える」という身近なテーマでデータ分析を行いました。
今回の分析結果をまとめると以下の通りです。
- 得点に関する項目が勝敗に大きく影響する
- レセプションの成功率は勝敗にあまり影響しない
- 勝利基準とチーム平均を比較することでチームの弱点を発見できる
- 弱点を1本ずつ改善するだけでも、勝率が大きく上昇する可能性がある
また、今回の分析から2チームの弱点を見つけられました。
チーム名 | 発見できた弱点 |
Piacenza |
|
Padova |
|
以上の弱点から、以下のように戦術を立てられます。
チーム名 | 弱点改善のための戦術 |
Piacenza |
|
Padova |
|
今回の分析を通じて、データから得られた情報を具体的なアクションまで繋げるという一連の流れをイメージしていただけたのではないでしょうか。
身近なものからデータ分析を行ってみると、データ分析に対する知識が深まりますので、本記事を参考にしてデータ分析を行ってみてください。
データサイエンスの活用事例をもっと知りたい方は『データサイエンスの活用事例まとめ|導入事例4選と必要な3つの準備』の記事もご参照ください。