Analysis of Center Back in FIFA 23 using Probability

Akinladiko
8 min readNov 5, 2023

--

A Comprehensive Review

Report ini dibuat sebagai tahap akhir dalam final project Probability Course di Pacmann

Introduction

FIFA 23 adalah serial permainan video sepak bola tahunan yang dikembangkan dan dipublikasikan lebih lanjut oleh pengembang asal Amerika, Electronic Arts. Disamping kontroversi yang dituai olehnya, serial game ini terus menjadi primadona bagi gamer karena menjadi salah satu game sepak bola terbaik, khususnya pada konsol dan PC. Tercatat game ini tidak pernah sepi peminat sejak diluncurkan pertama kali pada tahun 1994.

Dalam mekanisme gamenya, FIFA 23 menjalankan simulasi layaknya sepak bola sungguhan. Pemain diharuskan untuk mencetak gol ke gawang lawan sembari mempertahankan gawang sendiri agar tidak kemasukan gol. Untuk itu, posisi Center Back memiliki peran yang sangat krusial karena menjadi pengawal terakhir sebelum penjaga gawang. Dengan review ini, penulis berusaha untuk menganalisis berbagai aspek yang ada di pemain Center Back pada game FIFA 23. Harapannya, tulisan singkat ini bisa menjadi informasi tambahan bagi para pemain yang rutin bermain seri game FIFA.

Di analisis ini, penulis menggunakan dataset “FIFA 23 Player Research” yang bersumber pada website Kaggle. Dalam dataset ini, terdapat seluruh informasi berkaitan dengan player yang terdaftar pada game FIFA 23. Informasi player yang tercakup dalam dataset adalah Known As, Full Name, Overall, Potential, Value, Position Played, Best Position, Nationality, Image Link, Age, Height, Weight, TotalStats, BaseStats, Club Name, Wage, Release Clause, Club Position, Contract Until, Club Jersey Number, Joined On, On Loan, Preferred Foot, Weak Foot, Skill Moves, International Reputation, National Team Name, National Team Image Link, National Team Position, National Team Jersey Number, Attacking Work Rate, Defensive Work Rate, dan seluruh stats secara detail.

Tujuan dibuatnya analisis ini adalah sebagai bentuk sukarela dan sekaligus menambah pengetahuan penulis dalam membuat analisis menggunakan probabilitas. Report ini juga bisa menjadi wawasan dan referensi tambahan bagi pembaca yang menggemari seri game ini. Diharapkan pembaca mendapatkan pencerahan dari apa yang dipaparkan melalui tulisan ini.

Research Questions

1. Descriptive Statistic

Statistika deskriptif dibuat sebagai informasi dasar mengenai dataset yang akan diolah. Sebelum itu, dataset difilter menjadi pemain dengan Best Position pada CB

Berapa rata-rata tinggi dan berat dari pemain yang berposisi sebagai Center Back?

Dengan menggunakan fungsi AVERAGE didapatkan hasil berupa rata-rata tinggi dan berat bada dari pemain yang berposisi sebagai Center Back. Menurut perhitungan Excel, didapatkan rata-rata tinggi sebesar 186.44 cm dan rata-rata berat sebesar 79.51 kg

Berapa persebaran gaji yang ada pada pemain berposisi sebagai Center Back dan masuk di Starting XI?

Dengan menggunakan fungsi AVERAGE IF yang menyaring pemain di starting XI, didapat rata-rata gaji dari Center Back yang masuk ke dalam starting lineup ada di angka 10881 Euro. Sedangkan dengan menggunakan fungsi DSTDEV dicari simpangan baku gajinya yang ada di angka 21687 Euro. Hal yang dapat disimpulkan adalah persebaran gaji pemain memiliki gap yang cukup lebar.

Apakah rata-rata gaji pemain yang masuk Starting XI akan lebih tinggi daripada yang tidak?

Dengan menggunakan fungsi DAVERAGE dilihat dan dibandingkan gaji pemain yang masuk starting lineup di klub dan tidak masuk. Rataan gaji pemain yang masuk pada starting ada di angka 10881 Euro dan rataan gaji pemain yang tidak masuk starting ada di angka 6848 Euro. Selisih dari kedua angka ini cukup besar di angka 4033 Euro

Berapa rata-rata growth potential yang kemungkinan akan didapatkan oleh pemain berusia < 25?

Growth Potential didefinisikan sebagai kemungkinan pertumbuhan yang akan terjadi pada pemain di game tersebut. Rumusnya adalah mengurangi kolom Potential dengan Overall Rating. Lalu dengan menggunakan rumus DAVERAGE didapatkan angka sebesar 9.5. Oleh karena itu, pemain yang berusia di bawah 25 tahun memiliki potensi untuk bertumbuh sebesar 9–10 overall rating.

Berapa banyak pemain yang memiliki kontrak paling lama masa berlakunya?

Kontrak terlama didapatkan dengan fungsi MAX dengan tahun 2028. Lalu faktanya, pada posisi Center Back hanya ada 4 pemain yang memiliki kontrak dengan jangka waktu tersebut. Angka ini diperoleh menggunakan rumus COUNTIF

2. Discrete Variable Analysis

Di analisis ini, variabel berfokus pada jenis variabel diskrit. Beberapa diatur hingga didapat conditional probability

Peluang pemain Center Back yang bisa bermain lebih dari 1 posisi

Ada kalanya seorang pemain bisa bermain lebih dari satu posisi. Dalam dataset terdapat 2284 pemain dari 3465 pemain yang hanya mampu bermain menjadi Center Back. Maka dari itu, peluang pemain hanya bermain di posisi Center Back saja adalah 2284/3465 = 0.66. Lalu jika ingin mencari pemain yang bisa bermain lebih dari 1 posisi, maka tinggal mengurangi 1–0.66 = 0.34. Jadi peluang pemain mampu bermain di banyak posisi ada 0.34

Proporsi kaki natural pemain

Meskipun memiliki dua kaki, para pemain biasanya memiliki preferensi tersendiri untuk kenyamanan menendang mereka. Pemain bola biasanya memiliki kaki natural sebelah kanan atau kiri. Pada dataset, pemain natural kaki kiri sebanyak 818 dan pemain natural kaki kanan sebanyak 2647. Jika dibuat proporsi, maka pemain kaki natural kanan memiliki persentase sebesar 76.39 berbanding pemain kaki natural kiri dengan persentase 23.61

Peluang Center Back berkaki kiri natural memiliki Weak Foot Rating minimal 4

Weak Foot Rating artinya seberapa mampu seorang pemain untuk menggunakan kaki yang bukan merupakan kaki naturalnya. Misalnya kemampuan seseorang dalam menggunakan kaki kanan padahal ia berkaki natural kiri. Dengan menggunakan fungsi COUNTIFS, maka didapatkan jumlah pemain kaki natural kiri dan weak foot rating lebih besar sama dengan 4. Oleh karena itu, dengan jumlah pemain kaki natural kiri sebanyak 818, peluang pemain berkaki kiri yang memiliki weak foot rating sebesar minimal 4 adalah 0.04

Peluang pemain tetap di posisi terbaiknya di Center Back saat bermain menjadi Starting XI

Terkadang seorang pemain rela tidak bermain pada posisi terbaiknya, asalkan ia tetap bermain di lapangan. Namun beberapa pemain beruntung bisa memiliki kecocokan antara posisi terbaiknya dengan posisi yang dibutuhkan tim. Pada dataset, terdapat 1389 pemain Center Back yang bermain di posisi tersebut dari 3465 pemain Center Back. Oleh karena itu, peluang seorang Center Back akan bermain sebagai Center Back di starting lineup sebesar 1389/3465 = 0.40

Peluang pemain dengan High Attacking Work Rate, jika diketahui memiliki High Defensive Work Rate

Work Rate menjadi krusial di saat tertentu. Oleh sebab itu pemain dengan work rate yang baik akan memiliki nilai plus tersendiri. Pemain Center Back dengan High Defensive Work Rate pada dataset mencapai 1148 pemain. Namun hanya 77 diantaranya yang memiliki nilai High Attacking Work Rate. Oleh karena itu, peluang pemain High Attacking Work Rate jika ia juga High Defensive Work Rate adalah 77/1148 = 0.067

3. Continuous Variable Analysis

Di analisis ini, variabel berfokus pada jenis variabel kontinu

Proporsi pemain dengan overall rating 71–80

Pada visualisasi data, terlihat bahwa data terdistribusi secara normal. Selanjutnya dicari rata-rata dan standar deviasi untuk mencari distribusi normal pada frekuensi tertentu. Frekuensi diatur pada pemain dengan overall rating di antara 71–80. Menggunakan rumus NORM.DIST, didapatkan proporsi pemain dengan frekuensi tersebut sebesar 20.62%

Berapa kemungkinan pemain dengan overall di bawah 70 mendapatkan gaji di atas 30k euro?

Dengan menggunakan conditional probability, terlebih dahulu dicari peluang mendapatkan gaji di atas 30k Euro. Lalu pada tahap selanjutnya, dicari dengan kondisi pemain dengan maksimal overall 70. Melalui rumus NORM.DIST, didapatkan peluang pemain maksimal overall 70 akan mendapatkan gaji di atas 30k euro sebesar 0.46

4. Variable Correlation

Nilai kovarians dan korelasi dicari untuk melihat pengaruh antara dua variabel atau kolom yang ada pada dataset. Seluruh analisis ini menggunakan fungsi COVARIANS dan CORREL untuk mencari kovarians dan korelasi

Nilai kovarians dan korelasi antara Value pemain dengan Overall Rating

Setelah dianalisis, didapatkan hasil kovarians yaitu 24682867 yang artinya memiliki hubungan positif (berbanding lurus) dan didapatkan hasil korelasi yaitu 0.56 yang artinya memiliki hubungan yang cukup kuat antara 2 variabel. Hal ini cukup masuk akal dikarenakan semakin tingginya overall rating pemain maka akan diikuti oleh nilai pasar yang berlaku pada kontrak pemain tersebut.

Nilai kovarians dan korelasi antara Growth Potential dengan Umur

Setelah dianalisis, didapatkan hasil kovarians yaitu -21 yang artinya memiliki hubungan negatif (berbanding terbalik) dan didapatkan hasil korelasi yaitu -0.87 yang artinya memiliki hubungan yang sangat kuat antara 2 variabel. Hal ini bisa dipahami dikarenakan semakin tua umur pesepakbola maka ia sudah lebih lambat untuk mempelajari hal baru sehingga pertumbuhannya bisa terhambat atau bahkan mundur.

Nilai kovarians dan korelasi antara Reputasi Internasional dengan Gaji Pemain

Setelah dianalisis, didapatkan hasil kovarians yaitu 3639 yang artinya memiliki hubungan positif (berbanding lurus) dan didapatkan hasil korelasi yaitu 0.58 yang artinya memiliki hubungan yang cukup kuat antara 2 variabel. Hal ini wajar dikarenakan reputasi seseorang pasti akan berpengaruh pada strata sosial dan pada akhirnya akan mengalirkan keuntungan baru sehingga pantas untuk digaji mahal.

5. Hypothesis Testing

Hipotesis digunakan untuk melihat suatu dugaan dan apakah dugaan tersebut benar atau terbantahkan.

Rata-rata Overall Rating Center Back mirip dengan rata-rata Overall seluruh pemain

Hipotesis nol yang dirumuskan adalah rataan overall rating Center Back mirip dengan rata-rata overall seluruh pemain. Sedangkan hipotesis alternatif yang dirumuskan adalah rataan overall rating Center Back berbeda dengan rata-rata overall seluruh pemain. Ketika diuji menggunakan 2 tail test, z-test dan derajat kepercayaan sebesar 0.05 maka keputusan yang diambil adalah menerima H0 dan menolak H1. Maka kesimpulannya adalah rata-rata overall Center Back mirip dengan seluruh rataan overall pemain

Apakah terdapat perbedaan antara rata-rata tinggi badan Center Back dengan gaji di bawah 30k dengan minimal 30k?

Hipotesis nol yang dirumuskan adalah rata-rata tinggi badan berbeda antara gaji di bawah 30k euro dan minimal 30k euro. Sedangkan hipotesis alternatif yang dirumuskan adalah rata-rata tinggi badan memiliki kemiripan antara gaji di bawah 30k euro dan minimal 30k euro. Ketika diuji menggunakan 2 tail test, P-value dan derajat kepercayaan sebesar 0.05 maka keputusan yang diambil adalah menolak H0 dan menerima H1. Maka kesimpulannya adalah rata-rata tinggi badan memiliki kemiripan antara gaji di bawah 30k dengan minimal 30k

Pemain dengan kaki natural kanan lebih baik dalam hal Weak Foot Rating daripada pemain dengan kaki natural kiri

Hipotesis nol yang dirumuskan adalah pemain kaki kanan lebih baik dalam hal weak foot rating daripada pemain kaki kiri. Sedangkan hipotesis alternatif yang dirumuskan adalah pemain kaki kanan tidak lebih baik dalam hal weak foot rating daripada pemain kaki kiri. Ketika diuji menggunakan teknik hipotesis 2 sampel, right tail test, p value dan derajat kepercayaan sebesar 0.05 maka keputusan yang diambil adalah menolak H0 dan menerima H1. Maka kesimpulannya adalah pemain dengan kaki natural kanan tidak lebih baik dalam hal weak foot rating daripada pemain kaki naturan kiri.

Conclusion

Dengan dijabarkannya beberapa analisis di atas, maka beberapa konklusi yang dapat saya petik adalah sebagai berikut:

  • Gaji pemain sangat dipengaruhi oleh berbagai hal, mulai dari overall rating hingga reputasi pemain
  • Pertumbuhan pemain sangat dipengaruhi oleh umur dari pemain tersebut
  • Posisi Center Back tidaklah begitu berbeda perlakuannya dibandingkan dengan posisi lain
  • Meskipun lebih banyak pemain dengan kaki natural kanan, penggunaan weak foot mereka masing-masing berada di taraf yang sama

Further Research

Adapun hal yang bisa dikembangkan dalam analisis ini bila ada kesempatan lain adalah sebagai berikut:

  • Ditambahkannya variasi analisis dari probabilitas
  • Ditambahkannya visualisasi agar lebih mudah dipahami
  • Menambahkan lebih banyak analisis pada conditional probability

--

--