-
Analysis of FIFA 22 DATA (2)데이터 2022. 6. 10. 08:54
재미로 풀어본 축구 데이터 분석 (II)
이 자료는 머신러닝 플랫폼 Kaggle에 업로드 되어있는 FIFA 22 데이터를 활용하여 2022 월드컵에서 한국이 속한 H조의 축구 전력을 분석한 내용이다. 본 분석은 데이터 속에 숨어있는 스토리를 끌어내어 데이터분석의 재미를 느껴보자는 의도로 축구 문외한이 오직 데이터에 기반하여 분석한 내용임을 밝혀둔다. 대한민국 대표 선수들이 전세계를 놀라게 만드는 멋진 경기를 해 주리라 믿으면서 대한민국 축구 선수들을 선전을 기원하며 응원을 보낸다. 축구선수 데이터로 들어가 보자.
1. 데이터 살펴보기
분석에 사용한 FIFA 22 데이터는 총 19,239명의 선수 정보를 담고있는 데이터로 선수 개인에 대한 각종 정보를 담고 있다. 여기에는 선수들의 국적, 활동하고 있는 리그 종류 및 소속 팀, 이름, 포지션, 종합평(이하 평점), 잠재평점, 연봉, 나이, 키, 몸무게 등 일반적 정보 뿐만 아니라 슈팅, 패싱, 드리블 등 선수기량에 대한 정보와 정신력, 파워 등에 대한 정보들까지 110여 종의 들어있다. 이중 연봉정보가 누락된 74명 정보는 제외하고 19165명의 정보를 분석에 사용하였으며 데이터의 조사방법과 근거 등에 대한 정보는 확인할 수 없었다.
H 조에 편성된 국가들을 각각 살펴보기 전에 전체 데이터에 대한 윤곽을 파악해보자. FIFA 22 데이터에 등록된 선수들의 대륙별 국가별 현황과 활동하고 있는 리그별 선수 규모를 트리맵으로 알아보자.
축구 선수 인원은 확실히 유럽이 많고 국가별로 보면 전통적인 축국 강국들의 인원이 많음을 알 수 있다.
리그별로 활동하는 축구선수의 인원의 차이는 크지 않은 것으로 나타났다. 중앙 우측에 한국의 1부 리그도 보인다. 리별로 선수들의 몸값의 차이는 얼마나 날까?리그별 선수들 평균 몸값의 차이는 상당히 큼을 알 수 있다. 한국과 일본리그는 비슷한 수준으로 보인다.
2. H조 국가별 축구 전력 비교
2022월드컵 H조에는 우리나라와 가나, 포르투갈, 우루구아이가 편성되어있다. H조 국가들의 데이터를 먼저 살펴본다.
H 조 FIFA 등록선수 인원 국가 FIFA 등록선수 인원 Ghana 128 Korea Republic 325 Portugal 373 Uruguay 280 FIFA 22에 등재된 H조 국가의 선수는 위 표에서 보는 바와 같이 포르투갈이 373명으로 제일 많고, 한국은 325명으로 우루구아이나 가나 보다 많았다. 등록 축구선수 숫자가 국가의 축구 인프라를 상징한다는 면에서 등록 축구 선수의 수는 대한민국이 불리한것은 아닌것으로 보인다. 그러나, 월드컵 경기는 각 국에서 월드컵 대표선수로 선발된 대표 선수들 끼리 경기를 치루게 되므로, 선발된 대표팀 선수들의 실력이 중요하다. 아직은 각 나라의 월드컵 국가대표 선수들의 명단이 불확실하기 때문에 국가별 대표선수로 선발될 가능성이 높은 상위 30명(몸값 기준)의 선수들을 뽑아 전력을 비교하는것이 합리적으로 보인다. 이하 H조 국가별 비교는 국가별 상위 30명의 선수를 발췌해서 수행하였다.
FIFA_22 데이터를 기준으로 H조 각국의 평점 상위 30명의 평균 몸값을 비교해보면, 포르투갈 선수들이 498억원으로 우리나라 선수들의 83억의 6배 정도로 압도적으로 높으며 우루구아이는 233억으로 우리의 약 2.8배이며, 가나는 우리와 비슷한 85억 수준으로 나타났다. 평균 몸값이 생각보다 높게 나타난 이유는 매우 높은 몸값을 가진 아웃라이어 선수들 때문으로 몸값을 평균으로 단순 비교하는 것은 의미의 왜곡이 발생 할 수 있겠다. 심슨의 파라독스 처럼. 한국의 원탑인 손흥민 선수의 몸값이 나머지 29명의 몸값을 합친것 보다 많게 나타나는 현상은 프로세계 경쟁의 치열함을 상징적으로 보여주는 것 같아 마음이 서늘해 진다.
H조 각국 Top 10 선수들의 몸 값을 원 그래프로 그려보았다.
또한 덴시티 다이어그램으로 보면, 각국 공히 몸값의 편차가 심하나, 포르투갈은 비교적 몸값이 높은 선수 층이 두텁고 우루구아이는 몸값이 높은 선수들이 비교적 두텁게 분포하지만 손흥민 같은 독보적인 스타(아웃라이어)는 없다는 것을 알 수 있다. 가나 선수들의 연봉은 낮은 연봉 구간에서는 우리보다 조금 높은 수준을 보이지만 독보적인 아웃라이어는 없는 것으로 나타나고 있다. 즉 한국의 아웃라이어 인 손흥민 선수를 제외하면 평균 몸값의 수준은 한국이 가장 낮음을 알 수 있다.
그럼 이제 본격적으로 H조 국가별 축구선수들의 역량을 비교해보자. 원본 데이터는 선수들의 역량을 공통분야, 개인기, 체력, 정신력(Mentality) 등으로 대분류 한 다음 이를 다시 세분화해서 각각에 대해서 선수 개인별로 평점을 부여하고 있다.
2-1 신체적 조건 분석
선수들의 기본적인 신체 조건인 나이, 신장, 체중을 비교해보자.
H 조 국가별 신체 조건 비교 국가 나이 신장(Cm) 체중(Kg) Ghana 25.2 179.4 74.1 Korea Republic 25.8 180.9 74.2 Portugal 26.1 179.3 73.4 Uruguay 26.1 179.2 75.5 신체적인 조건은 국가간 큰 차이가 없으며, 한국선수들의 평균 신장이 오히려 조금 큰 것을 알 수 있다.
2-2 기술능력 분석
선수들의 기술능력 슈팅능력, 패싱 능력, 드리블능력, 방어력 및 결정력 분야로 나누어 국가별 선수 평균으로 비교한다.
H조 국가별 공통기술 요소 평점 국가 슈 팅 패 싱 드리블 방 어 결정력 Ghana 61.1 64.3 71.9 56.2 56.3 Korea Republic 59.6 64.0 69.7 51.4 54.8 Portugal 71.5 75.3 80.5 61.5 66.0 Uruguay 66.5 69.3 73.3 61.2 63.0 수치상으로는 비교가 제한되어 레이더 차트를 이용해서 비교하자.
슈팅, 골결정력, 방어, 드리블, 패싱 요소의 각국 평균을 비교하면 국가별 차이가 존재함을 한눈에 알 수 있다. 특히 전분야에서 포르투갈이 두각을 나타내고 우루구아이가 그 다음에 위치함을 알수있다. 좀더 세밀하게 분석하려면 각국별 상위 30명 선수들의 포지션을 분석해서 공격포지션 선수를 대상으로 기술력을 분석할 필요가 있다. 데이터 상의 선수 포지션은 크게 세가지로 나누어 작성되었다. 첫째, 선수가 소화할 수 있는 포지션의 종류, 둘째, 소속된 클럽팀의 포지션, 마지막으로 국가 대표 선발시 포지션으로 나누어져있다. 그러나 국가대표시의 포지션은 대다수가 공란이어서 소속 클럽에서의 포지션을 기준으로 분석하였다. 원본 데이터에서는 과도하게 세분화되어 있는 포지션의 종류를 분석의 편의상 대분류하여 공격수, 미드필더, 방어수, 골키퍼 4개로 단순화 하였다. 국가별 포지션별 선수 현황은 아래 보는 바와 같다. 데이터 상 분류가 애매한 포지션이 2가지 존재했는데, RES와 SUB가 그것이다. 아마도, 각각 예비와 교체명단으로 판단된다.
국가 수비수 공격수 골키퍼 미드필더 예비 대체선수 Ghana 7 5 2 3 2 11 Korea Republic 7 8 3 5 NA 7 Portugal 6 6 2 8 NA 8 Uruguay 9 5 1 4 1 10 각국의 공격수들 대상으로 슈팅, 골 결정력, 드리블, 패싱 및 신체적 능력을 비교하여 분석해보자.
국가 슈팅 패싱 드리블링 체력 결정력 Ghana 71.4 63.4 75.8 68.8 72.4 Korea Republic 68.0 62.6 73.2 67.2 71.1 Portugal 82.3 73.8 82.0 72.5 83.8 Uruguay 79.6 73.4 79.2 74.8 82.0 공격수들을 대상으로한 기술 비교 역시 포르투갈과 우루구아이가 우수하다는 것을 알 수 있다. 공격수들의 슈팅, 패싱, 드리블링 및 골결정력은 우리나라 공격수의 평점이 가나보다 우수하게 나타났다.
2-3 멘탈리티(심리/정신력) 분석
다음은 멘탈리티(심리 또는 정신력)에 대한 분석이다.
멘탈리티 항목은 공격성, 가로채기, 위치선정, 패털티, 침착성으로 구성되어있다.국가 공격성 가로채기 위치선정 패널티 침착성 Ghana 66.3 53.2 60.5 54.0 66.7 Korea Republic 58.4 48.3 60.6 50.9 65.0 Portugal 69.4 61.3 71.9 62.0 79.3 Uruguay 72.2 60.1 66.2 60.4 73.7 멘털리티 관한 데이터 측정기준을 어떻게 산정하는 지 정확히 파악은 안되지만, 한국 선수가 정신력에서도 밀린 다는 사실은 받아 들이기 쉽지 않았다. 데이터의 멘털리티의 개념정의가 일반적 개념과 차이가 있는것 같다. 다만 침착성 면에서는 한국이 포르투갈이나 우루구아이에 비해 많이 낮은 상태로 정신적 트레이닝도 필요한 것으로 보인다.
2-4 선수 파워 분석
데이터는 기타 선수들의 파워요소에 대한 평점을 다양하게 제공하고있다. 여기에는 선수들의 킥력, 점프력, 스태미너, 롱킥력에 대한 평점을 제공하고 있다.
국가 킥력 점프력 스태미너 롱킥력 Ghana 67.33333 75.23333 71.53333 57.26667 Korea Republic 61.96667 63.00000 69.36667 53.56667 Portugal 76.80000 68.73333 77.93333 67.36667 Uruguay 72.63333 70.43333 77.33333 64.50000 파워를 비교하는 지표 중 스태미너는 큰 차이가 많지 않은 반면, 롱킥력, 킥력, 점프력에서는 수준차이가 벌어지고 있음을 알 수 있다. 가나 선수들은 다른 요소는 뒤쳐지지만 점프력 면에서는 우위를 보이고 있는것이 특징이다.
2-5 선수 움직임 분석
데이터는 선수들의 다양한 움직임에 관한 평점도 제공하고있다. 움직임에 대한 평점은 가속력, 달리기속력, 기민성, 반응성, 균형성에 대한 평점을 제공하고있으며 국가별 선수 평균은 아래 표와 같다.
국가 가속력 속력 기민성 반응성 균형성 Ghana 75.7 76.9 73.9 68.9 72 Korea Republic 72.2 72.7 72.3 68.0 69 Portugal 75.1 73.4 76.1 81.4 74 Uruguay 73.3 73.1 70.4 75.8 69 선수들의 움직임 면에서 속력, 가속력, 기민성 등은 큰 차이가 없으나 반응성 분야에서 우리나라와 가나가 조금 뒤처지는 것을 확인 할 수 있었다.
#### 2-6 선수 개인기 분석
선수들의 개인기 측면의 평점은 드리블링, 프리킥 정확도, 장거리 패스, 볼컨트롤 분에의 평점을 제공하고 있으며 현황은 아래 표와 같다. 한국이 프리킥 정확도가 우루구아이나 가나 보다 높아 프리킥 상황에서 집중하면 기회가 올것으로 예측된다. 볼컨트롤이 상대적으로 약한 것으로 나타나 패스 위주의 전략을 구상하는 것도 필요할 것으로 보인다.
국가 드리블링 프리킥정확도 장거리패스 볼컨트롤 기술평균 Ghana 68.1 45.5 60.0 69.3 60.725 Korea Republic 63.3 48.7 57.7 64.0 58.425 Portugal 76.1 57.9 69.6 77.9 70.375 Uruguay 70.3 57.9 66.3 74.0 67.125 종합평가
다양한 요소들을 종합적으로 집계한 종합평점으로 분석 해볼때 한국의 전력은 H조 국가들 중 하위권으로 확인이 되었다. 특히 평점의 분포를 보면 포르투갈과 우루구아이가 우리보다는 확실히 우수하다는 것을 알 수 있다. 축구에는 다양한 변수가 있겠으나, 국가별로 평점이 높은 독보적인 아웃라이어 선수가 한 두명씩 포함되어 있어 이들을 견제하기 위한 싸움이 심할 것으로 보인다. 대한민국의 손흥민, 포르투갈의 호날두와 페르난데스, 우루구아이 수아레스, 가나의 토머스 파티 선수가 그들이다. 이들은 모두 유럽과 스페인리그에서 활약하고 있으며, 공격수라는 공통점과 종합평점도 비슷한 수준에 있다.
H조 국가별 아웃라이어 국가 이름 활동리그 포지션 Ghana T. Partey English Premier League RDM Korea Republic H. Son English Premier League LW Portugal Cristiano Ronaldo English Premier League ST Uruguay L. Su?rez Spain Primera Division RS 마지막으로 H조 각국 선수들의 활동 무대를 분석해보자. 왼쪽은 H조 각나라 축구 선수들을 나타내고 있고, 오른쪽에 표시된 노드는 선수들이 뛰고 있는 프로축구 리그이다. 우리나라 선수들의 경우 해외에서 활동하고 있는 선수는 많지 않고 대부분이 한국 K리그에서 뛰고 있는것으로 나타났다. 포르투갈의 경우 반정도 선수들은 포르투갈 자국 리그에 활동하고 나머지는 주로 유럽의 각종 리그에서 활동하는 것으로 나타났다. 우루구아이는 반정도 선수들이 자국 리그에서 활동하고, 일부는 남미대륙의 아르헨티나 리그나 멕시코 리그에서 활동하지만 상당한 인원들이 유럽리그에 진출해 있는것을 볼 수 있다. 가나의 경우 아프리카 리그나 자국 리그가 없는 상태이기 때문에 대부분이 유럽리그에 활동하고 있고, 중국이나 미국리그에서 활동하는 선수도 보이는 등 다양한 리그에서 활동하고 있는것으로 나타났다.
월드컵 평가전과 손흥민 선수의 활약으로 축구에 대한 관심이 많이 높아진 요즘, 재미로 시작해 본 월드컵 H조의 선수 데이터분석은 매우 의미가 있었다. 이번 데이터 분석을 통해 세계의 벽이 정말 높고 우리가 월드컵 16강에 진출하는 것이 얼마나 험난한 도전 과제인지 명확하게 알게되었다. 그러나 축구공은 둥글다는 말이 있듯이 축구는 다양한 요소에 의해 승패가 결정되는 만큼 좋은 감독 영입과 좋은 전략으로 대한민국의 축구 선수들이 자신의 기량을 200% 발휘하여 월드컵에서 좋은 성적을 거두기를 간절히 기도해본다.
대한민국 축구 화이팅 !!! 대한민국 16강 가즈아 !!!!
'데이터' 카테고리의 다른 글
Handling Factor Variable using forcats package (0) 2022.08.07 Tidymodels를 활용한 ML Process (0) 2022.07.23 ggplot을 이용한 데이터가시화 II (0) 2022.07.08 ggplot을 이용한 데이터 가시화 I (0) 2022.06.26 Analysis of FIFA 22 DATA (0) 2022.05.28