연령과 어빌상승량에 대한 경험적 분석[발롱도르~]
- Gozan_De_Hogoo
- 3145
- 81
- 61
시간이 없거나 통계적 방법에 흥미없는 사람은 아래 요약만 볼 것을 추천함.
=============================================
1. 실험목표
- 유망주의 나이와 어빌상승량간에는 큰 상관관계가 있다는 것은 이미 널리 알려진 사실이라 할 수 있음.
- 그러나 그간 나이와 어빌상승량 간의 상관관계에 대해 '얼마나 유효한지'에 관한 연구는 전무한 상태였음.
- 그러므로 본 연구의 목표는 다음과 같음.
- 1) 나이와 어빌상승량 간의 상관계수의 분석을 통해 '얼마나 유효한지'를 분석
- 2) 회귀분석을 통해 어빌상승량에 대한 나이의 방정식을 도출
- 3) 추후 진행될 다른 연구를 통해 어빌상승량에 대해 통합적 방정식을 도출하기 위한 초석
2. 실험 설계
1) 가설 수립
- 가설 : 선수의 나이는 어빌상승량에 영향을 미칠 것이다.
- 가정 : FM내의 모든 수치는 등간척도(Scale)를 기준으로 설정되어있을 것이다.
2) 실험 설계
- 본 연구의 가설을 검증하기위한 변수인 나이를 제외하고 통제가능한 모든 변수를 통제.
- 샘플은 각 포지션 당 16세~27세의 생성선수로 설정하고 한 시즌 간의 어빌상승량을 기록.
- 포지션별 샘플정보는 다음과 같음.
- 통제한 변수는 다음과 같음
- 생성선수를 기준으로 통제가능한 변수는 야망(10 고정)을 제외하고 지난 실험(https://www.flayus.com/4538005)과 같음
- 생성선수의 생년월일은 연도(나이(첫 시즌) 기준 16~27)만을 변수로 설정, 생일은 모두 동일하게 설정하였음.
- 구단과 리그를 기준으로 한 모든 변수통제는 지난 실험과 같음.
3. 실험 방법
- 실험은 지난 실험과 동일하게 2016년 7월 1일부터 2017년 7월 1일까지 진행(일 년)
- 12개팀의 132명의 선수로 시행하였으며 변수의 설정의 위와 같음
- 하루를 단위로 진행하되, 하루 단위로 부상정보와 사기, 금지정보, 불만정보 등을 갱신
- 하루를 단위로 갱신한 정보는 다음과 같음
- 경기는 경기계획을 사용하지 않은 시뮬레이션으로 대신함
4. 실험결과
- 나이와 최종어빌상승량에 대한 기술통계는 다음과 같음
- 또한 나이와 최종어빌상승량에 대한 단순산점도는 다음과 같음
- 전술한 바와 같이 본 연구는 FM내의 모든 히든 및 어빌이 균등척도를 기준으로 설정되었다고 가정하였음.
- 균등척도간의 상관관계를 확인하기위해 피어슨 상관계수로 분석하여 나이와 최종어빌상승량 간 상관관계를 분석
- 결과는 아래와 같음
- 양쪽 유의확률을 보았을 때 p<0.05를 충족하였음.
- 이는 나이와 최종어빌상승량 간 상관관계가 없다는 영가설을 기각하므로 양측의 상관관계는 통계적으로 유의미하고 할 수 있음.
- 상관계수 또한 -0.902로, 매우 높은 상관관계를 가진다고 할 수 있음.
- 이를 통해 살펴보았을 때 통계적으로 나이와 최종어빌상승량 간 매우 높은 상관관계를 가지고 있다고 할 수 있음.
- 매우 높은 상관관계를 가지고 있다는 기존의 사례들이 통계적으로 유의미하다는 결론이 나왔으므로 회귀분석을 시도
- 단순산점도를 가장 잘 설명할 수 있는 방정식을 구성하기위해 1차, 2차, 3차 모형을 각각 분석
- 각기 다른 모형을 통해 분석해보았을 때 모두 통계적으로 유의미하다는 결론을 낼 수 있었음.
- 그러나 수정된 R^2를 통해 살펴보았을 때 선형모형에 비해 2차 모형, 3차 모형이 설명력이 높다고 할 수 있음.
- 2차 모형과 3차 모형이 같은 수정된 R^2값을 가지나 보다 더 단순한 모형을 위해 2차 모형이 가장 알맞다고 판단됨.
- 2차 모형을 통해 나이와 어빌상승량 간 방정식을 도출해낼 수 있음. Y = 어빌상승량, X = 나이일 때 방정식은 다음과 같음
y = 23.729 + 1.361x - 0.082x^2
- 위의 방정식은 어빌상승량의 .821을 설명할 수 있음.
5. 결론 및 한계
- 연령과 선수의 어빌상승량과의 상관관계를 분석하기 위해 각기 다른 연령을 설정한 132명의 생성선수를 샘플로 지정하고 일 년 간의 어빌상승량을 분석함.
- 상관관계를 보다 명확히 설정하기위해 훈련시설 등의 구단변수와 히든 및 어빌분배 등 생성선수 개인 변수를 최대한 통제함
- 위와 같은 설계에 따라 각기 다른 야망을 가진 132명의 샘플로 일 년 간의 어빌상승량의 데이터를 산출
- 앞서 FM 내 모든 어빌 및 히든은 등간척도로 측정되었다고 가정하였으므로, 이를 분석하기위해 피어슨 상관계수를 통해 상관관계를 분석.
- 피어슨 상관계수를 통해 연령과 어빌상승량 간의 상관관계를 분석하였을 때 매우 높은 통계적 유의미성을 가졌다고 할 수 있음.
- 즉 나이와 어빌상승량 간 통계적으로 매우 높은 상관관계를 가졌다고 할 수 있음.
- 이 상관관계를 보다 명확히 분석하기위해 선형, 2차, 3차의 회귀모형을 설정하여 분석
- 각기 다른 모형의 수정된 R^2 값을 분석하였을 때 선형모형보다 2차, 3차의 회귀모형이 보다 큰 설명력을 갖추었다고 할 수 있음.
- 2차와 3차 회귀모형의 수정된 R^2 값은 동일하였으나 모델의 단순화를 위해 2차 회귀모형을 선택하여 분석하였음.
- 2차 회귀모형인 y = 23.729 + 1.361x - 0.082x^2이 가장 단순하면서 .821수준의 설명력을 갖춘 모형으로 판단됨.
- 그러나 경기 중 부상 및 퇴장, 평점 및 팀 간의 성적, 그리고 몇 시간 단위의 사기저하와 부상, 불만에는 대응하지 못하였으므로 이에 따른 변수는 통제하지 못하였다는 한계가 있음.
6. A/S - 연령별 어빌상승량에 대한 비교분석
- 구체적으로 어느 나이대의 선수들이 단일 시즌 기준 가장 높은 어빌상승량을 보이는 가에 대한 질문에 답하기 위해 추가적인 분석을 올림
- 이를 위해 나이를 기준으로 한 일원배치 분산분석(ANOVA)을 통해 나이 대별 어빌상승량 간 유의미한 차이가 나는 지를 분석해보고자 함.
- 그러나 분산의 등질성 검정 결과 p>0.05를 만족하지 못하였기 때문에 등분산을 가정하지 못함.
- 분산분석은 유의미하다고 나오나 기본적으로 분산이 등질성을 가정하지 못하므로 기각됨.
- 그러나 평균의 등질성검정 모두 유의한 것으로 나타남.
- 이를 통해 비모수검정을 통해 각 집단간의 비교가 가능하다고 할 수 있음.
- 크루스칼-월리스의 순위 일원분산분석을 통한 비모수 검정 결과 위와 같은 결과가 도출 됨.
- 위의 결과는 p<0.05를 만족하므로 연령에 따른 어빌상승량의 차이는 유의미하다고 할 수 있음.
- 연령별 순위는 다음과 같음
18 > 17 > 16 > 19 > 20 > 21 > 22 > 23 > 25 > 26 > 24 > 27
===================================================
요약
1. 선수의 나이와 어빌상승량의 상관관계는 통계적으로 매우 유의미하다고 할 수 있음.
2. 나이가 어릴 수록 일 년 단위의 어빌상승량은 높음
3. 회귀분석을 통해 회귀모형을 산출하였을 때 2차 모형인 y = 23.729 + 1.361x - 0.082x^2이 가장 단순하면서 설명력이 높은 것으로 나타남
4. 다른 변수가 모두 통제되었을 때 나이에 따른 어빌 상승량의 변화는 위의 방정식으로 예측할 수 있을 듯
5. 연령별 집단 간의 차이는 등분산을 충족하지 못하므로 비모수 검정을 통해 집단간의 순위만 예측할 수 있음.
6. Kruskal-Wallis H 검정을 통해 각 잡단 간의 차이는 유의미하다고 할 수 있음.
7. 132명의 선수를 통한 실험의 결과 연령에 따른 집단 간 어빌상승량의 순위는 18 > 17 > 16 > 19 > 20 > 21 > 22 > 23 > 25 > 26 > 24 > 27라고 할 수 있음.
8. 어차피 오래두고 키울 유망주면 어빌은 누적계수니 그냥 어릴수록 이득임
9. 일년 바짝 키우고 팔 생각을 할 때나 위의 순위가 유의미할 듯
추천인 61
Gozan_De_Hogoo
댓글 81
꿀팁감사