캐글코리아라는 비영리 커뮤니티에서 진행한 "3차 대회 : 자동차 분류하기"를 소개하고자 합니다.
이 대회는 모든 사람에게 공개된 대회는 아니였고 캐글 코리아 회원에 한하여 특정 링크를 타고 들어가야 데이터 접근이
가능한 대회였습니다. 제목에서 알 수 있듯이 이 대회는 자동차를 분류하는 대회로 기존의 자동차인지 아닌지를 구분하는 대회보다 한단계 업그레이드 된 대회라고 보시면 되겠습니다. 대회바로가기
ㅁ 대회 소개글(from 대회)
우리가 살면서 갖고 싶은게 여러 가지가 있지만, 집 다음으로 보통 자동차 일 것입니다. 우리 주위에서 흔히 볼 수 있고, 편리한 교통 수단 중에 하나입니다. 전 세계적으로 그 수는 무려 10억대가 넘고, 그 종류는 수백, 수천 가지 이상 된다고 합니다.
하지만, 이렇게 많은 차종을 구별하는 것은 사람일지라도 쉽지가 않은데요. 만약, 그림만 보고 자동차의 모델(Class)을 쉽게 예측할 수 있다면 CCTV나 블랙박스 속의 차량을 자동으로 분류, 감지해서 범죄예방에 도움을 줄 수 있는 등 다양한 곳에 유익하게 사용될 수 있습니다.
이번 컴페티션에서는, 자동차 이미지 데이터셋을 활용하여 이미지에 해당하는 차종(Class)이 과연 무엇인지 예측해보겠습니다
ㅁ 평가 함수
이번 컴페티션의 평가지표(Metric)은 F1 score 입니다. F1 Score Metrice은 Accuracy를 측정하기 위해 주로 사용되는데 특히 Imbalance된 데이터에서 단순 accuaracy를 산출하는 것보다 더 효과적인 평가가 가능합니다. F1 Score를 측정하기 위해서는 Precision(정밀도),
Recall(재현율)을 먼저 산출해야하고 이를 조합하여 아래와 같이 F1 Score를 최종 산출합니다.
F1 Score는 Precision과 Recall이 동시에 큰 값으로 증가할 때 해당 모델이 가장 좋은 알고리즘이라고 평가합니다.
'Kaggle 대회' 카테고리의 다른 글
[Santander Product Recommendation] 데이터 탐색하기 ① : X (0) | 2019.12.19 |
---|---|
[2019 3rd ML month with KaKR] 대회 참가 후기(삽질의 기록) (0) | 2019.12.19 |
[ASHRAE - Great Energy Predictor III] Best Weight 찾기 (0) | 2019.12.15 |
[ASHRAE - Great Energy Predictor III] Hyperparameter Optimaization (0) | 2019.12.14 |
[ASHRAE - Great Energy Predictor III] Leakage 된 데이터 활용하기 (0) | 2019.12.09 |
댓글