바닥부터 시작하는 인공지능

3분만에 정복하는 캐글(Kaggle) : 머신러닝 입문

HappinessChung 2019. 9. 2. 15:21
반응형

 

 

 

1) 캐글이란?

 

캐글 사이트 주소: https://www.kaggle.com

캐글이란 쉽게 말해 머신러닝 종합 플랫폼으로 어떤 기업이나 단체에서 머신러닝을 통해 해결하고싶은 과제를 등록하면 캐글에 가입한 사람들이 자유롭게 이를 해결하여 보수를 받는 시스템입니다. 뿐만 아니라 다양한 단체가 제공한 무료 데이터들을 통해 머신러닝을 공부할 수 있는 환경을 제공합니다. 캐글은 현재 구글에 인수된 상태이며 따라서, 캐글에 대한 인식은 점점 확대될 전망입니다. 데이터를 활용하는 회사들(삼성, 우버 등)의 경우에서도 대부분 캐글 실적을 포트폴리오로 활용하고있다고 합니다.

 

 

2)메뉴 탐색

 

Competition

캐글 사이트에 들어가면 보이는 메뉴바

컴페티션은 본격적으로 머신러닝 경연이 이루어지는 곳으로, 순위제도가 있습니다. 어떤 기업이 과제를 등록하면, 이용자들이 자유롭게 문제를 해결하고, 결과를 예측합니다. 예측된 결과의 정확도를 바탕으로 순위를 매겨 높은 순위에 등록된 사람들에게 상금을 지급합니다. 

또, All Categories 메뉴에서 Play Ground에 들어가시면 상금과 상관없이 데이터를 분석한 자료들도 보실 수 있습니다. 이들은 모두 오픈소스로 다른사람들이 어떻게 분석했는지 코드를 자유롭게 확인 할 수 있습니다.

 

 

 

Dataset

기업과 단체에서 올려주는 무료 데이터 셋들을 모아놓은 것으로, 목적에 맞게 다양하게 활용이 가능합니다.

 

 

Notebook

Conpetition에 사용된 모든 커널(코드)들을 보여주는 곳입니다. YourWork이라는 메뉴에 들어가면 내가 작성한 커널을 볼 수 있습니다. 참고로 이 Notebook은 주피터 노트북과 매우 유사한 환경을 제공합니다. 쉽게 생각하면 주피터 노트북을 클라우드 서비스 처럼 이용할 수 있는 곳이라고 하면 되겠습니다. 머신러닝에 필요한 라이브러리들도 다 들어있어서 따로 추가할 필요가 없고, 컴퓨터와 저장공간을 무료로 제공합니다. 만약 자신의 컴퓨터(로컬)에서 직접 돌리길 원한다면 그렇게 진행할 수도 있다고 하네요.

 

Discussion

이거는 네이버 지식in의 머신러닝 버전이라고 생각하면 될것 같습니다. 커널을 작성하다 모르는것이 있으면 자유롭게 질문하고 답변하는 공간입니다.

 

Courses

캐글에서 자체적으로 제공하는 머신러닝 교육 플랫폼으로 머신러닝 입문자들이 자신에게 맞는 강의를 무료로 들을 수 있습니다. 

 

 

 

3) 레벨시스템

 

캐글을 포트폴리오로 활용하기 좋은 이유는 레벨시스템이 존재하기 때문이기도 합니다. 자신이 받은 댓글, 추천 수 등으로 메달을 따게 되면 이것들이 누적되어 레벨이 되는 것입니다. 처음 가입하는 사람들은 노비스에 해당되고 프로필을 등록하고, 1개의 커널을 작성, 결과를 제출하는 등의 간단한 작업을 수행하면 Contrbutor가 됩니다. 처음 시작하시는 분들도 간단한 작업 몇개를 통해 Contributor가 될 수 있다니 이정도까지는 다들 시도해보시는게 좋겠습니다. 이 다음에는 직접적으로 메달을 휙득해야 레벨을 올릴 수 있습니다. 레벨 급간은 굉장히 많아보이지만 실질적으로는 Expert인 분들도 아직 적다고 하네요. 

여기까지 캐글에 대한 간략한 소개였습니다. 4차산업혁명의 시대인만큼 시대의 흐름을 발빠르게 따라가는 사람들이 얻는것이 더 많겠죠? 이 글을 읽으시는 분들도 캐글을 통해 머신러닝 지식, 포트폴리오 등 많은것을 얻어가셨으면 좋겠습니다.

반응형