Gaegul's devlog

[Kaggle] kaggle dataset API 사용 본문

Artificial Intelligence/Data Science

[Kaggle] kaggle dataset API 사용

부지런깨꾹이 2021. 8. 6. 16:09
728x90
반응형

이번에는 kaggle dataset API 를 사용해서 사용중인 vscode나 colab에서 바로 다운 받을 수 있는 방법에 대해 알아보겠습니다. 

1.  kaggle 패키지 다운

# -c 채널 옵션에 conda-forge를 주어서 패키지를 다운로드한다.

# conda-forge 는 anaconda에서 쉽게 설치할 수 있도록 검증된 파이썬 패키지들을 모아 놓은 하나의 채널.

#아나콘다에 설치
conda install -c conda-forge kaggle #추천
conda install kaggle

 

2. 사용자 API Token 받기

내 프로필의 Account에 들어가면 API token을 발급받을 수 있다. Create New API Token 버튼을 누르면 kaggle.json 파일이 자동으로 다운 받아지게 된다.

 

3. 다운 받은 폴더로 가고, kaggle 폴더를 생성(mkdir)후에 json파일을 kaggle 폴더로 이동시킨다. (중요)

만약, 서버를 사용중이라면 json 파일을 서버 내 폴더로 이동해준 뒤 kaggle 폴더를 만든후 이동시켜준다.

mkdir -p ~/.kaggle && mv kaggle.json ~/.kaggle/kaggle.json

 

4. 데이터셋 API 복사.

다운 받길 원하는 대회의 data 를 들어가면 API command를 copy할 수 있다.

 

5. 터미널에 복사한 command를 붙여넣기 하고 다운 시작.

바로 다운 받자마자 옆에 다운 받아진 용량, 걸린 시간, 남은 시간이 표시되게 된다.

 

6. 다운 받은 zip 파일의 압축을 풀어준다.

 

728x90
반응형
Comments