Colaboratory - load file from Google Drive
상황
- 데이터파일이 나의 Google Drive에 있고
- 이것을 Colaboratory로 가져와서 pandas 로 신나게 요리하고 싶다.
링크
- 공식예제: https://goo.gl/XHVLnF
- Stackoverflow 링크: https://goo.gl/kqBqLD
- PyDrive: https://pythonhosted.org/PyDrive/index.html
→ 다양한 해법이 있겠으나 공식예제의 PyDrive 를 사용하겠음
해보자
1. Google Drive 에 위치한 파일의 id 를 알아내자
- 원하는 파일을 우클릭 후 "Get shareable link 선택
- 여기서 링크의 id 부분을 저장해둔다
|
예를 들어 링크가 https://drive.google.com/open?id=1bGTPirOnwDlzRABCEDWtGkQ2a1bAaMWY 라면 1bGTPirOnwDlzRABCEDWtGkQ2a1bAaMWY 부분이 id 이다. |
2. Colaboratory 초기 작업
PyDrive 를 설치하고, 구글 인증을 하는 부분이니 그냥 실행하면 된다.
|
3. Load 하기
1) file_id 는 Google Drive 에서 얻어낸 것
2) CreateFile() 로 가져온 다음
3) GetContentFile() 에 명시한 파일명으로 Colaboratory 에 저장한다. 즉, 원래 파일명이 아니라도 된다
|
4. pandas dataframe 으로 가져오기
1) !ls -al 명령으로 Colaboratory 의 현재폴더에 schma.csv 파일이 들어와 있는 것이 보인다.
2) pandas 로 읽어들이고 일부를 출력해보니 잘 가져왔다.