티스토리 뷰

문제점

 

data.csv 파일을 Colaboratory 에서 pd.read_csv() 읽었더니 한글이 깨진다.

data.csv 

 

encoding 확인

 

notepad++ 읽어서 encoding 확인해보니 EUC-KR

 


 

 

 

Jupyter lab 경우

 

- engine='python' 옵션만 주어도 문제없이 출력된다.

- 옵션을 주지않으면 에러가 발생한다.

 


 

 

Colaboratory 경우

 

실습용 Colaboratory  링크: https://goo.gl/1KdNKK

실습용 데이터data.csv


 

Colab 파일 올리기

 

- 아래 코드를 실행하면 업로드 버튼이 생긴다.

- 로컬의 파일을 Colaboratory 올린다.

 

from google.colab import files

uploaded = files.upload() 파일 업로드 기능 실행

 

for fn in uploaded.keys(): 업로드된 파일 정보 출력

    print('User uploaded file "{name}" with length {length} bytes'.format(

        name=fn, length=len(uploaded[fn])))

 

 

engine='python' 옵션을 써보자

 

- 깨진다.

 


 

solution: euc-kr euc-kr

 

Python Standard Encoding 보면 euc-kr 있다.

 

링크: https://docs.python.org/3/library/codecs.html#standard-encodings

 


 

 

encoding='euc-kr' 옵션

 

- 문제해결!

 


 


반응형
반응형
잡학툰 뱃지
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
«   2024/03   »
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31
글 보관함