1. 'file-path-setting'의 이름을 가진 주피터 노트북 파일을 만들어 준다.
2. 도로교통공단_교통사고 정보 로 들어가셔서 데이터를 다운받는다.
(다른 데이터를 다운받아도 됨)
https://www.data.go.kr/dataset/15003493/fileData.do
공공데이터 포털
국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Datase
www.data.go.kr
3. 다운받은 파일을 주피터 노트북에서 작업하고 있는 폴더로 가져오기
!move "C:\Users\송민영\Downloads\한국도로공사_교통사고통계_20191231.csv" .
- 윈도우는 위와 같이 작성
!move "파일다운로드 받은 경로" "보내고싶은 목적지 경로"
- 파일을 다운 받은 폴더의 경로를 적어야한다. (개인마다 다르기 때문에 자신에 맞게 작성)
- 제일 끝에 한 칸을 띄우고 . 을 꼭 적어야 한다. (현재 폴더를 나타냄)
- %pwd => 주피터 노트북이 있는 폴더의 경로 출력
4. 판다스로 csv파일 불러오기
csv 파일을 저장하였기 때문에 read_csv를 통해 csv 파일 불러오기
pd.read_csv("한국도로공사_교통사고통계_20191231.csv",encoding="cp949")
- 소괄호() 안에서 shift + tab 키를 누르면 도움말을 볼 수 있다.
- csv파일을 불러올 때 한글파일 인코딩을 하지 않으면 오류가 나기 때문에 encoding="cp949"를 함께 적어야 한다. ("euc-kr" 경우 일부 한글이 깨지기 때문에 "cp949" 사용 추천)
5. 데이터 파일의 경우 따로 폴더를 만들어서 관리하는 것을 추천
=> data라는 폴더를 만든후 다운받은 csv 파일 옮겨주기
=>이때 4번에서의 파일 경로 바꿔주기