더북(TheBook)

두 번째 방법

깃허브(github.com)에 파일을 저장해 읽는 것이다. 다만 25MB 크기 이하인 파일만 가능하다. 다음은 이 책의 깃허브 리파지토리에 저장된 CSV 파일을 읽어들이는 예다. 이 방법은 구글 코랩과 인터넷이 연결된 PC의 파이썬에서 모두 사용할 수 있다.

import pandas as pd

url = 'https://raw.githubusercontent.com/jimsjoo/gilbut_portfolio/master/portfolioAB.csv'
df = pd.read_csv( url )

raw 파일의 주소를 적어야 한다는 점에 주의하자. github.com/jimsjoo/gilbut_portfolio/blob/master/portfolioAB.csv에서 RAW 버튼을 클릭하면 파일의 전체 내용이 날것으로 보이게 된다. 이때 브라우저 주소 입력줄의 파일 위치(https://raw.githubusercontent.com/jimsjoo/gilbut_portfolio/master/portfolioAB.csv)를 read_csv() 함수에 전달해야 한다.

▲ 그림 4-10 깃허브 리파지토리에 저장된 CSV 파일

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.