개요
Github/GitLab 저장되어 있는 파일을 Python을 이용해 읽어 들이려고 한다.
저장소를 별도 공간에 내려받지 않고 읽어보자.
예시 저장소
https://github.com/jinyuo/branch_test 에 저장되어 있는 test.csv 파일을 읽어본다.
저장소는 Public이라고 가정한다.
코드
http/https를 통해 파일에 접근할 수 있기 때문에 requests를 이용한다.
파일의 raw 데이터를 읽어야 하므로 사진의 Raw 버튼을 이용해 URL을 얻어야 한다.
예시 파일의 raw 데이터는 https://github.com/jinyuo/branch_test/raw/main/test.csv 에 저장되어 있다.
코드
접근할 URL에 http GET 요청을 한다. 요청한 데이터는 response의 text 속성을 이용해 접근할 수 있다.
import requests
url = 'https://raw.githubusercontent.com/jinyuo/branch_test/main/test.csv'
response = requests.get(url)
csv_data = response.text
print(csv_data)
+ 비단 GitHub/GitLab 뿐만 아니라 http를 이용해 파일을 접근할 때 사용할 수 있을 것 같다.
참고 문서
https://stackoverflow.com/questions/64555735/how-do-i-get-a-file-from-github-into-my-python-code