Python

[Python] Github/GitLab에 저장된 파일 읽기

비번변경 2023. 1. 29. 17:44

개요

Github/GitLab 저장되어 있는 파일을 Python을 이용해 읽어 들이려고 한다.

저장소를 별도 공간에 내려받지 않고 읽어보자.

 

 

예시 저장소

https://github.com/jinyuo/branch_test 에 저장되어 있는 test.csv 파일을 읽어본다.

저장소는 Public이라고 가정한다.

 

 

코드

http/https를 통해 파일에 접근할 수 있기 때문에 requests를 이용한다.

파일의 raw 데이터를 읽어야 하므로 사진의 Raw 버튼을 이용해 URL을 얻어야 한다. 

예시 파일의 raw 데이터는 https://github.com/jinyuo/branch_test/raw/main/test.csv 에 저장되어 있다.

 

코드

접근할 URL에 http GET 요청을 한다. 요청한 데이터는 response의 text 속성을 이용해 접근할 수 있다.

import requests

url = 'https://raw.githubusercontent.com/jinyuo/branch_test/main/test.csv'
response = requests.get(url)
csv_data = response.text
print(csv_data)

 

+ 비단 GitHub/GitLab 뿐만 아니라 http를 이용해 파일을 접근할 때 사용할 수 있을 것 같다.

 

 

참고 문서

https://stackoverflow.com/questions/64555735/how-do-i-get-a-file-from-github-into-my-python-code