본문 바로가기
Python/Pandas & numpy

판다스 : 다중데이터 불러오기

by Mr.DonyStark 2024. 2. 7.

□ glob 라이브러리 사용

□ 방법 1 : 데이터 하나하나 불러오기

import pandas as pd
import glob
nyc_taxi_data = glob.glob('C:/python/DataScience/Data/data/python_data/fhv_*')
#glob라이브러리를 활용해 담긴 변수의 인덱스번호를 활용하여 데이터 저장
taxi1 = pd.read_csv(nyc_taxi_data[0])
taxi2 = pd.read_csv(nyc_taxi_data[1])
taxi3 = pd.read_csv(nyc_taxi_data[2])
taxi4 = pd.read_csv(nyc_taxi_data[3])
taxi5 = pd.read_csv(nyc_taxi_data[4])
#저장된 데이터 concat 함수로 저장
all_taxi = pd.concat([taxi1,taxi2,taxi3,taxi4,taxi5])

 

□ 방법 2 : 반복문을 활용하여 불러오기

import pandas as pd
import glob
nyc_taxi_data = glob.glob('C:/python/DataScience/Data/data/python_data/fhv_*')

#읽어들인 파일을 저장할 리스트
taxi_list = list()
#glob함수를 활용하여 불러온 파일을 csv로 저장 후 빈 리스트에 추가
for i in nyc_taxi_data:
    df = pd.read_csv(i)
    taxi_list.append(df)
#리스트에 저장된 파일들을 concat으로 병합
taxi_loop_concat = pd.concat(taxi_list)
taxi_loop_concat