□ glob 라이브러리 사용
□ 방법 1 : 데이터 하나하나 불러오기
import pandas as pd
import glob
nyc_taxi_data = glob.glob('C:/python/DataScience/Data/data/python_data/fhv_*')
#glob라이브러리를 활용해 담긴 변수의 인덱스번호를 활용하여 데이터 저장
taxi1 = pd.read_csv(nyc_taxi_data[0])
taxi2 = pd.read_csv(nyc_taxi_data[1])
taxi3 = pd.read_csv(nyc_taxi_data[2])
taxi4 = pd.read_csv(nyc_taxi_data[3])
taxi5 = pd.read_csv(nyc_taxi_data[4])
#저장된 데이터 concat 함수로 저장
all_taxi = pd.concat([taxi1,taxi2,taxi3,taxi4,taxi5])
□ 방법 2 : 반복문을 활용하여 불러오기
import pandas as pd
import glob
nyc_taxi_data = glob.glob('C:/python/DataScience/Data/data/python_data/fhv_*')
#읽어들인 파일을 저장할 리스트
taxi_list = list()
#glob함수를 활용하여 불러온 파일을 csv로 저장 후 빈 리스트에 추가
for i in nyc_taxi_data:
df = pd.read_csv(i)
taxi_list.append(df)
#리스트에 저장된 파일들을 concat으로 병합
taxi_loop_concat = pd.concat(taxi_list)
taxi_loop_concat
'Python > Pandas & numpy' 카테고리의 다른 글
판다스 : .apply() 함수 예제 (1) | 2024.02.08 |
---|---|
.apply() / .agg() 함수 (0) | 2024.02.07 |
판다스 : .melt() 함수2 (한 필드의 고정 값이 2개 이상시) (1) | 2024.02.07 |
판다스 : 시리즈 (0) | 2024.02.04 |
판다스 : 타이타닉 데이터 결측값 처리 (0) | 2024.02.02 |