판다스 : 다중데이터 불러오기

□ glob 라이브러리 사용

□ 방법 1 : 데이터 하나하나 불러오기

import pandas as pd
import glob
nyc_taxi_data = glob.glob('C:/python/DataScience/Data/data/python_data/fhv_*')
#glob라이브러리를 활용해 담긴 변수의 인덱스번호를 활용하여 데이터 저장
taxi1 = pd.read_csv(nyc_taxi_data[0])
taxi2 = pd.read_csv(nyc_taxi_data[1])
taxi3 = pd.read_csv(nyc_taxi_data[2])
taxi4 = pd.read_csv(nyc_taxi_data[3])
taxi5 = pd.read_csv(nyc_taxi_data[4])
#저장된 데이터 concat 함수로 저장
all_taxi = pd.concat([taxi1,taxi2,taxi3,taxi4,taxi5])

□ 방법 2 : 반복문을 활용하여 불러오기

import pandas as pd
import glob
nyc_taxi_data = glob.glob('C:/python/DataScience/Data/data/python_data/fhv_*')

#읽어들인 파일을 저장할 리스트
taxi_list = list()
#glob함수를 활용하여 불러온 파일을 csv로 저장 후 빈 리스트에 추가
for i in nyc_taxi_data:
    df = pd.read_csv(i)
    taxi_list.append(df)
#리스트에 저장된 파일들을 concat으로 병합
taxi_loop_concat = pd.concat(taxi_list)
taxi_loop_concat

저작자표시

'Python > Pandas & numpy' 카테고리의 다른 글

판다스 : .apply() 함수 예제 (1)	2024.02.08
.apply() / .agg() 함수 (0)	2024.02.07
판다스 : .melt() 함수2 (한 필드의 고정 값이 2개 이상시) (1)	2024.02.07
판다스 : 시리즈 (0)	2024.02.04
판다스 : 타이타닉 데이터 결측값 처리 (0)	2024.02.02

Dandora.Blog.Ninety

판다스 : 다중데이터 불러오기

'Python > Pandas & numpy' 카테고리의 다른 글

티스토리툴바

판다스 : 다중데이터 불러오기

'Python > Pandas & numpy' 카테고리의 다른 글

관련글

티스토리툴바