본문 바로가기
프로그래밍/Python

[Python/파이썬/pandas] Pandas read_excel, Select Sheet Name, 시트 선택하기

by Mr.noobiest 2024. 1. 31.

 

 

Pandas

Python의 강력한 ML/DL 라이브러리와 함께 데이터 분석을 위해서는 거의 필수적으로 쓰여지는 라이브러리가 바로 Pandas이다.

pandas는 특히 엑셀파일(xlsx,csv등)과 굉장히 궁합이 좋은데, 파일을 Dataframe으로 변경하여 전처리를 진행하고 다른 파일로 저장하거나 기존 파일에 덧붙이거나, 아예 다른 데이터 형태로 변경이 가능하고, Tableau Hyper파일로 변환할 수도 있다.

Postgresql / MySQL과 같은 DB에도 Dataframe에서 바로 업데이트가 가능하다.

강력한 데이터 분석 라이브러리 Pandas

 

참고로 Pandas는 우리가 아는 동물 판다를 얘기하는게 아니고, 초기 라이브러리 개발시 Panel이라는 데이터 구조를 다루는 툴로 개발을 하였고, Panel Data System을 줄여서 Pandas로 얘기하는 것이다.

 

 


 

 

pd.read_excel("Select Sheet Name")


특정 경로의 xlsx파일을 dataframe으로 읽어들일 수 있는데, 코드는 다음과 같다.

import pandas as pd

xlsx_df= pd.read_excel('/경로/../파일명.xlsx')

 

문제는 Pandas는 read를 사용할때 "기본적으로 첫번째 시트를 우선적으로 가져온다"

이런 경우에는 시트명을 통해 원하는 시트를 선택해야 한다, 바로 실행하는 코드를 알아보자.

 

import pandas as pd


xlsx = pd.ExcelFile('/경로/../파일명.xlsx')

xlsx_df = pd.read_excel(xlsx, xlsx.sheet_names[-1])

또는

import pandas as pd

xlsx_df = pd.read_excel('/경로/../파일명.xlsx', '시트명')

으로 바로 지정하여도 좋다.(시트명을 확실하게 알고 있다는 가정하에..)

 

 


 

 

 

시트명들 모두 보기


시트명들을 보고 싶으면 아래 코드를 사용하자

import pandas as pd

xlsx = pd.ExcelFile('/경로/../파일명.xlsx')
print(xlsx.sheet_names)

결론적으로 xlsx.sheet_names는 List 형태다.

 

 

728x90
반응형