[Pandas] DataFrame 이미지로 저장하는 방법
1. 라이브러리 설치
pip install dataframe-image
아나콘다 가상환경 상에서도 설치해 보려고 했으나 PackagesNotFoundError: The following packages are not available from current channels:
라는 사인이 떴다(conda-forge 채널도 사용해보았으나 같은 메시지가 떴음).
cf. 아나콘다 공식문서를 통해 dataframe_image로 설치해야됨을 확인하였으나 설치를 실패하였음, pip 으로 설치하는 것을 추천함
2. 데이터프레임 이미지로 저장하기
설치한 dataframe-image 라이브러리의 export 함수를 사용하면 데이터프레임을 이미지로 추출할 수 있다.
(1) 라이브러리 로드
# 이미지 추출을 위해 필요한 라이브러리 로드
import pandas as pd
import dateframe-image as dfi
(2) 데이터프레임 생성
이미지 추출을 위해 사용한 데이터셋은 Kaggle Datasets ‘Pima Indians Diabetes Database’ 이다.
# Kaggle의 Pima Indians Diabetes Database 데이터 로드
df = pd.read_csv('../Data/pima_indians_diabetes.csv')
(3) 이미지 추출
# dataframe-image의 export 함수를 사용한다.
dfi.export(df.head(), 'df_head.png', max_rows=-1, max_cols=-1)
첫 번째 인자로는 이미지로 저장하고싶은 dataframe 값을, 두 번째 인자로는 저장할 이미지의 파일명이다. max_rows
와 max_cols
는 전체 컬럼, 전체 행을 모두 image로 저장하겠다는 것이다.
Fig 2를 보면 데이터프레임이 이미지로 잘 저장되었음을 알 수 있다. max_rows
와 max_cols
에 특정 값을 전달하면 전체 데이터프레임이 아닌 일부만 불러와 저장할 수 있지만 … 으로 일부 열과 행이 요약되어 저장되기 때문에 이 점을 유의해야 한다.
3. Reference
👩🏻💻개인 공부 기록용 블로그입니다
오류나 틀린 부분이 있을 경우 댓글 혹은 메일로 따끔하게 지적해주시면 감사하겠습니다.
댓글남기기