1. 라이브러리 설치

pip install dataframe-image

아나콘다 가상환경 상에서도 설치해 보려고 했으나 PackagesNotFoundError: The following packages are not available from current channels: 라는 사인이 떴다(conda-forge 채널도 사용해보았으나 같은 메시지가 떴음).
cf. 아나콘다 공식문서를 통해 dataframe_image로 설치해야됨을 확인하였으나 설치를 실패하였음, pip 으로 설치하는 것을 추천함


2. 데이터프레임 이미지로 저장하기

설치한 dataframe-image 라이브러리의 export 함수를 사용하면 데이터프레임을 이미지로 추출할 수 있다.

(1) 라이브러리 로드

# 이미지 추출을 위해 필요한 라이브러리 로드
import pandas as pd
import dateframe-image as dfi

(2) 데이터프레임 생성

이미지 추출을 위해 사용한 데이터셋은 Kaggle Datasets ‘Pima Indians Diabetes Database’ 이다.

# Kaggle의 Pima Indians Diabetes Database 데이터 로드
df = pd.read_csv('../Data/pima_indians_diabetes.csv')

(3) 이미지 추출

# dataframe-image의 export 함수를 사용한다.
dfi.export(df.head(), 'df_head.png', max_rows=-1, max_cols=-1)

첫 번째 인자로는 이미지로 저장하고싶은 dataframe 값을, 두 번째 인자로는 저장할 이미지의 파일명이다. max_rowsmax_cols 는 전체 컬럼, 전체 행을 모두 image로 저장하겠다는 것이다.

Fig 1. 동일한 경로에 생성된 파일


Fig 2. df.head()의 결과


Fig 2를 보면 데이터프레임이 이미지로 잘 저장되었음을 알 수 있다. max_rowsmax_cols 에 특정 값을 전달하면 전체 데이터프레임이 아닌 일부만 불러와 저장할 수 있지만 … 으로 일부 열과 행이 요약되어 저장되기 때문에 이 점을 유의해야 한다.


3. Reference

👩🏻‍💻개인 공부 기록용 블로그입니다
오류나 틀린 부분이 있을 경우 댓글 혹은 메일로 따끔하게 지적해주시면 감사하겠습니다.

댓글남기기