猫とコード

化学メーカーでweb開発している猫大好きエンジニアの備忘録です。

pandas_profilingのprofile_report()が引数join axesでエラーになる場合の対処

こちらの本で機械学習の勉強をしています。

第5章3部のpandas_profilingのコードがGoogle Colabratoryで動かなかったときの対処です。

Pandasとpandas_profilingのVersionをチェック

環境:Google Colab

print(pd.__version__)
!pip freeze |grep pandas-profiling
1.1.5
pandas-profiling==1.4.1

公式の情報を見てみると、pandas_profilingのバージョンが古いようです。 Google ColabのプリインストールではVer1.xが入っていますが、今はVer2.xになっているようです。

参考サイト

pandas-profilingをgithubからインストールする

! pip install https://github.com/pandas-profiling/pandas-profiling/archive/master.zip 

インストールが完了したらメッセージに従いランタイムを再起動します。 f:id:yurukaiha:20210428152345p:plain

再度バージョンを確認してpands-profilingが2.xになっていることを確認します。

1.1.5
pandas-profiling==2.12.0

プロファイリングレポートを表示する

import numpy as np
import pandas as pd
import seaborn as sns
import pandas_profiling as pdp

df = sns.load_dataset("iris")
df.iloc[0,1] = np.NaN

profile = pdp.ProfileReport(df)
profile.to_notebook_iframe()

f:id:yurukaiha:20210428151519p:plain