📘

データ可視化 - ヒストグラム

 

ヒストグラムとは?

ヒストグラムは、あるデータを対象とし、一定の値の範囲(レンジ)に区切ることでデータの発生頻度や分布の形状を可視化するために用いられるカードです。レンジは指定したビン数に対応する形で決定されます。ビン数が大きいほどレンジの幅は狭くなり、ビン数の値が小さいほどレンジの幅は大きくなるため、可視化されるデータの解像度に違いを持たせることができます。

ヒストグラムカードの操作方法

結線

対象データを結線してください。

パラメータの設定

設定項目任意/必須初期値説明
対象カラム必須無しヒストグラム適用の対象のカラム
ヒストグラムのビン数必須10ヒストグラムの解像度を決定するビン数

実行

  • “実行”ボタンを押してください。
  • 処理時間が 10 分を超えるとタイムアウトし、処理が強制終了されます。

ヒストグラムの結果の確認

  • この例は公開データである「シェアサイクル利用の総台数予測クイックスタート」のcnt(自転車の総利用台数)のヒストグラムを可視化しています。
  • ヒストグラムで可視化された分布の形状だけでなく、要約統計量や他の可視化(散布図、相関行列など)の結果も踏まえた上で分析のネクストアクションを検討してください。