データとは

予測する、結論を出す、意思決定するための事実の集まりのことをデータと言います。
データときくと一般的に数値化されたものをイメージすることも多いですが、数値化されたものに限らず文字や映像、画像などもデータとなります。

データ分析とは

データ分析とは、予測する、結論を出す、意思決定をするために、データを集め、適切なかたちに変換し、組織化することをさします。
そして、データに基づく決定を、「データ主導の意思決定(Data-driven decision making)とよびます。

データ主導の意思決定ときくと大げさな印象ですが、普段から私たちはデータ主導の意思決定をおこなっています。
以下はその一例です

  • 天気予報(気象データ)をみて、外出するかや、傘をもっていくかを決める
  • クチコミサイト(主観的評価データ)をみて、予約する飲食店を決める
  • 乗り換えサイト(交通データ)をみて、出発時間や乗り換えの経路を決める
  • 予約サイトの座席表(予約データ)をみて、座席を決める

上記はいずれもインターネット上にある様々な情報サービスは、データを集め、分析し、利用しやすい形に組織化して、提供されているものです。つまり、私たちが利用する様々な情報サービスは、データ分析の成果物なのです。

データ分析のプロセスとは

Courseraが提供する「Google データアナリティクス」コースでは、以下のように定義されています。

  1. 問い
  2. 準備
  3. 処理
  4. 分析
  5. 共有
  6. 行動