データとは
予測する、結論を出す、意思決定するための事実の集まりのことをデータと言います。
データときくと一般的に数値化されたものをイメージすることも多いですが、数値化されたものに限らず文字や映像、画像などもデータとなります。
データ分析とは
データ分析とは、予測する、結論を出す、意思決定をするために、データを集め、適切なかたちに変換し、組織化することをさします。
そして、データに基づく決定を、「データ主導の意思決定(Data-driven decision making)とよびます。
データ主導の意思決定ときくと大げさな印象ですが、普段から私たちはデータ主導の意思決定をおこなっています。
以下はその一例です
- 天気予報(気象データ)をみて、外出するかや、傘をもっていくかを決める
- クチコミサイト(主観的評価データ)をみて、予約する飲食店を決める
- 乗り換えサイト(交通データ)をみて、出発時間や乗り換えの経路を決める
- 予約サイトの座席表(予約データ)をみて、座席を決める
上記はいずれもインターネット上にある様々な情報サービスは、データを集め、分析し、利用しやすい形に組織化して、提供されているものです。つまり、私たちが利用する様々な情報サービスは、データ分析の成果物なのです。
データ分析のプロセスとは
Courseraが提供する「Google データアナリティクス」コースでは、以下のように定義されています。
- 問い
- 準備
- 処理
- 分析
- 共有
- 行動