コンテンツにスキップ

Data analysis

データ分析とは

データの識別、クリーニング、変換、モデリングを行って意味のある有用な情報を検出するプロセス

データ分析のカテゴリ

  • 記述的
  • 診断的
  • 予測的
  • 処方的
  • 認知的

記述的分析

履歴データに基づいて、何が起きたか

  • 大規模なデータセットを要約
  • KPI (主要業績評価指標) を開発することにより、これらの戦略を使用して、主要な目的の成功または失敗を追跡する
  • e.g. 組織の売上と財務データを把握するためのレポートの生成

診断的分析

イベントがなぜ発生したか

  • 記述的分析から得られた結果を利用して、原因を究明
  • 業績評価指標を詳細に調べて、これらのイベントが改善された、または悪化した原因を究明
  • e.g. データの異常を特定 → 関連データ収集 → 統計的技法を使用して異常を説明する関係や傾向を見つけ出す

予測的分析

目標またはターゲットを達成するためにどのアクションを実行する必要があるか

  • 処方的分析から得られた分析情報を使用して、データ ドリブンの意思決定を行う
  • 過去の意思決定やイベントを分析して、さまざまな結果の可能性を推定する

認知的分析

既存のデータやパターンから推論を引き出し、既存のナレッジベースに基づいて結論を導き出した後、将来の推論 (自己学習のフィードバック ループ) のために、これらの結論をナレッジ ベースに追加する

  • 状況が変化した場合に何が発生する可能性があるかを理解し、そのような状況にどのように対処するかを決定するサポートとなる
  • 推論は、ルール データベースに基づく構造化クエリではなく、複数のソースから収集され、さまざまな信頼度で表現される非構造化仮説
  • e.g. 自然言語処理の概念を使用して、コールセンターの会話ログや製品レビューなどのデータソースの意味を解明する

データ分析のタスク

  • 準備
  • モデル
  • 視覚化
  • 分析
  • 管理

準備

データのモデル化と視覚化に備えて、データのプロファイル、クリーニング、変換を行うプロセス

  • データの整合性の確保
  • 不正確なデータの修正
  • 欠落データの特定
  • データの構造や種類の変換
  • データを読みやすくする処理
  • データの匿名化

モデル(データモデリング)

テーブルを相互に関連付ける方法を決定するプロセス

メトリックスを定義し、カスタムの計算を追加してデータを充実させることで、モデルを拡張する

視覚化

視覚化タスクの最終的な目的は、ビジネス上の問題を解決すること

データの意味を理解するのに役立ち、正確で重大な意思決定を行うことができるようにする

分析

レポートに表示される情報を理解および解釈する

  • 分析情報の検出
  • パターンと傾向の特定
  • 結果の予測

管理

コンテンツの適切な管理と共有

  • データ資産の管理
  • レポートやダッシュボードなどのアイテムの共有と配布の監視
  • データ資産のセキュリティの確保