統計分析の基本と分析モデルについて

 2020.08.14  マーケティング インテリジェンス チャンネル

ビジネスシーンで「統計分析」あるいは「統計学」という言葉を耳にする機会が多くなったように感じるでしょう。実際に統計分析は、今日のビジネスを支える重要な役割を果たす分析手法となっています。

しかし、統計分析の意味はなんとなく理解できても「統計分析とはなんですか?」と問われて、正確に答えられる方は少ないでしょう。これからの時代、全てのビジネスパーソンが統計分析に関するなんらかのスキルを備えておく必要があります。特にマーケティングや経営企画などに携わる人は必須と言えます。

そこで本記事では、「統計分析とは?」というシンプルな疑問に真面目に答えていきたいと思います。また、代表的な分析モデルについても解説します。これを読み終われば統計分析の概要は掴んでいる状態になれるので、その後はより具体的な知識やスキル習得等に取り組んでみていただければ幸いです。

analytical-model

統計分析とは?

我々の周囲、特にビジネスシーンにおいては常に膨大なデータが存在しています。そして、それらのデータは一様ではなく必ず不確実性(バラツキ)を持って生まれます。そうして集まったデータの集合体を外側から単に眺めるだけでは、データから特定の事実を抽出してビジネスに活かすことはできません。そこで人はデータの統計(データの母集団を数量的に測ること)を取り、分析を通じて1つの事実や傾向を導き出します。これが統計分析です。

もっと噛み砕いて説明してみましょう。データ自体を眺めてみると、その1つひとつにさしたる意味はなく、ある事象のそのまたごく一部分を抜き取った情報に過ぎません。それはまるで、数千ものカケラから成るパズルの1ピースのようなものです。しかし数千ものピースをかき集め、それらを前にして論理的な思考を働かせば、少しずつ、1つの大きな絵を完成させることができます。統計分析もこれと同じように、1つひとつには大きな意味のないデータをかき集めて分析することで、ビジネスにとって大きな価値のある事実を導き出すことができるのです。

統計分析が用いられている最も身近な例が「平均身長」です。例えば、日本人男性と欧米人男性をそれぞれ100名ずつ集めて身長を計測し、100名分のデータを集めたとします。

これらのデータを単純に比較するだけでは、何かを判断することはできません。なぜなら、データを比較しようにも比較する基準がないからです。1人目に身長を測定した日本人男性と欧米人男性の数値を比較して何が判断できるでしょうか?必要なのは統計分析を通じて、これらのデータから1つの真実を導き出すことです。つまり、「平均身長」を計算することで日本人男性と欧米人男性の平均的な身長差を知ることができます。

これが統計分析です。言い換えれば、統計分析とは「物事をシンプルに考えて意思決定に必要な情報を導き出すためのツール」ということです。

 

統合的マーケティング・アナリティクス戦略に必要な7つのステップ
導入事例:ダイキン工業株式会社

統計分析の種類

統計分析には一般的な分類として「記述統計」と「推計統計」があります。それぞれの違いは次の通りです。

記述統計

あるデータに対し、そのデータの特徴をよりわかりやすく表現するための統計分析です。上記の平均身長や、クラスの平均点、一般的に平均値を求めるような統計分析は全て記述統計に分類されます。また、データをグラフや表として表し、視覚的に理解しやすいようデータを整えるのも推計統計に分類されます。

 

推計統計

推計統計では、限られたデータサンプルから調査したい母集団全体の特徴を推計するための統計分析です。推測統計とも呼ばれます。この統計分析では、手元にあるデータを母集団の中の小さなサンプルデータにすぎないと考えます。例えば「日本人の平均年収」を調査するにあたり、全人口の年収データを取得して調査することは骨の折れる作業です。そのため最低限必要なサンプルデータを収集して推計と呼ばれる手法で母集団となる日本人全体の平均年収を求めます。

 

ベイズ統計

もう1つ、これらの統計分析とは別に位置される「ベイズ統計」というものがあり、これは「主観確率」を扱う統計分析です。「サイコロの1の目が出る確率は?」という問いに対し誰もが1/6と回答するでしょう。これは「客観確率」と呼ばれます。一方、主観確率とは分析者の主観的に捉えられる確率のことで、人によっては1/3と回答する場合もあれば1/100と回答する場合もある確率のことです。ベイズ統計では最初に目安となる確率を設定しておき、新しい情報が入るたびに「その時点での確率」を判定します。いわゆる確率精度を高めていく手法です。

統計分析に用いられる分析モデル

次に、統計分析の現場でよく用いられている分析モデルをご紹介します。これらの分析モデルは学習次第で誰でも手に入れられるスキルなので、興味があればぜひ調べてみてください。

1.アソシエーション分析

共起しているデータには必ず何かしらの関連性があると考え、そこに隠れている要因を明らかにするのがアソシエーション分析です。この分析手法の一種が「マーケットバスケット分析」であり、POSシステムの登場によって一躍有名になりました。

マーケットバスケット分析では消費者が購入している商品をデータとして分析し、例えば「商品Aを購入した消費者の75%が商品Bも購入している」などの関連性を見つけ出します。そこからある仮説を立て、検証し、実証してビジネスに有用な知見を発掘します。ちなみにアソシエーション分析とマーケットバスケット分析は、「データマイニング(データの発掘)」と呼ばれるデータ活用に分類される分析手法です。

2.クラスター分析

性質の異なる複数のデータが混ざり合って存在している状況から、類似性の高いデータをクラスター(集団)として分類し、それらの関係性を分析する手法です。ポイントは「クラスターの分類方法」「分類の形式(階層的か非階層的か)」「分類に用いる対象間の距離」「クラスターの合併方法」です。

中でも重要なのが「分類に用いる対象間の距離」で、つまりはデータ同意の類似性をどうやって定義するかが分析精度を大きく分けることになります。

3.ロジスティック回帰分析

ロジスティック回帰分析は回帰分析の一種です。回帰分析は様々な事象の関連性を確認するための統計学であり、例えばアイスクリームの需要を予測するにあたって、気温や天気という要素からアイスクリームの需要を考えます。そして、1つの変数(xやyなどの数量を表す)から予測するものを単回帰分析、複数の変数から予測するものを重回帰分析と呼び、ロジスティック回帰分析はその中で重回帰分析に分類されます。

ロジスティック回帰分析を用いることでゼロから1の間で事象の発生率を予測でき、その確実性を高めることでマーケティング等に活用できるデータ分析手法です。

 

4.主成分分析

クラスター分析によってデータ分析を続けると、類似したデータのクラスタ数が膨大になり、分類が複雑になるだけでなく分析が行いにくくなります。そこで、クラスタリングをやりやすくするために、データを整理してクラスタ数を限定するのが主成分分析です。

 

分析を支える環境の重要性

以上、簡単に統計分析についてご紹介しました。

統計分析・データ分析をビジネスシーンで当たり前のように活用する時代はすでに到来しています。しかし、それらのデータはあらゆるところに分散しており、大局を見極めるためにはそのデータ群を統合することが大きなポイントになります。例えばマーケティング分析を行うためのDatoramaではデータを統合して容易に分析することが可能になります。このようなツールを有効活用することでマーケティングなどにおいて精度の高い施策を行えるようになるでしょう。

自身のキャリアップのため、そしてより良いビジネスのために統計分析の活用について、ぜひ検討してみてください。

導入事例:KDDI株式会社

RECENT POST「マーケティング分析」の最新記事


統計分析の基本と分析モデルについて
統合的マーケティング・アナリティクス戦略に 必要な7つのステップ

RANKING人気資料ランキング

RECENT POST 最新記事

ブログ購読のお申込み

RANKING人気記事ランキング