無料Google Sheetsで学ぶ!アンケート定量分析入門:回答データのクロス集計と集計結果の比較
アンケートデータ活用の第一歩:集計から分析へ
多くのビジネスシーンで、顧客満足度調査、従業員意識調査、製品利用アンケートなど、様々な目的でアンケートが実施されています。アンケートによって収集されたデータは、現状の把握や改善のための貴重な情報源となります。
しかし、アンケート結果を集計するだけで終わってしまい、そのデータに秘められた深いインサイト(洞察や示唆)を引き出せていないケースも少なくありません。単なる合計値や平均値を見るだけでは、例えば「どのような属性の回答者が、特定の設問に対して異なる意見を持っているのか」といった、ビジネス上の意思決定に直結する重要な情報を見落としてしまう可能性があります。
この記事では、表計算ソフトの利用経験がある方を対象に、無料ツールであるGoogle Sheetsを使ってアンケートの定量データを分析する基本的な手法、特に「クロス集計」と「集計結果の比較」に焦点を当てて解説します。これらの手法を用いることで、単なる集計結果では見えなかったデータ間の関係性や、回答者グループごとの傾向の違いを明らかにし、アンケートデータをより効果的に業務に活用できるようになることを目指します。
なぜGoogle Sheetsでアンケート分析を始めるのか
Google Sheetsは、多くのビジネスパーソンにとって馴染み深い無料の表計算ツールです。ウェブブラウザがあれば利用でき、特別なソフトウェアのインストールは不要です。アンケートツールとして広く利用されているGoogle Formsからのデータエクスポートも容易で、スムーズに分析を開始できます。
メリット:
- 無料かつ手軽: 追加のコストなしで利用開始できます。
- 操作性の高さ: 表計算ソフトの基本操作ができれば、分析を進めることができます。
- データ連携: Google Formsをはじめ、様々な形式のデータをインポートできます。
- 共有の容易さ: 分析結果をチームメンバーと簡単に共有できます。
デメリット:
- 大規模データへの制約:非常に大量のデータを扱う場合や、複雑な統計分析には向かない場合があります。
- 高度な機能の限界: プログラミング言語(Python/Rなど)や専門の統計ソフトに比べると、利用できる分析手法やカスタマイズ性に限りがあります。
しかし、アンケートの基本的な定量分析を行う上で、Google Sheetsは非常に有用なツールです。まずは身近なツールでデータ分析の基本を学ぶのに適しています。
アンケート定量分析の基本手法:クロス集計と集計結果の比較
ここでは、アンケートの定量分析において特に役立つ二つの手法について説明します。
1. クロス集計 (Cross Tabulation)
クロス集計とは、2つ以上の設問の回答を組み合わせて集計する手法です。例えば、「性別」と「商品Aの購入経験」といった二つの設問を掛け合わせて集計することで、「男性の購入経験率」と「女性の購入経験率」の違いを明らかにするといった分析が可能になります。
- なぜ役立つのか: 回答者全体ではなく、特定の属性や行動を持つグループ(セグメント)ごとの傾向を把握できます。「売上貢献度の高い顧客層は、どのような製品特徴を重視しているか?」や「特定キャンペーンの接触者は、ブランドイメージをどう評価しているか?」といった問いに答える手がかりが得られます。
2. 集計結果の比較
これは、特定の条件で絞り込んだ回答者グループ間で、特定の設問に対する回答の分布や平均値などを比較する手法です。例えば、サービス利用開始時期が早いグループと遅いグループで、ロイヤルティ(忠誠心)に関する設問への回答傾向を比較するといった分析を行います。
- なぜ役立つのか: グループ間の違いを明確にすることで、施策の効果測定(例:新機能導入前後の満足度の変化)や、異なる属性を持つ顧客へのアプローチ方法の検討に繋がります。クロス集計も一種の比較分析ですが、ここではFILTER関数などを用いて柔軟にグループを抽出・比較する方法を含みます。
Google Sheetsでの実践:具体的な分析ステップ
ここでは、具体的な操作手順を見ていきます。Google Formsで収集したアンケートデータをSheetsに連携・エクスポートした状態から始めます。データは1行が1回答者に対応し、各列が設問への回答やタイムスタンプになっている形式を想定します。
例として、「顧客アンケートデータ」を用いて、以下の分析を行います。
- クロス集計例: 「年代別」の「商品Aの利用頻度」の違いを調べる。
- 比較分析例: 「Web広告経由の顧客」と「SNS経由の顧客」で「総合満足度(5段階評価)」を比較する。
ステップ1:データの準備・整形
分析を始める前に、データが分析しやすい形式になっているか確認します。
- ヘッダー行: 1行目が設問名など分かりやすいヘッダーになっているか確認します。
- データの形式: 回答が選択肢形式の場合、テキストや数値(例: 満足度を1-5の数値)で記録されていることを確認します。自由記述欄は今回の定量分析では主に使用しません。複数回答の設問は、分析方法が少し複雑になるため、今回は単一回答の設問を対象とします。
- 不要なデータの削除: テスト回答など、分析対象外の行や列があれば削除します。
データがGoogle Formsから直接エクスポートされたものであれば、基本的には整形済みですが、必要に応じて列名を見直したり、数値への変換を行ったりします。
ステップ2:クロス集計の実践(ピボットテーブル)
「年代別」の「商品Aの利用頻度」の違いを調べるクロス集計を行います。
-
ピボットテーブルの作成:
- 分析対象のデータ範囲(表全体、または特定の列範囲)を選択します。
- メニューの
挿入
>ピボットテーブル
を選択します。 - 新しいシートに作成するか、既存のシートに作成するかを選びます。通常は新しいシートを選んだ方が整理しやすいでしょう。
作成
ボタンをクリックします。
-
ピボットテーブルの設定:
- 新しいシートに「ピボットテーブルエディタ」が表示されます。ここで分析軸となる項目を設定します。
- 行 (Rows): 「年代」の列を選択します。回答者の年代がここに表示されます。
- 列 (Columns): 「商品Aの利用頻度」の列を選択します。利用頻度(例: 毎日, 週に数回, 月に数回...)がここに表示されます。
- 値 (Values): 何を数えるか、または集計するかを指定します。ここでは、各年代・利用頻度の組み合わせに該当する回答者数を数えたいので、回答者IDの列や、いずれかの回答者特定可能な列(例: タイムスタンプ)を選択し、集計方法を「COUNTA」(空白でないセルの個数を数える)または「COUNT」にします。通常は「COUNTA」が良いでしょう。
- 設定が完了すると、ピボットテーブルの領域にクロス集計表が表示されます。行に年代、列に利用頻度が並び、それぞれの交差するセルに回答者数が表示されているはずです。
-
構成比(%)の表示: 回答者数だけでなく、合計に対する割合(構成比)で見た方が傾向が分かりやすい場合があります。
- ピボットテーブルエディタの「値」セクションで、集計方法を設定した項目(例: COUNTA of タイムスタンプ)の下にある「表示形式を次として表示」ドロップダウンをクリックします。
- 「行の合計に対する割合 (%)」または「列の合計に対する割合 (%)」を選択します。
- 「行の合計に対する割合 (%)」を選ぶと、「各年代の中で、利用頻度ごとの割合がどうなっているか」を見られます(例: 20代の回答者のうち、「毎日」利用している人の割合は何%か)。
- 「列の合計に対する割合 (%)」を選ぶと、「各利用頻度の回答者のうち、どの年代が何%を占めているか」を見られます(例: 「毎日」利用している回答者のうち、20代は何%を占めているか)。
- 見たい切り口に応じて適切に選択します。多くの場合、行の合計に対する割合で「各グループ内の傾向」を見るのが一般的です。
ピボットテーブルを使えば、数クリックでクロス集計表を作成できます。
ステップ3:集計結果の比較の実践(FILTER関数など)
次に、「Web広告経由の顧客」と「SNS経由の顧客」で「総合満足度(5段階評価)」を比較します。この例では、特定の条件(顧客の流入経路)でデータを抽出し、それぞれのグループの満足度を集計して比較します。
-
データを抽出・表示: 特定のグループのデータのみを表示するには、FILTER関数が便利です。
- 例えば、新しいシートや空いているセルに、Web広告経由の顧客のデータのみを表示したいとします。顧客の流入経路が記録されている列(例: 列D)があり、「Web広告」と入力されていると仮定します。総合満足度が記録されている列(例: 列E)と流入経路の列を表示したい場合、以下のFILTER関数を使用します。
excel =FILTER(A:Z, D:D="Web広告")
*A:Z
は元のデータ範囲(適宜調整してください)。D:D="Web広告"
は条件式で、「列Dの値が'Web広告'である行」を抽出するという意味です。 * 同様に、SNS経由の顧客データも別の場所に表示します。excel =FILTER(A:Z, D:D="SNS")
-
抽出したデータの集計: 抽出されたデータに対して、総合満足度の平均値を計算します。満足度データが抽出後の表の列E(元の表と同じ列番号かは抽出関数により変わる場合があります。ここでは抽出後の表での列Eと仮定)にあるとします。
-
Web広告経由顧客の満足度平均:
excel =AVERAGE(抽出したデータ範囲!E:E)
(抽出したデータ範囲!E:E
は、上記FILTER関数で表示された結果のうち、満足度の列を指します。例えば、FILTERの結果が別シートのA1セルから始まっている場合、満足度の列がE列であればSheets!E:E
のようになりますが、FILTER関数で表示される列は、元の範囲の列順になるため、FILTER関数で表示された表の何列目が満足度か確認が必要です。FILTER関数で表示されたデータ範囲を直接AVERAGE関数で指定する方が確実です。例えば、=AVERAGE(FILTER(A:Z, D:D="Web広告")!E:E)
のようにも書けますが、よりシンプルに、FILTERで表示させたデータ範囲に対してAVERAGE関数を使うのが分かりやすいでしょう。) -
SNS経由顧客の満足度平均:
excel =AVERAGE(抽出したデータ範囲!E:E)
(同様に、SNS経由で抽出したデータに対する満足度列を指定します。) -
あるいは、元のデータに対して直接QUERY関数などを用いて集計することも可能です。QUERY関数はSQLのような構文で、抽出と集計を一度に行える強力な関数です。
```excel 'Web広告経由の満足度平均 =AVERAGE(QUERY(A:Z, "SELECT E WHERE D='Web広告'", 1))
'SNS経由の満足度平均 =AVERAGE(QUERY(A:Z, "SELECT E WHERE D='SNS'", 1))
`` *
A:Zは元のデータ範囲。
"SELECT E WHERE D='Web広告'"はQUERYの条件式で、「列Dが'Web広告'である行の列Eを選択せよ」という意味です。
1` はヘッダー行数を指定します。このQUERY関数で抽出された満足度データの平均値をAVERAGE関数で計算しています。 -
-
結果の比較と可視化: 計算された平均値を並べて比較表を作成したり、棒グラフなどで視覚的に比較したりします。
- 比較表を作成し、「Web広告経由」「SNS経由」それぞれのグループ名と対応する平均満足度を記載します。
- この比較表をもとに、メニューの
挿入
>グラフ
を選択し、棒グラフなどを挿入すると、両グループの満足度平均の違いが一目で分かりやすくなります。
FILTER関数やQUERY関数は、Google Sheetsでデータを柔軟に操作する上で非常に強力です。最初は難しく感じるかもしれませんが、基本的な使い方を覚えれば、様々な分析に応用できます。
よくある疑問や注意点
- データの整形はなぜ重要? 分析関数やピボットテーブルは、データが一定のルール(例: 各列が同じ種類のデータ、重複行がない、表記ゆれがない)に従っていることを前提としています。データが綺麗でないと、期待通りの結果が得られなかったり、エラーの原因になったりします。
- サンプルサイズとは? 分析対象となるデータの個数のことです。特定のグループの回答者数が極端に少ない場合、そのグループの分析結果は全体の傾向を代表していない可能性が高いため、解釈には注意が必要です。
- 相関関係と因果関係: 「年代が上がるほど、満足度が高い傾向がある」という相関関係が見られたとしても、それが「年代が上がるから満足度が高い」という因果関係を示すとは限りません。他の要因が影響している可能性も考慮が必要です。
- ピボットテーブルが更新されない? 元のデータが変更されても、ピボットテーブルは自動では更新されません。ピボットテーブルの範囲内で右クリックし、「データを更新」を選択する必要があります。
分析結果をインサイトに繋げる
クロス集計や比較分析によって、データ間の関係性やグループごとの違いが明らかになります。重要なのは、これらの「結果」をどのように「インサイト」に昇華させ、ビジネス上のアクションに繋げるかです。
例えば、「20代の顧客は、他の年代と比べてデザインに対する評価が低い」というクロス集計結果が得られたとします。ここから「若年層向けのデザインを見直す必要があるのではないか?」というインサイトが得られ、具体的な施策検討に繋がります。
分析結果は、必ず業務上の課題や目的に照らし合わせて解釈することが重要です。「この結果は何を意味するのか?」「この結果から、どのような改善策や新しい施策が考えられるか?」を議論することで、アンケートデータは単なる数字の羅列から、価値ある情報へと変わります。
まとめ:Google Sheetsで始めるアンケートデータ活用
この記事では、無料のGoogle Sheetsを使用してアンケートの定量データを分析する基本として、クロス集計と集計結果の比較方法を解説しました。ピボットテーブルやFILTER関数、QUERY関数といったSheetsの機能を活用することで、複雑な分析ツールを使わずとも、回答データから有用なインサイトを引き出すことが可能です。
アンケートデータ分析は、現状理解、課題発見、施策立案、効果測定など、様々なビジネスプロセスにおいて強力なサポートとなります。まずは身近なGoogle Sheetsを使って、今回ご紹介した手法からアンケートデータ分析の一歩を踏み出してみてはいかがでしょうか。
さらに深掘りしたい場合は、複数のアンケート結果を結合して分析したり、統計的な手法(例:t検定など、無料ツールでも可能な範囲で)を用いてグループ間の差が偶然ではないかを確認したりする方法などがあります。サイト内の他の記事も参考に、データ分析のスキルを広げていくことをお勧めします。