ビッグデータの意味と活用事例を代表的な分析手法とともに解説
2023年10月20日
ビッグデータとは、大量かつ多種多様なデータのことです。Volume(量)、Variety(種類)、Velocity(速度)の3つの特性があり、GPSの位置情報やスーパーのPOSデータなどが該当します。
内容に規則性がない膨大なデータのため、これまではデータの処理や分析が難しいとされていました。しかし近年のテクノロジーの進歩や官公庁の推進が後押しとなり、ビッグデータを分析して事業に活用しようとする動きが活発になってきています。
この記事では、ビッグデータの特性やデータの活用でできること、分析結果をビジネスに活かした事例を解説します。
ビッグデータとは
ビッグデータとは、大量かつ多種多様なデータを指します。明確な定義はありませんが、得られたデータを分析することで、事業に役立つ情報を見つけ出すことができます。
▼ビッグデータの一例
- コンビニやスーパーなどのPOSデータ(販売情報)
- センサーデータ
- 日々の在庫データ
- アクセスログ
- メールの内容
ビッグデータを構成するデータは、以下の3つに分類できますが、多くを占めるのは「半構造化データ」と「非構造化データ」です。
▼データの種類
構造化データ | 概要 | 行と列からなる表形式のデータ |
特徴 | Excelなど表計算ソフトで扱え、集計・分析が容易 | |
具体例 | POSデータ、顧客データ(住所、クレジットカード情報など) | |
半構造化データ | 概要 | 大きなくくりで見ると非構造化データだが、ある程度構造化されているデータ |
特徴 | 集計・分析を行う際は、データの整理や変換などの処理が必要 | |
具体例 | XML形式、JSON形式のデータ | |
非構造化データ | 概要 | 表形式へ変換できないデータで、音声や動画・画像など、テキスト以外のデータも含む |
特徴 | 集計、分析を行う際は、データの整理や変換など手を加えることが必要(アフターコーディングなど) | |
具体例 | Webサイトの商品レビュー、監視カメラ映像 |
ビッグデータの特性
ビッグデータは量が多いだけではなく、以下の3点の特性があると言われています。
▼ビッグデータの特性を示す3V
Volume(量) | 膨大な容量 |
---|---|
Variety(種類) | テキスト、音声、画像、動画、位置情報など多様な種類 |
Velocity(速度) | 発生速度や頻度が高い |
また最近では、上記の3要素に以下2点を加えて「5V」とも言われています。
▼5Vで追加される2要素
Veracity(正確性) | 正確なデータ |
---|---|
Value(価値) | 価値ある、もしくは価値を産み出せるデータ |
ビッグデータの具体例
総務省の「平成29年情報通信白書」によると、ビッグデータは以下の4つに大別されます。
【1.オープンデータ】
政府や地方公共団体が提供しているデータです。ビッグデータとして先行している分野で、「官民データ活用推進基本法」を踏まえ、政府や地方公共団体が保有する公共情報について、データとしてオープン化を強力に推進することとされています。
【2.暗黙知(ノウハウ)をデジタル化・構造化したデータ】
農業やインフラ管理からビジネスなどに至る産業や企業が持つ、パーソナルデータ以外のデータです。「知のデジタル化」とも言われており、産業データに位置づけられます。
【3.M2Mから吐き出されるストリーミングデータ】
M2Mデータ(Machine to Machine)とは、工場などの生産現場にあるIoT機器から収集されるデータや、橋梁に設置されているIoT機器が察知した歪みや振動などのセンシングデータを指します。「知のデジタル化」同様、情報の生成及び利用の観点から、産業データとして位置づけられます。
【4.個人の属性に係るパーソナルデータ】
パーソナルデータは、個人の属性情報や行動・購買履歴などを指します。「改正個人情報保護法」では、ビッグデータの適正な利活用に資する環境整備として「匿名加工情報」の制度が設けられました。そのため、特定の個人を識別できないよう加工された情報であっても、個人との関係性が見出される情報として「パーソナルデータ」に含まれます。
なお、ビッグデータの具体例として、総務省「ビッグデータの活用に関するアドホックグループの検討状況」では以下が紹介されています。
▼具体的なビッグデータの例
データ名 | データの具体例 |
---|---|
ソーシャルメディアデータ | SNSのプロフィール情報やコメント |
カスタマーデータ | CRM上の会員データやDMなどの送付履歴 |
オフィスデータ | 業務書類やEメールなど |
ログデータ | ウェブサーバ上のアクセスログやエラーログなど |
オペレーションデータ | POSデータや取引明細データなど |
センサーデータ | GPSデータや乗車履歴、温度、加速度など |
ウェブサイトデータ | ECサイト上での購入履歴やブログエントリーなど |
マルチメディアデータ | 動画配信サービスの音声や動画など |
ビッグデータの利活用が注目される背景は?
GPSデータやPOSデータなどのビッグデータは以前からありましたが、2010年代ごろから、企業だけでなく日本政府も利活用に着目しています。
例えば総務省は、平成24年の「情報通信白書」でビッグデータの重要性に言及しています。また、平成29年の「情報通信白書」でも、「ビッグデータ利活用元年の到来」と打ち出しています。
我が国において、その環境は整いつつある。2016年末から2017年にかけて、官民データ活用推進基本法の制定や改正個人情報保護法の全面施行などといった法整備が進められている。
~(中略)~
こういった法整備により、データの保護とのバランスを取りながら活用を促進する動きが加速することが見込まれる。もとよりデータ利活用のニーズは高かったが、こうした環境整備によって予見可能性が高まり、今後一気にデータ利活用が進み、本年は「ビッグデータ利活用元年」となる可能性がある。
引用:総務省「平成29年情報通信白書 第1部 特集 データ主導経済と社会変革」
ビッグデータの利活用は年々注目が高まっていますが、その背景には2つの要因があります。
データ量の爆発的増加
近年、世界中で扱われるデータ量は爆発的に増加しています。
例えば、これまで紙ベースでの作成や保存が主だった書類などのアナログデータは、徐々に電子化され、デジタルデータへと移行しつつあります。また、スマートフォンの流通を機に各種SNSの活用も広まるなど、テキストから写真・動画まで、数えきれないほどの情報が日々扱われています。
誰もが時間や場所に縛られず、膨大な情報を容易に発信したり獲得したりできるようになり、国や企業も今まで以上にビジネスや行政サービスにビッグデータを活用しようとしています。
テクノロジーの進歩
ビッグデータを分析する技術が発展したことも、データの利活用が広まるきっかけの1つです。
膨大な量のビッグデータを管理・分析するには、CPUの性能がよくメモリ容量も多い高性能なコンピューターやシステムが必要です。以前は限られた人や企業しか有していなかった技術ですが、データ処理速度の高速化やAIの普及などテクノロジーの進歩を受け、膨大なデータの蓄積や迅速な分析を誰もが行えるようになりました。
多くの人がビッグデータを扱えるようになったことで、結果的にビジネスで活用されるシーンが増え、データの利活用が注目され始めました。
官公庁によるデータ活用の環境整備
民間企業だけでなく、官公庁でもビッグデータの利活用が推進されつつあります。
例えば、2016年に制定された「官民データ活用促進基本法」では、ビッグデータ活用を促進するため、必要であれば公的機関と民間企業が互いに有益なデータの分析・管理を共同で行えるよう、データの流通範囲を拡大しました。これを機に、民間企業は国や自治体が有するビッグデータを活用できるようになりました。
官公庁がデータ活用の環境整備を率先して行うことで、今後より多くの企業でビッグデータの活用が促進されることが期待されています。
ビッグデータの活用でできること
ビッグデータを活用して具体的にどのようなことができるのか、3つのビジネスシーンから解説します。
新たなビジネスモデル創出
ビッグデータを活用すれば、顧客の嗜好や市場動向を高い精度で予測することができます。そのため、製品やサービスの改善点を見つけることや、新たなビジネスモデルの開発が可能になります。
データに基づいた、精度の高い意思決定
ビッグデータは、勘や経験に頼らない意思決定に役立ちます。
例えば小売業界の場合、購買までの動線や視線の動きなど消費者行動に関するデータを収集・分析することで、勘や定説にとらわれない、顧客の実態にあった商品配置の改善を行うことができます。また、鉄道業界であれば、鉄道の異常検知をビッグデータとして蓄積・分析することで、メンテナンス時期を事前に予測し、安全管理に役立てることができます。
顧客満足度の向上
ビッグデータを分析すると、ユーザーの関心や課題感、購買傾向などが可視化されるため、ニーズを的確に把握できます。把握したニーズをもとに顧客に寄り添った施策を打ち出すことができれば、顧客満足度の向上が期待できます。
ビッグデータを活用する際の注意点
ビッグデータを活用できるシーンは多岐にわたりますが、注意してデータを扱わないと、経営に影響が出るような問題が発生しかねません。本章では、ビッグデータを活用する際に注意が必要な3つのポイントを解説します。
コストがかかる
ビッグデータは、膨大なデータ量を蓄積、管理できるシステムが必要です。これからビッグデータを扱いたい場合、データ基盤やツールを新たに導入する必要があるため、大きなコストがかかります。さらに、システム維持や万が一の故障などトラブル発生時には、追加費用を支払う必要があります。
また、ツールを用意しても、データを扱える人材がいないと意味がありません。人材の育成や確保も並行して行うとなると、人件費やアウトソーシング料金もかかります。
管理と維持の両面でコストがかかることを念頭に、データ活用までの環境整備を行うことが重要です。
データ収集に手間がかかる
ビッグデータを正確に分析するには、適切にデータを取捨選択し、かつデータの処理を確実に行う必要があります。しかし、多くのビッグデータは非構造化データであるため、データの変換や整理など、分析前に一度、手を加える必要があります。
また、収集したデータのなかには形式が統一されていなかったり、データが重複していたりと、分析に不適切なデータが多数含まれている場合もあります。ビッグデータはデータ量が膨大なためデータの取捨選択が難しくなり、手間が増えてしまうこともあります。
プライバシー保護が必須
ビッグデータのなかには、住所や顔写真など、顧客個人の情報が含まれていることもあります。個人情報の取り扱いを誤ると、企業の社会的信頼が大きく低下するおそれがあります。プライバシー保護のためデータを加工することや、流出を防ぐためにセキュリティ面を強化するなど、プライバシー保護の対策は必須です。
各国の政府もプライバシー保護への意識を高めています。例えば米国の複数の都市では、プライバシーを侵害するおそれがあるとして顔認証技術の利用が禁止されています。欧州でも、GDPR(General Data Protection Regulation:一般データ保護規則)でデータの取り扱いに規制がかけられています。
ビッグデータの分析手法
ビッグデータの分析手法は多数存在しますが、各々に向いている用途や分析に必要なデータが異なります。分析の目的を考慮し、最適な分析手法を選択することが重要です。
クロス集計
クロス集計とは、2つ以上の質問項目の回答内容をかけ合わせ、回答者属性ごとの反応の違いを見るようなときに用いる集計方法です。集計したデータを細分化して把握できるため、あらゆる統計的調査で使用されます。
クロス集計については「クロス集計表とは?基礎知識と賢い活用法」も併せてご覧ください。
ロジスティック回帰分析
ロジスティック回帰分析は、いくつかの要因(説明変数)から、2値の結果(目的変数)が起こる確率を説明・予測する統計手法です。(※2値:試験の合格/不合格のように答えが2つしかない値のこと)
多変量解析の手法の1つでもあり、マーケティングでもよく使われています。ロジスティック回帰分析は「ロジスティック回帰分析とは?用途、計算方法をわかりやすく解説!」で詳しく解説しています。
アソシエーション分析
アソシエーション分析は、一見関係性が見いだせない要素から、共通性や類似性を発見することで、要素同士の関係性を導き出す分析手法です。マーケティングの分野では、消費者の行動からマーケティング活動に資する特定のパターンを見つけ出すために活用されます。
アソシエーション分析から派生した手法には、ある商品と同時に買われやすい商品を見つけ出す手法である、「バスケット分析」もあります。詳しく知りたい方は「アソシエーション分析とは?基本情報から実際の活用シーンまで幅広く解説」をご覧ください。
決定木分析
決定木分析(デシジョンツリー)とは、ツリー構造を活用して、データの分類やパターンの抽出を行う分析手法です。機械学習のデータ分析で複数パターンを抽出したり、データから特定の情報を抜き出して整理したい場合に用いられます。
また、アンケート調査の結果や顧客情報から、消費者行動の分析も可能です。詳しくは「決定木分析とは?メリットやマーケティングでの活用方法を解説」をご覧ください。
主成分分析
主成分分析とは、膨大な変数を少ない変数に置き換える手法です。変数を要約することで、データを理解しやすくします。主成分分析では、データを1〜3つの変数(=主成分)に置き換えることが一般的で、顧客満足度調査や作品・製品評価、人事評価や人員配置に用いられます。
主成分分析については「主成分分析とは?因子分析との違いや事例を初心者にも分かりやすく解説」で詳しく解説しています。
クラスター分析
クラスター分析は、データ全体から似たもの同士をグループ分けする方法です。性別・年齢・在住地域といったデモグラフィックなデータではなく、意識や価値観など、はっきり定まっていない指標によって分類を行います。
クラスター分析は以下の2つに大別されます。
▼クラスター分析の種類
階層クラスター分析 | 似ている対象を、順々に複数のクラスター(集団)にまとめる方法。デンドログラム(樹形図)を用いることで、グルーピングする過程を視覚的に把握できる。 |
---|---|
非階層クラスター分析 | 集団全体から、似たもの同士が同じクラスターに入るように分割する方法。事前にグループ数を決めており、階層的な構造はないため、個体数が多い場合に適している。 |
ビッグデータは個体数が多いため、クラスター分析を用いる場合は非階層クラスター分析が採用されることが一般的です。詳しく知りたい方は、「クラスター分析とは?その手法と応用例を図解!」もご覧ください。
ビッグデータの活用事例
総務省の「ビッグデータの流通量の推計及びビッグデータの活用実態に関する調査研究報告書」によると、データの活用目的は以下の8つと紹介されています。
- 経営戦略、事業戦略の策定
- 顧客や市場の調査・分析
- 商品・サービスの品質向上
- 経営管理
- 内部統制強化
- 業務の効率化
- 基礎研究、学術研究
- 在庫圧縮、最適供給
最後に、ビッグデータをビジネスシーンで役立てている事例を2つ紹介します。
【自動車メーカー】カーナビを搭載している自動車同士でデータ共有
自動車メーカーAでは、防災や天気、省燃費ルートなどの情報を発信するナビサービスを提供していますが、このサービスを搭載している車の走行データを蓄積、共有することで、渋滞の回避や目的地へのより早いルート案内なども行っています。
走行データを活用した渋滞予測による効果検証結果では、約20%早いルートが案内され、CO2換算では約16%の削減効果がありました。また、走行データから急ブレーキポイントの多発地点を抽出し、街路樹の剪定や路面標示を設置したところ、急ブレーキの回数が約7割も減少しました。
さらに、外部機関と連携し、災害時には通行実績マップの作成・公開も実施しました。日々の快適な運転に加え、安全面でもビッグデータが役立っていることがわかります。
参考:総務省「平成24年版情報通信白書」
【インフラ企業】発電プラントの異常を即座に感知
インフラ企業Bでは、プラントの運転監視用センサーを発電所に設置し、振動・圧力・温度・加速度センサーなどから大量のデータを収集・分析してデータベース化しています。データベース化したビッグデータを活用するため、各施設や機器の状態を把握し、正常運転とは異なる動きを早期に検出するシステムをメーカーと共同開発しました。
その結果、これまで故障や異常が発生した段階で検知していましたが、予兆段階で検知できるようになり、さらに原因となっている部分も速やかに特定できるようになりました。
インフラ事業では、安定・安全・安心の確保が最重要課題です。本システムにより、より安全で品質の高い施設運用の実現が期待されています。
参考:総務省「ビッグデータの流通量の推計及びビッグデータの活用実態に関する調査研究報告書」
まとめ|ビッグデータはビジネスチャンス創出や意思決定に役立つ
ビッグデータは、大量かつ多種多様なデータです。近年のデータ量の爆発的な増加や技術の進歩を受け、今やあらゆる業界でビッグデータが活用されています。今後さらにテクノロジーが進歩し新たな技術が生まれることで、さらなる活用が進むことが期待されます。
ビッグデータを使いこなすには、プライバシー保護や情報流出防止などの対策を行いつつ、目的に応じて分析手法を使い分けることが重要です。これにより、自社のビジネスチャンス創出や精度の高い意志決定につながります。
- 3分で読めるGMOリサーチ&AIのサービス
-
GMOリサーチ&AIは、オンラインリサーチや海外調査などのサービスで、消費者ニーズに役立つサービスを提供しています。業界トップクラスのモニター数を有していますので、アンケート調査を行う際にはぜひご相談ください。
- 資料ダウンロード
よくある質問
Q1.ビッグデータについてよく聞く3Vとは? |
---|
ビッグデータの特性を示す用語で、それぞれ以下のとおりです。
詳しくは「ビッグデータの特性」の章をご覧ください。 |
Q2.ビッグデータを活用して、何ができる? |
ビッグデータを活用してできることは、以下の3つです。
詳しくは「ビッグデータの活用でできること」の章をご覧ください。 |
- サービス概要を無料配布中「3分で読めるGMOリサーチ&AIのサービス」
-
GMOリサーチ&AIはお客様のマーケティング活動を支援しており、さまざまなサービスを提供しております。
- スピーディーにアンケートデータを収集するには
- お客様ご自身で好きな時にアンケートを実施する方法
- どこの誰にどれくらいリーチができるか
ぜひこの機会にお求めください。 - 資料請求する