「ビッグデータ」それは現代の錬金術?
2013年06月25日
国際協力研究科 有田富美子
アベノミクスの一つに「ビッグデータを10兆円市場に」という戦略がある。これは、ITの発展と共に大量のデータを保存出来るようになり、このデータを分析すると今まで気がつかなかったことがわかり、今後の行動への指針が立てられるというものだ。
「ビッグデータ」とは
従来は、仮説の検証や将来の予測などをするときに、仮説に基づいて必要な調査を行ってデータを集め、分析して、仮説の正当性を検証してきた。ところが、ITの発達と共に、社会生活の中で大量のデータが発生し、当初の目的が終わっても、そのデータを保存する環境が作れるようになった(コンピュータのデータ保存容量が増えた)。
たとえば、コンビニで見られるPOSシステムは、大量のデータを保有している。ITを使用しないころは、伝票で処理し物流が完了したら廃棄していた。今は、どの店で何時に何が売れているかをセンターは把握しており、その地域で急に雨が降れば、店員が傘の配送をセンターに発注しなくても、たちどころに傘が到着し売り上げが伸びる。伝票の内容はデジタルで保存する。POSでは、各店の、その日の天気、気温、購入者の性別・年齢なども入力して、売れ筋商品を見極め、狭い店舗に売れ筋の商品を陳列する。最近は、カードを見せると商品が安くなったり、ポイントをつけたりしている店がある。カードは、その人の正確な年齢や住所、購入金や購入頻度わかるので、店にとっても、客層をつかむためにはとても便利な方法である。この結果、消費者も店もwin-winの関係となり、カードを使うお客が目に付く。このように、ビッグデータを分析することによって、その地域にあった品物や、他店と区別して特徴のある品物の陳列の工夫ができるようになる。
そのほかにも、荷物につけたICタグの情報や携帯電話のGPSが発するログファイル、写真やビデオのデジタルデータ、オンラインショッピングの売買履歴レコードなど、さまざまな種類のデータがつくられ、ネットワークを介して次々と蓄積されていく。このように、ビッグデータは、社会の中で記録されているさまざまな情報をデータとして集めたものである。通常、データの件数は巨大であり、データの構造が決まっているわけではない。
「ビッグデータ」の分析
「ビッグデータ」は、分析する目的が先にあるのではなく、情報があるから、使うかどうかは別として、まず保存しておく事から始まる。
次に「日曜日にスーパーに買い物に来るお父さんのために有効な品揃えは何か」を予測するときには、「ビッグデータ」の中から、「購入者の性別・年齢」、「購入品の種類」、「購入額」だけでなく、「天気」、「マイカーを持っているか」、「そのほかでどのような購入をしているか」など使えそうなあらゆる項目を探してきて分析をかける。その結果、お父さんのプロファイリングができ、商品陳列が的確となる。注意しなければいけないのは、分析結果は、「雨の日は傘が売れる」といった当り前のことが大部分である。時には「ビールと紙おむつを同時に買うお客が多い」という分析結果から、ビールと紙おむつを並べて陳列する」といった現実では奇妙な結果も混じるし、「風は吹けば桶屋が儲かる」といった因果関係が出てくることもある。分析結果は、鵜呑みにしないで、有効なのかどうか十分な検討が必要だ。
分析手法は、統計学で通常使われている回帰分析や因子分析のほか、ニューラルネットワーク、決定木、コレスポンデンス分析、コンジョイント分析など多様な手法を活用し、データマイニングと呼ばれている。どのデータにどの分析をかければうまく説明出来るかは、データの分野によって異なり、まだまだ分析されていないデータが大量に眠っているのが現状である。
成長戦略に向けて
今年(2013年)4月には、日立製作所と博報堂が、「マーケット・インテリジェンス・ラボ」を立ち上げ、「ビッグデータ」の解析事業で提携し、販売促進策などの助言まで一貫して請け負うサービスが始まった。新サービスでは、まず顧客企業が季節や地域帯別の売上高、来店人数、仕入れ価格などの個別データを提供するし、解析担当の日立は顧客企業の製品名や社名と関連する言葉を交流サイト(SNS)から集計する。博報堂は独自に蓄えたノウハウを加味して、顧客企業に効果的な新製品開発やマーケティング手法を提案する。料金も中堅・中小企業が利用できる水準に抑え、3年後に300億円程度の売り上げを目指している[1]。
全省庁・自治体のデータの公開
国勢調査や経済センサスをはじめとして、税金を使って大量の調査が行われている。1回の国勢調査の結果だけでも本棚の2-3段を占拠するほどの報告書が作成されるが、元のデータを十分に活用しているわけではない。男女別・地域別・年齢別・収入階層別のクロス表などという詳細な表は作られていない。詳細なメッシュデータは、マーケティングには欠くことのできないものである。
統計、道路交通、気象など省庁・自治体の持つ「ビッグデータ」を開放して民間も活用する「オープンデータ」は2013年から本格的に動き始めた。役所情報の著作権をフリーにできるのか、プライバシーは守られるのか、公開するとなるとプライバシー秘匿が心配になり調査の捕捉率が下がらないかなど、民間の活用が可能になるまでには高いハードルがあるが是非クリアしてほしい。「ビックデータ」は宝の山だから。
[1] 日本経済新聞 2013.1.13








