Action(活動) 週刊 経団連タイムス 2014年11月6日 No.3199  「ビッグデータの時代と統計」について説明聞く -経済政策委員会統計部会

経団連の経済政策委員会統計部会(野呂順一部会長)は10月24日、東京・大手町の経団連会館で会合を開催した。青山学院大学をはじめとする8大学で進めている「統計教育大学間連携ネットワーク」の取り組みおよび「統計教育と社会が求める人材像」の検討状況について、青山学院大学の仙波憲一学長、平澤典男副学長同席のもと、同大の美添泰人経済学部教授、日本統計協会の舟岡史雄専務理事から、説明を聞くとともに意見交換を行った。その後、美添教授から「ビッグデータの時代と統計」をテーマに講演を聞いた。
講演の概要は次のとおり。

1.ビッグデータへの期待

1980年ごろから、コンピューターは飛躍的な能力向上を遂げた。計算能力が大幅に向上することで、統計学でも従来は難しかった新たな応用領域が生まれた。同時にデータ収集の幅・量も増大しており、遺伝子解析や気象システムといった分野まで分析対象となっている。

こうしたデータは超高次元で複雑な構造を持ち、古い統計手法では分析が困難である。大量のデータから有用な情報を抽出するには、収集、可視化、モデリング、分析のすべてのプロセスが必要となる。この課題に対応するには、統計学とコンピュータ科学両方にまたがる専門知識が要求される。

ビッグデータは、三つの点で新しいといわれる。一つ目は扱うデータの量である。顧客データやサーチエンジンから得られる情報など、その量はこれまでとは桁違いで比べものにならないほど巨大化している。二つ目は多様性である。非定型文書、音声や動画データまでも分析対象となっている。三つ目は速度である。ストリーミングデータやオンラインゲームなどは極めて高い頻度で恒常的にデータが生成され、蓄積される。

ビッグデータを通じた機械学習さえあれば、科学的分析手法は必要ないとの意見もある。しかし、データ上で相関がみられても、みせかけの関係にすぎない場合など、統計的視点から注意を要する点も多い。良質の疑問から出発しない機械的結論は、無意味になり得るだろう。常に比較的小さなデータセットで仮説を丁寧に検証しながら、ビッグデータの解析を行う必要がある。

2.公的統計とビッグデータ

公的統計においても、ビッグデータの利用可能性は無視できないほど大きい。国勢調査では人口総数などの基本的情報に加えて、職業別・産業別の就業者数など、調査しなければ知ることができない多変数の関係などの情報もある。そのうえに、インターネット経由の情報を付加して精度を上げる試みも行われている。調査とビッグデータの組み合わせは、事業者がある地域に出店・進出する計画の評価に有用であろう。

しかし、ビッグデータを有効に活用するためには、統計的な理解が不可欠である。統計の作成方法がわずかに違うだけで、結果に大きな違いが発生することも珍しくない。データ収集方法に関する正確な理解と適切な分析が求められる。

【経済政策本部】