ITプラットフォームへ移動
特集

ビッグデータは宝の山。でもまだ「ビッグ」企業向け 〜 デジタル学習はじめの一歩 3

  • 2023年2月17日
  • 中小機構 中小企業アドバイザー(経営支援) 高見康一
  • はじめてのIT
  • ビッグデータ

中小企業の支援をしていると「ビッグデータはウチ規模の会社には関係ない」と考えている事業者様と多くお会いします。
ビッグデータは文字通り「ビッグ」なデータ。そのため、「集めるのは大変」「ウチの体力では無理だ」と思われるのではないでしょうか。実は、私もそう思います。これまで紹介してきたAIやIoTと比べ、ビッグデータの活用にはどうしても体力が必要だと考えているためです。
今回はこの「ビッグデータ」の現状と、中小企業としての関わり方について、私の考えをお伝えしていきます。

今まで「データ」と呼んでいたもの、今は「スモールデータ」と呼ばれます。

ご承知のとおり、随分前から「データ」と呼ばれるものは事業で活用されていました。「〇〇システム」から「データベース」に接続し、格納されている「データ」を更新したり参照したりする。今でも当たり前に日々の業務で行っていると思います。表計算ソフトなどを活用している場合もありますね。この慣れ親しんだ「データ」は、今は「スモールデータ」と呼ばれつつあります。「ビッグデータ」という言葉が登場したからです。

ビッグデータの細かな定義は情報通信白書(H24年版)をご確認ください。簡単に言うと(1)量(2)種類(3)頻度が多い・高いデータのことです。英単語の頭文字を取って「3V(Volume、Variety、Velocity)」と言われる事もあります。

慣れ親しんだ「スモールデータ」とは異なり、膨大な件数で、音声や画像・動画なども含む様々な形式で、随時更新されていくもの、それを「ビッグデータ」と呼んでいます。小売店の顧客情報で例えると、「名前」「年齢」「性別」「住所」など一般的な情報は「スモールデータ」。それに「過去の購入履歴」「購入までの店内での動き」「同伴者」「来店時の天気」「為替」「景気」などが加わると「ビッグデータ」とイメージすると良いかも知れません。

スモールデータとビックデータの内容を記載した図表

「オープンデータ」は確かに中小企業でも活用できます。

ビッグデータ関連の言葉で「オープンデータ」と言うものがあります。デジタル庁のサイトに種々資料がありますが、簡単に言うと、政府や自治体が公開している公共のデータなど、誰でも利用可能なデータのことです(参考:デジタル庁 オープンデータ)。「地域経済分析システム(RESAS)」や「政府統計の総合窓口(e-Stat)」などが有名ですね。政府や各自治体が運営するデータカタログサイトも昨今拡充が図られています(参考:デジタル庁 データカタログサイト)。

これらから得た情報を組み合わせれば、「誰でも」ビッグデータを得ることができます。例えば、店舗型の近隣住民向け事業者であれば、商圏範囲の住民情報と消費動向調査を組み合わせて市場規模の推定ができたりします。自社の販売情報と比較分析をすれば、自社のポジショニング推定なども可能です。

オープンデータの説明(地域経済分析システムおよび政府統計の総合窓口の画面イメージ)

ただ、ここでネックになるのは「スキル・ノウハウ」です。このようにデータの取得は「オープンデータ」を用いてある程度可能になりましたが、「活用」するには「データ活用スキル・ノウハウ」が必要です。この「スキル・ノウハウ」は一朝一夕に身につくものではありません。私も活用法を一つお伝えするのに2時間のセミナーを開催したりしています。私はこの「スキル・ノウハウ」の不足こそ、中小企業がビッグデータを活用しにくい一番の原因だと考えています。

データ構造は大きく2種類。「非構造化データ」の活用がポイント。

ビッグデータの構造は「構造化データ」と「非構造化データ」の2種類に分かれます。

「構造化データ」は表計算ソフトの一覧を思い浮かべてください。2次元(列と行、縦と横)にデータが整理されており、検索や集計、分析などが行いやすいという特徴があります。一方、「非構造化データ」は「構造データ」ではないものを指します。例えば動画や音声、徒然と書かれている文章などが挙げられますが、PDFなどの「ファイル」を指す事もあります。これらは情報としての価値はありますが、規則性がない為分析には不向きです。

「ビッグデータ」はこの「構造化データ」と「非構造化データ」両方の総称です。構造によらず、先ほどお伝えした「3V」の特徴があるものを「ビッグデータ」と呼びます。

ビッグデータのイメージ図

では、このビッグデータを事業に有効活用するにはどうしたら良いでしょうか。ポイントは「非構造化データ」の活用です。非構造化データは構造化データに比べ、情報量・更新頻度が多く、日々の業務活動をより正確に・忠実に反映しています。「これを有効活用すること」=「ビッグデータの有効活用」と言っても過言ではありません。

活用方法は現在も様々な試行錯誤が続けられていますが、大きく2種類あると言われています。「(1)構造化する」「(2)規則性を見つける」の2種類です。「(1)構造化する」は、データを加工・変換し構造化データに変換。それを分析していく方法です。これはXMLなど、少し構造化されているデータ「半構造化データ」に用いられることが多いです。「(2)規則性を見つける」は動画や音声、文章などの非構造化データを「AI」に学習させる方法です。

例えば、特集記事「デジタル学習はじめの一歩 1 〜いまのAIに知能はありません。でも、パワフルです。〜」にある「自動運転AI」は、様々な走行データを活用し、最適な処理ができるように学習させていきます。

非構造化データの活用についてのイメージ画像

コストをかければ「夢」はある。費用△・時間・手間・工夫○。

周りを見渡せば、ビッグデータとして定義できるものは沢山あります。メール、ファイル、動画、画像、ログ、オープンデータ。ただ、活用するには乗り越えなければいけないことがあります。「活用スキル・ノウハウの取得」です。そして、これには少なからずコストがかかります。その為、一部を除き、まだまだビッグデータの活用は経営体力のある企業の専売特許と言える状況です。では、中小企業はどう関わっていけば良いでしょうか。

普通に考えるのであれば、一般的な投資判断と同じように「(1)仮説をたて」「(2)コストパフォーマンスを精査」していけば良いでしょう。コストに見合うパフォーマンスを得られるのであれば、それがビッグデータの活用であっても、もちろん前向きに検討すべきです。一方で、私は「活用すると決める」からスタートするのも、ビックデータに関しては、良策だと思います。ビッグデータ活用は「とりあえずやってみる」価値があると考えているためです。

オープンデータの活用を試したり、無料で使えるAIを利用して学習を試してみたり、IoT機器を利用してビッグデータの蓄積を加速させたり…「やる」と決めれば、宝探しはすぐにでも始められます。少しずつ「活用スキル・ノウハウの取得」を始めてみてはいかがでしょうか。

関連おすすめ