データレンジ

ビッグデータ分類SaaS

イントロダクション

昨今、ビジネスの最前線の現場における各種データは、実はビジネスにおいては整理されたデータとして、まとまっているわけではありません。もちろん、デジタライゼーションは進んでおりますが、アナログな業務におけるデータもビッグデータとしていよいよ整理される時がきました。

構造化されたデータのみがIT業界の中でソリューション化されている実態はあります。

例えばPoSデータの業務システムなどは、この一部の中でのデータがビッグデータとして取り扱われている可能性があります。

ビッグデータを分類するSaaSがこのデータレンジです。

Azure上のCognitive Serviceを有効活用しているサービスです。

データレンジ分析理論

マイクロソフトのCognitiveサービスをどう活用しているかの説明をする前に、簡単にデータレンジの分類理論を説明します。

一般的にデータを社会学的なアプローチで理論化したアプローチをとります。

経営リソースを一般的にヒト・モノ・カネ・情報などといいますが、データレンジの情報空間におけるアプローチではヒト・モノ、カネの情報をコトとして分析する社会学のアプローチによって何かしらの知見(意味)を発見するという理論です。

すでにある「理論」をベースに演繹的に物事を推論していくアプローチや統計学で行われているようなサンプルデータによって帰納的に物事を推論していくアプローチなどが一般的ではありますが、我々がデータレンジで目指しているものは、各種アイデアを探索的にコンセプトに変えて、さらにモデル・理論にまで高める前段の意味解釈を主観的に行うという作業をタグのコーディングやメタデータの付与によって実現しようとしている点です。

データレンジの特長

データレンジの画面は直感的にすぐ使えて、ブラウザで簡単に通常のファイルサーバのフォルダに対して簡単にデータ操作ができます。

簡単に操作可能なデータをファイルクリックするとこのようにファイルを開けます。特に画面右下にある関連タグという項目にタグやメタデータが表示されています。

ここにタグを手動で入力することによって、分類が可能となりますが、今回AzureのCognitiveサービスを使うことによって、AIが学習済みのモデルを自動タグ付けという形で簡単に分類可能な形で表現できます。

データレンジによる課題解決

最近のAIブームによってもてはやされるAIではありますが、実際に現場で使うとなるといくつかの課題があります。

  • モデル生成作業の課題
  • トレーニングデータの前処理作業の課題
  • コーパスなど専門用語などを作成し、学習し続けるなどの課題

そういった課題を解決しながら、弊社データレンジサービスにおいては、マイクロソフトの各種Cognitive Serviceなどを用いています。

ヒトの顔にはFace API、モノにはCustom Vision Service API、音声などを含む映像の出来事にMedia Serviceを使って、それぞれタグをつけていく作業を実装しています。

データレンジの操作方法

データレンジSaaSのまとめ

まとめとして、これまでのご説明に合った通り、演繹や帰納ではなく、社会学的なタグ付けのアプローチでヒト、モノ、コトを非構造データから分析していくサービスがデータレンジであり、さらにBIツールなどのPoSデータなどカネの情報との突合せを行うことで実際のコストや利益といった経営上の有効な知見を得られる前段の整理ができるツールとなります。