Looker で次世代のデータ活用を実現!データの民主化における課題と解決法とは?

Looker で次世代のデータ活用を実現!データの民主化における課題と解決法とは?

エンジニアブログ

投稿日:2021/07/07 | 最終更新日:2021/10/20

本記事は、2021年5月25日に開催された Google の公式イベント「 Google Cloud Day : Digital ’21 」において、 Looker 事業本部カスタマーエンジニアの蓮池拓哉氏が講演された「 アジリティの高いデータ利活用 〜 Looker で実現するデータの民主化〜 」のレポート記事となります。

今回は、データの民主化における課題や解決法について、 Google が提供する BI ツール「 Looker 」とともに解説します。

なお、本記事内で使用している画像に関しては Google Cloud Day : Digital ’21 「アジリティの高いデータ利活用 〜Looker で実現するデータの民主化〜」を出典元として参照しております。

それでは、早速内容を見ていきましょう。

データの民主化とは?

データの民主化とは、自社が保有するデータを特定の場所にしまうのではなく、誰もが使えるように保管しておくことです。データは存在しているだけでは意味がなく、効果的に活用してこそ真の価値が生まれます。

すべての社員がデータにアクセスできる状態をつくることで、あらゆる目線から多角的にデータを活用できます。また、データを全員共通のものとして会話を進められるため、業務効率化や生産性向上にも繋がります。

このように、効率的な経営を実現するためにはデータの民主化が必要不可欠であり、実際に多くの企業が各種ツールを活用してデータの民主化に取り組んでいます。しかし、現実的にはデータの民主化が進んでいない企業も多く、現状を打破するための具体的な解決策が求められています。

データの民主化を阻む3つの課題

ガバナンスが働いていない

ガバナンスが働いていないことがデータの民主化を阻む課題の一つとなります。例えば、データを取得する際のデータの取得元、データ形式、条件などが社内で統一されていないケースが想定されます。

このような状態では、せっかくデータを抽出してもデータ自体の価値は低くなります。特定部門においては有用なデータであったとしても、他部門ではまったく価値のないデータになってしまうなど、データを適切に管理できていないことによる弊害は大きいです。

データの公開範囲を限定している

データはそれ自体が意味を持つケースは少なく、他のデータと掛け合わせることで価値が高まります。そのため、取得可能なデータを限定している状態では、本来データが持つ価値をすべて享受することはできません。

また、特定の社員のみがデータにアクセスできるような環境も、データの民主化においては避けるべきです。場合によっては一部の社員から不満が上がり、コミュニケーションの鈍化を招く原因にもなりかねません。

もちろん、機密情報などはセキュリティ観点から限定的にせざるを得ないケースもありますが、基本的には公開範囲を制限せず、誰もが平等にデータを取得できる状態をつくることが大切です。

IT 人材やスキルが不足している

データを活用するためには、大前提としてデータを扱うための人材やスキルが必要になります。自社に IT に詳しい人間がいない場合は、効率的なデータ活用を進めることはできません。

とはいえ、スキルのある人材を雇用するためには、当然ながらコストが発生します。そのため、経済的な事情からデータ活用を断念し、結果としてデータの民主化が進まない企業も少なくありません。

ここまで、データの民主化を阻む課題を3つ挙げましたが、これらの課題を Looker が解決します。 Looker は Google が提供する BI ツールであり、企業のデータ活用を強くサポートします。次章以降で詳しくご説明します。

効率的なデータ活用を実現する Looker とは?

Lookerは、次世代型の BI ツールと呼ばれています。 BI ツールとは「 Business Inteligence ツール」の略であり、企業に蓄積された大量のデータを分析し、分析したデータを可視化できるものです。データを可視化することで、企業の経営活動の指針になったり顧客データの分析ができます。

Looker が次世代型 BI ツールと呼ばれているのは、今までの BI ツールのメリットを詰め合わせたツールになっているからです。今までの BI ツールを振り返ると、出始めの頃は知見があるスペシャリストしか扱えないものでした。

その後登場した BI ツールは、誰にでも扱えるのをコンセプトとしたため、気軽にデータ分析が可能となったのです。しかし、誰にでもデータ分析ができる反面、よりマクロな視点でのデータ分析やセキュリティ面での不安がありました。

しかし、次世代BIツールと呼ばれる Looker は、今までの課題点を解消しつつメリットだけを組み込んだのです。

Looker概要

Looker に関しては、以下の記事で詳しく解説しています。
次世代BIツール「Looker」の概要と導入時の注意点をご紹介!

Looker によるデータの民主化の実現(データの共通言語化)

Looker を活用することで、社内のデータを共通言語化できます。データに関する定義を Looker で一元管理し、誰が作業しても同じ結果を得られるような環境を整備します。そうすることで、部門やチームを超えた全社横断的なデータ活用を実現します。

Lookerによる定義の一元管理

Looker には「 LookML 」という、 SQL を抽象化して Looker に情報を提供し、データベースとレイヤーの間にモデルレイヤーを作成できるテクノロジーが搭載されています。

LookML は Git (分散型のバージョン管理システム)による構成管理が可能なため、複数人で編集する場合や組織単位で管理をする場合でも、 Git の承認フローを挟むことで定義の氾濫を防ぐことが可能です。

また、 LookML は再利用可能な定義情報となっており、「 View ファイル」と「 Model ファイル」の2つのファイルによって管理します。 View ファイルは Looker で取り扱う論理的なテーブル定義であり、 Model ファイルは LookML の View ファイルで定義されたテーブル同士の関係性や結合ロジックを含むファイルとなっています。

これらのファイルを活用することでデータの集計定義などを事前に定めることができ、全社員が「同じ場所」「同じ手法」「同じ定義」でデータを取り出せる環境を整備できます。結果として、データの共通言語化を実現でき、自社のデータ活用促進に繋がります。

Looker によるデータの民主化の実現(データの適切な公開範囲設定)

自社のデータ活用を進めるためには、データの公開範囲を適切に設定する必要があります。

昨今、データ統合や CDP (顧客データプラットフォーム)などの取り組みの中で、サイロ化されたデータの集約化が進んでいます。その一方で、機密度やセキュリティポリシーの観点から、データ活用が一部分に留まっているケースも存在します。

データ活用が限定的になる代表的な例が人事情報です。人事データを活用したいと考えているものの、データの中には社員の個人評価や個人情報が含まれているため、全社員に対してオープンすることができず、特定の社員にしか公開できない、といったケースが想定されます。

Looker には、様々なアクセス制御の機能が搭載されており、上記のような「データを公開したくてもできない」という状況を解決できます。

例えば、行レベルフィルターを活用することで、ユーザーの所属部署やエリアなどに合わせて、フィルターを操作することなく、自分に関係するデータだけを表示できます。結果として、ユーザーがデータを探す手間を削減できますし、管理者のマート分割作業も不要になります。

また、列レベルのアクセス制限により、職位や職責に応じて機密度の異なるデータへのアクセス権を正しく設定することで、公開可能なデータの種類を増やし、データ活用の幅を広げることができます。さらに、ユーザー属性に合わせてデータの取得元を自動で変更することも可能なため、運用工数の削減とデータの外部公開を同時に実現できます。

このように、 Looker を活用することで適切なデータの公開範囲を設定でき、手間をかけずにデータ活用の効果を最大化することが可能になります。

Looker によるデータの民主化の実現(わかりやすいデータキュレーション)

キュレーションとは、「情報を整理する」という意味の言葉です。 Looker を使ってデータを適切に整理することで、社員がデータを利用するハードルを下げられます。「調べる」「見つける」「使う」というデータ活用における一連の流れをスムーズにし、データを身近な存在として社員に感じさせることができるわけです。

Looker には、埋込分析や外部連携の機能が搭載されているため、別ツールに情報を見に行く必要はなく、日頃から利用しているアプリケーションの中で各種データを確認できます。つまり、目に見える場所に常にデータを表示しておくことで、社員に対して「データを見る」という意識を植え付けることが可能になります。

外部連携

また、 Looker には「データディクショナリー」という機能が搭載されており、社内に存在するデータをわかりやすく可視化できます。

具体的には、以下のような項目を確認可能です。

  • どのようなデータが存在しているのか?
  • データの種類は何か?
  • どんな定義で集計されているのか?

これらの情報をデータディクショナリーで一元的に管理でき、ユーザーは辞書形式で簡単に確認・検索することができます。

データディクショナリー

さらに、データに詳しい人向けには「 LookML ダイアグラム」を使うことで、 LookML 側での定義や裏側に隠れているデータおよびその傾向値などを統計的に一元表示できます。つまり、 Looker の活用により、ユーザーの知識レベルに合わせてデータの届け方や見せ方を柔軟に変えられるというわけです。

このように、 Looker はデータに対する社員の意識変革や理解の深化を実現するソリューションです。その結果として、データ活用のハードルを下げることができ、自社におけるデータの民主化を前進させることが可能になります。

Looker に関する質問

Q . IAM の情報と連携して表示制御をすることは可能でしょうか?

A . SAML 認証でシングルサインオンを実装することで IAM の情報をもとに表示制御をすることが可能です。

Q . Google Cloud (GCP)のデータカタログと Looker のデータディクショナリーはどのように使い分けるのでしょうか?

A . Looker のデータディクショナリーはテーブルの定義だけでなく集計値の定義も含むことができます。また、 Looker はマルチクラウドに対応しているので、 Google Cloud (GCP)外にあるデータソースへもアクセスしている場合に、これらも含めて定義を1箇所で管理、公開していくことが可能です。

まとめ

本記事では、データの民主化における課題や解決法について、 Google が提供する BI ツール「 Looker 」とともに解説しました。

Looker はレベルの違うユーザーに対してデータを届きやすい形に変換し、データが含んでいる価値のある情報を届けることで、組織内におけるデータ文化の醸成を強くサポートします。

例えば、データ定義を一元管理して共通言語化することでデータ分析を均質化したり、適切な公開範囲を設定してセキュリティ性を担保するとともに、あらゆるデータを開示することでデータ価値の最大化を図ることができます。また、データをいつでも即座に使える状態にすることでデータそのものを社員にとって身近な存在にし、データの民主化を実現することが可能です。

Looker はこれらの内容を手間なく簡単に実践できるデータプラットフォームとなっています。本記事を参考にして、ぜひ Looker の導入を検討してみてはいかがでしょうか。



弊社トップゲートでは、 Google Cloud ( GCP )、または 20ID以上のGoogle Workspace(旧G Suite) 導入をご検討をされているお客様へ「Google Meet で無料個別相談会」を実施いたします。導入前に懸念点を解決したい方、そもそも導入した方がいいのかをお聞きしたい方はお気軽にお申し込みください!

トップゲート経由で Google Cloud (GCP) をご契約いただけると Google Cloud ( GCP )の利用料金はずっと3%オフとお得になります!

お申込みはこちら



弊社トップゲートでは、TOPGATE Broadcaster と称してウェビナーを定期開催しております。

  • クラウドに関すること
  • Google Cloud (GCP) の最新情報やお役立ち情報
  • Googleのテクノロジーを活用した生産性の向上に関すること

など、 仕事で差がつく情報を忙しいビジネスパーソンのために短時間でコンパクトにお届けしております。

参加者さまからの「わかりやすかった」「勉強になった」など好評いただいております。取っ付きにくい内容も講師がわかりやすく解説しております。参加費は無料であるウェビナーがほとんどです!

以下のボタンをクリックして、気になるウェビューへお気軽にご参加ください!

TOPGATE Broadcasterの情報はこちら

メール登録者数3万件!大人気TOPGATE MAGAZINEにご登録いただけますと、TOPGATE Broadcaster の情報があなたのメールボックスに届きます。
他にも、Google Cloud (GCP) 、Google Workspace(旧G Suite) 、TOPGATEの最新情報が満載!

メルマガ登録はこちら

記事を探す

GCP のメリットを最大限に活用しよう!

Google Cloud・Google Workspace のご相談・
お見積り依頼はお気軽に
お問合せフォーム