【レポート&動画公開!】 DWHがもたらすデータ分析/AI/機械学習分析の事例紹介&無限のコンピュートリソースが人工知能を支えるクラウドデータプラットフォーム「Snowflake」のご紹介
Session 1:DWHがもたらすデータ分析/AI/機械学習分析の事例紹介&無限のコンピュートリソースが人工知能を支えるクラウドデータプラットフォーム「Snowflake」のご紹介
Supershipグループは「Supership Day vol.02」と題して、8月25日(火)〜8月27日(木)の3日間、計6テーマのウェビナーを開催しました。
当記事では、Session 1「DWHがもたらすデータ分析/AI/機械学習分析の事例紹介&無限のコンピュートリソースが人工知能を支えるクラウドデータプラットフォーム『Snowflake』のご紹介」のレポートをお送りします。
ウェビナー内容 | 「AI」セッション DATUM STUDIO × Snowflake
当セッションはDATUM STUDIOパートとSnowflakeパートの二本立てとなっております。
DATUM STUDIOパートでは、データ活用の先進的な取り組みや企業の競争力、事業成長を高めるためのスピーディーなデータ活用方法をご紹介します。
Snowflakeパートでは、膨大なデータに対し高負荷な処理を実現する、新しいデータプラットフォームSnowflakeをご紹介します。
ゲストプロフィール | KT (Snowflake株式会社)
KT氏(Snowflake株式会社)
シニアセールスエンジニア
データドリブン文化を推進する人々を育成するDATA Saber認定制度の創設者。約5年間Tableauでエバンジェリストとしてコミュニティを育成した後、現在はSnowflakeでCLOUD DATA PLATFORMをすべての組織に届け、データドリブン文化を支える土台づくりの支援をしています。
講師プロフィール | 里 洋平 (DATUM STUDIO株式会社)
里 洋平(DATUM STUDIO株式会社)
取締役副社長 CAO
ヤフー株式会社で推薦ロジックや株価の予測モデル構築など分析業務を経て、株式会社ディー・エヌ・エーで大規模データマイニングやマーケティング分析業務に従事。その後、株式会社ドリコムにて、データ分析環境の構築やソーシャルゲーム、メディア、広告のデータ分析業務を経て、DATUM STUDIO株式会社を設立。
事例から見る企業活動におけるデータ活用の課題は「部門間でデータが散在し、連携・収集が困難」
サービスのIT化に伴って、各企業の保持するデジタルデータは膨大になり、かつ様々な分析が可能になりました。またコロナ禍においてIT化は加速し、先行き不透明な未来の予測に対しデータが有用であるとされ、DX(デジタルトランスフォーメーション)の必要性は、今まで以上に高まっています。
DATUM STUDIO CAOの里よりご紹介するのは、ハウスメーカー様の事例になります。ウェブ経由での展示場への申込者数を増加させるにあたり、申込みされやすいセグメントを発見したいというご依頼がありました。
里: あるハウスメーカー様の事例をご紹介します。当社への依頼は、ハウスメーカーが主催する展示場のウェブ集客の分析依頼でした。しかし、不動産という商品の特性もあり、ウェブ広告経由での来場者が少なく、データがほとんどないことがわかりました。
このハウスメーカーさんではチラシなどウェブ以外でのプロモーションも実施していたので、来場者の多くはウェブ以外からのお客様でした。このお客様たちをどうやってデータ化するか、ということが我々のミッションでありました。
そこでまず取り組んだことは、ウェブ以外、いわゆるチラシや工務店さん経由、偶然近所で立ち寄った顧客に御礼メールを送付しました。それから、結合用IDを付与し、来場者データベースを作成し、取得した実属性情報を活用してセグメントを作りました。
セグメントを設計するにあたってのボトルネックは、データが社内のいろいろな部門に散在していたことでした。例えば、データを利用したいIT部門は来場者のデータを保持しておらず、そのデータは営業部が保持していたなどです。
里: データを保有する部門が異なるため、データの連携が難しく、まずはそのハードルを乗り越える必要がありました。そのハードルを乗り越えたあと、POCを始めて、モデルを作ります。
こういった事例から見えてくる企業のデータ活用における現状の課題は、データの収集にあるということです。
各部門からデータ収集してから、POCが始まりますが、POCがうまくいったからといって、ETL設計・構築がうまくいくわけではありません。そこで登場するのがSnowflakeです。
データ連携における課題を解決するDWH(データウェアハウス)『Snowflake』
社内での部門調整やデータ連携のハードルを超えたのち、定常運用段階に移行するため、IT部門(データエンジニア)にパイプライン作成とデータ不正確認機能の構築を依頼し、ETLの構築を実施します。
この際に生じる課題は、スキルセットや人的工数にあります。その課題を解決してくれるのがSnowflakeです。
里: Snowflakeでは、IT部門ではETL処理は行わず、分析チームに引き渡し用のオブジェクトストレージにデータを吐き出します。データ準備やデータ品質チェック、TRANSFORM処理は全てSnowflake内で分析者が実行します。
これで運用者のスキルセットとリソース不足が解消できるので、圧倒的にスピード感がアップします。SnowflakeはAWSのS3を利用し、社内にSQLが使える人材が多い企業様に適しています。
DATUM STUDIOではSnowflake社様と協業により、データ基盤の構築のご支援をさせていただいています。SnowflakeとSupership社の持つソリューションや他システムなどを連携させ、施策実行までトータルな支援が可能です。
今回はPOCと定常運用におけるメリットをお話しましたが、それ以外にもSnowflakeにはコスト感などでもメリットはたくさんあります。
そちらに関しては過去のブログをご覧ください。
ゲストスピーカー KT様より『Snowflake』についての詳細
前編にてDATUM STUDIO 里より、POC/定常運用での利用方法としてご紹介した「Snowflake」について、後編ではSnowflake社のKT様より、データサイエンスという観点よりご紹介いただきました。
KT: コロナ禍で私たちの暮らしは一変しました。その中で未来を予測するためにデータの重要性はより高まりましたが、活用しようにも実際にはデータがほとんどなく、稀にデータがあったとしても、様々なところに散在していてデータが集取できないといった状況がほとんどです。
データサイエンスを使って、未来を予測するには全てのデータが統合された環境、効率的なデータの準備、データの移行をしなくても使える、拡張性の高いパートナーエコシステムが必要です。そういった課題を解決するために、Snowflakeが誕生しました。
クラウドテクノロジーをベースに、全てのデータが一箇所に統合され、いつでも、どこでも、求める人が何人いても、データにアクセスできるプラットフォームです。
複数のクラウドサービス、パートナーと連携し、サーバーレスなデータ統合を実現します。データのシェアリングはもちろん、無制限にデータ量・ユーザーを追加できます。必要な処理に合わせてリサイズも可能なだけでなく、処理スピードも早く、費用も使った分だけ支払えばいいのです。
フォーム入力後ウェビナーを視聴できます
ゲストスピーカー・KT様からの「Snowflake」の詳細なご紹介については、ウェビナー動画をご覧ください。
視聴後、アンケートを入力いただけるとセミナー資料もダウンロード可能です。