2023年04月10日

データサイエンスの実践学習!ビジネス・マーケティング観点からプロが徹底解説

データサイエンスの実践学習!ビジネス・マーケティング観点からプロが徹底解説

昨今、ビジネスの現場ではビックデータが爆発的に増加し、データ分析、ひいてはデータサイエンスの重要性が日々高まっています。 

一方で、データサイエンスの教育現場ではインターネット上で無償公開されているサンプルデータを使用することが多く、実際にビジネスで使われているデータを使用することはほぼないのが実情です。 

そのため以下のような疑問が生まれます。 

そこで本コラムでは、コニカミノルタが提供するショッパー行動解析サービス「Go Insight(※)」の”生きたデータ”を使いながら、ビジネスにおけるデータサイエンスの使い方を実践的に解説していきます。 

Go Insight:スーパーマーケットやコンビニエンスストアなどでお買い物をしているお客さんの実際の行動をデータ分析し、圧倒的なN数で小売店の販促活動をコンサルティングするサービス。 

読了後には、「マーケティング観点を取り入れたデータサイエンスの一端を経験し、ビジネスに活用するイメージがついている」という状態になっているかと思います。 

なお、本コラムは、書籍「実践マーケティングデータサイエンス:ショッパー行動の探索的データ解析と機械学習モデル構築」の筆者:清水が、本書の内容に則して執筆しております。 

こんにちは!
『実践マーケティングデータサイエンス』筆者の清水です。 

本コラムでは、学術として学んだデータサイエンスの知識を実際のビジネスの現場でどう活かしていけば良いのか、本書を事例として文字通り実践的にご紹介していきます。 

なお、コラム中に出てくる「P.●」は『実践マーケティングデータサイエンス』の該当ページ数を表していますので、本書をお持ちの方は合わせてご参照ください。 

これを機に実践的にデータサイエンスを学習してみませんか?

「データサイエンス×マーケティング」
「データサイエンス×ビジネス」
上記について、実践的に学習してみたい方はぜひ本書を手にとってみてください。 

≫書籍の概要・料金・目次をAmazonで確認してみる 

データサイエンスとは 

データサイエンス(data science)とは、データを用いた科学的なアプローチのことです(P.2)。 

統計学・数学・経営学などの学問に加えて、プログラミング・データベースなどのIT技術を使い、データから価値を引き出し有益な知見を得ようとするものです。 

データ”サイエンス”という名前の通り、科学的であることがポイントになります。実験と観察を繰り返し、再現性を見出すことがサイエンス(科学)の特徴です。 

データサイエンス×ビジネスとは 

データサイエンス×ビジネスとは、文字通りデータサイエンスの知見にビジネスを掛け合わせて、ビジネスの課題解決にデータサイエンスを活用することです。 

ビジネスには様々な課題が山積しており、人がひとつずつ手作業で解決していくには限界があります。そこでデータサイエンスの手法を用いて、より効率的に精度よくその課題を解決していこうとするものです。 

ビジネスにデータサイエンスを活用する6STEP 

ビジネスにおいてデータサイエンスを活用するには、CRISP-DMというプロセスモデルに基づいて次の6STEPで行うことが多いです。 

【STEP1】ビジネス課題の理解(P.6) 

ビジネスの現場でビジネス課題が明確化されていることは意外と少ないため、まずはビジネス課題の理解から始めます。業務担当者へのヒアリングや自身のビジネス理解を通して、ビジネス課題の解像度を高めていきます。 

【STEP2】データの理解(P.7) 

ビジネス課題を解決するために活用するデータがいったいどのようなものなのか、理解を深めていきます。そのデータの仕様、データ取得にかかるコスト、信頼性、データの限界などについて理解していきます。 

【STEP3】データの準備(P.7) 

前のSTEPで理解したデータの性質を元にして、分析しやすいようにデータを準備していきます。フォーマットがばらばらだったり、余計な情報が入っていたり、表記ゆれがあったりするデータを綺麗にする作業(データクレンジングといいます)を行います。また、モデル構築を行う場合はここで特徴量を作成します。 

【STEP4】モデル構築(P.7) 

準備したデータをもとにして機械学習モデルを構築していくステップです。機械学習とはデータサイエンスの手法の1つであり、「機械」が自分の力で自動的に「学習」していくことを指しています。なお、モデル構築は必ずしも必要ではなく、統計的なデータ分析だけで課題解決が出来る場合はスキップしても構いません。 

【STEP5】評価(P.8) 

データ分析を行った結果や構築したモデルがビジネス課題の解決に資するものとなっているのかを評価するプロセスです。データ分析やモデル構築とこの評価をいったりきたりしながら課題解決の精度を高めていきます。 

【STEP6】展開/共有(P.8) 

分析結果や構築したモデルを実際にビジネスで活用するステップです。 展開とはデータサイエンスを社会実装することを指し、共有とはデータサイエンスで得た知見を他のビジネス活動にシェアしていくことを指します。 

ビジネスデータサイエンスのユースケース3選 

ビジネスでは様々なシチュエーションでデータサイエンスが使われています。
ここでは代表的な3つについてご紹介します。 

1.マーケティング 

マーケティングは「マーケティングサイエンス」という分野があるほど昔からデータサイエンスと相性が良い分野です。マーケティングに関しては後ほど詳しく記載します。

2.品質保証 

プロダクト(製品やサービス)開発ではその製品やサービスの品質を担保する必要がありますが、この時にデータサイエンスが活用されます。例えば、工場で製品を製造する際に中にはいくつか不良品が混じってしまう場合があります。不良品をゼロにするのは困難であるため、その不良品の混入がいくつだったら品質的に問題ないとするのかを決める必要があります。この時にデータサイエンスの統計解析手法を活用したりします。 

3.営業 

一見するとあまり縁が無いように見える営業活動でも、データサイエンスが活用されることがあります。例えば受注する/しないを二値分類したり、その要因を解析したりします。どんな人が、どんな商談を、いつ、どこで、誰に対してすると、受注しやすいのか、などを探っていくことで、より効率的な営業活動に繋げていくのです。

≫データサイエンス×ビジネスについて、もっと詳しく学びたい方はこちらから 

データサイエンス×マーケティングとは 

データサイエンス×マーケティングとは、文字通りデータサイエンスとマーケティングを掛け合わせることです。データサイエンスを活用してマーケティング課題を解決したり、データサイエンスを使ってマーケティング活動を効率的に行ったりします。 

マーケティングにデータサイエンスを活用する6STEP 

マーケティングにデータサイエンスを活用する際も、先ほど紹介したのと同じSTEPを活用できます。
『実践マーケティングデータサイエンス』で取り上げているショッパーマーケティングの分野で具体的に紹介します。 

【STEP1】ビジネス課題の理解 

まずはビジネス課題を理解します。ショッパーマーケティングでは具体的に以下のような課題があります。 

【STEP2】データの理解 

STEP1で挙げたビジネス課題を解決するために活用するデータを理解していきます。ここではショッパー行動解析データ「GIデータ」を使用します。GIデータには以下のような情報が含まれています。 

これらのデータを探索的に分析しながらその仕様を理解すると共にデータの理解を深めていきます。 

【STEP3】データの準備 

STEP2で行ったデータの理解を元にして、例えば以下のような具体的な仮説を検証していきます(P.99)。 

また、特徴量を割り出してモデル構築の為のデータ準備を進めていきます。『実践マーケティングデータサイエンス』では「商品に接触した人のうち商品を購入する人(購入者)と購入しない人(接触非購入者)に分類する」というお題(二値分類問題)を設定し(P.139)、その特徴量となりそうなデータを探っていきます。 

【STEP4】モデル構築 

STEP3で作成したモデルを使って機械学習モデルを構築していくSTEPです。『実践マーケティングデータサイエンス』では以下のモデルを使っています。 

【STEP5】評価 

探索的データ解析による分析結果をクライアントに評価してもらってフィードバックを得たり(P.117)、STEP4で作成した機械学習モデルの精度を評価したり(P.163)するSTEPです。『実践マーケティングデータサイエンス』では混同行列について紹介(P.165)したあと、具体的な指標値としてAUCを使用しています。 

【STEP6】展開/共有 

STEP2で行った探索的データ解析結果や、STEP4・5で構築・評価した機械学習モデルを、実際にビジネスに使える形に展開/共有していくいSTEPです。 

例として、 

といった施策を挙げています(P.238)。 

マーケティングデータサイエンスのユースケース5選 

ショッパーマーケティングにおいてデータサイエンスを使うシチュエーションの事例としては、前項の【STEP1】で挙げた課題の裏返しがそのままユースケースとなります。 

他にも様々なユースケースが考えられ、『実践マーケティングデータサイエンス』では、 

といった活用方法(P.240)や、 

なども紹介しています。 

≫データサイエンス×マーケティングについて、もっと詳しく学びたい方はこちらから 

データサイエンスを実践しながら学習することの重要性 

さて、そもそもなぜ「実践」が必要になるのでしょうか? 

それは、実践が無ければビジネスへのデータ活用もままならないからであり、データサイエンスを行う意義も薄れるからです。 

データサイエンスの間違った学習方法 

データサイエンスの学習方法として、動画学習サイトや書籍などでPythonやRのプログラミングを学んだり、統計学の基礎を学んだり、Kaggleのコンペに取り組んでみたりすることが多いでしょう。

最初の一歩としてはそれでまったく問題ないのですが、そればかりになってしまうと実際にビジネスの現場でデータサイエンスを活用することが出来ません。 

ビジネスにおけるデータサイエンスでは、なによりも「ビジネス課題の理解」が大切です。そして、そのビジネス課題を解決するためにどのようにデータを活用すればよいか、を自分の頭で考える必要があります。

だからこそ、実際のビジネスの現場に飛び込み、クライアントと対話をしながら「ビジネス課題は何か」を考える機会を持つと良いでしょう。 

なお、Kaggleコンペに取り組む過程でビジネス課題の理解や特徴量生成の技法などを疑似体験できますので、なかなか身近にそういった環境が無いという場合は、コンペをあたってみても良いでしょう。 

データサイエンスの実践事例:コニカミノルタの”Go Insight” 

ショッパー行動解析サービス「Go Insight」は、ショッパーマーケティングにおけるビジネス課題を解決するための手段として生まれました。

従って、Go Insightのプロジェクトに取り組むことでビジネス課題を理解してデータサイエンスを活用するとはどういうことかが、プロセルレベルで自然と理解できるようになるのです。 

このような背景から、Go Insightのデータを活用して大学での講義も行ったりしています。 

≫国立大学法人 電気通信大学様×コニカミノルタマーケティングサービスの取り組みを見てみる(課題解決に役立つデータ活用の学びを産学連携で実現)

『実践マーケティングデータサイエンス』でもショッパー行動解析データを活用する形で構成しており、この書籍で学習することでビジネスの課題解決を進める手がかりをつかめるようになるでしょう。 

≫Go Insightの取り組みを公式ページで確認してみる

データサイエンスの実践事例:コニカミノルタの”Go Analytics”  

データ活用のあらゆる場面でご支援可能な伴走型支援サービス「Go Analytics」は、ショッパーマーケティングに限らずあらゆるビジネスシーンに対応しています。

ビジネス課題を持っているクライアントは、必ずしもデータサイエンスについて詳しいわけではありません。一方でデータサイエンティストを内製化しようとすると時間がかかります。

そこで、ビジネス理解もあり課題解決を第一に考え、手段としてデータサイエンスを活用すると徹底されているデータサイエンティストたちがご支援をするという枠組みにしています。 

≫Go Analyticsの取り組みを公式ページで確認してみる

「マーケティング」や「ビジネス」に生かせるデータサイエンスの学習方法3選 

では、具体的にマーケティングやビジネス活かせるようなデータサイエンスの学習方法はどのようなものがあるのでしょうか?

ここでは、以下の3つほど紹介してみたいと思います。 

それぞれ紹介していきます。

方法①:自社業務における課題をテーマに取り組んでみる 

現在自分が直面しているビジネス上の課題をテーマに取り組んでみる手法です。 

例えば
「アプリ開発に関わっているならその不具合解析をしてみる」
「プロダクトマーケティングに関わっているならマーケティング施策とその効果を定量的に整理してみる」
などです。 

ただ、まずは課題設定とその整理に工数を使うことになるため、具体的なデータサイエンスまでたどり着かないかもしれません。 

方法②:企業課題解決型のコンペに取り組む 

KaggleやSIGNATEなどで公開されているコンペでは、企業が自社課題と保有データをオープンにして課題解決を促している場合があります。このようなコンペに参加して実践的に学ぶのも良いでしょう。 

例1:西日本旅客鉄道株式会社「JR西日本 走行中の北陸新幹線車両台車部の着雪量予測」

参考:https://signate.jp/competitions/271

例2:Sansan株式会社「Sansan 名刺の項目予測」 

参考:https://signate.jp/competitions/288

一方で、この方法だと実践的すぎて「まず初めに何をしたら良いのか分からない」となることもあります。 

方法③:書籍『実践マーケティングデータサイエンス』を活用する 

書籍『実践マーケティングデータサイエンス』を読み進めながら手を動かすことで、ビジネスにおけるデータサイエンスプロジェクトを疑似体験しながらプロセスや手法を体系的に学ぶことができます。 

本文中の解説を読み進めながらインプットを重ねた上で、演習問題や章末問題に取り組みアウトプットを行うことで、理論と実践の両方を効率よく体得することが出来るでしょう。 

これを機に実践的にデータサイエンスを学習してみませんか?

「データサイエンス×マーケティング」
「データサイエンス×ビジネス」
上記について、実践的に学習してみたい方はぜひ本書を手にとってみてください。 

≫書籍の概要・料金・目次をAmazonで確認してみる 

【動画解説付き】書籍「実践マーケティングデータサイエンス」での学習を体験してみる 

それでは、『実践マーケティングデータサイエンス』での学習を体験してみましょう! 

≫全ての動画をプレイリストで一気に確認したい方はこちらから

まえがき 

まえがきでは、日々の購買行動の奥にはショッパーマーケティングにおける課題や謎が隠れていて、データサイエンスがその課題を解決できる可能性を秘めていることを解説しています。 

本書のねらいや範囲、対象読者なども合わせて確認しておきましょう。 

第1章:全体像と学習の進め方 

第1章では、ビジネスにおけるデータサイエンスのプロセス全体を概観します。CRISP-DMというプロセスモデルに照らし合わせながら、各章でどのようなプロセスを学ぶのかを説明しています。 

第2章:ショッパーマーケティングの課題

ビジネスにおけるデータサイエンスでは、課題解決をするビジネス領域(ドメイン)の知識を得ることが重要です。第2章では、この書籍における課題解決の対象ドメインであるショッパーマーケティングとは何かについて解説します。 

これは「【STEP1】ビジネス課題の理解」にあたります。ショッパーマーケティングにおける課題や、今回のクライアントについて理解を深めていきます。 

第3章:ショッパー行動解析データ概論 

第2章で挙げたショッパーマーケティングの課題は、ショッパー行動解析データ(GIデータ)を活用することで解決が可能です。 

ここではそのGIデータのフォーマットを確認し、具体的なケースを元にして解説していきます。 

これは「【STEP2】データの理解」にあたります。 

第4章:探索的データ解析(Ⅰ) 

第4章と第5章では探索的データ解析に取り組んでいきます。第4章では基本的なデータの中身を確認したり、ヒストグラムや箱ひげ図などを作成したりして、データの理解を深めていきます。 

第4章と第5章も「【STEP2】データの理解」にあたります。 

第5章:探索的データ解析(Ⅱ) 

引き続き探索的にデータ理解を行っていきます。第5章ではショッパーに着目して性別・年代を確認したり、商品に着目して接触/購入の回数/人数を確認したりします。 

また、メーカー別に集計したりします。 

第6章:仮説検証型データ分析  

ビジネスにおけるデータサイエンスでは、探索的にデータを分析するだけでなく、ある程度「アタリ」(仮説)をつけてそれが正しいのかどうか検証することも大切です。第6章では具体的な仮説を取り上げて、その仮説を検証するプロセスを学んでいきます。 

これは「【STEP3】データの準備」にあたります。 

第7章:報告資料の作成とプレゼン(Ⅰ)  

ここまで行ってきたデータ分析結果を元にしてクライアントに報告をしていくことに取り組んでいきます。ビジネス課題に取り組む以上、その成果を誰かにプレゼンする必要があります。その際の資料作成や発表の仕方などについて解説しています。 

これはクライアントに自身の活動を評価してもらうという意味で、「【STEP5】評価」に該当します。 

第8章:モデル構築の準備

なぜ・どのように・どのような機械学習モデルを構築するのかを考えた後に、「商品に接触した人のうち商品を購入する人(購入者)と購入しない人(接触非購入者)に分類する」というお題(二値分類問題)を設定し、モデル構築を行う準備をします。 

第4章~第6章で行ったデータ確認結果も活用しながら、特徴量を作成して中間データとして保存していきます。 

これは「【STEP3】データの準備」にあたります。 

第9章:精度評価の手法

構築した機械学習モデルはしかるべき方法を用いて評価をし、その精度がビジネスの課題解決に十分使えるかどうかを判断する必要があります。 

第9章では混同行列を使いながらその精度を評価していきます。 

これは「【STEP5】評価」にあたります。 

第10・11章:決定木・ロジスティック回帰

いよいよ機械学習モデルを構築していきます。第8章で準備した中間データを活用しながらモデル構築を行い評価していきます。 

具体的なモデルとして、第10章では決定木、第11章ではロジスティック回帰を取り上げています。 

これは「【STEP4】モデル構築」にあたります。 

第12章:アンサンブル

第12章でもモデル構築を行います。決定木とロジスティック回帰のアンサンブルを行ったり、LightGBMに取り組んだりします。 

これも「【STEP4】モデル構築」にあたります。 

第13章:報告資料の作成とプレゼン(Ⅱ) 

これまで行った機械学習モデルの構築・評価も含めて再度クライアントへの報告を考えていきます。 

クライアントは必ずしも機械学習のプロではない(むしろその方が多い)ので、分かりやすい言葉を選びながら成果を報告することが重要です。 

第14・15章:システム化・回帰・クラスタリング・全体のふりかえりと今後にむけて  

これまで行ったデータ分析結果や機械学習モデルを具体的にどのような形でビジネスに活用してくのかを紹介します。また、回帰やクラスタリングについても簡単に触れてその可能性について紹介します。 

これは「【STEP6】展開/共有」にあたります。 

まとめ 

いかがでしたか? 

ビジネスやマーケティングにおけるデータサイエンスの進め方や、書籍『実践マーケティングデータサイエンス』を活用した学習方法などについてご紹介をしました。 

ぜひビジネス課題をデータサイエンスの力で解決する手法やプロセスを身に付けて、データサイエンティストとしてのスキルを高めるとともに、みなさんの事業も成長させていってください! 

↑