AIとMachine Learningに関するサービス
これまでAI(人工知能)や機械学習に直接携わるのは一部の専門的なエンジニアのみであり、一般的なユーザーは未来を描く小説や映画などを通して目にするばかりでした。ところが最近では、メディアでもたびたび取り上げられるようになり、実際に既に多くのDXCのお客様がAIや機械学習の活用に取り組んでいます。AIや機械学習という用語や、理想を描くメッセージのみが注目されていますが、実際に活用するためには、AIや機械学習でビジネスを成功へ導いた実績に基づく、確固たる統計的な知識やデータマイニングの知識が必要です。DXC Analyticsは下記のような機械学習の取り組みを通して、お客様のビジネスに貢献しています。実績豊富なデータサイエンティストも多数在籍しております。AIや機械学習の活用推進に際して、是非一度ご相談下さい。
・ 予防保全(故障予測)
・ 離脱(解約)者予測
・ マーケットバスケット分析(併売分析)
・ 価格弾性力分析
・ 住宅ローンの採用者予測
・ キャンペーン反応者予測
・ 加盟店審査の自動化
・ 各種スコアリング
・ Robotic Process Automation など
DXC Analyticsの機械学習の例
以下にDXC Analyticsの提供する機械学習の例を記載します。
① 予防保全(故障予測)
従来、企業は物品の故障が発生した際の、迅速な対処と復旧に力を入れてきました。現在は、IoTの取り組みやビックデータを処理する技術の進化によって、故障を事前に予知し、予防保全が行えるレベルにまで達しています。DXCは、IoTプラットフォームの構築と機械学習における豊富な実績とナレッジにより、お客様の予防保全の取り組みをご支援しています。
図1:DXCの予防保全ソリューションで期待されるビジネス効果
図2:予防保全ソリューション導入事例
予防保全に関しては、上記のような各種導入事例及び予防保全ソリューションに関するデモ環境(Microsoft Azureにて構築)をご用意しております。
② RPA(Robotic Process Automation)
Robotic Process Automationは、スクリーンスクライピング技術やOCR技術、ワークフローオートメーション、AIを土台として成熟期に入りました。特に、超高齢社会に突入し、労働人口が減少する日本においては、労働生産性の向上が大きな課題であり、RPAに対する期待も高まっています。
DXCは、サーバーやIT機器全般の保守運用サービスを長きにわたり提供する中で、業務の自動化(特にRun book Automation)を継続的に支援してきました。現在では、その経験を元にRobotic Process Automationをご支援しています。
図3:DXCが提供するRPAサービス
「予測する」とはどういう事か?
上記では、DXCの機械学習の例についてご説明しましたが、ここからは一般的には予測をするという事はどのような事を指すかを記載します。
イメージのつき易い簡単な例が、離脱(解約)者予測です。携帯電話事業者から利用者が離脱(解約)をする事をチャーン(Churn)と言い、このチャーンの確率をどれだけ下げるかが業績に大きく影響します。携帯電話事業者を例に挙げていますが、サービスから離脱(解約)するという点では、B to Cのビジネスを行っている多くの会社に同じ考え方が適用できます。例えば、保険会社の生命保険や損害保険の契約でも、銀行の住宅ローンでも、他の様々なサービス業でも同じ考え方が使えます。
説明をする上で、一定の定義が必要になるため、例えば、ある事業者の毎月の解約率を3%程度と定義します。全体の契約者の中から、ランダムに100人を抽出すると、期待値としては、その中から次の月に離脱(解約)を行う3人が抽出されます。予測分析では、この離脱(解約)を行う人を、その人の属性や行動特性などの情報から予測する事によって、100人を抽出した時に、平均的な3人ではなく、20人、30人の離脱(解約)予備軍を発見する事を目標とします。そして、この離脱(解約)予備軍に対して、早期にアクションを行う事によって、全体の離脱(解約)率を下げる事が最終的な目的です。
一般的に、平均3人のところを、20人、30人発見する事をその量の増加ととらえて、リフト値といい、予測分析の世界では良く使われるワードになっています。そのイメージを下記に示します。
図4:リフト値のイメージ
リフト値のグラフにおいては一般的に、横軸が分析の対象となるデータの割合を意味し、縦軸が作成した予測モデルによる分析によって発見できる予測対象の割合を示します。例えば、ある予測モデルの結果として上記のようなリフト値のグラフが算出された場合は、横軸の上位10%で、離反(解約)者の50%強を発見できる事を意味します。このようなモデルが作成できた場合、予測モデルの上位10%をより深く分析する事によって、離反(解約)の根本的な原因を探り、その原因を改善するアクションを実施する事になります。
予測分析では、現在のデータから未来を予測しなければなりません。現在のデータで予測分析を行い、予測モデルを作成し、別のデータにその予測モデルを適用する事によって、ここでいう未来の離脱(解約)者を発見する必要があります。その為、いつ時点のデータで、いつまでに離脱(解約)する人を発見するのか、また、予測する為にどの程度のサイズのサンプルデータを用いるかなど、予測分析をはじめる際の計画が重要になります。
また、様々な予測方法があり、例えば、離脱(解約)者を予測するという事は、解約する人、解約しない人を見分ける事が目的となります。つまり、目的変数(応答変数ともいう)が解約する人、解約しない人の2値のパターンとなります。その場合、統計的な手法としてはロジスティック回帰分析が代表的な手法となります。又、データマイニングの手法としてはディシジョンツリー(決定木)やランダムフォレストなどの手法が代表的な手法になります。これらの手法にセグメンテーションなどの手法を組み合わせるケースも少なくありません。
※一般的に、目的変数の取り得るデータの形式によって、適用する手法が異なります。
更に、統計的な手法を使う場合は、一般的に分析するデータが正規分布に従っている必要があるという性質があります。しかし、データが正規分布に従っている事はまれであり、一般的にはデータの正規化が必要になります。データを正規化した場合、そのデータの目的変数に対する影響度も変換されてしまっているので、予測モデルが作成された後に、その逆変換を行って評価する事も重要になります。また、正規化と併せて、データの外れ値に対する対処なども必要になります。
現在では、機械学習という言葉が一般的になり、機械学習を行うソフトウェアやサービスも様々なものが市場に出ています。しかし、データを用意し、ソフトウェアやサービスに読み込ませるだけでは予測分析は行えません。予測分析を行う方々には、その予測分析の目的、目標、計画、目的を満たす為のアクションの定義、プロセス、統計モデルの選択、データ加工など様々な点で確かな知識や詳細な検討が必要になります。DXCは、これまでの経験を元に、お客様の予測分析をご支援いたします。