機械学習とは

機械学習 (ML) は、AIのサブカテゴリです。パターンを認識し、改良するために、ニューラルネットワークを活用するコンピューターのプロセスで、それらのパターンを特定する能力を備えています。十分に調整され、多くのデータがあれば、機械学習アルゴリズムは新しいパターンや情報を予測できます。

機械学習プロセスの各部分

ニューラルネットワーク

ニューラルネットワークは、人間の脳の構造や機能から発想を得たコンピューターモデルのタイプです。層構造になっている人工ニューロン (ノードやユニットともいう) が相互接続されたもので構成されています。各ニューロンは入力を受け取り、演算を実行し、出力を生成します。これが後続のレイヤーにある他のニューロンに渡されます。ニューラルネットワークはデータを学習し、適応するように設計されています。これは機械学習とディープラーニングの基本コンポーネントになっています。

機械学習では、ニューラルネットワークはデータのパターンを解析し認識するために使用され、分類、回帰、クラスタリングなどのタスクを実行するために、ラベル付きデータセットでトレーニングできます。ニューロン間の重みとバイアスを調整することで、ニューラルネットワークはトレーニングデータから一般化した情報を学習し、未知のデータに対して予測や決定を行います。

ディープラーニングは機械学習の特定のサブセットで、複数の隠れ層があるディープニューラルネットワークを活用します。ディープニューラルネットワークは、データの階層表現を自動的に学習する能力があり、各レイヤーでさらに抽象的な特徴を次々と抽出します。この機能は、ディープラーニングモデルを強化して、画像や音声認識、自然言語処理、さらにゲームプレイまでといった複雑なタスクを処理します。

ディープラーニング

一方ディープラーニングは、MLの機能を利用してその能力の一歩先を行くMLの特定分野です。

MLでは一般に、エンジニアがアルゴリズムの結果をレビューし、その精度に基づいて調整を加えることができるという点で若干の人間が関与しますが、ディープラーニングはこうしたレビューに依存しません。その代わりに、ディープラーニングアルゴリズムは独自のニューラルネットワークを使用して結果の精度をチェックしたうえでそれらの結果から学習します。

ディープラーニングアルゴリズムのニューラルネットワークは、人間の脳の構造を再現するために階層化されるアルゴリズムの構造であるため、エンジニアがフィードバックを提供しなくても、時間とともにタスクをスムーズに完了させる方法を学習します。

ニューラルネットワークの開発の主要な段階は、トレーニングと推論の2つです。最初の段階となるのがトレーニングであり、ここではディープラーニングアルゴリズムにデータが提供され、データセットの意味を解釈するタスクが課されます。その後、エンジニアが解釈の精度に関するフィードバックをニューラルネットワークに提供し、その情報に応じてニューラルネットワークに調整が加えられますが、このプロセスでは多くのイテレーションが必要になることがあります。推論はニューラルネットワークが展開されるときに行われ、それまで知られていなかったデータセットを取得して、それが何を表すのかを正確に予測できます。

MLの仕組み

大規模データセットに対する機械学習のプロセスには一般に複数のステップがあります。エンタープライズのユースケースで注目する5つの主要なステップを次に示します。

1. データ収集および準備: 第1ステップは、対象の問題に対して関連データを収集することです。収集データには、顧客記録、販売データ、Webサイトログ、Webサイトイベント、顧客フィードバック、その他に企業内で利用できるようなデータなどのソースが含まれます。収集済みデータには事前処理が実行されます。これには、失われたデータや誤差の多いデータのクリーンアップ、外れ値の処理、分析用の適切なフォーマットへのデータ変換などのタスクが含まれます。

2. 特徴量エンジニアリング: データの準備ができたら、次のステップは、データセットから意味のある特徴を抽出することです。この段階でよく行われるのは、パターンや関係を捉えた、さらに代表的な特徴にrawデータを変換することです。エンタープライズのユースケースでは、顧客層統計データ、購買履歴、季節性、製品のホットスポット、顧客の問題、その他、解決する問題に影響を与えるような関連属性などの特徴をここで生み出します。

3. モデル選択およびトレーニング: 特徴のエンジニアリング処理が終了した後、対象の問題と利用できるデータに基づいて、適切な機械学習モデルを選択します。多様なタイプのモデル、決定木、ランダムフォレスト、サポートベクターマシン、ニューラルネットワークなどがあります。選択モデルは、問題の特性に応じて、教師あり/教師なし学習などの手法を使用して、事前処理データでトレーニングされます。

4. モデルの評価および妥当性確認: このステップでは、トレーニングされたモデルを、交差検証やホールドアウト検証などの検証手法を使用して、評価します。モデルのパフォーマンス測定基準 (正解率、適合率、再現率、F1値など) は、対象の問題でその効果を評価するために分析されます。エンタープライズのデータ間で信頼性と一般化可能性を保証するために、モデルのパフォーマンスを検証することが不可欠です。

5. 展開および監視: 満足のいくモデルが得られたら、エンタープライズの実稼働環境に展開します。これには、モデルを既存のビジネスプロセス、システム、アプリケーションに統合することが含まれます。展開後に、モデルのパフォーマンスを継続的に監視し、何らかのドリフトを検出し、新しいデータが利用可能になったとき、定期的にモデルを更新すること、さらに正確で価値がある有益な情報を引き続き提供することが重要です。

これらのステップでは、エンタープライズのユースケースに対する大規模データセットにおける機械学習プロセスの高レベル概要を示します。ただし、留意が必要なのは、各ステップで、最適な結果を達成するために慎重な検討、イテレーション、精緻化が必須であることです。

機械学習モデルの種類

MLのアルゴリズムを機能させるときに必要となる人間による介入や強化は、状況によって増減します。主要なMLモデルは、教師あり学習、教師なし学習、半教師あり学習、強化学習の4種類です。

 教師あり学習では、コンピューターが人間のタスクを実行する方法を学習できる、一連のラベルありデータがコンピューターに提供されます。これは人間の学習能力を再現しようとするものであるため、最も複雑ではないモデルです。

 教師なし学習では、コンピューターにラベルなしデータが提供され、コンピューターはそこからこれまで知られていなかったパターンや有益な情報を引き出します。以下のように、MLアルゴリズムはさまざまな方法でこうした処理を行います。

  • コンピューターがデータセット内の類似するデータポイントを見つけてグループ化 (「クラスター」を作成する) クラスタリング。
  • コンピューターがデータセットの分布状況を調べて有益な情報を見つけ出す密度推定。
  • コンピューターが他のデータとは大きく異なるデータセット内のデータポイントを特定する異常検知。
  • データセットを使用して正確な予測が行えるよう、コンピューターがデータセットを分析してまとめる主成分分析 (PCA)。

 半教師あり学習では、コンピューターに部分的にラベルが付けられたデータセットが提供され、コンピューターは、パラメーターを理解してラベルなしデータを解釈するためにラベルありデータを使用してタスクを実行します。

 強化学習では、コンピューターは環境を監視し、そのデータを使用してリスクを最小限に抑える、成果を最大限まで高める、またはその両方につながる理想的な動作を特定します。これは反復的なアプローチであり、コンピューターが最善のアクションを的確に特定できるようにするための何らかの強化信号が必要です。

ディープラーニングとMLの関係

MLは、データセットを取得し、それを使用してパターンを特定したり、有益な情報を見出したり、予測を行ったりできるアルゴリズムの広義のカテゴリです。一方ディープラーニングは、MLの機能を利用してその能力の一歩先を行くMLの特定分野です。

MLでは一般に、エンジニアがアルゴリズムの結果をレビューし、その精度に基づいて調整を加えることができるという点で一部人間が関与しますが、ディープラーニングはこうしたレビューに依存しません。その代わりに、ディープラーニングアルゴリズムは独自のニューラルネットワークを使用して結果の精度をチェックしたうえでそれらの結果から学習します。

ディープラーニングアルゴリズムのニューラルネットワークは、人間の脳の構造を再現するために階層化されるアルゴリズムの構造であるため、エンジニアがフィードバックを提供しなくても、時間とともにタスクをスムーズに完了させる方法を学習します。

ニューラルネットワークの開発の主要な段階は、トレーニングと推論の2つです。最初の段階となるのがトレーニングであり、ここではディープラーニングアルゴリズムにデータが提供され、データセットの意味を解釈するタスクが課されます。その後、エンジニアが解釈の精度に関するフィードバックをニューラルネットワークに提供し、その情報に応じてニューラルネットワークに調整が加えられますが、このプロセスでは多くのイテレーションが必要になることがあります。推論はニューラルネットワークが展開されるときに行われ、それまで知られていなかったデータセットを取得してそれが何を表すのかを正確に予測できます。

機械学習のメリット

MLは、強力で柔軟性と耐障害性に優れた企業の実現を促進するものであり、賢明な組織は、収益と利益を増やしたり、従業員の生産性を向上させたり、顧客満足度を高めたりするためにMLを選択しています。

多くの企業はいくつかのMLのユースケースで成功を収めていますが、それはML導入のほんの始まりにすぎません。まずはMLを実験することから始まりますが、その次には企業全体に拡張できるよう、ビジネスアプリケーションやビジネスプロセスにMLモデルを統合する必要があります。

機械学習のユースケース

MLのテクノロジーと手法はさまざまな業種に展開されており、多くの組織に目に見える現実の成果をもたらしています。

金融サービス

たとえば金融サービスでは、銀行は相互に関係する膨大な測定尺度を参照するMLの予測モデルを使用することにより、顧客のニーズをより的確に把握して満たしています。またMLの予測モデルでは、リスクを明らかにして抑制することもでき、銀行は、サイバー脅威を特定したり、顧客の詐欺的な行為を追跡して記録したり、新製品のリスクをより的確に予測したりすることが可能です。銀行におけるMLの主なユースケースとしては、不正の検出と軽減、個人向け財務顧問サービス、信用度採点、ローン分析などがあります。

製造業

製造の分野では、多くの企業がすでに自動化を取り入れており、今では機器とプロセスの両方を実装しています。こうした企業は、MLモデリングを使用して、現在の需要に対応すると同時に将来の変化を意識した方法で生産体制を再編成して最適化しています。その結果、アジリティと耐障害性を即座に実現する、優れた製造プロセスが確立されています。製造の分野で見られる主なMLのユースケースとしては、収率向上、根本原因分析、そしてサプライチェーンおよび在庫管理の3つが挙げられます。

企業がMLOpsを利用する理由

多くの組織には、このような全社レベルの統合を行えるスキル、プロセス、ツールがなく、企業がMLの大規模な導入を成功させるには、モデルの開発から実用化までのMLライフサイクルの各段階を合理化して標準化するプロセス、ツール、テクノロジーを含む、ML Opsへの投資を検討する必要があります。このML Opsという新たな分野は、MLライフサイクルのアジリティとスピードの向上を目指すものであり、ソフトウェア開発ライフサイクルに対するDevOpsの成果と比較することができます。

企業がMLの実験段階から実用段階へと進むには、強力なML Opsのプロセスが必要です。ML Opsは、組織に競争力をもたらすだけでなく、組織がMLのその他のユースケースを実行できるようにし、スキルの強化による人材の能力の向上、より協調的な環境の構築、さらには収益性やカスタマー・エクスペリエンスの向上、売上高の増加といったメリットをもたらします。

HPEと機械学習

HPEはMLによって複雑性を解消し、コアエンタープライズデータセンターからインテリジェントエッジまでをカバーするエンドツーエンドのソリューションを生み出しています。

HPE Apollo Gen10システムは、卓越したパフォーマンスで迅速にインテリジェンスを引き出す業界をリードするアクセラレータを搭載した、エンタープライズディープラーニングおよび機械学習プラットフォーム を提供します。

HPE Ezmeralソフトウェアプラットフォームは、企業が組織全体のデジタルトランスフォーメーションを加速 させることができるようサポートする設計となっています。このプラットフォームにより、企業はアジリティと効率を向上させて有益な情報を引き出し、ビジネスイノベーションを実現できます。このプラットフォームの包括的なポートフォリオは、AI、ML、データ分析、さらにはコンテナオーケストレーション、コンテナ管理、コスト管理、IT自動化、AI主導型運用、セキュリティまでをカバーします。

HPE Ezmeral ML Opsソフトウェアソリューションは、HPE Ezmeral Container Platformの機能を拡張してMLライフサイクル全体をサポート し、DevOpsのようなプロセスを実装してMLのワークフローを標準化します。

企業がMLの概念実証を短期間で完了させて本稼働に移行できるよう、HPE Pointnext Advisory and Professional Servicesは、MLプロジェクトを実行するのに必要な専門知識とサービス を提供します。世界中で数百のワークショップとプロジェクトを実施してきた経験を持つHPE Pointnextのエキスパートが、プロジェクトを展開するまで期間を数年から数か月、さらには数週間にまで短縮するスキルと専門知識を提供します。