教師あり機械学習
教師あり機械学習とは
教師あり機械学習は、ラベル付けされたデータを使用してモデルをトレーニングする人工知能の一種です。アルゴリズムに入力と出力のペアが供給されると、入力とそれに対応する出力のマッピングを学習できます。
- 教師あり機械学習の仕組み
- 教師あり学習のプロセス
- 教師あり機械学習のタイプ
- HPEとのパートナーシップ
教師あり機械学習の仕組み
教師あり機械学習のトレーニングでは、アルゴリズムがパラメーターを微調整し、予想された出力と実際の出力との差を小さくしていきます。トレーニングが完了すると、トレーニングデータのパターンを法則化し、未知のデータについて予測を立てることが可能になります。教師あり学習でよく見られる問題として、分類 (分類ラベルを予測) と回帰 (連続値を予測) があります。
教師あり学習のプロセス
教師あり学習 (機械学習の基本的枠組み) では、アルゴリズムがラベル付けされたデータから学習して、予測または意思決定を行います。このプロセスには、データ収集および処理から始まりモデルのトレーニング、テスト、展開へと続く、重要な段階が含まれています。各段階は、さまざまな実環境アプリケーションに有効なモデルを開発および展開するうえで重要な役割を担っています。
- データ収集および処理: MLモデルがデータを効率的に処理できるようにするため、大量のrawデータをトリミングして修正する必要があります。通常は、データアナリストまたはデータサイエンティストがデータを見て不足しているものを確認するほか、データにさらなるコンテキストが必要かを確認したり、新たなデータをセットに追加してMLモデルを補完したりします。
- トレーニングプロセス: 機械学習のアルゴリズムにデータセットが供給されると、パターン、他のデータリージョンとの相関関係、入力特徴と出力ラベルの関係性を特定する方法を学習します。アルゴリズムが内部パラメーターを調整して、入力特徴を出力ラベルにマッピングする、最適な数学関数を特定します。データサイエンティストが最初の反復を確認し、モデルテストに使用できるようになるまでプロセスを調整します。
- モデルのトレーニング: 機械学習アルゴリズムの調整が完了すると、新しいデータまたは未知のデータでテストを開始し、トレーニング段階と同様の (または整合性のある) 回答が得られることを確認します。出力が要求水準に達していない場合、データサイエンティストは、整合性のある回答が得られるまでアルゴリズムを調整するか、プロセスを最初からやり直す必要があります。
モデルの実行: 整合性のある結果が得られたら、そのモデルを企業に入ってくる新しいデータに適用し、新たな成果、予算や収益、次のトレンドの予測に活用します。
教師あり機械学習のタイプ
分類: 分類は教師あり学習の一種であり、入力特徴に基づいて、アルゴリズムが事前定義済みのクラスまたはカテゴリにデータを分類します。ラベル付けされたトレーニングデータから学習し、新しい未知のデータポイントのクラスラベルを予測します。
業界:
- 医療: 医用画像を分類して病気の診断に使用します。
- 金融: 取引を分類して不正検知に使用します。
- e-コマース: 顧客をグループ化してターゲットマーケティングに使用します。
回帰: 回帰は、入力特徴と出力変数との関係に基づいて連続する数値を予測するために使用される、教師あり学習手法の1つです。ラベル付けされたトレーニングデータから学習することで、こうした関係を推定し、新しいデータに関する予測を立てます。
業界:
- 不動産: 資産の特徴に基づいて住宅価格を予測します。
- 医療: 治療に基づいて患者の回復期間を予測します。
- エネルギー: リソースのプランニングにあたって電力消費量を推定します。
HPEとのパートナーシップ
HPEのパートナーシップを利用して、AIおよび機械学習モデルを拡張できます。企業のAI導入を加速させる製品をいくつかご紹介します。
- HPE Machine Learning Development Environment: 機械学習モデルの設計、トレーニング、展開に必要な要素がすべて含まれています。機械学習に最適化されたIDE、ライブラリ、フレームワークが組み込まれています。
- HPE Machine Learning Data Management Software: 機械学習データを整理するツールです。データのインポート、前処理、ラベル付け、バージョン付けを効率化し、データをキュレートして、モデルのトレーニングやテストで簡単に使用できるようにします。
- AI/ML/データ分析製品: HPEのソリューションはAI、機械学習、データ分析に対応しています。ハードウェアアクセラレータ、専用サーバー、ストレージソリューション、AI向けのソフトウェアプラットフォームを搭載できます。
HPEのパートナーがお客様の組織におけるAIおよび機械学習の利用をサポートし、的確な意思決定、自動化、イノベーションを実現します。またHPEは、AIアプリケーションの開発および展開の迅速化を支援し、産業効率と競争力の向上につなげることができます。
教師ありと教師なしの比較
特徴 | 教師あり学習 | 教師なし学習 |
---|---|---|
定義 | 教師あり学習は、アルゴリズムが入力データとそれに対応する出力ラベルの両方を含むラベル付けされたデータから学習する機械学習の一種であり、その目標は、ラベル付けされた例から学習したパターンに基づいて新しいデータを予測または分類することにあります。 | 教師なし学習は、アルゴリズムがラベル付けされていないデータから学習する機械学習の一種です。教師なし学習は、明示的なガイダンスやフィードバックを得ることなくデータの構造とパターンを探るものであり、隠された有益な情報や分類を明らかにすることを目標とします。 |
トレーニングデータ | ラベル付けされたデータ (入力と出力のペア) を必要とします。 | ラベル付けされたデータを必要としません。 |
目標 | ラベル付けされたデータに基づいて予測または分類を行う。 | データの隠されたパターンや構造を見出す。 |
フィードバック | トレーニング中にフィードバックを受け取ります。 | トレーニング中にフィードバックを受け取りません。 |
出力 | 出力は既知のもので事前定義済みです。 | 出力は事前定義済みでなく、既知のものでもありません。 |
サンプルアプリケーション | スパム検出、画像認識、感情分析。 | クラスタリング、異常検知、次元削減。 |