지도형 기계 학습
지도형 기계 학습이란?
지도형 기계 학습은 레이블이 지정된 데이터를 사용하여 모델을 교육하는 인공 지능의 한 유형입니다. 이 방식에서는 알고리즘에 입력-출력 쌍을 제공하여 알고리즘이 입력과 해당 출력 간 매핑을 학습할 수 있습니다.
- 지도형 기계 학습의 작동 방식
- 지도형 학습의 과정
- 지도형 기계 학습의 유형
- HPE와의 파트너십
지도형 기계 학습의 작동 방식
지도형 기계 학습을 사용한 교육 시 알고리즘은 예상 출력과 실제 출력 간의 차이를 줄이기 위해 매개변수를 조정합니다. 교육이 완료된 모델은 교육 데이터의 패턴을 일반화함으로써 이전에 알지 못했던 데이터에 대한 예측 내용을 생성할 수 있습니다. 지도형 학습의 일반적인 문제로는 카테고리 레이블을 예측하는 분류, 연속적인 값을 예측하는 회귀가 있습니다.
지도형 학습의 과정
기계 학습의 핵심 패러다임인 지도형 학습에서는 레이블이 지정된 데이터를 통해 학습된 알고리즘에 따라 예측 또는 결정이 진행됩니다. 이 과정에는 데이터 수집 및 전처리로 시작하여 모델 교육, 테스트, 배포로 이어지는 중요한 단계가 포함됩니다. 각 단계는 다양한 실제 응용 분야를 위한 효과적인 모델의 개발 및 배포에서 중요한 역할을 합니다.
- 데이터 수집 및 처리: ML 모델이 데이터를 효율적으로 처리할 수 있도록 많은 양의 원시 데이터를 다듬고 수정해야 합니다. 일반적으로 데이터 분석가 또는 데이터 과학자가 데이터를 살펴보고 누락된 부분을 확인하며 데이터에 더 많은 컨텍스트가 필요한지 또는 ML 모델을 보완하기 위해 데이터를 추가해야 하는지를 판단합니다.
- 교육 과정: 기계 학습 알고리즘에 데이터 세트가 제공되면 이를 학습하여 패턴, 다른 지역 데이터와의 연관성, 입력 내용과 출력 레이블 간 관계를 식별합니다. 알고리즘은 입력 내용을 출력 레이블에 매핑하는 최적의 수학적 함수를 찾기 위해 내부 매개변수를 조정합니다. 데이터 과학자는 첫 번째 반복을 검토하고 모델 테스트 준비가 완료될 때까지 이 과정을 조정합니다.
- 모델 테스트: 기계 학습 알고리즘을 조정한 후에 새로운 데이터 또는 보지 못한 데이터에 대한 테스트를 시작하여 교육 단계와 유사하거나 일관된 결과가 나오는지 확인합니다. 출력이 원하는 수준보다 낮다면 데이터 과학자가 일관된 결과가 도출될 때까지 알고리즘을 조정하거나 해당 과정을 다시 시작해야 합니다.
모델 실행: 일관된 결과를 얻은 후에는 비즈니스에 들어오는 새로운 데이터에 대해 모델을 배포하고 새로운 결과 예측, 예산 또는 수익 예측, 다음 동향 관찰 등에 사용합니다.
지도형 기계 학습의 유형
분류: 분류는 알고리즘이 입력 내용을 바탕으로 데이터를 사전 정의된 클래스 또는 카테고리로 분류하는 지도형 학습의 한 유형으로, 레이블이 지정된 교육 데이터를 학습한 후에 보지 못한 새로운 데이터 포인트의 클래스 레이블을 예측합니다.
업종:
- 의료: 질병 진단을 위한 의료 이미지 분류
- 금융: 부정행위 감지를 위한 트랜잭션 카테고리 분류
- 전자 상거래: 타겟 마케팅을 위한 고객 그룹화
회귀: 회귀는 입력 내용과 출력 변수의 관계를 바탕으로 연속적인 숫자 값을 예측하는 지도형 학습 기술로, 레이블이 지정된 교육 데이터를 학습하여 이러한 관계를 예측하고 새로운 데이터에 대한 예측 결과를 제공합니다.
업종:
- 부동산: 자산의 특징을 바탕으로 주택 가격 예측
- 의료: 치료를 바탕으로 환자의 회복 시간 예측
- 에너지: 리소스 계획을 위한 전력 소비 예측
HPE와의 파트너십
HPE와의 파트너십을 통해 AI 및 기계 학습 모델을 확장할 수 있습니다. 비즈니스에서 AI 도입을 가속화하는 데 도움이 되는 몇 가지 제품은 다음과 같습니다.
- HPE Machine Learning Development Environment: 기계 학습 모델의 설계, 교육, 배포에 필요한 모든 구성요소, 즉 기계 학습에 최적화된 IDE, 라이브러리, 프레임워크 등을 제공합니다.
- HPE Machine Learning Data Management Software: 이 툴은 기계 학습 데이터를 정리합니다. 데이터 가져오기, 전처리, 레이블 지정, 버전 관리를 간소화하여 모델 교육 및 테스트에 맞게 데이터를 큐레이션하고 더 쉽게 이용할 수 있습니다.
- AI, ML 및 데이터 분석 제품: HPE 솔루션은 AI, 기계 학습, 데이터 분석에 적합하게 구축되었습니다. 하드웨어 가속기, 특수 서버, 스토리지 솔루션, AI 전용 소프트웨어 플랫폼 등이 포함됩니다.
HPE 파트너는 조직이 AI 및 기계 학습을 사용하여 의사 결정, 자동화, 혁신을 강화하는 데 도움을 줍니다. HPE는 AI 애플리케이션의 개발 및 배포를 가속화하여 산업의 효율성과 경쟁력을 개선하도록 지원합니다.
지도형과 비지도형 비교
방식 | 지도형 학습 | 비지도형 학습 |
---|---|---|
정의 | 지도형 학습은 알고리즘이 입력 데이터 및 해당하는 출력 레이블을 포함하여 레이블이 지정된 데이터를 통해 학습하는 기계 학습 유형입니다. 목표는 레이블이 지정된 예시를 통해 학습한 패턴을 바탕으로 새로운 데이터를 예측 또는 분류하는 것입니다. | 비지도형 학습은 알고리즘이 레이블이 지정되지 않은 데이터를 통해 학습하는 기계 학습 유형입니다. 명시적인 가이드 또는 피드백 없이 데이터 내의 구조와 패턴을 탐색하여 숨겨진 인사이트나 그룹을 발견하는 것입니다. |
교육 데이터 | 레이블 지정 데이터(입력-출력 쌍)가 필요합니다. | 레이블 지정 데이터가 필요하지 않습니다. |
목표 | 레이블 지정 데이터를 바탕으로 예측 또는 분류합니다. | 데이터에 숨겨진 패턴이나 구조를 찾습니다. |
피드백 | 교육 중에 피드백을 받습니다. | 교육 중에 피드백을 받지 않습니다. |
출력 | 출력은 알려지고 사전 정의됩니다. | 출력은 사전 정의되거나 알려지지 않습니다. |
애플리케이션 예시 | 스팸 탐지, 이미지 인식, 감정 분석 | 클러스터링, 이상 징후 감지, 차원 축소 |