기계 학습이란?

ML(기계 학습)은 인공 지능의 하위 범주로, 신경망을 활용하여 패턴을 인식하고 이러한 패턴 식별 역량을 개선하는 컴퓨터의 프로세스를 의미합니다. 기계 학습 알고리즘은 충분한 세부 조정과 데이터를 통해 새로운 패턴과 정보를 예측할 수 있습니다.

기계 학습 과정의 요소

신경망

신경망은 인간의 뇌의 구조와 기능에서 영감을 받은 컴퓨팅 모델 유형입니다. 상호 연결된 인공 뉴런(노드 또는 단위라고도 함)으로 구성되며 여러 레이어에 정리되어 있습니다. 각 뉴런이 입력 신호를 받아 컴퓨팅을 수행하고 출력값을 생성하면 이 출력값이 다음 레이어의 다른 뉴런으로 전달됩니다. 신경망은 데이터를 통해 학습하고 적응하도록 설계되어 기계 학습 및 딥 러닝의 기본 요소라고 할 수 있습니다.

기계 학습에서 신경망은 데이터의 패턴을 분석하고 인식하는 데 사용됩니다. 라벨이 지정된 데이터 세트를 학습하고 분류, 회귀 또는 클러스터링 등의 작업을 수행할 수 있습니다. 뉴런 간 연결의 가중치와 편향을 조정함으로써 신경망은 학습 데이터를 통해 일반화를 진행하고 확인하지 않은 데이터에 대해 예측하거나 결정을 내리는 학습을 합니다.

딥 러닝은 여러 개의 레이어가 숨겨진 심층 신경망을 활용하는 기계 학습의 하위 범주입니다. 심층 신경망은 계층 구조로 표현된 데이터를 자동으로 학습하며 각 레이어에서 점점 더 추상적인 특징을 추출합니다. 이러한 기능으로 딥 러닝 모델은 이미지 및 음성 인식, 자연어 처리뿐 아니라 게임 플레이 등의 복잡한 작업을 처리할 수 있습니다.

딥 러닝

딥 러닝은 ML의 기능을 사용하고 역량을 강화하는 기계 학습의 특정 분야입니다.

일반적으로 기계 학습은 엔지니어들이 알고리즘의 결과를 검토하고 정확도를 바탕으로 조정할 수 있을 정도로 인간의 개입이 포함됩니다. 딥 러닝은 이러한 검토가 이루어지지 않습니다. 대신 딥 러닝 알고리즘은 자체 신경망을 사용하여 결과의 정확도를 검사하고 이를 통해 학습합니다.

딥 러닝 알고리즘의 신경망은 인간의 뇌의 구조를 복제하도록 계층화된 알고리즘 구조입니다. 따라서 신경망은 시간이 지나면서 작업 수행 능력을 키우는 방법을 학습하고, 엔지니어가 피드백을 제공하지 않아도 됩니다.

신경망 개발의 두 가지 중요한 단계는 교육과 추론입니다. 교육은 딥 러닝 알고리즘에 데이터 세트가 제공되고 데이터 세트의 의미를 해석하는 작업을 맡는 초기 단계입니다. 엔지니어는 신경망에 해석의 정확도에 대한 피드백을 제공하고 적절하게 조정합니다. 이 과정이 여러 번 반복될 수 있습니다. 추론은 신경망이 구축되고 신경망에서 처음 보는 데이터 세트로 그것이 의미하는 것을 정확하게 예측하는 것입니다.

기계 학습의 작동 방식

대규모 데이터 세트에 대한 기계 학습의 과정은 보통 몇 가지 단계로 구성됩니다. 기업의 사용 사례를 중심으로 하는 5단계는 다음과 같습니다.

1. 데이터 수집 및 준비: 첫 번째 단계는 당면한 문제와 관련한 데이터를 수집하는 것입니다. 고객 기록, 판매 데이터, 웹 사이트 로그, 웹 사이트 이벤트, 고객의 피드백 또는 해당 기업에서 이용 가능한 기타 데이터와 같은 소스가 포함됩니다. 수집한 데이터는 누락되거나 잘못된 데이터의 정리, 특이 요소 처리, 데이터를 분석에 적합한 형식으로 전환하는 것과 같은 전처리 작업을 거칩니다.

2. 특성 엔지니어링: 데이터 준비 후 다음 단계는 데이터 세트에서 의미 있는 특징을 추출하는 것입니다. 원시 데이터를 패턴과 관계를 포착할 수 있도록 더욱 대표적인 특징으로 전환하는 과정이 포함되는 경우가 많습니다. 기업 사용 사례에서는 고객의 인구 통계, 구매 기록, 계절적 요인, 제품 중 관심도가 높은 부분, 고객 버그 또는 해결할 문제에 영향을 줄 수 있는 관련 특성 등을 생성하는 작업이 포함될 수 있습니다.

3. 모델 선택 및 교육: 특성 엔지니어링 후에 해당 문제와 이용 가능한 데이터를 바탕으로 적합한 기계 학습 모델을 선택합니다. 의사 결정 나무, 랜덤 포레스트, 지원 벡터 시스템, 신경망 등 다양한 모델 유형이 존재합니다. 문제의 성질에 따라 지도형 또는 비지도형 학습과 같은 기술을 사용하여 선택한 모델이 전처리된 데이터를 학습하게 합니다.

4. 모델 평가 및 검증: 이 단계에서는 학습된 모델을 교차 검증 또는 홀드아웃 검증과 같은 검증 기술을 사용하여 평가합니다. 정확도, 정밀도, 재현율 또는 F1 점수와 같은 모델의 성능 메트릭을 분석하여 주어진 문제 해결에 대한 유효성을 평가합니다. 기업 데이터 전반에서 안정성과 일반화 가능성을 보장하기 위해서는 모델의 성능을 검증해야 합니다.

5. 배포 및 모니터링: 만족스러운 모델이 확보되면 기업의 프로덕션 환경에 배포됩니다. 해당 모델을 기존의 비즈니스 프로세스, 시스템 또는 응용 분야에 통합하는 과정이 포함됩니다. 배포 후에는 모델의 성능을 지속적으로 모니터링하면서 변화를 감지하고, 새로운 데이터의 이용이 가능한 경우 주기적으로 모델을 업데이트하고, 정확하고 가치 있는 인사이트를 계속 제공하도록 보장해야 합니다.

이러한 단계는 기업의 사용 사례에서 대규모 데이터 세트에 대한 기계 학습 과정을 대략적으로 보여줍니다. 하지만 최상의 결과를 얻기 위해서는 단계마다 신중하게 고려하고 반복하며 개선해야 합니다.

관련 HPE 솔루션, 제품 또는 서비스

기계 학습 모델의 유형

상황에 따라 기계 학습 알고리즘은 인간의 개입/강화 비율을 높이거나 낮춥니다. 네 가지 주요 기계 학습 모델은 지도형 학습, 비지도형 학습, 준지도형 학습, 강화 학습입니다.

 지도형 학습은 인간의 작업을 수행하는 방법을 학습하도록 지원하는 라벨 데이터 세트를 컴퓨터에 제공합니다. 인간의 학습을 복제하는 시도에서 복잡성이 가장 낮은 모델입니다.

 비지도형 학습은 컴퓨터에 라벨 없는 데이터가 제공되며, 이 데이터를 통해 이전에 알려지지 않은 패턴/인사이트를 얻습니다. 기계 학습 알고리즘이 이를 처리하는 방법은 다음과 같이 매우 다양합니다.

  • 클러스터링: 컴퓨터가 데이터 세트에서 유사한 데이터 포인트를 찾아 적절하게 그룹화합니다(‘클러스터’ 생성).
  • 집적도 예측: 컴퓨터가 데이터 세트의 분산 방식을 보고 인사이트를 검색합니다.
  • 이상 징후 감지: 컴퓨터가 데이터 세트에서 나머지 데이터와 큰 차이가 있는 데이터 포인트를 식별합니다.
  • PCA(Principal Component Analysis): 컴퓨터가 데이터 세트를 분석하고 정확한 예측에 사용할 수 있도록 내용을 요약합니다.

 준지도형 학습은 컴퓨터에 일부 라벨이 있는 데이터 세트가 제공되고, 라벨 데이터를 사용하여 작업을 수행하여 라벨 없는 데이터를 해석할 매개변수를 파악합니다.

 강화 학습: 컴퓨터가 환경을 관찰하고 관련 데이터를 사용하여 위험 최소화 및/또는 보상 극대화 효과가 있는 이상적인 행동을 식별합니다. 이는 컴퓨터가 최상의 행동을 더 잘 식별하는 데 도움이 되는 일종의 강화 신호가 필요한 반복적인 방식입니다.

딥 러닝 및 기계 학습의 관계

기계 학습은 데이터 세트를 사용하여 패턴을 식별하고 인사이트를 확인하고 예측을 수행할 수 있는 알고리즘의 광범위한 카테고리에 속합니다. 딥 러닝은 ML의 기능을 사용하고 역량을 강화하는 기계 학습의 특정 분야입니다.

일반적으로 기계 학습은 엔지니어들이 알고리즘의 결과를 검토하고 정확도를 바탕으로 조정할 수 있을 정도로 인간의 개입이 포함됩니다. 딥 러닝은 이러한 검토가 이루어지지 않습니다. 대신 딥 러닝 알고리즘은 자체 신경망을 사용하여 결과의 정확도를 검사하고 이를 통해 학습합니다.

딥 러닝 알고리즘의 신경망은 인간의 뇌의 구조를 복제하도록 계층화된 알고리즘 구조입니다. 따라서 신경망은 시간이 지나면서 작업 수행 능력을 키우는 방법을 학습하고, 엔지니어가 피드백을 제공하지 않아도 됩니다.

신경망 개발의 두 가지 중요한 단계는 교육과 추론입니다. 교육은 딥 러닝 알고리즘에 데이터 세트가 제공되고 데이터 세트의 의미를 해석하는 작업을 맡는 초기 단계입니다. 엔지니어는 신경망에 해석의 정확도에 대한 피드백을 제공하고 적절하게 조정합니다. 이 과정이 여러 번 반복될 수 있습니다. 추론은 신경망이 구축되고 신경망에서 처음 보는 데이터 세트로 그것이 의미하는 것을 정확하게 예측합니다.

기계 학습의 이점

기계 학습은 강력하고 유연하고 탄력적인 엔터프라이즈를 위한 촉매제 역할을 합니다. 스마트 조직은 전체적인 성장 촉진, 직원 생산성 및 고객 만족도 향상을 위해 ML을 선택합니다.

기업에서 소수의 ML 사용 사례로 성공하는 경우도 많지만 이것은 여정의 시작일 뿐입니다. ML 사용 시도가 우선하지만 이후 엔터프라이즈 전체로 확장할 수 있도록 ML 모델을 비즈니스 애플리케이션 및 프로세스로 통합해야 합니다.

기계 학습 사용 사례

수직 산업 전반에서 ML 기술을 성공적으로 배포하여 조직에서 실질적인 성과를 얻고 있습니다.

금융 서비스

예를 들어 금융 서비스 분야에서 은행은 상호 연결된 광범위한 조치 전체를 관장하는 ML 예측 모델을 활용하여 고객의 요구를 더 잘 이해하고 충족할 수 있습니다. 또한 ML 예측 모델은 위험 노출을 확인하고 제한하는 것도 가능합니다. 은행은 사이버 위협을 식별하고, 고객의 상기 행위를 추적 및 문서화하고, 신제품의 위험에 대한 예측을 개선할 수 있습니다. 은행의 주요 ML 사용 사례로는 사기 탐지 및 완화, 개인 금융 자문 서비스, 신용 점수 및 대출 분석 등이 있습니다.

제조

제조업 관련 기업은 자동화를 도입하고 장비와 프로세스를 둘 다 활용하고 있습니다. ML 모델링을 통해 현재의 수요에 대응하고 미래의 변화도 고려하는 방식으로 생산을 재구성 및 최적화합니다. 최종 결과는 민첩성과 복원력이 뛰어난 제조 프로세스입니다. 제조업의 세 가지 주요 ML 사용 사례는 생산량 증대, 근본 원인 분석, 공급망 및 재고 관리입니다.

기업에서 MLOps를 사용하는 이유

조직에서 이러한 수준의 전사적 통합을 달성하는 데 필요한 기술, 프로세스, 툴이 부족한 경우가 많습니다. 적절한 규모로 ML을 구축하려면 기업에서 ML Ops 대상 투자를 고려해야 하며, 모델 개발부터 운영화까지 ML 수명 주기의 모든 단계를 간소화 및 표준화하는 프로세스, 툴, 기술이 포함됩니다. 새로운 영역인 ML Ops의 목적은 ML 수명 주기에 민첩성과 속도를 지원하는 것입니다. 소프트웨어 개발 수명 주기에서 DevOps의 효과와 비교할 수 있습니다.

엔터프라이즈가 ML 사용 시도에서 ML 운영화로 진행하려면 강력한 ML Ops 프로세스가 필요합니다. ML Ops로 조직에서는 경쟁 우위를 확보하는 것뿐만 아니라 다른 기계 학습 사용 사례도 구현할 수 있습니다. 기술 증진 및 협업 지원 환경을 통한 인재 역량 강화, 수익 증대, 고객 경험 개선, 매출 성장 촉진 등을 포함한 다른 이점도 있습니다.

HPE 및 기계 학습

HPE는 코어 엔터프라이즈 데이터 센터부터 인텔리전트 엣지에 이르기까지 복잡성을 줄이고 엔드 투 엔드 솔루션을 구축하는 기계 학습을 지원합니다.

HPE Apollo Gen10 시스템은 우수한 성능으로 인텔리전스 확보 속도를 높이는 업계 최고의 가속기가 장착된 엔터프라이즈 딥 러닝 및 기계 학습 플랫폼을 제공합니다.

HPE Ezmeral 소프트웨어 플랫폼은 엔터프라이즈가 조직 전체에서 디지털 트랜스포메이션을 촉진하도록 설계되었습니다. 민첩성 및 효율성 향상, 인사이트 확보, 비즈니스 혁신 지원 등의 효과가 있습니다. 전체 포트폴리오에 인공 지능, 기계 학습, 데이터 분석뿐 아니라 컨테이너 오케스트레이션 및 관리, 비용 관리, IT 자동화, AI 기반 운영, 보안이 포함됩니다.

HPE Ezmeral ML Ops 소프트웨어 솔루션은 전체 기계 학습 수명 주기를 지원 하고DevOps와 같은 절차를 도입하여 기계 학습 워크플로를 표준화하기 위해 HPE Ezmeral Container Platform의 역량을 확장합니다.

엔터프라이즈가 ML 개념 증명에서 생산 단계로 빨리 이동하는 데 도움이 되도록 HPE Pointnext Advisory and Professional Services는 ML 프로젝트 제공에 필요한 전문성과 서비스 를제공합니다. HPE Pointnext 전문가는 전 세계에서 수백 개의 워크샵과 프로젝트를 제공한 경험을 바탕으로 프로젝트 배포를 몇 년에서 몇 달, 몇 주로 가속하는 기술과 전문성을 제공합니다.