有监管的机器学习
什么是有监管的机器学习?
有监管的机器学习是一种使用标记数据来训练模型的人工智能。这种人工智能会向算法提供输入-输出对,使其能够学习输入及其相应输出之间的映射。
- 有监管的机器学习如何运作?
- 监督学习的流程
- 有监管的机器学习的类型
- 与 HPE 合作
有监管的机器学习如何运作?
使用有监管的机器学习进行训练时,算法会调整其参数,以减少预期输出和实际输出之间的差异。经过训练的模型可从训练数据中概括出模式,以根据先前未知的数据生成预测。常见的监督学习问题包括分类(预测分类标签)和回归(预测连续值)。
监督学习的流程
在监督学习(机器学习的基本范式)中,算法通过标记数据进行学习,以做出预测或决策。这个过程有几个重要的关键阶段,从数据收集和预处理开始,然后是模型训练、测试和部署。在为各种实际应用开发和部署有效模型时,以上每一步都发挥着至关重要的作用。
- 数据收集和处理:需要对大量原始数据进行修剪和修改,以便 ML 模型能够有效地处理数据。通常会由数据分析师或数据科学家来检查数据,看看遗漏了什么,以及数据是否需要更多上下文或者是否需要对数据集中添加更多数据来完善 ML 模型。
- 训练流程:将数据集输入机器学习算法,然后算法学着识别模式、与其他数据区域的相关性以及输入特征和输出标签之间的关系。算法将调整其内部参数,以找到将输入特征映射到输出标签的最佳数学函数。数据科学家会审查第一次迭代、调整训练流程,直至它已做好进行模型测试的准备。
- 模型测试:机器学习算法校准后,开始基于新的或未见过的数据进行测试,看看它是否能得出与训练阶段相似或一致的答案。如果输出低于期望值,则数据科学家将调整算法,直到得到一致的答案,否则需要重新开始该流程。
模型执行:在得到一致的结果后,将模型部署到新数据上,应用于实际业务,用于预测新结果、预测预算或收入,或观察下一趋势。
有监管的机器学习的类型
分类:分类是一种类型的监督学习,在这种学习中,算法根据输入特征将数据分类为预定义的类或类别。它从标记的训练数据中学习,然后预测新的、未见过的数据点的类标签。
行业:
- 医疗保健:对医学图像进行分类,以用于疾病诊断。
- 金融:对交易进行分类以检测欺诈行为。
- 电子商务:对客户进行分组,以便有针对性地开展营销。
回归:回归是一种监督学习技术,用于根据输入特征和输出变量之间的关系预测连续数值。它通过标记的训练数据进行学习,以估计这种关系并基于新数据进行预测。
行业:
- 房地产:根据房地产特征预测房价。
- 医疗保健:根据治疗情况预测患者康复时间。
- 能源:估算电力消耗,以便进行资源规划。
与 HPE 合作
HPE 合作关系有助于扩展 AI 和机器学习模型。以下产品可以加速人工智能在您企业中的应用:
- HPE Machine Learning Development Environment:它拥有设计、训练和部署机器学习模型所需的一切。其中包含经过机器学习优化的 IDE、库和框架。
- HPE Machine Learning Data Management Software:此工具可组织机器学习数据。它简化了数据导入、预处理、标记和版本控制操作,使用户能够轻松管理和访问用于模型训练和测试的数据。
- AI、ML 和数据分析产品:为 AI、机器学习和数据分析构建的 HPE 解决方案。其中包括硬件加速器、专用服务器、存储解决方案和 AI 特定的软件平台。
HPE 合作伙伴可以帮助您的组织使用 AI 和机器学习,更好地进行决策、自动化和创新。HPE 可帮助您加快 AI 应用的开发和部署,提高行业效率和竞争力。
监督与无监督对比
方面 | 监督学习 | 无监督学习 |
---|---|---|
定义 | 监督学习是一种机器学习,在这种学习中,算法通过标记数据(包括输入数据和相应的输出标签)进行学习。目标是基于从标记示例中学习到的模式来预测或分类新数据。 | 在无监督学习这种机器学习方式中,算法通过未标记数据进行学习。它在没有明确指导或反馈的情况下,探索数据内的结构和模式,旨在发掘隐藏的洞见或分组。 |
训练数据 | 需要标记数据(输入-输出对)。 | 不需要标记数据。 |
目标 | 基于标记数据进行预测或分类。 | 发现数据中的隐藏模式或结构。 |
反馈 | 在训练期间接收反馈。 | 训练期间没有反馈。 |
输出 | 输出是已知且预定义的。 | 输出是未预定义或未知的。 |
应用示例 | 垃圾邮件检测、图像识别、情绪分析。 | 聚类、异常检测、降维。 |