国外优惠卷网站如何做,汉阳网站建设鄂icp,施工企业岗位证书有哪些,wordpress您找的页面不存在机器学习中的关键组件
数据
每个数据集由一个个样本组成#xff0c;大多时候#xff0c;它们遵循独立同分布。样本有时也叫作数据点或数据实例#xff0c;通常每个样本由一组称为特征或协变量的属性组成。机器学习会根据这些属性进行预测#xff0c;预测得到的称为标签或…机器学习中的关键组件
数据
每个数据集由一个个样本组成大多时候它们遵循独立同分布。样本有时也叫作数据点或数据实例通常每个样本由一组称为特征或协变量的属性组成。机器学习会根据这些属性进行预测预测得到的称为标签或目标。
目标函数
在机器学习中我们需要定义对模型的优劣程度的度量这个度量在大多数情况下是“可视化”的这被称为目标函数。我们通常定义一个目标函数并希望优化它到最小值。当任务在试图预测数值时最常见的损失函数是平方误差即预测值与实际值之差的平方。当试图解决分类问题时最常见的目标函数是最小化错误率错误率即预测与实际情况不符的样本比率。有些目标函数平方误差很容易被优化有些目标函数错误率由于不可微性或其他复杂性难以直接优化。通常损失函数是根据模型参数定义的并取决于数据集。在一个数据集上我们可以通过最小化总损失来学习模型参数的最佳值。该数据集由一些为训练而采集的样本组成称为训练数据集或训练集。可用数据集通常可以分为两部分训练数据集用于拟合模型参数测试数据集用于评估拟合的模型。然后我们观察模型在这两部分数据集上的性能。当一个模型在训练集上表现良好但不能推广到测试集时这个模型被称为过拟合的。
优化算法
深度学习中大多数流行的优化算法通常基于一种基本方法--梯度下降
机器学习分类及其问题
监督学习
监督学习擅长在“给定输入特征”的情况下预测标签。每个“特征-标签”对都称为一个样本。即使标签是未知的样本也可以指代输入特征。我们的目标是生成一个模型该模型能够将任何输入特征映射到标签即预测
监督学习在训练参数时我们为模型提供了一个数据集其中每个样本都有真实的标签。在给定一组特定的可用数据的情况下估计未知事物的概率。
监督学习的学习过程 从已知大量数据样本中随机选取一个子集为每个样本获取真实标签。有时这些样本已有标签有时这些样本可能需要被人工标注。这些输入和相应标签一起构成了训练数据集。选择有监督的学习算法它将训练数据集作为输入并输出一个“已完成学习的模型”将之前没有见过的样本特征放到这个“已完成学习的模型”中使用模型的输出作为相应标签的预测 监督学习的模型
回归
回归问题是由输出决定的此时的目标是生成一个模型使它的预测值非常接近实际标签值。
分类
分类问题希望模型能够预测样本属于哪个类别其正式称为类。 分类器可能会输出图像是猫的概率为0.9也就是分类器确定图像描绘的是一只猫的概率为90%。预测类别的概率传达了模型的不确定性。 交叉熵
分类问题的常见损失函数
层次分类
人们宁愿错误地归入一个相关的类别也不愿错误地归入一个不相关的类别这通常被称为层次分类
标注问题
多标签分类
学习预测不相互排斥的类别问题
搜索
有时我们不仅仅希望输出一个类别或一个实值。在信息检索领域我们希望对一组项目进行排序
推荐系统
目标是向特定用户进行“个性化”推荐
序列学习
标记和解析
用属性注释文本序列通常目标是基于结构和语法假设对文本进行分解以获得一些注释。
自动语音识别
在语音识别中输入序列是说话人的录音输出序列是说话人所说内容的文本记录。
文本到语音
输入是文本输出则是音频文件
机器翻译
在语音识别中输入和输出的出现顺序基本相同。而在机器翻译中颠倒输入和输出的顺序非常重要。机器翻译是输入和输出的数量以及相应序列的顺序大都不会相同。
无监督学习
数据中不含有“目标”的机器学习问题通常被称为“无监督学习”
无监督学习主要解决的问题
①聚类问题②主成分分析问题③因果关系和概率图模型
④生成对抗网络提供一种合成数据的方法
与环境互动
无论是监督学习还是无监督学习我们都会预先获取大量数据然后启动模型不再与环境交互。所有的学习都是在算法与环境断开后进行的被称为离线学习
离线学习的优点我们可以孤立地进行模式识别而不必分心于其他问题 缺点能解决的问题相当有限
强化学习
智能体在一系列的时间步骤上与环境交互。在每个特定时间点智能体从环境接受一些观测并且必须选择一个动作然后通过某种机制执行器将其传输回环境最终智能体从环境中获得奖励。此后新一轮循环开始。 强化学习的目标是产生一个好的策略。强化学习智能体选择的“动作”受策略控制即一个从环境观测映射到动作的功能。 一般来说智能体只是得到一些奖励。此外环境甚至可能不会告知是哪些动作导致了奖励强化学习可能还必须处理部分可观测性问题。也就是说当前的观测结果可能无法阐述有关当前状态的所有信息智能体的动作会影响后续的观测而奖励只与所选的动作相对应。环境可以是完整观测到的也可以是部分观测到的 当环境可被完全观测到时强化学习问题被称为马尔可夫决策过程当状态不依赖之前的动作时我们称该问题为上下文老虎机当没有状态只有一组最初未知奖励的可用动作时这就是经典的多臂老虎机
神经网络的起源
神经网络的核心是当今大多数网络中都可以找到的几个关键原则
①线性和非线性处理单元的交替通常称为层
②使用链式规则反向传播一次性调整网络中的全部参数
深度学习的发展
深度学习的一个关键优势是它不仅取代了传统学习管道末端的浅层模型还取代了劳动密集型的特征工程过程。此外通过取代大部分特定领域的预处理深度学习消除了以前分隔计算机视觉、语音识别、自然语言处理、医学信息学和其他应用领域的许多边界为解决各种问题提供了一套统一的工具