网站定制,阿里巴巴网站图片怎么做的,网站开发人员必备技能,工程建设信息网站有哪些目录
学习模式分为三大类#xff1a;监督#xff0c;无监督#xff0c;强化学习
监督学习基本问题
分类问题
回归问题
无监督学习基本问题
聚类问题
降维问题
强化学习基本问题
决策问题
如何选择合适的算法 我们将涵盖目前「五大」最常见机器学习任务#xff1a…目录
学习模式分为三大类监督无监督强化学习
监督学习基本问题
分类问题
回归问题
无监督学习基本问题
聚类问题
降维问题
强化学习基本问题
决策问题
如何选择合适的算法 我们将涵盖目前「五大」最常见机器学习任务 回归 分类 聚类 降维 决策 学习模式分为三大类监督无监督强化学习 监督学习基本问题
分类问题 分类是监督学习的一个核心问题。 在监督学习中当输出变量Y取有限个离散值时预测问题变成为分类问题。 这时输入变量X可以是离散的也可以是连续的。 监督学习从数据中学习一个分类模型或分类决策函数称为分类器classifier。 分类器对新的输入进行输出的预测成为分类classification。 可能的输出成为类别class。 分类的类别为多个时称为多分类问题。 分类问题包括学习和分类两个过程也就是训练和测试的过程。在学习过程中根据已知的训练数据集利用有效的学习方法学习一个分类器在分类过程中利用学习的分类器对新的输入实例进行分类。
分类问题可以通过下图来描述。图中是训练数据集学习系统由训练数据学习一个分类器或分类系统通过学到的分类器或对新的输入实例进行分类即预测其输出的类标记。 分类问题
评价分类器性能的指标有分类精度accuracy、查准率precision和召回率recall等
许多机器学习算法可以用于分类问题包括k近邻法、感知机、朴素贝叶斯、决策树、逻辑斯蒂回归、支持向量机、提升方法、贝叶斯网络、神经网络等等。
分类任务根据其特性将数据“分门别类”所以在许多领域都有广泛的应用。例如在银行业务中可以构建一个客户分类模型对客户按照贷款风险的大小进行分类在网络安全领域可以利用日志数据的分类对非法入侵进行检测在图像处理中分类可以用来检测图像中是否有人脸出现在手写识别中分类可以用于识别手写的数字在互联网搜索中网页的分类可以帮助网页的抓取、索引与排序。
回归问题 回归regression是监督学习的另一个重要问题。 回归用于预测输入变量自变量和输出变量因变量之间的关系特别是当输入变量的值发生变化时输出变量的值随之发生的变化。 回归模型正是表示从输入变量到输出变量的之间映射的函数。 回归问题的学习等价于函数拟合选择一条函数曲线使其很好地拟合已知数据且很好地预测未知数据。 回归问题也分为学习和预测两个过程。首先给定一个训练数据集其中是输入是对应的输出。学习系统基于训练数据构建一个模型即函数对新的输入预测系统根据学习的模型确定相应的输出。
回归问题按照输入变量的个数分为一元回归和多元回归按照输入变量和输出变量之间关系的类型即模型的类型分为线性回归和非线性回归。
回归学习最常用的损失函数是平方损失函数
许多领域的任务都可以形式化为回归问题比如回归可以用于商务领域作为市场趋势预测、产品质量管理、客户满意度调查、投资风险分析的工具。
无监督学习基本问题
聚类问题 聚类clustering是将样本集合中相似的样本实例分配到相同的类不相似的样本分配到不同的类。 聚类时样本通常是欧式空间中的向量类别不是事先给定而是从数据中自动发现但个别的个数通常是实现给定的。 样本之间的相似度或距离由应用决定。 如果一个样本只能属于一个类则称为硬聚类hard clustering如果一个样本可以属于多个类则称为软聚类soft clustering。 聚类的过程就是学习聚类模型的过程。 降维问题 降维dimensionality reduction是将训练数据中的样本实例从高位空间转换到低维空间。 假设样本原本存在于低维空间或者近似地存在于低维空间通过降维则可以更好地表示样本数据的结构即更好地表示样本之间的关系。 高维空间通常是高维的欧式空间而低维空间是低维的欧式空间或者流形manifold。 低维空间不是事先给定的而是从数据中自动发现的其位数通常是事先给定的。 从高维到低维的降维中要保证样本中的信息损失最小。 降维有线性降维和非线性降维。 强化学习基本问题
决策问题
机器学习中的决策任务不同于分类、回归、聚类和降维是将待解决问题建模为马尔科夫决策过程然后利用强化学习求解的问题框架。强化学习的目标就是给定一个马尔科夫决策过程寻找到最优策略。
下图解释了强化学习的基本原理。智能体在完成某项任务时首先通过动作A与周围环境进行交互在动作A和环境的作用下智能体会产生新的状态同时环境会给出一个立即回报。如此循环下去智能体与环境不断地交互从而产生很多数据。强化学习算法利用产生的数据修改自身的动作策略再与环境交互产生新的数据并利用新的数据进一步改善自身的行为经过数次迭代学习后智能体最终学到完成相应任务的最优动作最优策略。
从强化学习的基本原理能看出它与其他机器学习算法如监督学习和非监督学习的一些基本差别。在监督学习和非监督学习中数据是静态的、不需要与环境进行交互比如图像识别只要给出足够的差异样本将数据输入深度神经网络中进行训练即可。
然而强化学习的学习过程是动态的、不断交互的过程所需要的数据也是通过与环境不断交互所产生的。强化学习更像是人的学习过程即与通过与周围环境交互进行学习。 如何选择合适的算法
你使用机器学习算法的目的想要完成什么任务比如是预测明天下雨的概率还是对投票者按照兴趣分组想要选择合适的算法必须考虑以下两个问题
首先考虑机器学习算法的目的。如果想要预测目标变量的值则可以选择监督学习算法否则可以选择无监督学习。确定选择监督学习算法后需要进一步明确目标变量的类型如果目标变量是离散型则可以选择分类算法如果是连续型则需要选择回归算法。
其次应该考虑实际的数据问题应该充分了解数据对实际数据了解的越充分越容易创建符合实际需要的应用程序。
主要应该了解数据的以下特征 特征值是离散型变量还是连续型变量 特征值中是否有缺失的值何种原因造成 数据中是否有异常值 某些特征发生的频率如何
通过上面对数据的充分了解可以帮助我们缩小算法的选择范围一般并不存在最好的算法和可以给出最好效果的算法一般发现最好算法的关键环节是反复试错的迭代过程。