机器学习有几种算法
本文目录导航:
机器学习有几种算法?
1. 线性回归
上班原理:该算法可以按其权重可视化。
但疑问是,当你不可真正权衡它时,必定经过观察其高度和宽度来做一些猜想。
经过这种可视化的剖析,可以失掉一个结果。
2. 逻辑回归
依据一组独立变量,预计团圆值。
它经过将数据婚配到logit函数来协助预测事情。
3. 决策树
应用监视学习算法对疑问启动分类。
决策树是一种允许工具,它经常使用树状图来选择决策或或者的结果、时机事情结果、资源老本和适用程序。
依据独立变量,将其划分为两个或多个同构集。
4. 允许向量机(SVM)
基本原理(以二维数据为例):假设训练数据是散布在二维平面上的点,它们依照其分类汇集在不同的区域。
基于分类边界的分类算法的指标是,经过训练,找到这些分类之间的边界(直线的――称为线性划分,曲线的――称为非线性划分)。
关于多维数据(如N维),可以将它们视为N维空间中的点,而分类边界就是N维空间中的面,称为超面(超面比N维空间少一维)。
线性分类器经常使用超平面类型的边界,非线性分类器经常使用超曲面。
5. 豪华贝叶斯
豪华贝叶斯以为每个特色都是独立于另一个特色的。
即使在计算结果的概率时,它也会思考每一个独自的相关。
它不只易于经常使用,而且能有效地经常使用少量的数据集,甚至超越了高度复杂的分类系统。
6. KNN(K -最近邻)
该算法适用于分类和回归疑问。
在数据迷信行业中,它更罕用来处置分类疑问。
这个便捷的算法能够存储一切可用的案例,并经过对其k近邻的少数投票来对任何新事情启动分类。
而后将事情调配给与之婚配最多的类。
一个距离函数口头这个测量环节。
7. k – 均值
这种无监视算法用于处置聚类疑问。
数据集以这样一种形式列在一个特定数量的集群中:一切数据点都是同质的,并且与其余集群中的数据是异构的。
8. 随机森林
应用多棵决策树对样本启动训练并预测的一种分类器被称为随机森林。
为了依据其个性来分类一个新对象,每棵决策树都被排序和分类,而后决策树投票给一个特定的类,那些领有最多选票的被森林所选用。
9. 降维算法
在存储和剖析少量数据时,识别多个形式和变量是具备应战性的。
维数简化算法,如决策树、因子剖析、缺失值比、随机森林等,有助于寻觅相关数据。
10. 梯度提高和演算法
这些算法是在处置少量数据,以作出准确和极速的预测时经常使用的boosting算法。
boosting是一种组合学习算法,它联合了几种基本预计量的预测才干,以提高效能和功率。
综上所述,它将一切弱或平均预测因子组分解一个强预测器。
机器学习算法分为哪几类?
1. 线性回归在统计学和机器学习畛域,线性回归或者是最广为人知也最易了解的算法之一。
2. Logistic 回归Logistic 回归是机器学习从统计学畛域自创上来的另一种技术。
它是二分类疑问的首选方法。
3.线性判断剖析Logistic 回归是一种传统的分类算法,它的经常使用场景仅限于二分类疑问。
假设你有两个以上的类,那么线性判断剖析算法(LDA)是首选的线性分类技术。
4.分类和回归树决策树是一类关键的机器学习预测建模算法。
5. 豪华贝叶斯豪华贝叶斯是一种便捷而弱小的预测建模算法。
6. K 最近邻算法K 最近邻(KNN)算法是十分便捷而有效的。
KNN 的模型示意就是整个训练数据集。
7. 学习向量量化KNN 算法的一个缺陷是,你须要处置整个训练数据集。
8. 允许向量机允许向量机(SVM)或者是目前最盛行、被探讨地最多的机器学习算法之一。
9. 袋装法和随机森林随机森林是最盛行也最弱小的机器学习算法之一,它是一种集成机器学习算法。
想要学习了解更多机器学习的常识,介绍CDA数据剖析师课程。
CDA(Certified target=_blank>点击预定收费试听课。
机器学习人工默认的算法有哪些?
人工默认算法有集成算法、回归算法、贝叶斯算法等。
一、集成算法。
1、便捷算法普通复杂度低、速度快、易展现结果,其中的模型可以独自启动训练,并且它们的预测能以某种形式联合起来去做出一个总体预测。
2、每种算法如同一种专家,集成就是把便捷的算法组织起来,即多个专家独特选择结果。
集成算法比经常使用单个模型预测进去的结果要准确的多,但须要启动少量的保养上班。
二、回归算法。
1、回归剖析是在一系列的已知自变量与因变量之间的相关相关的基础上,建设变量之间的回归方程,把回归方程作为算法模型,经过其来成功对新自变量得出因变量的相关。
2、因此回归剖析是适用的预测模型或分类模型。
三、贝叶斯算法。
1、豪华贝叶斯分类是一种十分便捷的分类算法:关于给出的待分类项,求解在此项产生的条件下各个类别产生的概率,哪个最大,就以为此待分类项属于哪个类别。
2、豪华贝叶斯分类分为三个阶段,依据详细状况确定特色属性,并对每个特色属性启动适当划分,构成训练样本汇合。
计算每个类别在训练样本中的产生频率及每个特色属性划分对每个类别的条件概率预计。
经常使用分类器看待分类项启动分类。
文章评论