有学者按照机器学习发生场景的不同,将机器学习划分为三种范式,它们分别是有监督学习、无监督学习与强化学习。有监督学习指的是用来训练模型的数据是带有标签的,训练过程可简单概括为根据“数据带有的标签”与“模型产生的输出”之间的误差来调整模型的参数。无监督学习则适用于无标签的数据集,它往往通过对训练集进行记忆,尝试查找出数据中隐含的规律,比如,根据数据的相似度对它们进行划分。强化学习同样是针对无标签
前面我们介绍的机器学习算法都属于人工喂给机器数据,然后机器从这些数据中学得模型。而我们人类的学习过程并不是这样,人类通过自身的感官感知环境,而后从环境中获得经验、知识,因此单纯地依靠前面所介绍的方法并不能实现通用人工智能。那么有没有办法使得机器也能自动地不断从周围环境中获得经验或‘知识’呢?阿兰。图灵曾提出过这样的设想“除了试图去建立一个模拟成人大脑的程序外,为什么不试图建立一个可以模拟小孩
机器学习最重要的任务,是根据一些已观察到的证据(例如训练样本)来对感兴趣的未知变量(例如类别标记)进行估计和推测。概率模型提供了一种描述框架,将学习任务归结为计算变量的概率分布。概率图模型(probabilistic graphical model,简称PGM)是一类用图来表达变量相关关系的概率模型,它以图为表示工具,最常见的是用一个结点表示一个或一组随机变量,结点之间的边表示变量间的概率相
支持向量机是目前机器学习的众多算法中使用得最为广泛的算法之一,本文主要介绍支持向量机的概念与原理。 目录 什么是支持向量机 硬间隔线性支持向量机 软间隔线性支持向量机 非线性支持向量机 一、什么是支持向量机 支持向量机(Support Vector Machine,简称SVM)是一种用来解决二分类问题的机器学习算法,它通过在样本空间中找到一个划分超平面,将不同类别的样本分开,同时使
机器学习所研究的主要内容,是关于在计算机上从数据中产生“模型”的算法,这个产生的模型大体上可以分为“判别式模型”和“生成式模型”两大类。 其中判别式模型是给定x,通过直接对条件概率分布P(y|x)进行建模来预测y。这种方法寻找不同类别的最优分类面,反映的是异类数据之间的差异。之前几篇文章中介绍的SVM、决策树、线性模型等都是属于判别式模型。 生成式模型则是先对联合概率分布P(x,y)建模,然
在我的第一篇机器学习笔记的文章中曾写到,机器学习所研究的主要内容是“关于在计算机上从数据中产生模型的算法”,因此在进行机器学习的研究与实践中必然要处理许多的数据。这些数据的维度从低维到高维不等,对于低维的数据计算机处理起来很快,但对于高维的数据计算机处理起来不仅费时费力,而且还往往由于高维中存在着大量噪声,使得最终训练出的模型正确率大大降低。因此如何对数据降维也是机器学习中一个十分重要的话题,本文
决策树(decision tree)是机器学习中最常见的方法之一,本文主要对决策树的定义,生成与修剪以及经典的决策树生成算法进行简要介绍。 目录 一、什么是决策树 二、决策树的生成 三、决策树的修剪 四、一些经典的决策树生成算法 一、什么是决策树 顾名思义,决策树是基于树结构来进行决策的。它每次从训练样本的若干属性中选择一项出来进行判定,并根据样本在该属性上的取值将样本划入不同的集合,之
线性模型是机器学习常用的众多模型中最简单的模型,但却蕴含着机器学习中一些重要的基本思想。许多功能更为强大的非线性模型可在线性模型的基础上通过引入层级结构或高维映射得到,因此了解线性模型对学习其他机器学习模型具有重要意义。本文主要介绍机器学习中常用的线性模型,内容主要包括: 一、 线性回归(Linear Regression) 二、 对数几率回归(Logistic Regression) 三、
导读:本系列文章旨在对机器学习当前的概况与常用方法做一个梳理,所有内容均来自于笔者课堂所学、课后阅读与自己的思考总结。因自己接触机器学习时日尚短,所以文章中错误、纰漏之处在所难免,如有读者在阅读过程中发现文中错误,欢迎指正并一起交流探讨。 本章主要内容 一、什么是机器学习 二、机器学习的发展历程 三、机器学习的应用现状 一、什么是机器学习 在大家念小学的时候,一定记得小学语文课本上有着
积分
粉丝
勋章
TA还没有专栏噢
第三方账号登入
看不清?点击更换
第三方账号登入
QQ 微博 微信