写点什么

人工智能基础 2 - DAY10

用户头像
Qien Z.
关注
发布于: 2021 年 05 月 19 日
人工智能基础2 - DAY10

监督学习 & 无监督学习 & 强化学习

  • 监督学习需要标记数据,而无监督学习则不用,主要是通过聚类分析来实现

  • 除了监督学习与无监督学习以外,还有强化学习 reinforcement learning,AlphaGo 就是强化学习的代表作,但是强化学习在应用上暂时没有太多突出表现

  • 目前工业界的应用,大多数采用的是监督学习


监督学习

可以分为回归问题分类问题

回归问题:输出连续性变量,如:温度,身高,股价

分类问题:输出定性结果,如:好和坏,主题


特征与标签

例子:

数据集 Dataset 包含了 4 个样本 samples,每个样本拥有 3 个特征,分布是“语文”、“数学”、“英语”,和一个类别标签“总体”,标签分为了 4 种,所以这是个四分类的问题。

于是,数据集可以表示为


X 叫做特征的向量,Y 是标签,R4 是向量的维度,也就是包含了 4 个特征数量,{0,1,2,3} 代表 4 种标签,分别为“优秀、良好、及格、不及格”。


数据预处理

数据预处理往往是最重要的一步,以后再介绍。

数据可视化

数据可视化可以非常直观地把数据展示在二维或者三维空间当中。通过可视化,可以直观地观察到数据的分布特征,是否有异常值,特征值是否满足某一类分布的情况。但是,如果数据的特征维度很高,可视化化是不大合适的,因此,数据的降维是经常采用的方法,例如把 20 维降到 2 维或者 3 维的空间。最经典的一种降维方法叫做主成分分析 PCA


训练数据 &测试数据

获得的数据分为训练数据测试数据,顾名思义,训练数据用于训练模型,而测试数据用于测试模型的好坏。测试数据是不能用于训练模型当中的,仅用于测试。


发布于: 2021 年 05 月 19 日阅读数: 15
用户头像

Qien Z.

关注

Everything is all 2020.04.10 加入

接受反驳&不接受被定义

评论

发布
暂无评论
人工智能基础2 - DAY10