机器学习之监督学习与非监督学习

本文介绍了 监督学习和非监督学习概念

监督学习

监督学习:给出一个算法,需要部分数据集已经有正确答案。比如给出给定房价数据集,对于里面每个数据,算法都能计算出对应的正确房价。算法的结果就是短处更多的正确价格。

像房价预测问题这样的监督学习又叫回归学习。

非监督学习

Unsupervised Learning 无监督学习

在无监督学习中,我们用到的数据和监督学习中的不一样。在无监督学习中,没有属性或者说标签的概念,只有一个数据集。

对于给定的数据集,无监督学习算法通过数据中存在的内在结构可能判定,该数据集包含几个不同的聚类,然后把数据分到这几个聚类中。这就是聚类算法(clustering algorithm)。聚类算法的实际用例有谷歌新闻每天搜索成千上万条新闻,然后把同一个事件的新闻报道聚集在一起。

历史上,由于聚类问题和无监督学习关联更紧密,所以时常将两者概念混在一起。但事实上,无监督学习还有另一种算法——关联规则挖掘。实例如鸡尾酒宴问题。关联规则挖掘也是无监督学习。

上一篇 下一篇


推荐文章

评论
说点什么吧?

发表评论

取消回复
  最新文章