机器学习
定义:计算机能够在不经过明确编程的情况下进行学习的研究领域。你给算法的学习机会越多,它的表现会越好。机器学习的算法主要有两种主要类型:监督学习和无监督学习;
监督学习
许多现实世界应用中使用最多的机器学习,其进步和创新速度最快,也是最常用的学习算法,是指学习x->y或输入到输出映射的方法。关键特征是你给学习算法示例供你学习,这包括正确的答案,是给定输入x的正确标签y,通过看到正确的输入x对和所输出的标签y,学习算法最终学会了在没有输出标签的情况下单独获得输入,并对输出做出相当准确的预测或猜测。
在所有的这些应用程序中,你将首先使用输入x和正确答案即标签y训练模型,在模型从这些输入、输出或x和y对中学习之后,它们就可以获取一个全新的输入x,这是它以前从未见过的然后尝试相应的输出y。
input(x) | output(Y) | Application |
Spam?(0/1) | Spam fitleing | |
audio | text transcripts | speech recognition |
ad,user info | click(0/1)? | Online adverting |
English | Spanish | Machine translation |
image,radar info | Position of other cars | self-driving car |
Image of phone | defect?(0/1) | Visual inspection |
无监督学习
不依赖带有标签的数据,而处理未标识的数据,自行发现数据中的结构和模式。Data only comes with inputs x,but not output lables y,Algorithm has to find structure in the data.
监督与无监督优缺点分析
如何评估无监督学习模型的效果和准确性
通过上面对「机器学习(Machine Learning)」的基本原理有个大致的了解