无处不在的机器学习
机器学习的应用已遍及人工智能的各个分支,如专家系统、自动推理、自然语言理解、模式识别、计算机视觉、智能机器人等领域。
同时往往谈及机器学习(ML)时,人工智能(AI),深度学习(DL)也总是被提起,到底他们哥仨是什么关系?
我们举个例子吧:
人工智能(AI):模拟人脑,辨认哪个是羊,哪个是猪,哪个是牛。
机器学习ML:根据牲畜特征,随着见过的羊,猪和牛越来越多,辨别羊的能力越来越强,不会再把羊当牛了。
深度学习DL:农场里有20只羊,50只牛和30只猪,通过数据分析比对,把农场里的品种和数据建立联系,通过牲畜的外貌、重量、出生时间和产地等信息,分辨肉质的质量,从而选择购买用户需要的产品。
什么是机器学习?
机器学习是人工智能的一个分支学科,主要研究的是让机器从过去的经历中学习经验,对数据的不确定性进行建模,对未来进行预测。
举一个最简的二分类例子,假设现在想用机器自动把网页分成2大类:体育和非体育类网页。
首先需要收集训练样本。
在这里,指得就是各种体育类和非体育类的网页。
接下来,需要对样本进行分析,通过一些抽象化的描述,定义特征。譬如,分析网页里应用的词语以及每个词语出现的次数。
第三步为数据建模。通常,需要设计数学模型,来分析特征与标签的分布情况。
具体来说,是通过优化方法,学习一个映射函数,其输入是一个样本的特征向量,其输出是标签(体育类或非体育类)。
在预测阶段,当用户输入一个新的网页样本时,我们同样做特征抽取,通过使用学习完毕获得的映射函数,自动去预测这个样本的标签类别。
上述例子仅是一个较常见的有监督二分类问题。在机器学习领域,通常人们习惯把算法分为 3 类:有监督学习、半监督学习和无监督学习。所谓有没有“监督”,指的是机器在学习阶段,能否看到样本的标签(如上述例子中的体育及非体育类别)。
半监督学习通常也被称为弱监督学习,目的是通过少量的例子,在无标签的样本中自动学习参数。至于无监督学习,通常人们接触比较多的是聚类问题:通过分析数据样本的相似性,来把相似的数据组合成集群。
机器学习的算法
分类算法-是什么?
即根据一个样本预测出它所属的类别。
回归算法-是多少?
即根据一个样本预测出一个数量值。
聚类算法-怎么分?
保证同一个类的样本相似,不同类的样本之间尽量不同。
强化学习-怎么做?
即根据当前的状态决定执行什么动作,最后得到最大的回报。
机器学习在从sub-human,到par-human,甚至在可以预见的将来向super-human一步步发展。
下面让我们来回顾一下那些曾经火热,或现在仍旧在发光发热的机器学习算法。
也一起小小的展望一下机器学习在可以预见的未来都有那些重要的发展方向。
机器学习的昨天 80年代
Linear Regression
Logistic Regression
Decision Tree
Artificial Neural Network
机器学习的昨天 90年代
Random Forest
Support-vector Machine
机器学习的昨天 00年代
Kernal Tricks
机器学习的今天
Deep Learning
机器学习的明天
Deep Learning + Reinforcement Learning
Deep Learning + Generative Model
Deep Learning + Hardware
技术了解-DecisionTree
决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理不同输出。数据挖掘中决策树是一种经常要用到的技术,可以用于分析数据,同样也可以用来作预测。
技术了解-SVM
机器学习领域中一个最重要的突破。
支持向量(support vector machines),由瓦普尼克和科尔特斯在大量理论和实证的条件下年提出。
支持向量机能够利用所有的先验知识做凸优化选择,产生准确的理论和核模型。因此,它可以对不同的学科产生大的推动,产生非常高效的理论和实践改善。
开课时间:11月23日
点击这段文字即可报名参与试听课!
阮巨城教授Dr.Giant
· Lead Instructor @ FLAGDream
· Google AI高级工程师 @Google AI
· 10年多专注于人工智能、深度学习技术及相关产品的研发
· 在机器学习相关研究领域已发表数十篇论文,包含理论创新及优化、系统分析、计算机视觉等
扫码关注微信公众号“FLAGDream”
后台回复“视频 ” 即可获得完整视频
同时可免费获取职业咨询服务

