1、认识机器学习,机器学习?,主要内容,机器学习的应用 机器学习定义 机器学习的几个基本概念 有监督学习、无监督学习、回归、分类 机器学习具体算法概述 有监督学习算法 无监督学习算法 总结和讨论,机器学习技术的应用,机器学习最早在人工智能领域被提出。 真正的人工智能离我们还很远 机器学习被认为是通向这个目标的正确道路。机器学习早已不仅限于人工智能领域,机器学习应用 数据挖掘,推动力:网络,自动化 网页点击数据,http:/ 数据挖掘,医疗记录 目前的病例都是数据化的电子病历 将“记录”转化为“知识” 计算生物学、系统生物学 DNA序列的研究 复杂生化反应的研究,机器学习应用 数据挖掘,工业生产领域
2、,如故障诊断,机器学习应用 解决难题,汽车飞机的自动驾驶 斯坦福的Andrew Ng教授的课题组做的自动飞行计算机,机器学习应用 解决难题,手写字体识别自然语言处理技术 计算机视觉,机器学习应用解决难题,个性化服务,机器学习的定义,目前还没有统一的公认的的概念定义什么是机器学习,两个典型的: Arthur Samuel(1959)定义: : Field of study that gives computers the ability to learn without being explicitly programmed.不用精确编程而使计算机拥拥有学习能力的研究领域。Tom Michel(
3、1998) 定义:A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves the experience E,我的理解:可以认为机器学习就是让机器或者程序,从经验中自主地获取知识或者方法,并根据所得的知识或方法,更好的完成任务。,机器学习的几个基本概念,有监督学习(Supervised Learning) 教给计算机怎么做
4、训练集有“正确答案”无监督学习(Unsupervised Learning) 让程序自己学习怎么做 训练集没有“正确答案”,有监督学习 回归问题,房价数据,价格(1000美元),面积(平方英尺),训练模型,预测(使用模型),训练集(历史数据),选择模型类型,回归问题,有监督学习 分类问题,乳腺癌数据,恶性肿瘤?,1(Y),0(N),肿瘤大小,分类问题,我们做的故障警报是分类还是回归呢? 我们做的测点数据预测是分类还是回归呢?,肿瘤大小,年龄,有监督学习 无监督学习,无监督学习,肿瘤大小,年龄,肿瘤大小,年龄,有监督学习,聚类,机器学习具体算法,有监督学习 线性回归 逻辑回归 神经网络 支持向量
5、机 无监督学习 聚类,线性回归,价格(1000美元),面积(平方英尺),训练数据,机器学习算法,模型 H(x),输入变量x,输出结果y,模型函数损失函数(Cost Function)优化目标梯度下降方程,线性回归,1,0,J(0,1),在Matlab上看一下线性规划的实例,线性回归 梯度下降示意图,逻辑回归,恶性肿瘤?,1(Y),0(N),肿瘤大小,线性回归模型函数:,Sigmoid函数,模型函数,梯度下降公式,Matlab实例,逻辑回归,损失函数(Cost Function),简单线性回归与逻辑回归,人工神经网络,人工神经网络应用实例,人工神经网络,支持向量机,支持向量机应用实例,最优分界面,无监督学习 聚类,无监督学习 聚类,无监督学习 聚类,无监督学习 聚类,无监督学习 聚类,无监督学习 聚类,无监督学习 聚类,无监督学习 聚类,Matlab实例,机器学习应用领域 机器学习定义 机器学习基本概念 有监督学习 回归 分类 无监督学习 帮助分析数据 机器学习具体算法概述 有监督:线性回归, 逻辑回归,神经网络,支持向量机 无监督学习算法:聚类,总结,谢谢大家!,35,