1、机器学习基础,引言,什么是机器学习? 让机器“学习”的技术 指令工作数据工作例子: 约会机器学习方法: 利用已有的数据(经验), 得出了某种模型(迟到的规律) 并利用此模型预测未来(是否迟到),引言,机器学习的定义:例子:房价:房价面积ab关键概念:训练模型预测训练集和测试集,引言,机器学习的定义:广义: 一种能够赋予机器学习的能力 以此让它完成直接编程 无法完成的功能的方法。实践: 一种通过利用数据, 训练出模型,然后使用 模型预测的一种方法。,引言,机器学习的范围: 模式识别机器学习 数据挖掘机器学习数据库 统计学习和机器学习 计算机视觉图像处理机器学习 语音识别语音处理机器学习 自然语言
2、处理文本处理机器学习,不同类型应用场景: 回归:预测鲍鱼的年龄随着时间波动的股票价格,算法分类,不同类型应用场景:分类:电影题材归类垃圾邮件,算法分类,不同类型应用场景: 聚类对地图上的点进行聚类人脸识别,算法分类,不同类型应用场景: 关联分析啤酒和尿布Twitter源共现词,算法分类,经典算法分类:学习方式:监督学习非监督学习半监督学习,算法分类,经典算法分类:功能分类:,算法选择,如何选择合适的算法:,算法选择,如何使用算法:,工具的使用,机器学习常用的工具:R语言linux版和windows版强大的算法包可移植性比较好Matlabwindows版比较强大,可移植性是个问题版本问题比较严重Python Numpy、statsmodels、scripy-learn、pandas spark分布式框架mllib,建议,看懂一个例子开始;算法的重试;参数的选择;没有最好,只有更好。推荐书目:机器学习(周志华)R语言初学者指南机器学习实战,Thank you!,