【课程时长】
6天(6小时/天)
【课程简介】
人工智能的浪潮正在席卷全球,各种培训课程应运而生,但真正能让学员系统、全面掌握知识点,并且能学以致用的实战课程并不多见。本课程包含机器学习、深度学习的重要概念及常用算法(决策树、关联规则、聚类、贝叶斯网络、神经网络、支持向量机、隐马尔科夫模型、遗传算法、CNN、RNN、GAN等),以及人工智能领域当前的热点。通过6天的系统学习、案例讲解和动手实践,让学员能初步迈入机器学习和深度学习的知识殿堂。
【课程收益】
ü
掌握数据挖掘与机器学习基本知识;
ü
掌握数据挖掘与机器学习进阶知识;
ü
掌握深度学习的理论与实践;
ü
掌握Python开发技能;
ü
掌握深度学习工具:TensorFlow、Keras等;
ü
为学员的后续项目应用提供针对性的建议。
【课程特点】
本课程力图理论结合实践,强调从零开始,重视动手实践;课程内容以原理讲解为根本,以应用落地为目标。课程通过大量形象的比喻和手算示例来解释复杂的机器学习理论,既能将原理充分讲懂讲透,也避免了繁复而枯燥的公式推导。
【课程对象】
计算机相关专业本科;或理工科本科,且至少熟悉一门编程语言。
【主讲专家】
叶梓,博士、高级工程师。2005年上海交通大学计算机专业博士毕业,主研方向为数据挖掘、机器学习、人工智能等。现为某大型上市软件企业的人工智能团队技术负责人。曾主持设计并搭建上海市卫计委卫生大数据平台、无锡市卫生大数据平台,在大数据、人工智能应用等方面有着丰富的工程实践经验。先后在SCI或EI期刊上发表论文4篇,在中文核心期刊上发表论文近20篇,并被百度学术收录。2011年获中国医院协会科技创新一等奖。
【学员基础】
具备初步的IT基础知识
【课程大纲】(培训内容可根据客户需求调整)
时间
内容
案例实践与练习
Day1初识机器学习
上午
概述入门
数据预处理
概述(第一天——1)
1、
概念与术语(人工智能、数据挖掘、机器学习)
2、
数据挖掘的对象
3、
数据挖掘的关键技术
4、
知识的表达
5、
Python的安装
数据预处理(第一天——2)
1、
数据清理
2、
规范化
3、
模糊集
4、
粗糙集
5、
无标签时:PCA
6、
有标签时:Fisher线性判别
数据压缩(DFT、小波变换)
案例实践:
1、 python安装
2、 Tensorflow安装
3、 PCA的实验
4、 DFT的实验
Day1初识机器学习
下午
回归与时序分析
决策树
回归与时序分析 (第一天——3)
1、
线性回归
2、
非线性回归
3、
logistics回归
4、
平稳性、截尾与拖尾
5、
ARIMA
决策树(第一天——4)
1、
分类和预测
2、
熵减过程与贪心法
3、
ID3
4、
C4.5
5、
其他改进方法
决策树剪枝
案例实践:
1、 回归的实验
2、 ARIMA预测实验
3、 决策树的实验
Day2机器学习中的典型算法
上午
聚类
关联规则
朴素贝叶斯与KNN
聚类(第二天——1)
1、
监督学习与无监督学习
2、
K-means与k-medoids
3、
层次的方法
4、
基于密度的方法
5、
基于网格的方法
6、
孤立点分析
关联规则(第二天——2)
1、
频繁项集
2、
支持度与置信度
3、
提升度
4、
Apriori性质
5、
连接与剪枝
朴素贝叶斯与KNN(第二天——3)
1、
KNN
2、
概率论基础:条件概率、联合概率、分布、共轭先验。
3、
“概率派”与“贝叶斯派”
4、
朴素贝叶斯模型
案例实践:
1、 鸢尾花数据的聚类
2、 超市购物篮——关联规则分析
3、 朴素贝叶斯案例:皮马印第安人患糖尿病的风险
Day2机器学习中的典型算法
下午
极大似然估计与EM算法
性能评价指标
极大似然估计与EM算法(第二天——4)
1、
极大似然估计
2、
对数似然函数
3、
EM算法
性能评价指标(第二天——5)
1、
准确率;精确率、召回率;F1
2、
真阳性率、假阳性率
3、
混淆矩阵
4、
ROC与AUC
5、
对数损失
6、
Kappa系数
7、
回归:平均绝对误差、平均平方误差
8、 聚类:兰德指数、互信息
9、 k折验证
案例实践:
1、 正态分析的参数估计
2、 EM算法应用案例:双正态分布的参数估计
3、 绘制ROC并计算AUC、F1
4、 绘制拟合曲线,计算拟合优度
Day3神经网络专题
上午
BP神经网络
模拟退火算法与其他神经网络
BP神经网络
(第三天——1)
1、
人工神经元及感知机模型
2、
前向神经网络
3、
sigmoid
4、
径向基函数神经网络
5、
误差反向传播
模拟退火算法与其他神经网络 (第三天——2)
1、
模拟退火算法
2、
Hopfield网络
3、
自组织特征映射神经网络(SOM)
4、 受限布尔兹曼机
案例实践:
1、 可以手算的神经网络
2、 神经网络模拟一个圆锥曲面
3、 “货郎担”问题(模拟退火算法)
4、 识别破损的字母(Hopfield网络)
5、 聚类的另一种解法(SOM)
Day3神经网络专题
下午
机器学习中的最优化方法
遗传算法
机器学习中的最优化方法(第三天——3)
1、
参数学习方法
2、
损失函数(或目标函数)
3、
梯度下降
4、
随机梯度下降
5、
牛顿法
6、
拟牛顿法
遗传算法 (第三天——4)
1、
种群、适应性度量
2、
交叉、选择、变异
3、 基本算法
案例实践:
1、 随机梯度下降的例子
2、 牛顿法求Rosenbrock(香蕉函数)的极值
3、 “同宿舍”问题:遗传算法
Day4机器学习进阶
上午
支持向量机
隐马尔科夫模型
支持向量机 (第四天——1)
1、
统计学习问题
2、
支持向量机
3、
核函数
4、
多分类的支持向量机
5、
用于连续值预测的支持向量机
隐马尔科夫模型(第四天——2)
1、
马尔科夫过程
2、
隐马尔科夫模型
3、
三个基本问题(评估、解码、学习)
4、
前向-后向算法
5、
Viterbi算法
6、
Baum-Welch算法
案例实践:
1、 SVM:iris的三个分类
2、 HMM示例:天气与地表积水、罐中的彩球
3、 HMM之前向算法:掷骰子的序列
4、 HMM之viterbi算法:是否生病了?
Day4机器学习进阶
下午
文本挖掘
从LSA到LDA
文本挖掘(第四天——3)
1、文本分析功能
2、文本特征的提取
4、TF-IDF
5、文本分类
5、文本聚类
从LSA到LDA(第四天——3)
1、
LSA
2、
pLSA
3、
LDA
案例实践:
1、 英文文本分析;
2、 中文文本分析:《绝代双骄》
3、 中文语句情感分析
4、 LSA和LDA的比较
Day5机器学习进阶与深度学习初步
上午
利用无标签的样本
集成学习
利用无标签的样本(第五天——1)
1、
半监督学习
2、
直推式学习
3、
主动学习
集成学习(第五天——2)
1、
bagging
2、
co-training
3、
adaboost
4、
随机森林
5、 GBDT
案例实践:
1、 半监督学习:SVM标签扩展;
2、 主动学习:手写数字
3、bagging、adaboost、RF、GBDT的例子
Day5机器学习进阶与深度学习初步
下午
强化学习
深度学习-1
强化学习(第五天——3)
1、
agent的属性
2、
exploration
and exploitation
3、
Bellman期望方程
4、
最优策略
5、
策略迭代与价值迭代
6、
Q学习算法
深度学习-1(第五天——4)
1、
连接主义的兴衰
2、
深度学习与神经网络的区别与联系
3、
目标函数
4、
激励函数
学习步长
案例实践:
1、 强化学习示例:走迷宫
2、 强化学习:谷底的小车
3、 深度学习示例:模式识别
Day6深度学习
上午
深度学习-2
深度学习-3
深度学习-2(第六天——1)
1、
优化算法
2、
Adagrad
3、
RMSprop
4、
Adam
5、
避免过适应
深度学习-3(第六天——2)
1、
典型应用场景
2、
CNN
3、
各种CNN
4、
RNN
LSTM、GRU
案例实践:
1、 CNN的准备示例
2、 CNN处理MNIST手写数字数据集
3、 RNN准备示例
4、 RNN分析股票趋势
5、 LSTM的准备示例
Day6深度学习
下午
深度学习-4
1、
GAN
2、
DQN
案例实践:
1、 DQN结合CNN:“flappy bird”