Home

课程简介

 课程代码 课程名称授课老师 学分/学时 
 CS26003机器学习之统计理论  徐雷 教授    2/32

教室:上海交通大学闵行校区陈瑞球楼311
时间:630日-725       星期一 7-10
星期四 7-10节 

该课程将系统介绍机器学习理论所面临的基本挑战和几十年来应对挑战而发展出来的若干主要学习理论,不仅限于传授知识,而在于如何理解这些理论方法的基本思想和源起动机,启发听者思考。课程目标为:

讲授机器学习统计理论,  说经验教训漫谈做研究, 聊眼见耳闻杂论写文章。

该课程由上海交大计算机系致远讲习教授徐雷授课,是徐教授以”国家千人” 引进交大后首次开课。该课程的前身是徐教授在北京大学以长江讲座教授开设了五年的夏季学期课程(2007-2011),面向北大以及全国各高校的研究生和青年教师,每年有几十到百多人注册 。

今年在交大恢复该课程,本课程向上海交大研究生、本科生以及校外和国外同学开放选修,  欢迎感兴趣的同学、老师及同行报名选课,也恳请各位推荐给相关的学生。 开放选课时间至527截止, 选课流程见上海交大研究生院“关于2014年夏季学期研究生课程选课的通知”(链接:http://www.gs.sjtu.edu.cn/news/newShow.ahtml?id=16994

上海交大今年出台规定,校外学生若想参加小学期课程(由上海交大研究生院出具修课证明),需进入选课系统,在系统中注册,其中,上海市西南片联合办学合作高校学生选课免收学费(包括19所高校)。不是这19所高校的学生每个学分收费1260元,如不需要交大研究生院出具的修课证明,可免费旁听 。

(注:食宿自理交大闵行校门外有不少经济旅馆


授课教师简介

徐雷教授

上海交大致远讲席教授、2012年国家千人计划引进。

香港中文大学讲座教授、北京大学长江讲座教授、01年当选IEEE Fellow、02年当选国际模式识别学会Fellow 和欧洲科学院院士。1975年起当工人,考入哈工大77级获学士学位,82年到清华师从已故著名信息科学家常迥院士,获得硕士,博士学位。87 年入北京大学在已故著名数学家程民德院士和已故信息科学家石青云院士的指导下做博士后, 88年破格为副教授。89年至93年,在芬兰、加拿大、美国之四所大学(包括哈佛和麻省理工)为博士后、高级研究员。93年返香港任高级讲师、96年任教授、02年任讲座教授。研究领域为模式识别、 统计学习、神经网络等,发表学术期刊论文逾百篇,多个成果被广泛引用。SCI被引用量有数千次(最大单篇九百多,前十篇逾二千五), 而Google Scholar被引用量逾万次(最大单篇二千多,前十篇近六千)。94年起任多个国际学术期刊之编委,获得多个国内外奖项,曾在IEEE、国际和亚太相关领域的学会中担任数种职务。现为欧洲科学院科学委员会委员 (计算与信息科学部)。还于2014年创刊 Springer OA Journal Applied Informatics,任主编。


课程大纲

一、 智能能力、学习、和智能系统  

1)   两种智能能力

2)   规律与模型

3)   两个典型例子: 混合高斯分布和子空间分析

PCA、子空间、 因子分析、和ICA

      4)三个层次反问题: 问题求解参数學習、模型选择

学习的本质特点和基本要素

     1) 学习的本质: 通过有限的样本集建立学习系统与外界的双向映射

     2) 要素一: 学习系统(学生)的结构

若干常见结构和四种组构方式

     3) 要素二: 指导方针(学习理论)

   样本集最佳描述到学习反映样本集背后的规律

     4)要素三: 实现过程(學習算法)

   积分与优化,理论计算复杂性

基本挑战学习理论

1)   大数定理统计一致性Bias-Variance关系

2)   从大样本理论小样本集挑战

样本集大小规律复杂性系统规模之间的关系

样本最佳表示理论和最佳内部编码理论

3)   两个对策方向: 结构规范与结构简

结构规范:Tikhonov (简单平滑)SVM (界限分明)Combining and Boosting(集成复用)

结构简裁:Sparse(稀疏)与Selection(选裁)

4)   四个学习理论

误差估计(CVAICVC) Bayes (classicup-to-date) 、最佳编码(KolmogorovMDL)

最大和谐(BYY harmony learning

学习理论与四种哲学思想

学习之计算实现:积分与优化

1)   积分之近似计算

Taylor展开Lapalace近似

AIC BIC

2)   优化算法: 局部搜索与非局部搜索

局部梯度搜索、backpropagation, deep-learning

EM 算法与混合高斯学习、一个统一算法

SVM与凸规划算法

3)   模型选裁

两阶段法与逐步选择

学习过程中的自动选择:RPCL学习与BYY学习

4)   学习远不仅仅是优化搜索最优、累积优化、习得推断、适应进化

BYY和谐学习

1)   阴阳五行和谐系统与BYY学习系统

2)   问题求解A5与中医五行理论:以RHT检测为例

3)   BYY和谐:默契地一致与匹配之最小系统

4)   从学习梯度流看异同:最大似然、和谐学习和RPCL学习

統計學習理论的一个统一体系: 与现有主要方法之异同

1)   三个信息理论的统一框架

2)   三条通联现有主要方法之

最小交叉熵、最佳信息传递Variational BayesBayes方法(MAPBIC

3)   BYY和谐学习的若干优点

4)   算法: 峰点邻域近似、阴阳交替学习

几个典型学习问题 

 1)   学习线性矩阵系统XAY+E(独立因子、非负矩阵、 preference矩阵、时序关系)

 2)   学习局部子空间与自动确定子空间个数维数

 3)   学习Multi-agents (局部回归、局部判别、局部活动)

 4)   学习树状高斯混合分布与隐马模型学习