2017年复旦大学大数据学院暑期课程主讲及课程介绍

作者:sds-admin 发布时间:2017-05-29

复旦大学大数据学院拟定于2017年7月2日至21日举办暑期课程。本次暑期课程旨在为热爱大数据专业的高年级本科生、研究生和青年教师等搭建一个学习和交流的平台,通过邀请国内外顶尖的数据科学家、行业领军人物开设讲座课程,组织参观大数据行业的发展,让学生对数据科学、大数据技术和行业大数据的应用有更深刻的了解。 

 

一、第一周:大数据理论和算法基础


  • 主题:高维数据建模及其应用
  • 主讲:
    • 李润泽,美国宾州州立大学统计系教授,美国数理统计协会会员,美国统计协会员。
    • 张楠 ,复旦大学大数据学院青年副研究员,美国德州A&M大学统计学博士,研究非参数函数估计、函数型数据分析、稳健统计方法、基于抽样方法的大数据分析等。
  • 课程介绍:本次暑期课程涵盖高维数据的变量选择、特征筛选和假设检验等核心问题。第一部分将针对高维线性模型中的变量选择,介绍带惩罚最小二乘方法,内容包括惩罚函数的选择、PLS方法的理论性质及数值算法。第二部分主要介绍超高维数据中的特征筛选方法,包括边际/独立、联合特征筛选。第三部分将讨论高维均值向量、高维协方差结构和高维线性模型中回归系数的假设检验问题。此外,本课程在方法讲授的过程中,将涉及一些相关的实际应用问题。

  • 主题:基于统计语言模型的文本检索与分析
  • 主讲:
    • 翟成祥,美国伊利诺伊大学香槟分校(UIUC)计算机系教授,并同时在该校的生物信息研究所,图书馆信息科学系,及统计系任兼职教授。获得2004年度美国青年科学家和工程师最高荣誉总统奖(PECASE),SLOAN研究奖等。
    • 魏忠钰,复旦大学大数据学院青年副研究员,香港中文大学计算机科学博士,研究自然语言处理,社交媒体分析和论辩挖掘等。2014年12月获得香港中文大学博士学位,之后在美国德州大学达拉斯分校从事博士后研究工作。主要研究领域为自然语言处理,社交媒体分析和论辩挖掘等。
  • 课程介绍:本课程将从多个层面针对文本信息检索与分析进行介绍,重点讲解一些经典的基础模型以及应用,包括面向信息检索的统计语言模型,话题发现与分析,文本聚类,文本分类和文本摘要。同时,课程的最后还会覆盖一些前沿的文本分析技术内容,即基于神经网络的分布式语言表示和语言模型。本课程适用于对本领域研究感兴趣的研究人员(包括研究生和高阶的本科生)以及希望使用统计语言模型建立相关系统解决实际应用问题的企业技术人员。

 

二、第二周:经济和金融大数据


  • 主题:贝叶斯统计在商业分析中的应用
  • 主讲:
    • 董晓静 ,Santa Clara University 市场营销系终身教授,本科毕业于清华大学,硕士毕业于麻省理工学院(MIT),博士毕业于美国西北大学(Northwestern University)。研究方向是大数据分析及其在市场营销和商业决策中的应用。现已经发表10余篇论文,其中近3年在Marketing Science国际A期刊发表了3篇文章,并有专著章节和1本专著。最近,她设计并创立了新的硕士学位——Master of Science in Business Analytics,并任学位总监。

  • 主题:量化交易策略构建与案例分析
  • 主讲:
    • 李克辛,美国Numerical Algorithm资本主席。曾在纽约,伦敦,东京和新加坡多个投资银行担任定量交贸员/定量分析师, 在量化交易的理论和实践方面有很多的经验。他于芝加哥大学获得纯数学学士和金融数学硕士学位,于密歇根大学安阿伯分校获得计算机科学与工程的博士学位。在新加坡国立大学等多家高校兼任客座教授。

  • 主题:大数据金融:理论与实践
  • 主讲:
    • 刘富兵,毕业于上海交通大学金融工程博士,国泰君安金融工程首席分析师。

  • 主题:量化金融的行业机遇与市场变革。
  • 主讲:
    • 孙健,芝加哥大学博士,现为复旦大学经济学院教授。此前担任过摩根士丹利固定收益部执行总经理,和在法国巴黎国民银行(BNP Paribas)对冲基金结构产品部任总经理。

 

三、第三周:用于大数据处理和分析的计算平台


  • 主题:基于Apache Spark的大数据工程和数据科学
  • 主讲:
    • Jason Dai,美国英特尔公司,大数据技术方向首席技术执行官,Apache Spark项目Committer及PMC成员
  • 课程介绍:  本课程将概述如何使用Spark,一个分布式数据处理框架上,建立大科学工程和数据科学。课程奖展示大数据技术的基本背景信息,Apache Spark的内部细节,分布式数据分析算法,以及实践练习使用PySpark。通过本课程,学生可以在使用大数据和开发代码的过程中获得感受和经验。

  • 主题:大数据统计计算
  • 主讲:
    • Chuanhai Liu,美国普渡大学教授,国际计算和统计推断学专家、美国统计学会(ASA)研究院和国际统计协会(ISI)会员