近日,雅虎公司公布了2019年度FREP(Faculty Research and Engagement Program,教师研究和参与计划)项目的评审结果,密西根学院助理教授Paul Weng与项目副负责人波兹南工业大学教授Wojciech Kotlowski的课题“大规模多目标序列决策”成功入选获得资助。

Paul Weng课题组的主要研究方向是复杂决策模型研究以及决策支持系统和智能无人系统的算法设计,其融合了人工智能、机器学习以及运筹学等交叉学科的方法。目前,他的课题组着重研究(深度)强化学习,这是一类机器学习技术,可用于解决自适应控制和序列决策问题。这项技术近年来在学习电子游戏和围棋游戏中都取得了不俗的表现,例如Alpha go。此外,强化学习还可以被应用于许多其他领域,例如他的课题组正在研究的机器人技术和推荐系统。

201905225强化学习框架(左)以及强化学习最近成果(右)

在线系统(例如,推荐系统,在线广告)需要不断地通过发现和部署更好的机器学习模型来改进它们的操作。对于这样一个模型选择任务,A/B测试已经成为一个行业标准。然而,这种方法不够灵活,不能同时优化多种性能度量(例如,点击率,每行动成本,千人印象成本)。此次课题组的入选项目旨在开发用于解决这一问题且具有性能保证的在线机器学习方法。

雅虎公司的FREP项目评选始于2012年,旨在支持互联网应用领域的研究人员从事高水平的创新研究工作,本年度共有来自全球顶尖高校和科研机构的100余名研究人员提交相关项目申请,约14%的项目获得资助。Paul Weng是唯一来自中国地区高校的入选者。

教师介绍

Paul WengPaul Weng,2003年获法国皮埃尔和玛丽居里大学(UPMC) 硕士学位、2006年获法国皮埃尔和玛丽居里大学博士学位。博士毕业后,在巴黎索邦大学(原UPMC)担任计算机科学副教授。2015年至2017年受聘于中山大学-卡内基梅隆大学联合工程学院,并于2015年在卡内基梅隆大学(CMU)担任访问学者。在2003年前,他毕业于ENSAI(法国国家统计与信息分析学院),并在伦敦担任金融定量分析师。他的主要研究工作是人工智能和机器学习,侧重于自适应控制(强化学习,马尔可夫决策过程)和多目标优化(妥协规划,公平优化)。