海创科学沙龙第十五场强化应用学习参后感 by 卞志鹏博士

今日有幸参加了海创院与高促会组织的“海创科学沙龙”活动，聆听了来自阿尔伯塔大学的李玉喜博士的专题讲座。就我个人感受而言，与其说是一个讲座，其实更像是一个研讨会，大家坐在一起，探讨技术、交流工作中的心得体会。

李博士详细地向我们讲述了强化学习在各个领域中的应用，首先，就是强化学习在游戏领域中的应用，目前来说，在这一块领域中，强化学习的应用相对成熟，覆盖的游戏种类有：星际争霸、dota、CS等，李博士提到，由于在游戏领域中，容忍度相对较高，因此强化学习的操作空间大，可以充分地进行探索尝试，算法的优势得到了体现。

然后，李博士向我们介绍了强化学习在推荐系统中的应用，在这一领域中，强化学习的落地应用也是比较多的，例如阿里、京东等公司都会使用强化学习来提升用户体验，增加用户黏度。在推荐系统中使用强化学习的好处之一就是，由于强化学习能够进行探索，因此会给用户带来一些新的推荐产品，带给用户更好的体验。

接下来，李博士给我们讲述了一些他推荐的论文，这其中包含了来自谷歌、Facebook、阿里等团队的研究成果。随后，大家就当前的热点话题进行了充分的沟通与讨论。今天的活动进一步拓宽了我的思维与眼界。

其实，就我个人的经验而言，强化学习也可以应用于交通等领域，例如使用强化学习算法来控制交通灯，但是通过实践，我觉得强化学习不仅需要我们能够设计出合理的状态和回报函数，还需要依托足够多的训练样本，这样训练得到的策略才能在实际中使用，才能应对实际中的各种问题。

最后附上今天的活动照片，留作纪念。

再次感谢主讲人李玉喜博士、主办方海创院与高促会。

Leave a Reply Cancel reply