海创科学沙龙第十五场 强化应用学习 参后感 by 卞志鹏博士

今日有幸参加了海创院与高促会组织的“海创科学沙龙”活动,聆听了来自阿尔伯塔大学的李玉喜博士的专题讲座。就我个人感受而言,与其说是一个讲座,其实更像是一个研讨会,大家坐在一起,探讨技术、交流工作中的心得体会。

李博士详细地向我们讲述了强化学习在各个领域中的应用,首先,就是强化学习在游戏领域中的应用,目前来说,在这一块领域中,强化学习的应用相对成熟,覆盖的游戏种类有:星际争霸、dota、CS等,李博士提到,由于在游戏领域中,容忍度相对较高,因此强化学习的操作空间大,可以充分地进行探索尝试,算法的优势得到了体现。

然后,李博士向我们介绍了强化学习在推荐系统中的应用,在这一领域中,强化学习的落地应用也是比较多的,例如阿里、京东等公司都会使用强化学习来提升用户体验,增加用户黏度。在推荐系统中使用强化学习的好处之一就是,由于强化学习能够进行探索,因此会给用户带来一些新的推荐产品,带给用户更好的体验。

接下来,李博士给我们讲述了一些他推荐的论文,这其中包含了来自谷歌、Facebook、阿里等团队的研究成果。随后,大家就当前的热点话题进行了充分的沟通与讨论。今天的活动进一步拓宽了我的思维与眼界。

其实,就我个人的经验而言,强化学习也可以应用于交通等领域,例如使用强化学习算法来控制交通灯,但是通过实践,我觉得强化学习不仅需要我们能够设计出合理的状态和回报函数,还需要依托足够多的训练样本,这样训练得到的策略才能在实际中使用,才能应对实际中的各种问题。

最后附上今天的活动照片,留作纪念。

再次感谢主讲人李玉喜博士、主办方海创院与高促会。

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.