Contextual bandits

技术雷达

发布于 : Apr 13, 2021

不在本期内容中

这一条目不在当前版本的技术雷达中。如果它出现在最近几期中，那么它很有可能仍然具有相关参考价值。如果这一条目出现在更早的雷达中，那么它很有可能已经不再具有相关性，我们的评估将不再适用于当下。很遗憾我们没有足够的带宽来持续评估以往的雷达内容。了解更多

Apr 2021

试验

Contextual bandits 是一类非常适用于解决探索/利用权衡问题的强化学习算法。该算法以赌场中的“老虎机”命名，通过探索不同的选择，学习有关预期结果的更多信息，并通过利用表现良好的选项来平衡该结果。我们已经在一些场景中成功地使用了该技术，在这些场景中只使用了少量的数据来训练和部署一些机器学习模型。事实上，我们可以在此探索/利用的权衡过程中添加上下文，使它适合于各种用例，包括 A/B 测试、推荐和布局优化。

下载 PDF

English | Español | Português | 中文

订阅技术雷达简报

立即订阅

服务

行业

特色

数字出版物和工具

所有洞见

下载 PDF

订阅技术雷达简报

查看存档并阅读往期内容