Enable javascript in your browser for better experience. Need to know to enable it? Go here.

模型测试的合成数据

发布于 : Oct 26, 2022
不在本期内容中
这一条目不在当前版本的技术雷达中。如果它出现在最近几期中,那么它很有可能仍然具有相关参考价值。如果这一条目出现在更早的雷达中,那么它很有可能已经不再具有相关性,我们的评估将不再适用于当下。很遗憾我们没有足够的带宽来持续评估以往的雷达内容。 了解更多
Oct 2022
评估 ?

在我们本期技术雷达的讨论中,出现了几个用于生成合成数据的工具和应用。我们发现,随着工具的成熟, 模型测试的合成数据 成了一项强大而且有广泛应用的技巧。在验证机器学习模型判别能力的过程里,合成数据虽然尚不能取代真实数据,但也有相当广泛的使用场景。例如,合成数据可以用于预防小概率事件下模型彻底失效,或者在不暴露个人隐私信息的前提下对数据流水线进行测试。在探索缺乏真实数据的边缘场景以及确认模型偏差时,合成数据也很有用处。有一些有助于生成数据的工具,例如 FakerSynth 可以生成服从预期统计特性的数据,Synthetic Data Vault 等工具可以依照输入数据集特性来生成数据。

下载 PDF

 

English | Español | Português | 中文

订阅技术雷达简报

 

立即订阅

查看存档并阅读往期内容