来源:Deephub Imba 本文约1500字,建议阅读5分钟
这是一篇被顶会 NeurIPS 2021收录的关于主动学习的论文。
左:Realistic 数据集中的稀有类 右:Uber自动驾驶汽车在亚利桑那州坦佩市发生车祸
其次,现实世界的数据有很多冗余。这种冗余在通过从视频中采样帧创建的数据集中更为突出(高速公路上行驶的汽车的镜头或监控摄像头的镜头)。
是否可以有适用于广泛现实场景的单一并且统一的主动学习框架来训练机器学习模型?
Rare Classes Tutorial on CIFAR-10
https://github.com/decile-team/distil/blob/main/tutorials/image_classification/realistic_scenarios/DISTIL_Example_Rare_Classes_CIFAR10.ipynb
Rare Classes Tutorial on Medical Data
https://github.com/decile-team/distil/blob/main/tutorials/image_classification/realistic_scenarios/DISTIL_Example_Rare_Classes_PneumoniaMNIST.ipynb
Redundancy Tutorial
https://github.com/decile-team/distil/blob/main/tutorials/image_classification/realistic_scenarios/DISTIL_Example_Redundancy_CIFAR10.ipynb
Out-of-distribution data Tutorial
https://github.com/decile-team/distil/blob/main/tutorials/image_classification/realistic_scenarios/DISTIL_Example_OOD_CIFAR10.ipynb
编辑:于腾凯