2025-5-11
有一些相对较小的目标检测数据集:
- Pascal VOC:这是一个经典的目标检测数据集,包含 20 个不同的目标类别,如人、汽车、狗等。它有两个主要的版本,VOC 2007 和 VOC 2012。VOC 2007 包含约 9,963 张图像,而 VOC 2012 有大约 11,540 张图像。由于其规模相对较小,常用于快速验证新的目标检测算法。
- Caltech Pedestrian:该数据集主要关注行人检测任务,包含大约 10 小时的视频片段,从中提取出约 250,000 个行人标注框。虽然标注框数量较多,但图像数量相对较少,适合专注于行人检测的研究。
- KITTI:主要用于自动驾驶场景下的目标检测和跟踪,包含 7481 张训练图像和 7518 张测试图像,有车辆、行人、骑自行车的人等目标类别。数据集规模适中,且与实际应用场景紧密相关。