2025-6-24-zero/fewshot
Zero-shot/Few-shot
对,few-shot(少样本学习)和zero-shot(零样本学习)确实是两个不同的概念,虽然它们都属于样本稀缺下的泛化能力研究,但本质区别挺明显的。
方面 | Few-Shot 学习 | Zero-Shot 学习 |
---|---|---|
样本数 | 有极少量的标注样本(通常是1~几十张) | 没有任何训练时的该类别样本 |
训练方式 | 训练时会见到少量的目标类别样本,借助元学习等技巧快速适应 | 训练时从未见过目标类别,直接依靠其他信息(如文本描述)识别 |
依赖信息 | 依赖极少的真实样本数据 | 依赖类别的语义描述或其他辅助信息(如文本embedding) |
核心难点 | 如何快速从极少样本中学习到有效表示 | 如何利用语义信息和视觉特征桥接,实现类别推断 |
应用场景 | 类别少且样本采集困难的情况,如医疗影像等 | 类别新出现、动态添加类别,或者完全无样本的情况 |
方法举例 | MAML、ProtoNet、RelationNet 等元学习方法 | CLIP、Grounding DINO、基于文本提示的检测模型 |
更简单地理解:
- Few-shot = 有一点点样本(很少,但有),模型“看”过该类别样本,学会快速适应。
- Zero-shot = 完全没见过该类别样本,只靠类别描述或语义知识推断。
两者的联系:
- 都是解决“样本稀缺”问题,目标都是让模型能识别新类别。
- 在实际应用中,zero-shot有时可以看作few-shot的极端(样本数为0)。
- 都可能借助“辅助信息”,如文本embedding、类别属性、知识图谱等。