跳转到内容

草稿:软标签

维基百科,自由的百科全书

软标签(Soft Target)是知识蒸馏(Knowledge Distillation)中的核心概念,指由教师模型Teacher Model)输出之 softmax 几率分布,相较于传统 one-hot 编码的硬标签Hard Target),软标签能提供更多类别之间的相对关系与语意结构资讯,常被称为“暗知识”(Dark Knowledge)。

定义

[编辑]

在分类任务中,模型输出的 logits 经过 softmax 函数转换为几率分布:

其中 温度参数(Temperature),控制分布的平滑程度。当 时,输出分布更平滑,强调次要类别的重要性,使学生模型能学习教师模型对各类别的置信结构。

特性

[编辑]
  • 可反映样本与非正解类别的关联程度
  • 保留教师模型对任务的整体理解与模糊边界
  • 在模型训练中提供更多梯度讯号,有助于学生模型收敛与泛化

与硬标签比较

[编辑]
标签类型 表示方式 资讯量
软标签 几率分布(如 [0.6, 0.3, 0.1]) 高,含多类别关系
硬标签 One-hot(如 [1, 0, 0]) 低,仅标示正解类别

应用场景

[编辑]

参见

[编辑]

Category:机器学习 Category:人工智能