跳至內容

草稿:軟標籤

維基百科,自由的百科全書

軟標籤(Soft Target)是知識蒸餾(Knowledge Distillation)中的核心概念,指由教師模型Teacher Model)輸出之 softmax 概率分布,相較於傳統 one-hot 編碼的硬標籤Hard Target),軟標籤能提供更多類別之間的相對關係與語意結構資訊,常被稱為「暗知識」(Dark Knowledge)。

定義

[編輯]

在分類任務中,模型輸出的 logits 經過 softmax 函數轉換為概率分布:

其中 溫度參數(Temperature),控制分布的平滑程度。當 時,輸出分布更平滑,強調次要類別的重要性,使學生模型能學習教師模型對各類別的置信結構。

特性

[編輯]
  • 可反映樣本與非正解類別的關聯程度
  • 保留教師模型對任務的整體理解與模糊邊界
  • 在模型訓練中提供更多梯度訊號,有助於學生模型收斂與泛化

與硬標籤比較

[編輯]
標籤類型 表示方式 資訊量
軟標籤 概率分布(如 [0.6, 0.3, 0.1]) 高,含多類別關係
硬標籤 One-hot(如 [1, 0, 0]) 低,僅標示正解類別

應用場景

[編輯]

參見

[編輯]

Category:機器學習 Category:人工智能