要怎麼包一個自己的 loss ? - pytorch 新手教學

假設我現在有一個 loss_fun 要增加規則
例如是 nn.CrossEntropyLoss() 輸入後 *3
要怎麼包一個自己的 loss ?

你可以用一個自訂的 Python class 來包裝原本的 loss function，方法非常簡單：

✅ 自訂 loss class 範例：把 CrossEntropyLoss * 3

import torch
import torch.nn as nn

class ScaledLoss(nn.Module):
    def __init__(self, base_loss_fn, scale=3.0):
        super().__init__()
        self.base_loss_fn = base_loss_fn
        self.scale = scale

    def forward(self, input, target):
        base_loss = self.base_loss_fn(input, target)
        return self.scale * base_loss

✅ 使用方式：

base_loss = nn.CrossEntropyLoss()
loss_fn = ScaledLoss(base_loss, scale=3.0)

logits = torch.randn(8, 10)  # 假設是分類 logits
targets = torch.randint(0, 10, (8,))

loss = loss_fn(logits, targets)
print(loss)

重點

元素說明
__init__ 傳入原始 loss function，儲存 scale 值
forward() 計算原始 loss，然後乘以倍數
如果你還想要同時加上其他額外條件（例如 L1 正則、或是 mixup loss），也可以在 forward() 裡自由加入。

需要我幫你包一個包含主 loss + lb_loss 的總損失 class 嗎？這在你 MoE 訓練會很實用。

用 def 可以嗎? 還是說一定要用 nn.Module ?

你可以直接用 def，不一定要用 nn.Module，如果你只是包裝損失邏輯而不需要保存參數或組成模型，那 def 是完全 OK 的、而且更簡潔。

✅ 用 def 包裝 CrossEntropyLoss * 3 的例子：

import torch
import torch.nn as nn

base_loss = nn.CrossEntropyLoss()

def scaled_loss(input, target):
    return 3.0 * base_loss(input, target)

# 使用範例
logits = torch.randn(8, 5)
labels = torch.randint(0, 5, (8,))
loss = scaled_loss(logits, labels)
print(loss)

✅ 用在訓練流程中也沒問題：

for inputs, targets in dataloader:
    outputs = model(inputs)
    loss = scaled_loss(outputs, targets)
    loss.backward()

什麼時候要用 nn.Module？

用法建議
✅ 簡單邏輯（乘係數、加其他 loss）用 def 就夠了
✅ 損失函數會放到模型裡面一起儲存建議用 nn.Module
✅ 需要訓練的參數（例如學習的權重）必須用 nn.Module
所以你現在這個情況（單純乘 3），用 def 是最乾淨的做法。

2025/04/29
程式
python , GPT

Zoearth Joomla Site
台中阿任的Joomla網站