torch/lossgen/lossgen.py

*a58d3d2aSXin Liimport torch
*a58d3d2aSXin Lifrom torch import nn
*a58d3d2aSXin Liimport torch.nn.functional as F
*a58d3d2aSXin Li
*a58d3d2aSXin Liclass LossGen(nn.Module):
*a58d3d2aSXin Li    def __init__(self, gru1_size=16, gru2_size=16):
*a58d3d2aSXin Li        super(LossGen, self).__init__()
*a58d3d2aSXin Li
*a58d3d2aSXin Li        self.gru1_size = gru1_size
*a58d3d2aSXin Li        self.gru2_size = gru2_size
*a58d3d2aSXin Li        self.dense_in = nn.Linear(2, 8)
*a58d3d2aSXin Li        self.gru1 = nn.GRU(8, self.gru1_size, batch_first=True)
*a58d3d2aSXin Li        self.gru2 = nn.GRU(self.gru1_size, self.gru2_size, batch_first=True)
*a58d3d2aSXin Li        self.dense_out = nn.Linear(self.gru2_size, 1)
*a58d3d2aSXin Li
*a58d3d2aSXin Li    def forward(self, loss, perc, states=None):
*a58d3d2aSXin Li        #print(states)
*a58d3d2aSXin Li        device = loss.device
*a58d3d2aSXin Li        batch_size = loss.size(0)
*a58d3d2aSXin Li        if states is None:
*a58d3d2aSXin Li            gru1_state = torch.zeros((1, batch_size, self.gru1_size), device=device)
*a58d3d2aSXin Li            gru2_state = torch.zeros((1, batch_size, self.gru2_size), device=device)
*a58d3d2aSXin Li        else:
*a58d3d2aSXin Li            gru1_state = states[0]
*a58d3d2aSXin Li            gru2_state = states[1]
*a58d3d2aSXin Li        x = torch.tanh(self.dense_in(torch.cat([loss, perc], dim=-1)))
*a58d3d2aSXin Li        gru1_out, gru1_state = self.gru1(x, gru1_state)
*a58d3d2aSXin Li        gru2_out, gru2_state = self.gru2(gru1_out, gru2_state)
*a58d3d2aSXin Li        return self.dense_out(gru2_out), [gru1_state, gru2_state]