torch/utils/mkldnn.py

*da0073e9SAndroid Build Coastguard Worker# mypy: allow-untyped-defs
*da0073e9SAndroid Build Coastguard Workerimport torch
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass MkldnnLinear(torch.jit.ScriptModule):
*da0073e9SAndroid Build Coastguard Worker    def __init__(self, dense_module, dtype):
*da0073e9SAndroid Build Coastguard Worker        super().__init__()
*da0073e9SAndroid Build Coastguard Worker        self.register_buffer('weight', dense_module.weight.to_mkldnn(dtype))
*da0073e9SAndroid Build Coastguard Worker        if dense_module.bias is not None:
*da0073e9SAndroid Build Coastguard Worker            # Bias can be fp32 or bf16 for OneDNN bf16 path, but for good accuracy,
*da0073e9SAndroid Build Coastguard Worker            # we use fp32 dtype.
*da0073e9SAndroid Build Coastguard Worker            self.register_buffer('bias', dense_module.bias.to_mkldnn())
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            # TODO: Remove this once ScriptModule supports registering None buffer
*da0073e9SAndroid Build Coastguard Worker            self.register_buffer(
*da0073e9SAndroid Build Coastguard Worker                'bias',
*da0073e9SAndroid Build Coastguard Worker                torch.zeros([dense_module.weight.size(0)], dtype=torch.float).to_mkldnn())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @torch.jit.script_method
*da0073e9SAndroid Build Coastguard Worker    def __getstate__(self):
*da0073e9SAndroid Build Coastguard Worker        return (self.weight.to_dense(), self.bias.to_dense(), self.training)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @torch.jit.script_method
*da0073e9SAndroid Build Coastguard Worker    def __setstate__(self, state):
*da0073e9SAndroid Build Coastguard Worker        self.weight = state[0].to_mkldnn()
*da0073e9SAndroid Build Coastguard Worker        self.bias = state[1].to_mkldnn()
*da0073e9SAndroid Build Coastguard Worker        self.training = state[2]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @torch.jit.script_method
*da0073e9SAndroid Build Coastguard Worker    def forward(self, x):
*da0073e9SAndroid Build Coastguard Worker        x_mkldnn = x if x.is_mkldnn else x.to_mkldnn()
*da0073e9SAndroid Build Coastguard Worker        y_mkldnn = torch._C._nn.mkldnn_linear(x_mkldnn, self.weight, self.bias)
*da0073e9SAndroid Build Coastguard Worker        y = y_mkldnn if x.is_mkldnn else y_mkldnn.to_dense()
*da0073e9SAndroid Build Coastguard Worker        return y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass _MkldnnConvNd(torch.jit.ScriptModule):
*da0073e9SAndroid Build Coastguard Worker    """Common base of MkldnnConv1d and MkldnnConv2d."""
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    __constants__ = ['stride', 'padding', 'dilation', 'groups']
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def __init__(self, dense_module):
*da0073e9SAndroid Build Coastguard Worker        super().__init__()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.stride = dense_module.stride
*da0073e9SAndroid Build Coastguard Worker        self.padding = dense_module.padding
*da0073e9SAndroid Build Coastguard Worker        self.dilation = dense_module.dilation
*da0073e9SAndroid Build Coastguard Worker        self.groups = dense_module.groups
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if dense_module.bias is not None:
*da0073e9SAndroid Build Coastguard Worker            self.register_buffer('bias', dense_module.bias.to_mkldnn())
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            # Bias can be fp32 or bf16 for OneDNN bf16 path, but for good accuracy,
*da0073e9SAndroid Build Coastguard Worker            # we use fp32 dtype.
*da0073e9SAndroid Build Coastguard Worker            # TODO: Remove this once ScriptModule supports registering None buffer
*da0073e9SAndroid Build Coastguard Worker            self.register_buffer(
*da0073e9SAndroid Build Coastguard Worker                'bias',
*da0073e9SAndroid Build Coastguard Worker                torch.zeros([dense_module.weight.size(0)], dtype=torch.float).to_mkldnn())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @torch.jit.script_method
*da0073e9SAndroid Build Coastguard Worker    def __getstate__(self):
*da0073e9SAndroid Build Coastguard Worker        return (self.weight.to_dense(), self.bias.to_dense(), self.training)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @torch.jit.script_method
*da0073e9SAndroid Build Coastguard Worker    def forward(self, x):
*da0073e9SAndroid Build Coastguard Worker        return torch.mkldnn_convolution(
*da0073e9SAndroid Build Coastguard Worker            x,
*da0073e9SAndroid Build Coastguard Worker            self.weight,
*da0073e9SAndroid Build Coastguard Worker            self.bias,
*da0073e9SAndroid Build Coastguard Worker            self.padding,
*da0073e9SAndroid Build Coastguard Worker            self.stride,
*da0073e9SAndroid Build Coastguard Worker            self.dilation,
*da0073e9SAndroid Build Coastguard Worker            self.groups)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass MkldnnConv1d(_MkldnnConvNd):
*da0073e9SAndroid Build Coastguard Worker    def __init__(self, dense_module, dtype):
*da0073e9SAndroid Build Coastguard Worker        super().__init__(dense_module)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.register_buffer('weight', dense_module.weight.to_mkldnn(dtype))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @torch.jit.script_method
*da0073e9SAndroid Build Coastguard Worker    def __setstate__(self, state):
*da0073e9SAndroid Build Coastguard Worker        self.weight = state[0].to_mkldnn()
*da0073e9SAndroid Build Coastguard Worker        self.bias = state[1].to_mkldnn()
*da0073e9SAndroid Build Coastguard Worker        self.training = state[2]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass MkldnnConv2d(_MkldnnConvNd):
*da0073e9SAndroid Build Coastguard Worker    def __init__(self, dense_module, dtype):
*da0073e9SAndroid Build Coastguard Worker        super().__init__(dense_module)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.register_buffer('weight', torch._C._nn.mkldnn_reorder_conv2d_weight(
*da0073e9SAndroid Build Coastguard Worker            dense_module.weight.to_mkldnn(dtype),
*da0073e9SAndroid Build Coastguard Worker            self.padding,
*da0073e9SAndroid Build Coastguard Worker            self.stride,
*da0073e9SAndroid Build Coastguard Worker            self.dilation,
*da0073e9SAndroid Build Coastguard Worker            self.groups))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @torch.jit.script_method
*da0073e9SAndroid Build Coastguard Worker    def __setstate__(self, state):
*da0073e9SAndroid Build Coastguard Worker        self.weight = torch._C._nn.mkldnn_reorder_conv2d_weight(
*da0073e9SAndroid Build Coastguard Worker            state[0].to_mkldnn(),
*da0073e9SAndroid Build Coastguard Worker            self.padding,
*da0073e9SAndroid Build Coastguard Worker            self.stride,
*da0073e9SAndroid Build Coastguard Worker            self.dilation,
*da0073e9SAndroid Build Coastguard Worker            self.groups)
*da0073e9SAndroid Build Coastguard Worker        self.bias = state[1].to_mkldnn()
*da0073e9SAndroid Build Coastguard Worker        self.training = state[2]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass MkldnnConv3d(_MkldnnConvNd):
*da0073e9SAndroid Build Coastguard Worker    def __init__(self, dense_module, dtype):
*da0073e9SAndroid Build Coastguard Worker        super().__init__(dense_module)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.register_buffer('weight', torch._C._nn.mkldnn_reorder_conv3d_weight(
*da0073e9SAndroid Build Coastguard Worker            dense_module.weight.to_mkldnn(dtype),
*da0073e9SAndroid Build Coastguard Worker            self.padding,
*da0073e9SAndroid Build Coastguard Worker            self.stride,
*da0073e9SAndroid Build Coastguard Worker            self.dilation,
*da0073e9SAndroid Build Coastguard Worker            self.groups))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @torch.jit.script_method
*da0073e9SAndroid Build Coastguard Worker    def __setstate__(self, state):
*da0073e9SAndroid Build Coastguard Worker        self.weight = torch._C._nn.mkldnn_reorder_conv3d_weight(
*da0073e9SAndroid Build Coastguard Worker            state[0].to_mkldnn(),
*da0073e9SAndroid Build Coastguard Worker            self.padding,
*da0073e9SAndroid Build Coastguard Worker            self.stride,
*da0073e9SAndroid Build Coastguard Worker            self.dilation,
*da0073e9SAndroid Build Coastguard Worker            self.groups)
*da0073e9SAndroid Build Coastguard Worker        self.bias = state[1].to_mkldnn()
*da0073e9SAndroid Build Coastguard Worker        self.training = state[2]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass MkldnnBatchNorm(torch.jit.ScriptModule):
*da0073e9SAndroid Build Coastguard Worker    __constants__ = ['exponential_average_factor', 'eps']
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def __init__(self, dense_module):
*da0073e9SAndroid Build Coastguard Worker        super().__init__()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        assert not dense_module.training
*da0073e9SAndroid Build Coastguard Worker        assert dense_module.track_running_stats
*da0073e9SAndroid Build Coastguard Worker        assert dense_module.affine
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if dense_module.momentum is None:
*da0073e9SAndroid Build Coastguard Worker            self.exponential_average_factor = 0.0
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            self.exponential_average_factor = dense_module.momentum
*da0073e9SAndroid Build Coastguard Worker        self.eps = dense_module.eps
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.register_buffer('weight', dense_module.weight.to_mkldnn())
*da0073e9SAndroid Build Coastguard Worker        self.register_buffer('bias', dense_module.bias.to_mkldnn())
*da0073e9SAndroid Build Coastguard Worker        self.register_buffer('running_mean', dense_module.running_mean.to_mkldnn())
*da0073e9SAndroid Build Coastguard Worker        self.register_buffer('running_var', dense_module.running_var.to_mkldnn())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @torch.jit.script_method
*da0073e9SAndroid Build Coastguard Worker    def __getstate__(self):
*da0073e9SAndroid Build Coastguard Worker        weight = self.weight.to_dense()
*da0073e9SAndroid Build Coastguard Worker        bias = self.bias.to_dense()
*da0073e9SAndroid Build Coastguard Worker        running_mean = self.running_mean.to_dense()
*da0073e9SAndroid Build Coastguard Worker        running_var = self.running_var.to_dense()
*da0073e9SAndroid Build Coastguard Worker        return (weight, bias, running_mean, running_var, self.training)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @torch.jit.script_method
*da0073e9SAndroid Build Coastguard Worker    def __setstate__(self, state):
*da0073e9SAndroid Build Coastguard Worker        self.weight = state[0].to_mkldnn()
*da0073e9SAndroid Build Coastguard Worker        self.bias = state[1].to_mkldnn()
*da0073e9SAndroid Build Coastguard Worker        self.running_mean = state[2].to_mkldnn()
*da0073e9SAndroid Build Coastguard Worker        self.running_var = state[3].to_mkldnn()
*da0073e9SAndroid Build Coastguard Worker        self.training = state[4]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @torch.jit.script_method
*da0073e9SAndroid Build Coastguard Worker    def forward(self, x):
*da0073e9SAndroid Build Coastguard Worker        return torch.batch_norm(
*da0073e9SAndroid Build Coastguard Worker            x,
*da0073e9SAndroid Build Coastguard Worker            self.weight,
*da0073e9SAndroid Build Coastguard Worker            self.bias,
*da0073e9SAndroid Build Coastguard Worker            self.running_mean,
*da0073e9SAndroid Build Coastguard Worker            self.running_var,
*da0073e9SAndroid Build Coastguard Worker            False,  # training
*da0073e9SAndroid Build Coastguard Worker            self.exponential_average_factor,
*da0073e9SAndroid Build Coastguard Worker            self.eps,
*da0073e9SAndroid Build Coastguard Worker            False,  # cuda_enabled
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass MkldnnPrelu(torch.jit.ScriptModule):
*da0073e9SAndroid Build Coastguard Worker    def __init__(self, dense_module, dtype):
*da0073e9SAndroid Build Coastguard Worker        super().__init__()
*da0073e9SAndroid Build Coastguard Worker        self.register_buffer('weight', dense_module.weight.to_mkldnn(dtype))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @torch.jit.script_method
*da0073e9SAndroid Build Coastguard Worker    def __getstate__(self):
*da0073e9SAndroid Build Coastguard Worker        return (self.weight.to_dense(), self.training)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @torch.jit.script_method
*da0073e9SAndroid Build Coastguard Worker    def __setstate__(self, state):
*da0073e9SAndroid Build Coastguard Worker        self.weight = state[0].to_mkldnn()
*da0073e9SAndroid Build Coastguard Worker        self.training = state[1]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @torch.jit.script_method
*da0073e9SAndroid Build Coastguard Worker    def forward(self, x):
*da0073e9SAndroid Build Coastguard Worker        x_mkldnn = x if x.is_mkldnn else x.to_mkldnn()
*da0073e9SAndroid Build Coastguard Worker        y_mkldnn = torch.prelu(x_mkldnn, self.weight)
*da0073e9SAndroid Build Coastguard Worker        y = y_mkldnn if x.is_mkldnn else y_mkldnn.to_dense()
*da0073e9SAndroid Build Coastguard Worker        return y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef to_mkldnn(module, dtype=torch.float):
*da0073e9SAndroid Build Coastguard Worker    assert dtype in [torch.float, torch.bfloat16, torch.half], \
*da0073e9SAndroid Build Coastguard Worker        "MKLDNN only support float, bfloat16, and half path now"
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def m_fn(m, d):
*da0073e9SAndroid Build Coastguard Worker        if isinstance(m, torch.nn.Linear):
*da0073e9SAndroid Build Coastguard Worker            return MkldnnLinear(m, d)
*da0073e9SAndroid Build Coastguard Worker        elif isinstance(m, torch.nn.Conv1d):
*da0073e9SAndroid Build Coastguard Worker            return MkldnnConv1d(m, d)
*da0073e9SAndroid Build Coastguard Worker        elif isinstance(m, torch.nn.Conv2d):
*da0073e9SAndroid Build Coastguard Worker            return MkldnnConv2d(m, d)
*da0073e9SAndroid Build Coastguard Worker        elif isinstance(m, torch.nn.Conv3d):
*da0073e9SAndroid Build Coastguard Worker            return MkldnnConv3d(m, d)
*da0073e9SAndroid Build Coastguard Worker        elif isinstance(m, (torch.nn.BatchNorm2d, torch.nn.BatchNorm3d)):
*da0073e9SAndroid Build Coastguard Worker            # For batchnorm bf16 path, OneDNN requires weight and bias need fp32 dtype.
*da0073e9SAndroid Build Coastguard Worker            # so it doesn't need dtype argument.
*da0073e9SAndroid Build Coastguard Worker            return MkldnnBatchNorm(m)
*da0073e9SAndroid Build Coastguard Worker        elif isinstance(m, torch.nn.PReLU):
*da0073e9SAndroid Build Coastguard Worker            return MkldnnPrelu(m, d)
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            return m
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def m_fn_rec(m, d):
*da0073e9SAndroid Build Coastguard Worker        new_m = m_fn(m, d)
*da0073e9SAndroid Build Coastguard Worker        for name, sub_m in m.named_children():
*da0073e9SAndroid Build Coastguard Worker            setattr(new_m, name, m_fn_rec(sub_m, d))
*da0073e9SAndroid Build Coastguard Worker        return new_m
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    return m_fn_rec(module, dtype)