pytorch/test/test_autograd.py

*da0073e9SAndroid Build Coastguard Worker# Owner(s): ["module: autograd"]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerimport collections
*da0073e9SAndroid Build Coastguard Workerimport contextlib
*da0073e9SAndroid Build Coastguard Workerimport functools
*da0073e9SAndroid Build Coastguard Workerimport gc
*da0073e9SAndroid Build Coastguard Workerimport io
*da0073e9SAndroid Build Coastguard Workerimport math
*da0073e9SAndroid Build Coastguard Workerimport operator
*da0073e9SAndroid Build Coastguard Workerimport os
*da0073e9SAndroid Build Coastguard Workerimport pickle
*da0073e9SAndroid Build Coastguard Workerimport random
*da0073e9SAndroid Build Coastguard Workerimport subprocess
*da0073e9SAndroid Build Coastguard Workerimport sys
*da0073e9SAndroid Build Coastguard Workerimport tempfile
*da0073e9SAndroid Build Coastguard Workerimport threading
*da0073e9SAndroid Build Coastguard Workerimport time
*da0073e9SAndroid Build Coastguard Workerimport unittest
*da0073e9SAndroid Build Coastguard Workerimport uuid
*da0073e9SAndroid Build Coastguard Workerimport warnings
*da0073e9SAndroid Build Coastguard Workerimport weakref
*da0073e9SAndroid Build Coastguard Workerfrom collections import OrderedDict
*da0073e9SAndroid Build Coastguard Workerfrom copy import deepcopy
*da0073e9SAndroid Build Coastguard Workerfrom functools import partial, reduce
*da0073e9SAndroid Build Coastguard Workerfrom itertools import product
*da0073e9SAndroid Build Coastguard Workerfrom operator import mul
*da0073e9SAndroid Build Coastguard Workerfrom typing import List, Tuple, TYPE_CHECKING
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerimport torch
*da0073e9SAndroid Build Coastguard Workerimport torch.autograd._functions
*da0073e9SAndroid Build Coastguard Workerimport torch.autograd.forward_ad as fwAD
*da0073e9SAndroid Build Coastguard Workerfrom torch import inf, nan, nn
*da0073e9SAndroid Build Coastguard Workerfrom torch.autograd import (
*da0073e9SAndroid Build Coastguard Worker    _calculate_shape,
*da0073e9SAndroid Build Coastguard Worker    detect_anomaly,
*da0073e9SAndroid Build Coastguard Worker    Function,
*da0073e9SAndroid Build Coastguard Worker    kineto_available,
*da0073e9SAndroid Build Coastguard Worker    Variable,
*da0073e9SAndroid Build Coastguard Worker)
*da0073e9SAndroid Build Coastguard Workerfrom torch.autograd.function import InplaceFunction, once_differentiable
*da0073e9SAndroid Build Coastguard Workerfrom torch.autograd.graph import GradientEdge
*da0073e9SAndroid Build Coastguard Workerfrom torch.autograd.profiler import emit_itt, emit_nvtx, profile, record_function
*da0073e9SAndroid Build Coastguard Workerfrom torch.autograd.profiler_util import (
*da0073e9SAndroid Build Coastguard Worker    _format_time,
*da0073e9SAndroid Build Coastguard Worker    EventList,
*da0073e9SAndroid Build Coastguard Worker    FunctionEvent,
*da0073e9SAndroid Build Coastguard Worker    FunctionEventAvg,
*da0073e9SAndroid Build Coastguard Worker)
*da0073e9SAndroid Build Coastguard Workerfrom torch.testing import make_tensor
*da0073e9SAndroid Build Coastguard Workerfrom torch.testing._internal.common_cuda import TEST_CUDA
*da0073e9SAndroid Build Coastguard Workerfrom torch.testing._internal.common_device_type import (
*da0073e9SAndroid Build Coastguard Worker    deviceCountAtLeast,
*da0073e9SAndroid Build Coastguard Worker    dtypes,
*da0073e9SAndroid Build Coastguard Worker    dtypesIfCUDA,
*da0073e9SAndroid Build Coastguard Worker    dtypesIfMPS,
*da0073e9SAndroid Build Coastguard Worker    instantiate_device_type_tests,
*da0073e9SAndroid Build Coastguard Worker    onlyCPU,
*da0073e9SAndroid Build Coastguard Worker    onlyCUDA,
*da0073e9SAndroid Build Coastguard Worker    skipMeta,
*da0073e9SAndroid Build Coastguard Worker)
*da0073e9SAndroid Build Coastguard Workerfrom torch.testing._internal.common_dtype import floating_types_and
*da0073e9SAndroid Build Coastguard Workerfrom torch.testing._internal.common_methods_invocations import mask_not_all_zeros
*da0073e9SAndroid Build Coastguard Workerfrom torch.testing._internal.common_utils import (
*da0073e9SAndroid Build Coastguard Worker    disable_gc,
*da0073e9SAndroid Build Coastguard Worker    gradcheck,
*da0073e9SAndroid Build Coastguard Worker    gradgradcheck,
*da0073e9SAndroid Build Coastguard Worker    instantiate_parametrized_tests,
*da0073e9SAndroid Build Coastguard Worker    IS_MACOS,
*da0073e9SAndroid Build Coastguard Worker    IS_WINDOWS,
*da0073e9SAndroid Build Coastguard Worker    parametrize,
*da0073e9SAndroid Build Coastguard Worker    run_tests,
*da0073e9SAndroid Build Coastguard Worker    set_warn_always_context,
*da0073e9SAndroid Build Coastguard Worker    skipIfMps,
*da0073e9SAndroid Build Coastguard Worker    skipIfNoLapack,
*da0073e9SAndroid Build Coastguard Worker    skipIfTorchDynamo,
*da0073e9SAndroid Build Coastguard Worker    slowTest,
*da0073e9SAndroid Build Coastguard Worker    TestCase,
*da0073e9SAndroid Build Coastguard Worker    xfailIfTorchDynamo,
*da0073e9SAndroid Build Coastguard Worker)
*da0073e9SAndroid Build Coastguard Workerfrom torch.utils._mode_utils import no_dispatch
*da0073e9SAndroid Build Coastguard Workerfrom torch.utils._python_dispatch import TorchDispatchMode
*da0073e9SAndroid Build Coastguard Workerfrom torch.utils.checkpoint import (
*da0073e9SAndroid Build Coastguard Worker    checkpoint,
*da0073e9SAndroid Build Coastguard Worker    checkpoint_sequential,
*da0073e9SAndroid Build Coastguard Worker    CheckpointPolicy,
*da0073e9SAndroid Build Coastguard Worker    create_selective_checkpoint_contexts,
*da0073e9SAndroid Build Coastguard Worker)
*da0073e9SAndroid Build Coastguard Workerfrom torch.utils.cpp_extension import load_inline
*da0073e9SAndroid Build Coastguard Workerfrom torch.utils.flop_counter import FlopCounterMode
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerif TYPE_CHECKING:
*da0073e9SAndroid Build Coastguard Worker    from torch.utils.hooks import RemovableHandle
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef graph_desc(fn):
*da0073e9SAndroid Build Coastguard Worker    if fn is None:
*da0073e9SAndroid Build Coastguard Worker        return "None"
*da0073e9SAndroid Build Coastguard Worker    result = type(fn).__name__ + "("
*da0073e9SAndroid Build Coastguard Worker    next_functions = fn.next_functions
*da0073e9SAndroid Build Coastguard Worker    for next_fn, _ in next_functions:
*da0073e9SAndroid Build Coastguard Worker        result += graph_desc(next_fn)
*da0073e9SAndroid Build Coastguard Worker        result += ", "
*da0073e9SAndroid Build Coastguard Worker    if next_functions:
*da0073e9SAndroid Build Coastguard Worker        result = result[:-2]
*da0073e9SAndroid Build Coastguard Worker    return result + ")"
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass TestAutograd(TestCase):
*da0073e9SAndroid Build Coastguard Worker    def test_copy_slices_graph_task_updates(self):
*da0073e9SAndroid Build Coastguard Worker        def f1(x, y):
*da0073e9SAndroid Build Coastguard Worker            out = x.clone().view(-1)
*da0073e9SAndroid Build Coastguard Worker            out += y
*da0073e9SAndroid Build Coastguard Worker            return out
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def f2(x, y):
*da0073e9SAndroid Build Coastguard Worker            out = x.clone().view(-1)
*da0073e9SAndroid Build Coastguard Worker            b = out * 2
*da0073e9SAndroid Build Coastguard Worker            out += y
*da0073e9SAndroid Build Coastguard Worker            return out + b
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.rand(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        y_safe = torch._C._functions.DelayedError("Boom!", 1)(y)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for f in [f1, f2]:
*da0073e9SAndroid Build Coastguard Worker            # Ensure that the error Node works
*da0073e9SAndroid Build Coastguard Worker            out = f(x, y_safe)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, "Boom!"):
*da0073e9SAndroid Build Coastguard Worker                out.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            out = f(x, y_safe)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, "Boom!"):
*da0073e9SAndroid Build Coastguard Worker                torch.autograd.grad(out.sum(), y)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Ensure that if we don't ask for y, it doesn't crash
*da0073e9SAndroid Build Coastguard Worker            out = f(x, y_safe)
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.grad(out.sum(), x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            out = f(x, y_safe)
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.grad(out.sum(), y_safe)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            out = f(x, y_safe)
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.grad(out.sum(), (x, y_safe))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Ensure that we don't run extra view Node
*da0073e9SAndroid Build Coastguard Worker        def f3(x, y):
*da0073e9SAndroid Build Coastguard Worker            out = x.clone().view(-1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def hook(*args):
*da0073e9SAndroid Build Coastguard Worker                # This should never be called!
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            out.register_hook(hook)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            b = out + y
*da0073e9SAndroid Build Coastguard Worker            out += y
*da0073e9SAndroid Build Coastguard Worker            return out + b, b
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out, b = f3(x, y_safe)
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.grad(out.sum(), (b, y_safe))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_grad_mode_class_decoration(self):
*da0073e9SAndroid Build Coastguard Worker        # Decorating class is deprecated and should not be used
*da0073e9SAndroid Build Coastguard Worker        with self.assertWarnsRegex(FutureWarning, "Decorating classes is deprecated"):
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @torch.no_grad()
*da0073e9SAndroid Build Coastguard Worker            class Foo:
*da0073e9SAndroid Build Coastguard Worker                def __init__(self) -> None:
*da0073e9SAndroid Build Coastguard Worker                    assert not torch.is_grad_enabled()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                def foo(self):
*da0073e9SAndroid Build Coastguard Worker                    # Not applied to methods
*da0073e9SAndroid Build Coastguard Worker                    assert torch.is_grad_enabled()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Show that we can actually construct the class
*da0073e9SAndroid Build Coastguard Worker            foo = Foo()
*da0073e9SAndroid Build Coastguard Worker            foo.foo()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Decorating functions or methods is fine though
*da0073e9SAndroid Build Coastguard Worker        with warnings.catch_warnings(record=True) as w:
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @torch.no_grad()
*da0073e9SAndroid Build Coastguard Worker            def foo():
*da0073e9SAndroid Build Coastguard Worker                assert not torch.is_grad_enabled()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            foo()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            class Foo2:
*da0073e9SAndroid Build Coastguard Worker                @torch.no_grad()
*da0073e9SAndroid Build Coastguard Worker                def __init__(self) -> None:
*da0073e9SAndroid Build Coastguard Worker                    assert not torch.is_grad_enabled()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                @torch.no_grad()
*da0073e9SAndroid Build Coastguard Worker                def foo(self):
*da0073e9SAndroid Build Coastguard Worker                    assert not torch.is_grad_enabled()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            foo2 = Foo2()
*da0073e9SAndroid Build Coastguard Worker            foo2.foo()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(len(w), 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_tensor_grad_warnings(self):
*da0073e9SAndroid Build Coastguard Worker        dummy = torch.empty(1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with warnings.catch_warnings(record=True) as w:
*da0073e9SAndroid Build Coastguard Worker            # Accessing .grad on leaf
*da0073e9SAndroid Build Coastguard Worker            dummy.requires_grad_()
*da0073e9SAndroid Build Coastguard Worker            foo = dummy.grad
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(len(w), 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Accessing .grad on non-leaf
*da0073e9SAndroid Build Coastguard Worker            dummy = dummy.clone()
*da0073e9SAndroid Build Coastguard Worker            foo = dummy.grad
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(len(w), 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Accessing .grad on non-leaf that retains gradients
*da0073e9SAndroid Build Coastguard Worker            dummy.retain_grad()
*da0073e9SAndroid Build Coastguard Worker            foo = dummy.grad
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(len(w), 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _function_test(self, cls):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        result = cls.apply(x, 2, y)
*da0073e9SAndroid Build Coastguard Worker        go = torch.ones((), requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        result.sum().backward(go, create_graph=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, y + torch.ones(5, 5))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y.grad, x + torch.ones(5, 5) * 2)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNotNone(x.grad.grad_fn)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNotNone(y.grad.grad_fn)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        return x, y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_function(self):
*da0073e9SAndroid Build Coastguard Worker        class MyFunction(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, tensor1, pyscalar, tensor2):
*da0073e9SAndroid Build Coastguard Worker                ctx.pyscalar = pyscalar
*da0073e9SAndroid Build Coastguard Worker                ctx.save_for_backward(tensor1, tensor2)
*da0073e9SAndroid Build Coastguard Worker                return tensor1 + pyscalar * tensor2 + tensor1 * tensor2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_output):
*da0073e9SAndroid Build Coastguard Worker                var1, var2 = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                # NOTE: self is the test case here
*da0073e9SAndroid Build Coastguard Worker                self.assertIsInstance(var1, torch.Tensor)
*da0073e9SAndroid Build Coastguard Worker                self.assertIsInstance(var2, torch.Tensor)
*da0073e9SAndroid Build Coastguard Worker                self.assertIsInstance(grad_output, torch.Tensor)
*da0073e9SAndroid Build Coastguard Worker                return (
*da0073e9SAndroid Build Coastguard Worker                    grad_output + grad_output * var2,
*da0073e9SAndroid Build Coastguard Worker                    None,
*da0073e9SAndroid Build Coastguard Worker                    grad_output * ctx.pyscalar + grad_output * var1,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x, y = self._function_test(MyFunction)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x_grad_desc = graph_desc(x.grad.grad_fn)
*da0073e9SAndroid Build Coastguard Worker        y_grad_desc = graph_desc(y.grad.grad_fn)
*da0073e9SAndroid Build Coastguard Worker        self.assertExpected(x_grad_desc, "x_grad_desc")
*da0073e9SAndroid Build Coastguard Worker        self.assertExpected(y_grad_desc, "y_grad_desc")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_once_differentiable(self):
*da0073e9SAndroid Build Coastguard Worker        class MyFunction(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, tensor1, pyscalar, tensor2):
*da0073e9SAndroid Build Coastguard Worker                ctx.pyscalar = pyscalar
*da0073e9SAndroid Build Coastguard Worker                ctx.save_for_backward(tensor1, tensor2)
*da0073e9SAndroid Build Coastguard Worker                return tensor1 + pyscalar * tensor2 + tensor1 * tensor2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            @once_differentiable
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_output):
*da0073e9SAndroid Build Coastguard Worker                self.assertFalse(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker                t1, t2 = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                return (
*da0073e9SAndroid Build Coastguard Worker                    grad_output + grad_output * t2,
*da0073e9SAndroid Build Coastguard Worker                    None,
*da0073e9SAndroid Build Coastguard Worker                    grad_output * ctx.pyscalar + grad_output * t1,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x, y = self._function_test(MyFunction)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            graph_desc(x.grad.grad_fn),
*da0073e9SAndroid Build Coastguard Worker            "CopyBackwards(None, Error(AccumulateGrad(), None, AccumulateGrad()))",
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            graph_desc(y.grad.grad_fn),
*da0073e9SAndroid Build Coastguard Worker            "CopyBackwards(None, Error(AccumulateGrad(), None, AccumulateGrad()))",
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_function_returns_input(self):
*da0073e9SAndroid Build Coastguard Worker        class MyFunction(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad):
*da0073e9SAndroid Build Coastguard Worker                return grad * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for shape in [(1,), ()]:
*da0073e9SAndroid Build Coastguard Worker            v = torch.ones(shape, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            MyFunction.apply(v).backward()
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(v.grad, torch.full(shape, 2.0))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker                v.grad.zero_()
*da0073e9SAndroid Build Coastguard Worker            MyFunction.apply(v.clone()).backward()
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(v.grad, torch.full(shape, 2.0))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_function_returns_undefined_tensor(self):
*da0073e9SAndroid Build Coastguard Worker        class MyFunction(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad):
*da0073e9SAndroid Build Coastguard Worker                return None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Test that undefined tensors returned from custom backward function
*da0073e9SAndroid Build Coastguard Worker        # are propagated as undefined and not tensor full of zeroes
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        MyFunction.apply(x).backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(x.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        MyFunction.apply(x**2).backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(x.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        MyFunction.apply(x).sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(x.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.grad(MyFunction.apply(x), x, allow_unused=True)[0]
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_materialize_grads(self):
*da0073e9SAndroid Build Coastguard Worker        class MyFunction(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad):
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(grad, torch.zeros(1))
*da0073e9SAndroid Build Coastguard Worker                return grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        torch._C._functions.UndefinedGrad()(MyFunction.apply(x)).backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_dont_materialize_grads(self):
*da0073e9SAndroid Build Coastguard Worker        class MyFunction(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                ctx.set_materialize_grads(False)
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad):
*da0073e9SAndroid Build Coastguard Worker                self.assertIsNone(grad)
*da0073e9SAndroid Build Coastguard Worker                return grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        torch._C._functions.UndefinedGrad()(MyFunction.apply(x)).backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfTorchDynamo("compile tested in test/dynamo/test_autograd_function.py")
*da0073e9SAndroid Build Coastguard Worker    def test_set_materialize_non_diff_grads(self):
*da0073e9SAndroid Build Coastguard Worker        class Func(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                out0 = x.clone()
*da0073e9SAndroid Build Coastguard Worker                out1 = x.clone()
*da0073e9SAndroid Build Coastguard Worker                ctx.mark_non_differentiable(out1)
*da0073e9SAndroid Build Coastguard Worker                ctx._materialize_non_diff_grads = False
*da0073e9SAndroid Build Coastguard Worker                return out0, out1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, g0, g1):
*da0073e9SAndroid Build Coastguard Worker                self.assertIsNone(g1)
*da0073e9SAndroid Build Coastguard Worker                return g0
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out = Func.apply(a)[0]
*da0073e9SAndroid Build Coastguard Worker        out.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_legacy_function_deprecation_exception(self):
*da0073e9SAndroid Build Coastguard Worker        # Trigger exception
*da0073e9SAndroid Build Coastguard Worker        class MyFunction(Function):
*da0073e9SAndroid Build Coastguard Worker            def forward(self, x):
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def backward(self, grad_output):
*da0073e9SAndroid Build Coastguard Worker                return grad_output
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Check exception occurs
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError,
*da0073e9SAndroid Build Coastguard Worker            "Legacy autograd function with non-static forward method is deprecated",
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            MyFunction()(torch.randn(3, 4))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    class SimulateBackwardError(Function):
*da0073e9SAndroid Build Coastguard Worker        @staticmethod
*da0073e9SAndroid Build Coastguard Worker        def forward(ctx, input):
*da0073e9SAndroid Build Coastguard Worker            return input.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        @staticmethod
*da0073e9SAndroid Build Coastguard Worker        @once_differentiable
*da0073e9SAndroid Build Coastguard Worker        def backward(ctx, input):
*da0073e9SAndroid Build Coastguard Worker            raise Exception("Simulate error on backward pass")  # noqa: TRY002
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_custom_function_exception(self):
*da0073e9SAndroid Build Coastguard Worker        t1 = torch.rand((3, 3), requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        t2 = torch.rand((3, 3), requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        tmp = (t1 + t2) * (t1 + t2)
*da0073e9SAndroid Build Coastguard Worker        t3 = TestAutograd.SimulateBackwardError.apply(tmp)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(Exception, "Simulate error on backward pass"):
*da0073e9SAndroid Build Coastguard Worker            t3.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_custom_function_non_tensor_inputs_outputs(self):
*da0073e9SAndroid Build Coastguard Worker        class MyFunction(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, t1, t2, scale, t3):
*da0073e9SAndroid Build Coastguard Worker                t4 = t1 + t2 * t3
*da0073e9SAndroid Build Coastguard Worker                t5 = t1 * t2 + t3
*da0073e9SAndroid Build Coastguard Worker                t4 *= scale
*da0073e9SAndroid Build Coastguard Worker                t5 *= scale
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # Save scale
*da0073e9SAndroid Build Coastguard Worker                ctx.scale = scale
*da0073e9SAndroid Build Coastguard Worker                ctx.save_for_backward(t1, t2, t3)
*da0073e9SAndroid Build Coastguard Worker                return scale, t4, None, True, t5, "bar", t1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            @once_differentiable
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, *grads):
*da0073e9SAndroid Build Coastguard Worker                # Verify grads
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(7, len(grads))
*da0073e9SAndroid Build Coastguard Worker                self.assertIsNone(grads[0])
*da0073e9SAndroid Build Coastguard Worker                self.assertIsNone(grads[2])
*da0073e9SAndroid Build Coastguard Worker                self.assertIsNone(grads[3])
*da0073e9SAndroid Build Coastguard Worker                self.assertIsNone(grads[5])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                scale = ctx.scale
*da0073e9SAndroid Build Coastguard Worker                var1, var2, var3 = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                return (
*da0073e9SAndroid Build Coastguard Worker                    grads[1] * scale + grads[4] * var2 * scale + grads[6],
*da0073e9SAndroid Build Coastguard Worker                    grads[1] * var3 * scale + grads[4] * var1 * scale,
*da0073e9SAndroid Build Coastguard Worker                    None,
*da0073e9SAndroid Build Coastguard Worker                    grads[1] * var2 * scale + grads[4] * scale,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        t1 = torch.rand(10, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        t2 = torch.rand(10, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        t3 = torch.rand(10, dtype=torch.double)
*da0073e9SAndroid Build Coastguard Worker        scale = random.randint(0, 10)
*da0073e9SAndroid Build Coastguard Worker        res = MyFunction.apply(t1, t2, scale, t3)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(scale, res[0])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual((t1 + t2 * t3) * scale, res[1])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(None, res[2])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(True, res[3])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual((t1 * t2 + t3) * scale, res[4])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual("bar", res[5])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(t1, res[6])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Validate running backward.
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.backward([res[1].sum(), res[4].sum(), res[6].sum()])
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNotNone(t1.grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNotNone(t2.grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(t3.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Test gradcheck
*da0073e9SAndroid Build Coastguard Worker        def foo(t1, t2, t3):
*da0073e9SAndroid Build Coastguard Worker            res = MyFunction.apply(t1, t2, scale, t3)
*da0073e9SAndroid Build Coastguard Worker            return res[1], res[4], res[6]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        gradcheck(foo, (t1, t2, t3))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_custom_function_no_tensors(self):
*da0073e9SAndroid Build Coastguard Worker        class MyFunction(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, t1, t2, scale, t3):
*da0073e9SAndroid Build Coastguard Worker                t4 = t1 + t2 * t3
*da0073e9SAndroid Build Coastguard Worker                t5 = t1 * t2 + t3
*da0073e9SAndroid Build Coastguard Worker                t4 *= scale
*da0073e9SAndroid Build Coastguard Worker                t5 *= scale
*da0073e9SAndroid Build Coastguard Worker                return scale, t4, None, True, t5, "bar", t1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            @once_differentiable
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, *args):
*da0073e9SAndroid Build Coastguard Worker                return (args[0], args[1], None, args[2])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        t1 = random.random()
*da0073e9SAndroid Build Coastguard Worker        t2 = random.random()
*da0073e9SAndroid Build Coastguard Worker        t3 = random.random()
*da0073e9SAndroid Build Coastguard Worker        scale = random.randint(0, 10)
*da0073e9SAndroid Build Coastguard Worker        res = MyFunction.apply(t1, t2, scale, t3)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(scale, res[0])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual((t1 + t2 * t3) * scale, res[1])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(None, res[2])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(True, res[3])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual((t1 * t2 + t3) * scale, res[4])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual("bar", res[5])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(t1, res[6])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_invalid_gradients(self):
*da0073e9SAndroid Build Coastguard Worker        class MyFunction(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_output):
*da0073e9SAndroid Build Coastguard Worker                return torch.randn(10, dtype=torch.float)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "expected shape"):
*da0073e9SAndroid Build Coastguard Worker            input = torch.randn(5, 5, dtype=torch.float, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            MyFunction.apply(input).sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_unrelated_inputs(self):
*da0073e9SAndroid Build Coastguard Worker        # test to ensure grad(grad)check runs successfully even if there is an
*da0073e9SAndroid Build Coastguard Worker        # unrelated (but differentiable) inputs
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def my_function(x, y):
*da0073e9SAndroid Build Coastguard Worker            return x * x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(10, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.rand(10, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        gradcheck(my_function, (x, y))
*da0073e9SAndroid Build Coastguard Worker        gradgradcheck(my_function, (x, y))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_not_implemented_grad(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.rand(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        # if grad for nextafter ends up being implemented, this should be changed
*da0073e9SAndroid Build Coastguard Worker        y = torch.nextafter(a, a).sum()
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            NotImplementedError, "the derivative for .* is not implemented"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            y.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_not_implemented_fwad(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(3)
*da0073e9SAndroid Build Coastguard Worker        v = torch.rand(3)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            dual_x = fwAD.make_dual(x, v)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            err_msg = r"Trying to use forward AD with .* that does not support it"
*da0073e9SAndroid Build Coastguard Worker            hint_msg = "Running forward AD for an OP that does not implement it should raise a NotImplementedError"
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(NotImplementedError, err_msg, msg=hint_msg):
*da0073e9SAndroid Build Coastguard Worker                # if forward AD ends up being implemented for torch.igamma, choose a different op
*da0073e9SAndroid Build Coastguard Worker                torch.igamma(dual_x, dual_x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_saved_tensor_hooks_extra_exit_during_bw_no_crash(self):
*da0073e9SAndroid Build Coastguard Worker        # This usage of saved tensor is not supported, but should not crash
*da0073e9SAndroid Build Coastguard Worker        def unpack(x):
*da0073e9SAndroid Build Coastguard Worker            ctx_1.__exit__()
*da0073e9SAndroid Build Coastguard Worker            return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        ctx_1 = torch.autograd.graph.saved_tensors_hooks(lambda x: x, unpack)
*da0073e9SAndroid Build Coastguard Worker        ctx_2 = torch.autograd.graph.saved_tensors_hooks(lambda x: x, lambda x: x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for i in range(10):
*da0073e9SAndroid Build Coastguard Worker            with ctx_2:
*da0073e9SAndroid Build Coastguard Worker                ctx_1.__enter__()
*da0073e9SAndroid Build Coastguard Worker                x = torch.randn(3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker                x.sin().sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Clean up
*da0073e9SAndroid Build Coastguard Worker        for i in range(10):
*da0073e9SAndroid Build Coastguard Worker            ctx_1.__exit__()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Validate there are no more hooks on the stack
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = a.exp()
*da0073e9SAndroid Build Coastguard Worker        y.grad_fn._raw_saved_result.register_hooks(lambda x: x, lambda x: x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_saved_tensor_hooks_extra_enter_during_bw_no_leak(self):
*da0073e9SAndroid Build Coastguard Worker        # This usage of saved tensor is not supported, but should not leak
*da0073e9SAndroid Build Coastguard Worker        def scope():
*da0073e9SAndroid Build Coastguard Worker            def unpack(x):
*da0073e9SAndroid Build Coastguard Worker                weak_ctx_1().__enter__()
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            ctx_1 = torch.autograd.graph.saved_tensors_hooks(lambda x: x, unpack)
*da0073e9SAndroid Build Coastguard Worker            weak_ctx_1 = weakref.ref(ctx_1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            x = torch.randn(3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            with ctx_1:
*da0073e9SAndroid Build Coastguard Worker                x.sin().sum().backward()
*da0073e9SAndroid Build Coastguard Worker            return weakref.ref(unpack)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with disable_gc():
*da0073e9SAndroid Build Coastguard Worker            unpack_hook_ref = scope()
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(unpack_hook_ref())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_will_engine_execute_node(self):
*da0073e9SAndroid Build Coastguard Worker        counter = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class MyFunction(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                return gO * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def get_grad_fn(t):
*da0073e9SAndroid Build Coastguard Worker            if t.requires_grad and t.grad_fn is None:
*da0073e9SAndroid Build Coastguard Worker                return t.clone().grad_fn.next_functions[0][0]
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                return t.grad_fn
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(2, 3, 4, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        a2 = torch.randn(2, 3, 4, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = a * a2
*da0073e9SAndroid Build Coastguard Worker        b2 = b.cos()
*da0073e9SAndroid Build Coastguard Worker        c = MyFunction.apply(b)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        should_execute = list(map(get_grad_fn, (a, b, c)))
*da0073e9SAndroid Build Coastguard Worker        should_not_execute = list(map(get_grad_fn, (a2, b2)))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn(x):
*da0073e9SAndroid Build Coastguard Worker            counter[0] += 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            for g in should_execute:
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(torch._C._will_engine_execute_node(g))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            for g in should_not_execute:
*da0073e9SAndroid Build Coastguard Worker                self.assertFalse(torch._C._will_engine_execute_node(g))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        b.register_hook(fn)
*da0073e9SAndroid Build Coastguard Worker        c.register_hook(fn)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # .backward(inputs=) is OK
*da0073e9SAndroid Build Coastguard Worker        out = c.sum()
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.backward(out, inputs=(a, b), retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(counter[0], 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # .backward() is OK
*da0073e9SAndroid Build Coastguard Worker        should_execute = list(map(get_grad_fn, (a, a2, b, c)))
*da0073e9SAndroid Build Coastguard Worker        should_not_execute = list(map(get_grad_fn, (b2,)))
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.backward(out, retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # .grad is NOT OK when leaf is passed (this is the current state, subject to change)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, "are currently running autograd.grad()"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.grad(out, (a,))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # .grad is OK when non-leaf is passed
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(1, 2, 3, requires_grad=True) * 2
*da0073e9SAndroid Build Coastguard Worker        b = a * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn(x):
*da0073e9SAndroid Build Coastguard Worker            # Check a non-leaf
*da0073e9SAndroid Build Coastguard Worker            counter[0] += 1
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch._C._will_engine_execute_node(b.grad_fn))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        b.register_hook(fn)
*da0073e9SAndroid Build Coastguard Worker        counter[0] = 0
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.grad(b.sum(), (a,))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(counter[0], 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Verify other errors are raised
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "during the backward pass"):
*da0073e9SAndroid Build Coastguard Worker            torch._C._will_engine_execute_node(out.grad_fn)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "expects an grad_fn"):
*da0073e9SAndroid Build Coastguard Worker            torch._C._will_engine_execute_node(out)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_custom_function_vmap_defaults(self):
*da0073e9SAndroid Build Coastguard Worker        class MySquare(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(x):
*da0073e9SAndroid Build Coastguard Worker                return x**2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def setup_context(ctx, inputs, output):
*da0073e9SAndroid Build Coastguard Worker                (x,) = inputs
*da0073e9SAndroid Build Coastguard Worker                ctx.save_for_backward(x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                (x,) = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                return gO * 2 * x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(MySquare.generate_vmap_rule)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(hasattr(MySquare, "vmap"))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_custom_function_setup_context_simple(self):
*da0073e9SAndroid Build Coastguard Worker        class MySquare(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(x):
*da0073e9SAndroid Build Coastguard Worker                return x**2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def setup_context(ctx, inputs, output):
*da0073e9SAndroid Build Coastguard Worker                (x,) = inputs
*da0073e9SAndroid Build Coastguard Worker                ctx.save_for_backward(x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                (x,) = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                return gO * 2 * x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn([], requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = MySquare.apply(x)
*da0073e9SAndroid Build Coastguard Worker        (gx,) = torch.autograd.grad(y, x)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(gx, 2 * x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_custom_function_setup_context_multi_output(self):
*da0073e9SAndroid Build Coastguard Worker        # Multiple outputs with some non-Tensor outputs.
*da0073e9SAndroid Build Coastguard Worker        class MySquare(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(x):
*da0073e9SAndroid Build Coastguard Worker                two_x = x.item() * 2
*da0073e9SAndroid Build Coastguard Worker                return x**2, two_x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def setup_context(ctx, inputs, output):
*da0073e9SAndroid Build Coastguard Worker                (x,) = inputs
*da0073e9SAndroid Build Coastguard Worker                _, two_x = output
*da0073e9SAndroid Build Coastguard Worker                ctx.two_x = two_x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            @once_differentiable
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, gO, _):
*da0073e9SAndroid Build Coastguard Worker                return gO * ctx.two_x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn([], requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y, _ = MySquare.apply(x)
*da0073e9SAndroid Build Coastguard Worker        (gx,) = torch.autograd.grad(y, x)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(gx, 2 * x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_custom_function_setup_context_multi_input(self):
*da0073e9SAndroid Build Coastguard Worker        class MyReshape(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(x, shape, scale_forward, scale_backward):
*da0073e9SAndroid Build Coastguard Worker                return x.reshape(shape) * scale_forward
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def setup_context(ctx, inputs, output):
*da0073e9SAndroid Build Coastguard Worker                x, shape, scale_forward, scale_backward = inputs
*da0073e9SAndroid Build Coastguard Worker                ctx.scale_backward = scale_backward
*da0073e9SAndroid Build Coastguard Worker                ctx.x_shape = x.shape
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                return gO.reshape(ctx.x_shape) * ctx.scale_backward, None, None, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class MyReshapeRef(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x, shape, scale_forward, scale_backward):
*da0073e9SAndroid Build Coastguard Worker                ctx.scale_backward = scale_backward
*da0073e9SAndroid Build Coastguard Worker                ctx.x_shape = x.shape
*da0073e9SAndroid Build Coastguard Worker                return x.reshape(shape) * scale_forward
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                return gO.reshape(ctx.x_shape) * ctx.scale_backward, None, None, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def test(x, shape, scale_forward, scale_backward):
*da0073e9SAndroid Build Coastguard Worker            y = MyReshape.apply(x, shape, scale_forward, scale_backward).sum()
*da0073e9SAndroid Build Coastguard Worker            (gx,) = torch.autograd.grad(y, x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            y_expected = MyReshapeRef.apply(
*da0073e9SAndroid Build Coastguard Worker                x, shape, scale_forward, scale_backward
*da0073e9SAndroid Build Coastguard Worker            ).sum()
*da0073e9SAndroid Build Coastguard Worker            (gx_expected,) = torch.autograd.grad(y_expected, x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(y_expected, y)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(gx_expected, gx)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        test(torch.randn(24, requires_grad=True), (3, 8), 7, 11)
*da0073e9SAndroid Build Coastguard Worker        test(torch.randn(2, 3, 4, requires_grad=True), (6, 4), -1, 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_multiple_insert_removal_caching(self):
*da0073e9SAndroid Build Coastguard Worker        torch._C._set_cached_tensors_enabled(True)
*da0073e9SAndroid Build Coastguard Worker        try:
*da0073e9SAndroid Build Coastguard Worker            x = torch.rand([4])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            torch._C._add_cached_tensor(x)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch._C._is_cached_tensor(x))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            torch._C._add_cached_tensor(x)
*da0073e9SAndroid Build Coastguard Worker            torch._C._remove_cached_tensor(x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(torch._C._is_cached_tensor(x))
*da0073e9SAndroid Build Coastguard Worker        finally:
*da0073e9SAndroid Build Coastguard Worker            torch._C._set_cached_tensors_enabled(False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_accumulate_grad(self):
*da0073e9SAndroid Build Coastguard Worker        grad_output = torch.ones(5, 5)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def compute_grad(create_graph):
*da0073e9SAndroid Build Coastguard Worker            x = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            y = x + 2
*da0073e9SAndroid Build Coastguard Worker            y.backward(grad_output, retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker            x_grad = x.grad
*da0073e9SAndroid Build Coastguard Worker            x_grad_clone = x.grad.clone()
*da0073e9SAndroid Build Coastguard Worker            y.backward(grad_output, create_graph=create_graph)
*da0073e9SAndroid Build Coastguard Worker            return x_grad, x_grad_clone
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Accumulate in-place when create_graph is False
*da0073e9SAndroid Build Coastguard Worker        x_grad, x_grad_clone = compute_grad(create_graph=False)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x_grad, x_grad_clone * 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Accumulate out-of-place when create_graph is False
*da0073e9SAndroid Build Coastguard Worker        x_grad, x_grad_clone = compute_grad(create_graph=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x_grad, x_grad_clone)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_accumulate_grad_tensor_reference(self):
*da0073e9SAndroid Build Coastguard Worker        def _test_grad_tensor(
*da0073e9SAndroid Build Coastguard Worker            params_grad_tensor,
*da0073e9SAndroid Build Coastguard Worker            backward_grad_tensor,
*da0073e9SAndroid Build Coastguard Worker            should_preserve_reference,
*da0073e9SAndroid Build Coastguard Worker            create_graph,
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            params = torch.tensor([1.5, 1.5]).requires_grad_()
*da0073e9SAndroid Build Coastguard Worker            params.grad = params_grad_tensor
*da0073e9SAndroid Build Coastguard Worker            grad_saved = params.grad
*da0073e9SAndroid Build Coastguard Worker            params.backward(backward_grad_tensor, create_graph=create_graph)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker                id(grad_saved) == id(params.grad), should_preserve_reference
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for create_graph in (False, True):
*da0073e9SAndroid Build Coastguard Worker            # Accumulate dense gradient to sparse gradient will change the `params.grad` reference
*da0073e9SAndroid Build Coastguard Worker            _test_grad_tensor(
*da0073e9SAndroid Build Coastguard Worker                torch.sparse_coo_tensor(
*da0073e9SAndroid Build Coastguard Worker                    torch.tensor([[1, 1]]).long(), torch.tensor([1.0, 1.0])
*da0073e9SAndroid Build Coastguard Worker                ),
*da0073e9SAndroid Build Coastguard Worker                torch.tensor([1.5, 1.5]),
*da0073e9SAndroid Build Coastguard Worker                False,  # never accumulates in-place
*da0073e9SAndroid Build Coastguard Worker                create_graph,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Accumulate dense gradient to dense gradient will preserve the `params.grad` reference,
*da0073e9SAndroid Build Coastguard Worker            # but only if create_graph=False.
*da0073e9SAndroid Build Coastguard Worker            _test_grad_tensor(
*da0073e9SAndroid Build Coastguard Worker                torch.tensor([1.5, 1.5]),
*da0073e9SAndroid Build Coastguard Worker                torch.tensor([1.5, 1.5]),
*da0073e9SAndroid Build Coastguard Worker                not create_graph,
*da0073e9SAndroid Build Coastguard Worker                create_graph,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Accumulate sparse gradient to sparse gradient will preserve the `params.grad` reference,
*da0073e9SAndroid Build Coastguard Worker            # but only if create_graph=False.
*da0073e9SAndroid Build Coastguard Worker            _test_grad_tensor(
*da0073e9SAndroid Build Coastguard Worker                torch.sparse_coo_tensor(
*da0073e9SAndroid Build Coastguard Worker                    torch.tensor([[1, 1]]).long(), torch.tensor([1.0, 1.0])
*da0073e9SAndroid Build Coastguard Worker                ),
*da0073e9SAndroid Build Coastguard Worker                torch.sparse_coo_tensor(
*da0073e9SAndroid Build Coastguard Worker                    torch.tensor([[1, 1]]).long(), torch.tensor([1.0, 1.0])
*da0073e9SAndroid Build Coastguard Worker                ),
*da0073e9SAndroid Build Coastguard Worker                not create_graph,
*da0073e9SAndroid Build Coastguard Worker                create_graph,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_accumulate_grad_with_zero_numel_grad(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.rand(4, 0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = torch.rand(4, 1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        c = a + b
*da0073e9SAndroid Build Coastguard Worker        assert c.shape == (4, 0)
*da0073e9SAndroid Build Coastguard Worker        c.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(b.grad, torch.zeros(4, 1))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a.grad, torch.zeros(4, 0))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_hessian_vector(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        z = x**2 + y * x + y**2
*da0073e9SAndroid Build Coastguard Worker        z.backward(torch.ones(2, 2), create_graph=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            x_grad = 2 * x + y
*da0073e9SAndroid Build Coastguard Worker            y_grad = x + 2 * y
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, x_grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y.grad, y_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        grad_sum = 2 * x.grad + y.grad
*da0073e9SAndroid Build Coastguard Worker        grad_sum.backward(torch.ones(2, 2))
*da0073e9SAndroid Build Coastguard Worker        x_hv = torch.ones(2, 2) * 5
*da0073e9SAndroid Build Coastguard Worker        y_hv = torch.ones(2, 2) * 4
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, x_grad + x_hv)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y.grad, y_grad + y_hv)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_grad(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        z = x**2 + y * x + y**2
*da0073e9SAndroid Build Coastguard Worker        z.backward(torch.ones(2, 2), create_graph=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x_grad = 2 * x + y
*da0073e9SAndroid Build Coastguard Worker        y_grad = x + 2 * y
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, x_grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y.grad, y_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        grad_sum = 2 * x.grad + y.grad
*da0073e9SAndroid Build Coastguard Worker        x_hv = torch.autograd.grad(
*da0073e9SAndroid Build Coastguard Worker            outputs=[grad_sum],
*da0073e9SAndroid Build Coastguard Worker            grad_outputs=[torch.ones(2, 2)],
*da0073e9SAndroid Build Coastguard Worker            inputs=[x],
*da0073e9SAndroid Build Coastguard Worker            create_graph=True,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        expected_x_hv = torch.ones(2, 2) * 5
*da0073e9SAndroid Build Coastguard Worker        expected_y_hv = torch.ones(2, 2) * 4
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x_hv[0], expected_x_hv)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, x_grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y.grad, y_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Test that grad_outputs and outputs have the same shape
*da0073e9SAndroid Build Coastguard Worker        grad_out = torch.ones(2)
*da0073e9SAndroid Build Coastguard Worker        try:
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.grad(
*da0073e9SAndroid Build Coastguard Worker                outputs=[grad_sum],
*da0073e9SAndroid Build Coastguard Worker                grad_outputs=[grad_out],
*da0073e9SAndroid Build Coastguard Worker                inputs=[x],
*da0073e9SAndroid Build Coastguard Worker                create_graph=True,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            self.assertFail()
*da0073e9SAndroid Build Coastguard Worker        except RuntimeError as error:
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker                str(error),
*da0073e9SAndroid Build Coastguard Worker                "Mismatch in shape: grad_output[0] has a shape of "
*da0073e9SAndroid Build Coastguard Worker                + str(grad_out.shape)
*da0073e9SAndroid Build Coastguard Worker                + " and output[0] has a shape of "
*da0073e9SAndroid Build Coastguard Worker                + str(grad_sum.shape)
*da0073e9SAndroid Build Coastguard Worker                + ".",
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_grad_to_node(self):
*da0073e9SAndroid Build Coastguard Worker        def check_matches(out, inp):
*da0073e9SAndroid Build Coastguard Worker            ref = torch.autograd.grad(out.sum(), inp)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            edge = torch.autograd.graph.get_gradient_edge(inp)
*da0073e9SAndroid Build Coastguard Worker            new = torch.autograd.grad(out.sum(), edge)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(ref, new)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # We need to ensure that our main types of Node work (regular cpp Nodes,
*da0073e9SAndroid Build Coastguard Worker        # AccumulateGrad Nodes and custom Function)
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out = x.clone()
*da0073e9SAndroid Build Coastguard Worker        check_matches(out, x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = x.clone()
*da0073e9SAndroid Build Coastguard Worker        out = x.clone()
*da0073e9SAndroid Build Coastguard Worker        check_matches(out, x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.autograd._functions.Resize.apply(x, (2,))
*da0073e9SAndroid Build Coastguard Worker        out = x.clone()
*da0073e9SAndroid Build Coastguard Worker        check_matches(out, x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.var_mean(x)[1]
*da0073e9SAndroid Build Coastguard Worker        out = x.clone()
*da0073e9SAndroid Build Coastguard Worker        check_matches(out, x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_grad_to_node_set(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        x_edge = torch.autograd.graph.get_gradient_edge(x)
*da0073e9SAndroid Build Coastguard Worker        out = x.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            x.set_(torch.rand_like(x))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "to not have been used in the graph"):
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.grad(out.sum(), x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Works
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.grad(out.sum(), x_edge)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_grad_to_node_inplace(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(2, requires_grad=True).clone()
*da0073e9SAndroid Build Coastguard Worker        x_edge = torch.autograd.graph.get_gradient_edge(x)
*da0073e9SAndroid Build Coastguard Worker        x *= 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        g_old, g_new = torch.autograd.grad(x.sum(), (x_edge, x))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(g_old, 2 * torch.ones_like(x))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(g_new, torch.ones_like(x))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_grad_to_node_multi(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(2, requires_grad=True).clone()
*da0073e9SAndroid Build Coastguard Worker        y = torch.rand(2, requires_grad=True).clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = x + y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        ref = torch.autograd.grad(out.sum(), (x, y))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        inp_edges = (
*da0073e9SAndroid Build Coastguard Worker            GradientEdge(x.grad_fn, x.output_nr),
*da0073e9SAndroid Build Coastguard Worker            GradientEdge(y.grad_fn, y.output_nr),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        new = torch.autograd.grad(out.sum(), inp_edges)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(ref, new)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_grad_to_node_materialize(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(2, requires_grad=True).clone()
*da0073e9SAndroid Build Coastguard Worker        edge_x = GradientEdge(x.grad_fn, x.output_nr)
*da0073e9SAndroid Build Coastguard Worker        y = torch.rand(2, requires_grad=True).clone()
*da0073e9SAndroid Build Coastguard Worker        edge_y = GradientEdge(y.grad_fn, y.output_nr)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = x.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Works
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.grad(
*da0073e9SAndroid Build Coastguard Worker            out.sum(), (edge_x, y), allow_unused=True, materialize_grads=True
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.grad(
*da0073e9SAndroid Build Coastguard Worker            out.sum(), (x, y), allow_unused=True, materialize_grads=True
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.grad(out.sum(), (x, edge_y), allow_unused=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError,
*da0073e9SAndroid Build Coastguard Worker            "materialize_grads cannot be used when the given input is a GradientEdge",
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.grad(
*da0073e9SAndroid Build Coastguard Worker                out.sum(), (x, edge_y), allow_unused=True, materialize_grads=True
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_backward_to_node(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(2, requires_grad=True).clone()
*da0073e9SAndroid Build Coastguard Worker        edge_x = GradientEdge(x.grad_fn, x.output_nr)
*da0073e9SAndroid Build Coastguard Worker        y = torch.rand(2, requires_grad=True).clone()
*da0073e9SAndroid Build Coastguard Worker        edge_y = GradientEdge(y.grad_fn, y.output_nr)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = x.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # All should work in this case
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.backward(out.sum(), inputs=(edge_x, y))
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.backward(out.sum(), inputs=(x, y))
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.backward(out.sum(), inputs=(x, edge_y))
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.backward(out.sum(), inputs=(edge_x, edge_y))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_grad_fn_input_metadata(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(2, requires_grad=True, dtype=torch.float32)
*da0073e9SAndroid Build Coastguard Worker        y = torch.rand(2, requires_grad=True, dtype=torch.float32)
*da0073e9SAndroid Build Coastguard Worker        z = x * y
*da0073e9SAndroid Build Coastguard Worker        z_metadata = z.grad_fn._input_metadata[0]
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(z_metadata.shape, (2,))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(z_metadata.dtype, torch.float32)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Multiple outputs
*da0073e9SAndroid Build Coastguard Worker        b = torch.rand(3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        var, _ = torch.var_mean(b, dim=0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        metadata_0 = var.grad_fn._input_metadata[0]
*da0073e9SAndroid Build Coastguard Worker        metadata_1 = var.grad_fn._input_metadata[1]
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(metadata_0.shape, (3,))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(metadata_1.shape, (3,))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Preserves symints
*da0073e9SAndroid Build Coastguard Worker        nt = torch.nested.nested_tensor(
*da0073e9SAndroid Build Coastguard Worker            [torch.randn(3, 2), torch.randn(2, 2)],
*da0073e9SAndroid Build Coastguard Worker            layout=torch.jagged,
*da0073e9SAndroid Build Coastguard Worker            requires_grad=True,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        nt_metadata = nt.clone().grad_fn._input_metadata[0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(nt_metadata.shape[1], torch.SymInt)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(nt_metadata.shape, nt.shape)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(nt_metadata.is_nested_tensor)
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(nt_metadata.is_cpp_nested_tensor)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(nt_metadata.dtype, nt.dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class Test(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_output):
*da0073e9SAndroid Build Coastguard Worker                return grad_output
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        x = Test.apply(x)
*da0073e9SAndroid Build Coastguard Worker        metadata = x.grad_fn._input_metadata[0]
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(metadata.shape, (3, 3))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_gradient_edge_output(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.tensor([1.0, 2.0], requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn(x, reduce=True):
*da0073e9SAndroid Build Coastguard Worker            tmp = x.sin().cos()
*da0073e9SAndroid Build Coastguard Worker            if reduce:
*da0073e9SAndroid Build Coastguard Worker                tmp = tmp.sum()
*da0073e9SAndroid Build Coastguard Worker            out = tmp.exp().clone().sin().sum()
*da0073e9SAndroid Build Coastguard Worker            tmp_edge = torch.autograd.graph.get_gradient_edge(tmp)
*da0073e9SAndroid Build Coastguard Worker            return out, tmp_edge
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Compute fn backward in two steps
*da0073e9SAndroid Build Coastguard Worker        out, tmp_edge = fn(x)
*da0073e9SAndroid Build Coastguard Worker        (tmp_grad,) = torch.autograd.grad(out, (tmp_edge,))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        (x_grad,) = torch.autograd.grad(tmp_edge, (x,), grad_outputs=(tmp_grad,))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Compare with as if we did it in one go.
*da0073e9SAndroid Build Coastguard Worker        out, _ = fn(x)
*da0073e9SAndroid Build Coastguard Worker        (x_grad_ref,) = torch.autograd.grad(out, (x,))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x_grad, x_grad_ref)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Incorrect case: grad_outputs not passed/implicitly None and output is
*da0073e9SAndroid Build Coastguard Worker        # not a scalar
*da0073e9SAndroid Build Coastguard Worker        out, tmp_edge = fn(x, reduce=False)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, "grad can be implicitly created only for scalar output"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.grad(tmp_edge, (x,))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # grad_outputs is None, and output is a scalar is fine
*da0073e9SAndroid Build Coastguard Worker        out, tmp_edge = fn(x, reduce=True)
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.grad(tmp_edge, (x,))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Incorrect case: grad_outputs wrong size
*da0073e9SAndroid Build Coastguard Worker        out, tmp_edge = fn(x)
*da0073e9SAndroid Build Coastguard Worker        (tmp_grad,) = torch.autograd.grad(out, (tmp_edge,))
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "Mismatch in shape"):
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.grad(
*da0073e9SAndroid Build Coastguard Worker                tmp_edge, (x,), grad_outputs=torch.tensor([1.0, 2.0, 3.0, 4.0])
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Incorrect case: wrong dtype
*da0073e9SAndroid Build Coastguard Worker        out, tmp_edge = fn(x)
*da0073e9SAndroid Build Coastguard Worker        (tmp_grad,) = torch.autograd.grad(out, (tmp_edge,))
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "required to have the same dtype"):
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.grad(
*da0073e9SAndroid Build Coastguard Worker                tmp_edge,
*da0073e9SAndroid Build Coastguard Worker                (x,),
*da0073e9SAndroid Build Coastguard Worker                grad_outputs=torch.rand_like(tmp_grad, dtype=torch.complex64),
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_grad_nonleaf(self):
*da0073e9SAndroid Build Coastguard Worker        x_init = torch.randn(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        x = x_init
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        grad_output = torch.ones(2, 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn(x):
*da0073e9SAndroid Build Coastguard Worker            return x**2 + y * x + y**2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for _ in range(5):
*da0073e9SAndroid Build Coastguard Worker            (grad_x,) = torch.autograd.grad(
*da0073e9SAndroid Build Coastguard Worker                fn(x), x, grad_outputs=grad_output, create_graph=True
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            grad_x_expected = 2 * x + y
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(y.grad)
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(x.grad)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(grad_x, grad_x_expected)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            x = x + 0.05 * grad_x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        val_init = fn(x_init).sum()
*da0073e9SAndroid Build Coastguard Worker        val_final = fn(x).sum()
*da0073e9SAndroid Build Coastguard Worker        self.assertGreater(val_final, val_init)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x.backward(grad_output)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNotNone(y.grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNotNone(x_init.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_grad_nonleaf_many_outputs(self):
*da0073e9SAndroid Build Coastguard Worker        # This checks an edge case for function callbacks
*da0073e9SAndroid Build Coastguard Worker        # We want to capture two grads of a function, but can only
*da0073e9SAndroid Build Coastguard Worker        # register a single callback.
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(4, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        a, b = x.chunk(2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def hook(*grads):
*da0073e9SAndroid Build Coastguard Worker            hook_called[0] = True
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        hook_called = [False]
*da0073e9SAndroid Build Coastguard Worker        x.register_hook(hook)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        go = torch.randn(2, 2)
*da0073e9SAndroid Build Coastguard Worker        grad_a, grad_b = torch.autograd.grad(
*da0073e9SAndroid Build Coastguard Worker            (a + 2 * b), [a, b], grad_outputs=go, create_graph=True
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(grad_a, go)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(grad_b, go * 2)
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(hook_called[0])
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(x.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_grad_nonleaf_register_hook(self):
*da0073e9SAndroid Build Coastguard Worker        # This checks an edge case for register_hook.
*da0073e9SAndroid Build Coastguard Worker        # We want to capture grad of a nonleaf tensor,
*da0073e9SAndroid Build Coastguard Worker        # but avoid segfault during backward of other nonleaf tensors
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        x_list = x.unbind()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x0 = x_list[0]
*da0073e9SAndroid Build Coastguard Worker        hook_results = [None]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def hook(grad):
*da0073e9SAndroid Build Coastguard Worker            hook_results[0] = grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x0.register_hook(hook)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x_list[0].backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(hook_results[0], torch.tensor(1.0))
*da0073e9SAndroid Build Coastguard Worker        expected_grad = torch.tensor([1.0, 0, 0, 0, 0])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, expected_grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(x_list[0].grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for i in range(1, 5, 1):
*da0073e9SAndroid Build Coastguard Worker            x_list[i].backward()
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(hook_results[0], None)
*da0073e9SAndroid Build Coastguard Worker            expected_grad[i] = 1.0
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(x.grad, expected_grad)
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(x_list[i].grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_grad_materialize_grads(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.tensor(0.5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = x * a
*da0073e9SAndroid Build Coastguard Worker        dydx = torch.autograd.grad(y, x, create_graph=True)
*da0073e9SAndroid Build Coastguard Worker        d2ydx2_none = torch.autograd.grad(dydx, x, create_graph=True, allow_unused=True)
*da0073e9SAndroid Build Coastguard Worker        d2ydx2 = torch.autograd.grad(
*da0073e9SAndroid Build Coastguard Worker            dydx, x, create_graph=True, allow_unused=True, materialize_grads=True
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        # `allow_unused` set to True implicitly
*da0073e9SAndroid Build Coastguard Worker        d3ydx3 = torch.autograd.grad(d2ydx2, x, materialize_grads=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(d2ydx2_none[0])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(d2ydx2[0].item(), 0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(d3ydx3[0].item(), 0)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            ValueError, "Expected allow_unused to be True or not passed when"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.grad(y, x, allow_unused=False, materialize_grads=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_post_accumulate_grad_hook_on_non_leaf(self):
*da0073e9SAndroid Build Coastguard Worker        def hook(tensor):
*da0073e9SAndroid Build Coastguard Worker            tensor.sub_(1.0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        leaf = torch.rand(3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        non_leaf = 2.0 * leaf
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError,
*da0073e9SAndroid Build Coastguard Worker            "post accumulate grad hooks cannot be registered on non-leaf tensors",
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            non_leaf.register_post_accumulate_grad_hook(hook)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_post_accumulate_grad_hook_multiple_hooks(self):
*da0073e9SAndroid Build Coastguard Worker        def hook1(tensor):
*da0073e9SAndroid Build Coastguard Worker            tensor.sub_(tensor.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def hook2(tensor):
*da0073e9SAndroid Build Coastguard Worker            tensor.mul_(4.0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        tensor = torch.rand(3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        tensor_ref = tensor.clone().detach()
*da0073e9SAndroid Build Coastguard Worker        tensor.register_post_accumulate_grad_hook(hook1)
*da0073e9SAndroid Build Coastguard Worker        tensor.register_post_accumulate_grad_hook(hook2)
*da0073e9SAndroid Build Coastguard Worker        sum = tensor.sum()
*da0073e9SAndroid Build Coastguard Worker        sum.backward()
*da0073e9SAndroid Build Coastguard Worker        # both hooks should be called, in order
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(4.0 * (tensor_ref - 1.0), tensor)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_post_accumulate_grad_hook_multiple_tensors(self):
*da0073e9SAndroid Build Coastguard Worker        def hook(tensor):
*da0073e9SAndroid Build Coastguard Worker            tensor.sub_(tensor.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        tensor1 = torch.rand(3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        tensor1_ref = tensor1.clone().detach()
*da0073e9SAndroid Build Coastguard Worker        tensor2 = torch.rand(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        tensor2_ref = tensor2.clone().detach()
*da0073e9SAndroid Build Coastguard Worker        tensor1.register_post_accumulate_grad_hook(hook)
*da0073e9SAndroid Build Coastguard Worker        tensor2.register_post_accumulate_grad_hook(hook)
*da0073e9SAndroid Build Coastguard Worker        tensor1.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        tensor2.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        # both tensors should have been modified
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(tensor1_ref - 1.0, tensor1)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(tensor2_ref - 1.0, tensor2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_post_accumulate_grad_hook_returns_not_None(self):
*da0073e9SAndroid Build Coastguard Worker        def bad_hook(tensor):
*da0073e9SAndroid Build Coastguard Worker            return tensor.grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        tensor = torch.rand(2, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        tensor.register_post_accumulate_grad_hook(bad_hook)
*da0073e9SAndroid Build Coastguard Worker        # should error!
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "hooks should return None."):
*da0073e9SAndroid Build Coastguard Worker            tensor.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_post_accumulate_grad_hook_e2e(self):
*da0073e9SAndroid Build Coastguard Worker        def setup_optim_in_bwd(model):
*da0073e9SAndroid Build Coastguard Worker            optims = {}
*da0073e9SAndroid Build Coastguard Worker            handles = []
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def optim_step_hook(param):
*da0073e9SAndroid Build Coastguard Worker                optims[param].step()
*da0073e9SAndroid Build Coastguard Worker                optims[param].zero_grad()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            for p in model.parameters():
*da0073e9SAndroid Build Coastguard Worker                optims[p] = torch.optim.Adam([p])
*da0073e9SAndroid Build Coastguard Worker                handles.append(p.register_post_accumulate_grad_hook(optim_step_hook))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            return handles
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        model = torch.nn.Linear(3, 2)
*da0073e9SAndroid Build Coastguard Worker        input = torch.rand(2, 3)
*da0073e9SAndroid Build Coastguard Worker        handles = setup_optim_in_bwd(model)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # make a copy for reference
*da0073e9SAndroid Build Coastguard Worker        model_copy = deepcopy(model)
*da0073e9SAndroid Build Coastguard Worker        optim_copy = torch.optim.Adam(model_copy.parameters())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        iters = 5
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for _ in range(iters):
*da0073e9SAndroid Build Coastguard Worker            loss = model(input).sum()
*da0073e9SAndroid Build Coastguard Worker            loss.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            loss_copy = model_copy(input).sum()
*da0073e9SAndroid Build Coastguard Worker            loss_copy.backward()
*da0073e9SAndroid Build Coastguard Worker            optim_copy.step()
*da0073e9SAndroid Build Coastguard Worker            optim_copy.zero_grad()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        params_copy = []  # freeze a copy of the params to compare later
*da0073e9SAndroid Build Coastguard Worker        for p_reference, p in zip(model_copy.parameters(), model.parameters()):
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(p_reference, p)
*da0073e9SAndroid Build Coastguard Worker            params_copy.append(p_reference.clone().detach())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # After removing the handle, the model should no longer update.
*da0073e9SAndroid Build Coastguard Worker        for h in handles:
*da0073e9SAndroid Build Coastguard Worker            h.remove()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for _ in range(iters):
*da0073e9SAndroid Build Coastguard Worker            loss = model(input).sum()
*da0073e9SAndroid Build Coastguard Worker            loss.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            loss_copy = model_copy(input).sum()
*da0073e9SAndroid Build Coastguard Worker            loss_copy.backward()
*da0073e9SAndroid Build Coastguard Worker            optim_copy.step()
*da0073e9SAndroid Build Coastguard Worker            optim_copy.zero_grad()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for p_static, p_reference, p in zip(
*da0073e9SAndroid Build Coastguard Worker            params_copy, model_copy.parameters(), model.parameters()
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(p_static, p)
*da0073e9SAndroid Build Coastguard Worker            self.assertNotEqual(p_reference, p)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_post_accumulate_grad_hook_gets_cleaned_up(self):
*da0073e9SAndroid Build Coastguard Worker        def fun_stuff_with_hook():
*da0073e9SAndroid Build Coastguard Worker            thing_to_put_in_hook = torch.rand(3)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def hook(tensor):
*da0073e9SAndroid Build Coastguard Worker                tensor.sub_(tensor.grad)
*da0073e9SAndroid Build Coastguard Worker                tensor.add_(thing_to_put_in_hook)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            tensor = torch.rand(3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            tensor.register_post_accumulate_grad_hook(hook)
*da0073e9SAndroid Build Coastguard Worker            tensor.sum().backward()
*da0073e9SAndroid Build Coastguard Worker            ref = weakref.ref(thing_to_put_in_hook)
*da0073e9SAndroid Build Coastguard Worker            gc.collect()
*da0073e9SAndroid Build Coastguard Worker            return tensor, ref
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with disable_gc():
*da0073e9SAndroid Build Coastguard Worker            tensor, ref = fun_stuff_with_hook()
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNotNone(
*da0073e9SAndroid Build Coastguard Worker                ref()
*da0073e9SAndroid Build Coastguard Worker            )  # thing_to_put_in_hook should be kept alive by tensor
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            del tensor
*da0073e9SAndroid Build Coastguard Worker            gc.collect()
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(ref())  # thing_to_put_in_hook should be cleaned
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_post_accumulate_grad_hook_ordering(self):
*da0073e9SAndroid Build Coastguard Worker        tensor = torch.rand(3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def pre_hook(grad):
*da0073e9SAndroid Build Coastguard Worker            return grad.sub(2.0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def acc_grad_node_pre_hook(grad_out):
*da0073e9SAndroid Build Coastguard Worker            return (grad_out[0].div(5.0),)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def post_acc_grad_hook(tensor):
*da0073e9SAndroid Build Coastguard Worker            tensor.grad.add_(0.5)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def acc_grad_node_post_hook(grad_in, grad_out):
*da0073e9SAndroid Build Coastguard Worker            tensor.grad = grad_out[0].mul(10)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        acc_grad = tensor.view_as(tensor).grad_fn.next_functions[0][0]
*da0073e9SAndroid Build Coastguard Worker        tensor.register_hook(pre_hook)
*da0073e9SAndroid Build Coastguard Worker        acc_grad.register_prehook(acc_grad_node_pre_hook)
*da0073e9SAndroid Build Coastguard Worker        tensor.register_post_accumulate_grad_hook(post_acc_grad_hook)
*da0073e9SAndroid Build Coastguard Worker        acc_grad.register_hook(acc_grad_node_post_hook)
*da0073e9SAndroid Build Coastguard Worker        tensor.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # the hooks should run in the order of:
*da0073e9SAndroid Build Coastguard Worker        #   1. tensor prehook
*da0073e9SAndroid Build Coastguard Worker        #   2. acc_grad prehook
*da0073e9SAndroid Build Coastguard Worker        #   3. tensor post acc_grad hook
*da0073e9SAndroid Build Coastguard Worker        #   4. acc_grad posthook
*da0073e9SAndroid Build Coastguard Worker        # so that would be ((1 - 2) / 5 + 0.5) * 10 = 3
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(torch.tensor([3.0, 3.0, 3.0]), tensor.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_hook_with_no_name(self):
*da0073e9SAndroid Build Coastguard Worker        # Create a hook that do not have a __name__ attribute
*da0073e9SAndroid Build Coastguard Worker        class MyHookClass:
*da0073e9SAndroid Build Coastguard Worker            def __call__(self, grad):
*da0073e9SAndroid Build Coastguard Worker                return grad.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, requires_grad=True).clone()
*da0073e9SAndroid Build Coastguard Worker        x.register_hook(MyHookClass())
*da0073e9SAndroid Build Coastguard Worker        x.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        # Should run fine
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_prehook_ordering(self):
*da0073e9SAndroid Build Coastguard Worker        # Hooks registered to tensor are ordered before those
*da0073e9SAndroid Build Coastguard Worker        # that are registered to grad_fn
*da0073e9SAndroid Build Coastguard Worker        log = []
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def hook1(g):
*da0073e9SAndroid Build Coastguard Worker            log.append(1)
*da0073e9SAndroid Build Coastguard Worker            return g * 3
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def hook2(gs):
*da0073e9SAndroid Build Coastguard Worker            log.append(2)
*da0073e9SAndroid Build Coastguard Worker            return tuple(g * 2 for g in gs)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = a.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        b.grad_fn.register_prehook(hook2)
*da0073e9SAndroid Build Coastguard Worker        b.register_hook(hook1)
*da0073e9SAndroid Build Coastguard Worker        b.grad_fn.register_prehook(hook2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        acc = b.grad_fn.next_functions[0][0]
*da0073e9SAndroid Build Coastguard Worker        a.register_hook(hook1)
*da0073e9SAndroid Build Coastguard Worker        acc.register_prehook(hook2)
*da0073e9SAndroid Build Coastguard Worker        a.register_hook(hook1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        b.sum().backward(retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(log, [1, 2, 2, 1, 1, 2])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # grad also runs hooks on accumulate grad nodes, even though
*da0073e9SAndroid Build Coastguard Worker        # the accumulate grad nodes are not actually executed
*da0073e9SAndroid Build Coastguard Worker        log = []
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.grad(b.sum(), inputs=(a,), retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(log, [1, 2, 2, 1, 1])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        log = []
*da0073e9SAndroid Build Coastguard Worker        b.sum().backward(inputs=(b,))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(log, [1, 2, 2])
*da0073e9SAndroid Build Coastguard Worker        # retains_grad hooks would not observe modifications by all pre hooks
*da0073e9SAndroid Build Coastguard Worker        # because they are executed after
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(b.grad.item(), 3)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_retains_grad_can_always_observe_tensor_prehook(self):
*da0073e9SAndroid Build Coastguard Worker        def tensor_prehook(g):
*da0073e9SAndroid Build Coastguard Worker            return g * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = a.clone()
*da0073e9SAndroid Build Coastguard Worker        b.register_hook(tensor_prehook)
*da0073e9SAndroid Build Coastguard Worker        b.retain_grad()
*da0073e9SAndroid Build Coastguard Worker        b.register_hook(tensor_prehook)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        b.clone().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(b.grad.item(), 4)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = a.clone()
*da0073e9SAndroid Build Coastguard Worker        b.retain_grad()
*da0073e9SAndroid Build Coastguard Worker        b.register_hook(tensor_prehook)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        b.clone().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(b.grad.item(), 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_accumulate_grad_posthooks_can_observe_tensor_prehook(self):
*da0073e9SAndroid Build Coastguard Worker        # Post hooks on accumulate should be able to observe changes to
*da0073e9SAndroid Build Coastguard Worker        # grad made by tensor prehooks
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def tensor_prehook(g):
*da0073e9SAndroid Build Coastguard Worker            return g * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def posthook(gO, gI):
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.allclose(gI[0], a * 2))
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(len(gO), 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def prehook(gI):
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.allclose(gI[0], a * 2))
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(len(gI), 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        b = a.clone()
*da0073e9SAndroid Build Coastguard Worker        acc = b.grad_fn.next_functions[0][0]
*da0073e9SAndroid Build Coastguard Worker        acc.register_hook(posthook)
*da0073e9SAndroid Build Coastguard Worker        acc.register_prehook(prehook)
*da0073e9SAndroid Build Coastguard Worker        a.register_hook(tensor_prehook)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        b.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_accumulate_grad_posthooks_should_not_execute(self):
*da0073e9SAndroid Build Coastguard Worker        def tensor_prehook(g):
*da0073e9SAndroid Build Coastguard Worker            raise RuntimeError
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def posthook(gO, gI):
*da0073e9SAndroid Build Coastguard Worker            raise RuntimeError
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        a.register_hook(tensor_prehook)
*da0073e9SAndroid Build Coastguard Worker        b = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        c = a.clone()
*da0073e9SAndroid Build Coastguard Worker        acc = c.grad_fn.next_functions[0][0]
*da0073e9SAndroid Build Coastguard Worker        acc.register_hook(posthook)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = a + b + c
*da0073e9SAndroid Build Coastguard Worker        out.sum().backward(inputs=[b])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_hook_edge_case_when_called_with_grad(self):
*da0073e9SAndroid Build Coastguard Worker        # grad executes the tensor hooks of the next node but not
*da0073e9SAndroid Build Coastguard Worker        # grad_fn pre hooks or the post hooks
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = a * 2
*da0073e9SAndroid Build Coastguard Worker        c = b * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        tensor_hook_count = [0]
*da0073e9SAndroid Build Coastguard Worker        prehook_count = [0]
*da0073e9SAndroid Build Coastguard Worker        posthook_count = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def reset_counts():
*da0073e9SAndroid Build Coastguard Worker            nonlocal tensor_hook_count, prehook_count, posthook_count
*da0073e9SAndroid Build Coastguard Worker            tensor_hook_count = [0]
*da0073e9SAndroid Build Coastguard Worker            prehook_count = [0]
*da0073e9SAndroid Build Coastguard Worker            posthook_count = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def tensor_prehook(g):
*da0073e9SAndroid Build Coastguard Worker            tensor_hook_count[0] += 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def prehook(g):
*da0073e9SAndroid Build Coastguard Worker            prehook_count[0] += 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def posthook(gI, gO):
*da0073e9SAndroid Build Coastguard Worker            posthook_count[0] += 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a.register_hook(tensor_prehook)
*da0073e9SAndroid Build Coastguard Worker        b.register_hook(tensor_prehook)
*da0073e9SAndroid Build Coastguard Worker        acc = b.grad_fn.next_functions[0][0]
*da0073e9SAndroid Build Coastguard Worker        acc.register_hook(posthook)
*da0073e9SAndroid Build Coastguard Worker        acc.register_prehook(prehook)
*da0073e9SAndroid Build Coastguard Worker        b.grad_fn.register_hook(posthook)
*da0073e9SAndroid Build Coastguard Worker        b.grad_fn.register_prehook(prehook)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.grad(c, inputs=(b), retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(tensor_hook_count[0], 1)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(posthook_count[0], 0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(prehook_count[0], 0)
*da0073e9SAndroid Build Coastguard Worker        reset_counts()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.grad(c, inputs=(a, b), retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(tensor_hook_count[0], 2)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(posthook_count[0], 1)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(prehook_count[0], 1)
*da0073e9SAndroid Build Coastguard Worker        reset_counts()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        c.backward(retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(tensor_hook_count[0], 2)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(posthook_count[0], 2)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(prehook_count[0], 2)
*da0073e9SAndroid Build Coastguard Worker        reset_counts()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        c.backward(inputs=(a, b), retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(tensor_hook_count[0], 2)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(posthook_count[0], 2)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(prehook_count[0], 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_sharded_grad(self):
*da0073e9SAndroid Build Coastguard Worker        leaves = [torch.zeros(5, 5, requires_grad=True) for _ in range(10)]
*da0073e9SAndroid Build Coastguard Worker        intermediates = [l * i + l * l for i, l in enumerate(leaves)]
*da0073e9SAndroid Build Coastguard Worker        loss = sum(v * i for i, v in enumerate(intermediates)).sum()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # define a helper for dividing intermediates into groups
*da0073e9SAndroid Build Coastguard Worker        def group(l, group_size):
*da0073e9SAndroid Build Coastguard Worker            return (l[i : i + group_size] for i in range(0, len(l), group_size))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Compute the d loss / d intermediates in chunks of shard_size
*da0073e9SAndroid Build Coastguard Worker        shard_size = 2
*da0073e9SAndroid Build Coastguard Worker        d_intermediates = [
*da0073e9SAndroid Build Coastguard Worker            d_i
*da0073e9SAndroid Build Coastguard Worker            for intermediates_batch in group(intermediates, shard_size)
*da0073e9SAndroid Build Coastguard Worker            for d_i in torch.autograd.grad(loss, intermediates_batch)
*da0073e9SAndroid Build Coastguard Worker        ]
*da0073e9SAndroid Build Coastguard Worker        # Compute rest of backward pass
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.backward(intermediates, d_intermediates)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for i, l in enumerate(leaves):
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(l.grad, i * i * (1 + l))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_backward_badcalls(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(1)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "does not require grad"):
*da0073e9SAndroid Build Coastguard Worker            x.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_grad_badcalls(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(1)
*da0073e9SAndroid Build Coastguard Worker        y = x**2
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "does not require grad"):
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.grad(x, y)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "does not require grad"):
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.grad(y, x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = x**2
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.grad(y, x)  # this should succeed now
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_grad_empty_inputs(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.tensor([1.0], requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(ValueError, "grad requires non-empty inputs."):
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.grad(2 * x, [], grad_outputs=torch.tensor([1.0]))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_grad_fn_badcalls(self):
*da0073e9SAndroid Build Coastguard Worker        error_regex = "expected .* arguments, got .* instead"
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = x**2
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(TypeError, error_regex):
*da0073e9SAndroid Build Coastguard Worker            y.grad_fn(x.detach(), x.detach())  # too many
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(TypeError, error_regex):
*da0073e9SAndroid Build Coastguard Worker            y.grad_fn()  # too few
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        y.grad_fn(x.detach())  # this should succeed
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_grad_unreachable(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.ones(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        # Make sure x and y have grad accumulators allocated
*da0073e9SAndroid Build Coastguard Worker        z = x * 2
*da0073e9SAndroid Build Coastguard Worker        w = y * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        grad_x, grad_y = torch.autograd.grad(x * 2, [x, y], allow_unused=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(grad_x, x * 2)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(grad_y)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # This is slightly different than the case above, because z doesn't even
*da0073e9SAndroid Build Coastguard Worker        # have a grad accumulator allocated.
*da0073e9SAndroid Build Coastguard Worker        z = torch.ones(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        grad_x, grad_z = torch.autograd.grad(x * 2, [x, z], allow_unused=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(grad_x, x * 2)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(grad_z)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # allow_unused=False, but grads contains None inside, should throw
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "Set allow_unused=True"):
*da0073e9SAndroid Build Coastguard Worker            grad_x, grad_y = torch.autograd.grad(x * 2, [x, y], allow_unused=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_grad_unreachable_discovery(self):
*da0073e9SAndroid Build Coastguard Worker        # Test that certain nodes are not erroneously executed when an input
*da0073e9SAndroid Build Coastguard Worker        # is unreachable. See #39784
*da0073e9SAndroid Build Coastguard Worker        class MyFunc(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                self.fail("This node should not be executed!")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = MyFunc.apply(torch.randn(1, requires_grad=True) * 2)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        (gY,) = torch.autograd.grad(x, (y,), allow_unused=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(gY)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = MyFunc.apply(torch.randn(1, requires_grad=True) * 2)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        z = torch.randn(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        (gY, gZ) = torch.autograd.grad(x + z, (y, z), allow_unused=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(gY)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNotNone(gZ)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = MyFunc.apply(torch.randn(1, requires_grad=True) * 2)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.backward(x, inputs=(y,))  # allow_unused is implicitly True!
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(y.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_grad_batched_grad(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = x.clone()  # Size([2, 2])
*da0073e9SAndroid Build Coastguard Worker        batched_grad = (
*da0073e9SAndroid Build Coastguard Worker            torch.arange(3).expand(2, 2, 3).transpose(0, 2)
*da0073e9SAndroid Build Coastguard Worker        )  # Size([3, 2, 2])
*da0073e9SAndroid Build Coastguard Worker        (grad,) = torch.autograd.grad(out, (x,), (batched_grad,), is_grads_batched=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            grad, torch.arange(3).expand(2, 2, 3).transpose(0, 2).to(dtype=grad.dtype)
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Detect shape mismatch
*da0073e9SAndroid Build Coastguard Worker        grad_out = torch.ones(2, 2)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, "If `is_grads_batched=True`, we interpret the first"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.grad(
*da0073e9SAndroid Build Coastguard Worker                outputs=out,
*da0073e9SAndroid Build Coastguard Worker                grad_outputs=(grad_out,),
*da0073e9SAndroid Build Coastguard Worker                inputs=(x,),
*da0073e9SAndroid Build Coastguard Worker                is_grads_batched=True,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Scalar outputs
*da0073e9SAndroid Build Coastguard Worker        out = x.sum()  # Size([])
*da0073e9SAndroid Build Coastguard Worker        batched_grad = torch.arange(3)  # Size([3])
*da0073e9SAndroid Build Coastguard Worker        (grad,) = torch.autograd.grad(out, (x,), (batched_grad,), is_grads_batched=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            grad, torch.arange(3).expand(2, 2, 3).transpose(0, 2).to(dtype=grad.dtype)
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # We consider scalar and sized-1 to be a mismatch. This is consistent with current non-batched behavior.
*da0073e9SAndroid Build Coastguard Worker        grad_out = torch.ones(2).unsqueeze(1)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, "If `is_grads_batched=True`, we interpret the first"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.grad(
*da0073e9SAndroid Build Coastguard Worker                outputs=out,
*da0073e9SAndroid Build Coastguard Worker                grad_outputs=(grad_out,),
*da0073e9SAndroid Build Coastguard Worker                inputs=(x,),
*da0073e9SAndroid Build Coastguard Worker                is_grads_batched=True,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_hooks(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.ones(5, 5) * 4
*da0073e9SAndroid Build Coastguard Worker        y.requires_grad_(True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        counter = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def bw_hook(inc, grad):
*da0073e9SAndroid Build Coastguard Worker            self.assertIsInstance(grad, torch.Tensor)
*da0073e9SAndroid Build Coastguard Worker            counter[0] += inc
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        z = x**2 + x * 2 + x * y + y
*da0073e9SAndroid Build Coastguard Worker        x.register_hook(lambda *args: bw_hook(0, *args))
*da0073e9SAndroid Build Coastguard Worker        test = z.register_hook(lambda *args: bw_hook(1, *args))
*da0073e9SAndroid Build Coastguard Worker        z.backward(torch.ones(5, 5), retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(counter[0], 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        test2 = z.register_hook(lambda *args: bw_hook(2, *args))
*da0073e9SAndroid Build Coastguard Worker        z.backward(torch.ones(5, 5), retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(counter[0], 4)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        test2.remove()
*da0073e9SAndroid Build Coastguard Worker        z.backward(torch.ones(5, 5), retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(counter[0], 5)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def bw_hook_modify(grad):
*da0073e9SAndroid Build Coastguard Worker            return grad.mul(2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        test.remove()
*da0073e9SAndroid Build Coastguard Worker        z.register_hook(bw_hook_modify)
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            y.grad.zero_()
*da0073e9SAndroid Build Coastguard Worker        z.backward(torch.ones(5, 5), retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y.grad, (x + 1) * 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        y.register_hook(bw_hook_modify)
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            y.grad.zero_()
*da0073e9SAndroid Build Coastguard Worker        z.backward(torch.ones(5, 5))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y.grad, (x + 1) * 4)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _get_mul2(self, use_custom_function):
*da0073e9SAndroid Build Coastguard Worker        if use_custom_function:
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            class Mul2(Function):
*da0073e9SAndroid Build Coastguard Worker                @staticmethod
*da0073e9SAndroid Build Coastguard Worker                def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                    return x * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                @staticmethod
*da0073e9SAndroid Build Coastguard Worker                def backward(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                    return gO * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            return Mul2.apply
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            return lambda x: x * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_grad_fn_prehooks(self):
*da0073e9SAndroid Build Coastguard Worker        for use_custom_function in (True, False):
*da0073e9SAndroid Build Coastguard Worker            mul2 = self._get_mul2(use_custom_function)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            a = torch.tensor([1.0], requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            b = mul2(a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            post_counter = [0]
*da0073e9SAndroid Build Coastguard Worker            pre_counter = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def posthook(grad_input, grad_output):
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(pre_counter[0], 3)
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(torch.allclose(grad_output[0], torch.ones(1) * 8))
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(torch.allclose(grad_input[0], torch.ones(1) * 16))
*da0073e9SAndroid Build Coastguard Worker                post_counter[0] += 1
*da0073e9SAndroid Build Coastguard Worker                return grad_input
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def prehook(grad_output):
*da0073e9SAndroid Build Coastguard Worker                pre_counter[0] += 1
*da0073e9SAndroid Build Coastguard Worker                return (grad_output[0] * 2,)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # register posthook x 2
*da0073e9SAndroid Build Coastguard Worker            b.grad_fn.register_hook(posthook)
*da0073e9SAndroid Build Coastguard Worker            b.grad_fn.register_hook(posthook)
*da0073e9SAndroid Build Coastguard Worker            # register prehook x 3
*da0073e9SAndroid Build Coastguard Worker            b.grad_fn.register_prehook(prehook)
*da0073e9SAndroid Build Coastguard Worker            b.grad_fn.register_prehook(lambda x: None)
*da0073e9SAndroid Build Coastguard Worker            b.grad_fn.register_prehook(prehook)
*da0073e9SAndroid Build Coastguard Worker            b.grad_fn.register_prehook(prehook)
*da0073e9SAndroid Build Coastguard Worker            b.grad_fn.register_prehook(lambda x: x)
*da0073e9SAndroid Build Coastguard Worker            b.grad_fn.register_prehook(lambda x: None)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            b.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(post_counter[0], 2)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(pre_counter[0], 3)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Return None
*da0073e9SAndroid Build Coastguard Worker            a = torch.rand(3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            b = mul2(a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def prehook(grad_output):
*da0073e9SAndroid Build Coastguard Worker                pre_counter[0] += 1
*da0073e9SAndroid Build Coastguard Worker                return None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            b.grad_fn.register_prehook(prehook)
*da0073e9SAndroid Build Coastguard Worker            b.sum().backward()
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(pre_counter[0], 4)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.allclose(a.grad, torch.ones(3, 3) * 2))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_grad_fn_prehooks_multiple_outputs(self):
*da0073e9SAndroid Build Coastguard Worker        # Compute gradients without hooks
*da0073e9SAndroid Build Coastguard Worker        b = torch.rand(3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        var, mean = torch.var_mean(b, dim=0)
*da0073e9SAndroid Build Coastguard Worker        (var + mean).sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Compute gradients with hooks
*da0073e9SAndroid Build Coastguard Worker        a = b.detach().requires_grad_()
*da0073e9SAndroid Build Coastguard Worker        counter = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def prehook(grad_output):
*da0073e9SAndroid Build Coastguard Worker            gvar, gmean = grad_output
*da0073e9SAndroid Build Coastguard Worker            counter[0] += 1
*da0073e9SAndroid Build Coastguard Worker            return (gvar * 2, gmean * 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        var, mean = torch.var_mean(a, dim=0)
*da0073e9SAndroid Build Coastguard Worker        mean.grad_fn.register_prehook(prehook)
*da0073e9SAndroid Build Coastguard Worker        (var + mean).sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(counter[0], 1)
*da0073e9SAndroid Build Coastguard Worker        # Compare
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(torch.allclose(a.grad, b.grad * 2))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Test with custom Function
*da0073e9SAndroid Build Coastguard Worker        class DoubleMul2(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x, a, y):
*da0073e9SAndroid Build Coastguard Worker                ctx.a = a
*da0073e9SAndroid Build Coastguard Worker                return a * x * 2, a, a * y * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, g1, _a, g2):
*da0073e9SAndroid Build Coastguard Worker                return ctx.a * g1 * 2, None, ctx.a * g2 * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        counter = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def prehook(grad_output):
*da0073e9SAndroid Build Coastguard Worker            g1, ga, g2 = grad_output
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(ga)
*da0073e9SAndroid Build Coastguard Worker            counter[0] += 1
*da0073e9SAndroid Build Coastguard Worker            return (g1 * 2, None, g2 * 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = torch.randn(3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        k = 3
*da0073e9SAndroid Build Coastguard Worker        c, _, d = DoubleMul2.apply(a, k, b)
*da0073e9SAndroid Build Coastguard Worker        c.grad_fn.register_prehook(prehook)
*da0073e9SAndroid Build Coastguard Worker        (c + d).sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(counter[0], 1)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(torch.allclose(a.grad, torch.ones(1) * 4 * k))
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(torch.allclose(b.grad, torch.ones(1) * 4 * k))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_grad_fn_prehooks_remove_hooks(self):
*da0073e9SAndroid Build Coastguard Worker        for use_custom_function in (True, False):
*da0073e9SAndroid Build Coastguard Worker            mul2 = self._get_mul2(use_custom_function)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Simply remove hooks
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            a = torch.rand(3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            b = mul2(a)
*da0073e9SAndroid Build Coastguard Worker            counter = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def prehook(grad_output):
*da0073e9SAndroid Build Coastguard Worker                counter[0] += 1
*da0073e9SAndroid Build Coastguard Worker                return None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            handle = b.grad_fn.register_prehook(prehook)
*da0073e9SAndroid Build Coastguard Worker            b.grad_fn.register_prehook(prehook)
*da0073e9SAndroid Build Coastguard Worker            handle.remove()
*da0073e9SAndroid Build Coastguard Worker            b.sum().backward()
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.allclose(a.grad, torch.ones(3, 3) * 2))
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(counter[0], 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Remove hooks during backward
*da0073e9SAndroid Build Coastguard Worker            a = torch.rand(3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            b = mul2(a)
*da0073e9SAndroid Build Coastguard Worker            counter = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def prehook1(grad_output):
*da0073e9SAndroid Build Coastguard Worker                handle2.remove()
*da0073e9SAndroid Build Coastguard Worker                # Remove hook that is already removed is OK
*da0073e9SAndroid Build Coastguard Worker                handle3.remove()
*da0073e9SAndroid Build Coastguard Worker                return None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def prehook2(grad_output):
*da0073e9SAndroid Build Coastguard Worker                counter[0] += 1
*da0073e9SAndroid Build Coastguard Worker                return None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Hooks that registered first run first
*da0073e9SAndroid Build Coastguard Worker            b.grad_fn.register_prehook(prehook1)
*da0073e9SAndroid Build Coastguard Worker            handle2 = b.grad_fn.register_prehook(prehook2)
*da0073e9SAndroid Build Coastguard Worker            handle3 = b.grad_fn.register_prehook(prehook2)
*da0073e9SAndroid Build Coastguard Worker            handle3.remove()
*da0073e9SAndroid Build Coastguard Worker            b.sum().backward()
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.allclose(a.grad, torch.ones(3, 3) * 2))
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(counter[0], 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_node_post_hook_registered_during_unpack_hook(self):
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        Test that post hooks registered during one of the node's
*da0073e9SAndroid Build Coastguard Worker        unpack hooks are properly restricted and will run properly.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        test_case = self
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class RegisterPostNodeHook(torch.autograd.graph.saved_tensors_hooks):
*da0073e9SAndroid Build Coastguard Worker            def __init__(self) -> None:
*da0073e9SAndroid Build Coastguard Worker                def pack_tensor(tensor: torch.Tensor) -> torch.Tensor:
*da0073e9SAndroid Build Coastguard Worker                    return tensor
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                def unpack_tensor(tensor: torch.Tensor) -> torch.Tensor:
*da0073e9SAndroid Build Coastguard Worker                    node = torch._C._current_autograd_node()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    def hook(outputs, inputs):
*da0073e9SAndroid Build Coastguard Worker                        # Assert that inputs passed in are None
*da0073e9SAndroid Build Coastguard Worker                        test_case.assertTrue(all(i is None for i in inputs))
*da0073e9SAndroid Build Coastguard Worker                        halved_outputs = tuple(
*da0073e9SAndroid Build Coastguard Worker                            o / 2.0 if o is not None else None for o in outputs
*da0073e9SAndroid Build Coastguard Worker                        )
*da0073e9SAndroid Build Coastguard Worker                        return halved_outputs
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    node.register_hook(hook)
*da0073e9SAndroid Build Coastguard Worker                    return tensor
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                super().__init__(pack_tensor, unpack_tensor)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.rand(3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def model():
*da0073e9SAndroid Build Coastguard Worker            var, mean = torch.var_mean(a, dim=0)
*da0073e9SAndroid Build Coastguard Worker            loss = (var + mean).sum()
*da0073e9SAndroid Build Coastguard Worker            loss.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        model()
*da0073e9SAndroid Build Coastguard Worker        ref_grad = a.grad.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with RegisterPostNodeHook():
*da0073e9SAndroid Build Coastguard Worker            model()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Verify that the post hook got called and the grad propagation worked
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(ref_grad / 2.0 + ref_grad, a.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_hooks_cpp(self):
*da0073e9SAndroid Build Coastguard Worker        # Tests hooks for autograd function implemented in C++
*da0073e9SAndroid Build Coastguard Worker        bn = torch.nn.BatchNorm1d(5, affine=False)
*da0073e9SAndroid Build Coastguard Worker        bn.double()
*da0073e9SAndroid Build Coastguard Worker        bn.eval()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        counter = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def bw_hook(grad):
*da0073e9SAndroid Build Coastguard Worker            counter[0] += 1
*da0073e9SAndroid Build Coastguard Worker            return grad * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(5, 5, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        z = bn(x)
*da0073e9SAndroid Build Coastguard Worker        z.register_hook(bw_hook)
*da0073e9SAndroid Build Coastguard Worker        z.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(counter[0], 1, msg="bw_hook not called")
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            x.grad, torch.ones(5, 5, dtype=torch.double) * 2, atol=1e-5, rtol=0
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_hook_none(self):
*da0073e9SAndroid Build Coastguard Worker        # WARNING: this is a test for autograd internals.
*da0073e9SAndroid Build Coastguard Worker        # You should never have to use such things in your code.
*da0073e9SAndroid Build Coastguard Worker        class NoneGradientFunction(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x, y):
*da0073e9SAndroid Build Coastguard Worker                assert ctx.needs_input_grad[0]
*da0073e9SAndroid Build Coastguard Worker                assert not ctx.needs_input_grad[1]
*da0073e9SAndroid Build Coastguard Worker                return x, y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_x, grad_y):
*da0073e9SAndroid Build Coastguard Worker                return grad_x, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        was_called = [False]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def hook(grad):
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNotNone(grad)
*da0073e9SAndroid Build Coastguard Worker            was_called[0] = True
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(5, 5)
*da0073e9SAndroid Build Coastguard Worker        rx, ry = NoneGradientFunction.apply(x, y)
*da0073e9SAndroid Build Coastguard Worker        rx.register_hook(hook)
*da0073e9SAndroid Build Coastguard Worker        ry.register_hook(hook)
*da0073e9SAndroid Build Coastguard Worker        sum(rx, ry).sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(was_called[0])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_retain_grad(self):
*da0073e9SAndroid Build Coastguard Worker        input = torch.rand(1, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        h1 = input * 3
*da0073e9SAndroid Build Coastguard Worker        out = (h1 * h1).sum()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # It should be possible to call retain_grad() multiple times
*da0073e9SAndroid Build Coastguard Worker        h1.retain_grad()
*da0073e9SAndroid Build Coastguard Worker        h1.retain_grad()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Gradient should be accumulated
*da0073e9SAndroid Build Coastguard Worker        out.backward(retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(h1 * 2, h1.grad)
*da0073e9SAndroid Build Coastguard Worker        out.backward(retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(h1 * 4, h1.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            input.grad.zero_()
*da0073e9SAndroid Build Coastguard Worker        # It should be a no-op for leaves
*da0073e9SAndroid Build Coastguard Worker        input.retain_grad()
*da0073e9SAndroid Build Coastguard Worker        input.retain_grad()
*da0073e9SAndroid Build Coastguard Worker        out.backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(input * 18, input.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # NB: See test/cpp/api/autograd.cpp for more tests on the interaction between
*da0073e9SAndroid Build Coastguard Worker    #     retains_grad and hooks in cpp
*da0073e9SAndroid Build Coastguard Worker    def test_retain_grad_inplace(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor([1.0], requires_grad=True).clone()
*da0073e9SAndroid Build Coastguard Worker        a.retain_grad()
*da0073e9SAndroid Build Coastguard Worker        a.mul_(2)
*da0073e9SAndroid Build Coastguard Worker        a.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a.grad, torch.tensor([1.0]))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor([1.0], requires_grad=True).clone()
*da0073e9SAndroid Build Coastguard Worker        a.retain_grad()
*da0073e9SAndroid Build Coastguard Worker        # Inplace multiple times is OK
*da0073e9SAndroid Build Coastguard Worker        a.mul_(2)
*da0073e9SAndroid Build Coastguard Worker        a.mul_(2)
*da0073e9SAndroid Build Coastguard Worker        a.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a.grad, torch.tensor([1.0]))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # When in-place over view is done, the retains_grad hooks should be
*da0073e9SAndroid Build Coastguard Worker        # moved from base's original grad_fn to the copyslices node.
*da0073e9SAndroid Build Coastguard Worker        x = torch.tensor([1.0], requires_grad=True).clone()
*da0073e9SAndroid Build Coastguard Worker        x.retain_grad()
*da0073e9SAndroid Build Coastguard Worker        x_view = x[:]
*da0073e9SAndroid Build Coastguard Worker        x_view *= 2
*da0073e9SAndroid Build Coastguard Worker        x *= 2
*da0073e9SAndroid Build Coastguard Worker        x.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        # The grad is 1, not 4, because we are computing grad wrt the latest
*da0073e9SAndroid Build Coastguard Worker        # version of x.
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a.grad, torch.tensor([1.0]))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # If the base did not originally require grad, there should be no hook
*da0073e9SAndroid Build Coastguard Worker        # to move. Make sure this case runs without error.
*da0073e9SAndroid Build Coastguard Worker        x = torch.zeros(4)
*da0073e9SAndroid Build Coastguard Worker        y = x.view(2, 2)
*da0073e9SAndroid Build Coastguard Worker        y.add_(torch.randn(2, 2, requires_grad=True))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_retains_grad_inplace_multiple_outputs(self):
*da0073e9SAndroid Build Coastguard Worker        class DoubleMul(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x * 2, x * 3
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, g1, g2):
*da0073e9SAndroid Build Coastguard Worker                return g1 * 2 + g2 * 3
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        var_mean = partial(torch.var_mean, dim=0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for fn in (DoubleMul.apply, var_mean):
*da0073e9SAndroid Build Coastguard Worker            b = torch.rand(3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            var, mean = fn(b)
*da0073e9SAndroid Build Coastguard Worker            var.retain_grad()
*da0073e9SAndroid Build Coastguard Worker            mean.retain_grad()
*da0073e9SAndroid Build Coastguard Worker            # node has two retains_grad hooks
*da0073e9SAndroid Build Coastguard Worker            var.mul_(2)
*da0073e9SAndroid Build Coastguard Worker            # the retain_grad hook multi-output node refers should now be a nullptr
*da0073e9SAndroid Build Coastguard Worker            (var + mean).sum().backward()
*da0073e9SAndroid Build Coastguard Worker            gvar = var.grad
*da0073e9SAndroid Build Coastguard Worker            gmean = mean.grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            a = b.detach().requires_grad_(True)
*da0073e9SAndroid Build Coastguard Worker            var, mean = fn(a)
*da0073e9SAndroid Build Coastguard Worker            var.mul_(2)
*da0073e9SAndroid Build Coastguard Worker            out = (var + mean).sum()
*da0073e9SAndroid Build Coastguard Worker            gvar_expected, gmean_expected = torch.autograd.grad(out, inputs=(var, mean))
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.allclose(gvar, gvar_expected))
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.allclose(gmean, gmean_expected))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_retain_grad_inplace_over_view(self):
*da0073e9SAndroid Build Coastguard Worker        base = torch.tensor([1.0], requires_grad=True).clone()
*da0073e9SAndroid Build Coastguard Worker        view = base[:]
*da0073e9SAndroid Build Coastguard Worker        view2 = base[:]
*da0073e9SAndroid Build Coastguard Worker        view.retain_grad()
*da0073e9SAndroid Build Coastguard Worker        view2.retain_grad()
*da0073e9SAndroid Build Coastguard Worker        view.mul_(2)
*da0073e9SAndroid Build Coastguard Worker        (view + view2).sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # The old grad_fn, slice, wouldn't be part of the graph during backward
*da0073e9SAndroid Build Coastguard Worker        # so if the retains grad were not properly updated to the new grad_fn,
*da0073e9SAndroid Build Coastguard Worker        # the grad would still be None
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(view.grad, view2.grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(view.grad, torch.tensor([1.0]))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_tensor_hooks_inplace(self):
*da0073e9SAndroid Build Coastguard Worker        # Check that the second hook gets registered to the new version of tensor
*da0073e9SAndroid Build Coastguard Worker        count1 = [0]
*da0073e9SAndroid Build Coastguard Worker        count2 = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn1(grad):
*da0073e9SAndroid Build Coastguard Worker            count1[0] += 1
*da0073e9SAndroid Build Coastguard Worker            # x2 from mul, x2 from fn2
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(grad, torch.tensor([4.0]))
*da0073e9SAndroid Build Coastguard Worker            return grad * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn2(grad):
*da0073e9SAndroid Build Coastguard Worker            count2[0] += 1
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(grad, torch.tensor([1.0]))
*da0073e9SAndroid Build Coastguard Worker            return grad * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor([1.0], requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = a.clone()
*da0073e9SAndroid Build Coastguard Worker        b.register_hook(fn1)
*da0073e9SAndroid Build Coastguard Worker        b.mul_(2)
*da0073e9SAndroid Build Coastguard Worker        b.register_hook(fn2)
*da0073e9SAndroid Build Coastguard Worker        b.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(count1[0], 1)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(count2[0], 1)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a.grad, torch.tensor([8.0]))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        count3 = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn3(grad):
*da0073e9SAndroid Build Coastguard Worker            count3[0] += 1
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(grad, torch.tensor([4.0]))
*da0073e9SAndroid Build Coastguard Worker            return grad * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor([1.0], requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = a.clone()
*da0073e9SAndroid Build Coastguard Worker        b.register_hook(fn3)
*da0073e9SAndroid Build Coastguard Worker        # Inplace multiple times is OK
*da0073e9SAndroid Build Coastguard Worker        b.mul_(2)
*da0073e9SAndroid Build Coastguard Worker        b.mul_(2)
*da0073e9SAndroid Build Coastguard Worker        b.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(count1[0], 1)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a.grad, torch.tensor([8.0]))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_tensor_hooks_inplace_multiple_outputs(self):
*da0073e9SAndroid Build Coastguard Worker        class DoubleMul(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x * 2, x * 3
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, g1, g2):
*da0073e9SAndroid Build Coastguard Worker                return g1 * 2 + g2 * 3
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        var_mean = partial(torch.var_mean, dim=0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for fn in (DoubleMul.apply, var_mean):
*da0073e9SAndroid Build Coastguard Worker            counts = [0, 0, 0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def fn0(grad):
*da0073e9SAndroid Build Coastguard Worker                counts[0] += 1
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(grad, torch.ones_like(out1) * 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def fn1(grad):
*da0073e9SAndroid Build Coastguard Worker                counts[1] += 1
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(grad, torch.ones_like(out1) * 3)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def fn2(grad):
*da0073e9SAndroid Build Coastguard Worker                counts[2] += 1
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(grad, torch.ones_like(out1))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            b = torch.rand(3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            out1, out2 = fn(b)
*da0073e9SAndroid Build Coastguard Worker            out1.register_hook(fn0)
*da0073e9SAndroid Build Coastguard Worker            out2.register_hook(fn1)
*da0073e9SAndroid Build Coastguard Worker            # node refers to two hook dicts
*da0073e9SAndroid Build Coastguard Worker            # out1 no longer no longer points to its old hook dict
*da0073e9SAndroid Build Coastguard Worker            out1.mul_(2)
*da0073e9SAndroid Build Coastguard Worker            # fn2 is registered to out1's new hook dict
*da0073e9SAndroid Build Coastguard Worker            out1.register_hook(fn2)
*da0073e9SAndroid Build Coastguard Worker            (out1 + out2 * 3).sum().backward()
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(counts, [1, 1, 1])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_tensor_hooks_inplace_over_view(self):
*da0073e9SAndroid Build Coastguard Worker        # There might be a better UX here, but this is the way it is now
*da0073e9SAndroid Build Coastguard Worker        count = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn0(grad):
*da0073e9SAndroid Build Coastguard Worker            self.fail()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn1(grad):
*da0073e9SAndroid Build Coastguard Worker            self.fail()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn2(grad):
*da0073e9SAndroid Build Coastguard Worker            count[0] += 1
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(grad, torch.tensor([1.0]))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        base = torch.tensor([1.0], requires_grad=True).clone()
*da0073e9SAndroid Build Coastguard Worker        view = base[:]
*da0073e9SAndroid Build Coastguard Worker        view2 = base[:]
*da0073e9SAndroid Build Coastguard Worker        view.register_hook(fn0)
*da0073e9SAndroid Build Coastguard Worker        view2.register_hook(fn1)
*da0073e9SAndroid Build Coastguard Worker        view.mul_(2)
*da0073e9SAndroid Build Coastguard Worker        # We need to explicitly trigger an update to view to update its grad_fn
*da0073e9SAndroid Build Coastguard Worker        view2.grad_fn
*da0073e9SAndroid Build Coastguard Worker        view2.register_hook(fn2)
*da0073e9SAndroid Build Coastguard Worker        (view + view2).sum().backward()
*da0073e9SAndroid Build Coastguard Worker        # The hooks originally registered to view are not fired, one must explicitly
*da0073e9SAndroid Build Coastguard Worker        # trigger an update to the view's grad_fn, and then register a new hook
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(count[0], 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_retain_grad_cycle(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def run_test():
*da0073e9SAndroid Build Coastguard Worker            y = x * 2
*da0073e9SAndroid Build Coastguard Worker            y.retain_grad()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            return y / 2, torch._C._WeakTensorRef(y)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        z, ref = run_test()
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(ref.expired())
*da0073e9SAndroid Build Coastguard Worker        z.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_backward(self):
*da0073e9SAndroid Build Coastguard Worker        v = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = (torch.rand(5, 5) + 0.1).requires_grad_(True)
*da0073e9SAndroid Build Coastguard Worker        z = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        grad_output = torch.randn(5, 5)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        v.backward(grad_output)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(v.grad, grad_output)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = x + (y * z) + 4 * z**2 * x / y
*da0073e9SAndroid Build Coastguard Worker        a.backward(grad_output)
*da0073e9SAndroid Build Coastguard Worker        x_grad = 4 * z.pow(2) / y + 1
*da0073e9SAndroid Build Coastguard Worker        y_grad = z - 4 * x * z.pow(2) / y.pow(2)
*da0073e9SAndroid Build Coastguard Worker        z_grad = 8 * x * z / y + y
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, x_grad * grad_output)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y.grad, y_grad * grad_output)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(z.grad, z_grad * grad_output)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_to_sparse_backward(self):
*da0073e9SAndroid Build Coastguard Worker        to_attr_names = (
*da0073e9SAndroid Build Coastguard Worker            "to_dense",
*da0073e9SAndroid Build Coastguard Worker            "to_sparse",
*da0073e9SAndroid Build Coastguard Worker            "to_sparse_csr",
*da0073e9SAndroid Build Coastguard Worker            "to_sparse_csc",
*da0073e9SAndroid Build Coastguard Worker            "to_sparse_bsr",
*da0073e9SAndroid Build Coastguard Worker            "to_sparse_bsc",
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        to_params = ((), (), (), (), (2,), (2,))
*da0073e9SAndroid Build Coastguard Worker        to_attr_names_params = dict(zip(to_attr_names, to_params))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def check_inversion_possible(
*da0073e9SAndroid Build Coastguard Worker            t, layout1, layout1_params, layout2, layout2_params
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            l = (layout1, layout2)
*da0073e9SAndroid Build Coastguard Worker            p = (layout1_params, layout2_params)
*da0073e9SAndroid Build Coastguard Worker            for l1, l2, p1, p2 in ((*l, *p), (*l[::-1], *p[::-1])):
*da0073e9SAndroid Build Coastguard Worker                try:
*da0073e9SAndroid Build Coastguard Worker                    to_l1 = getattr(t, l1)(*p1)
*da0073e9SAndroid Build Coastguard Worker                    to_l2 = getattr(to_l1, l2)(*p2)
*da0073e9SAndroid Build Coastguard Worker                except RuntimeError:
*da0073e9SAndroid Build Coastguard Worker                    return False
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            return True
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self_strided = torch.rand(4, 4, dtype=torch.double) + 1
*da0073e9SAndroid Build Coastguard Worker        grad_strided = torch.rand(4, 4, dtype=torch.double) + 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for from_to_attr in to_attr_names:
*da0073e9SAndroid Build Coastguard Worker            from_params = to_attr_names_params[from_to_attr]
*da0073e9SAndroid Build Coastguard Worker            self_from = getattr(self_strided, from_to_attr)(
*da0073e9SAndroid Build Coastguard Worker                *from_params
*da0073e9SAndroid Build Coastguard Worker            ).requires_grad_(True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            for to_to_attr in to_attr_names[1:]:
*da0073e9SAndroid Build Coastguard Worker                to_params = to_attr_names_params[to_to_attr]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                if check_inversion_possible(
*da0073e9SAndroid Build Coastguard Worker                    self_strided, from_to_attr, from_params, to_to_attr, to_params
*da0073e9SAndroid Build Coastguard Worker                ):
*da0073e9SAndroid Build Coastguard Worker                    self_to = getattr(self_from, to_to_attr)(*to_params)
*da0073e9SAndroid Build Coastguard Worker                    grad_to = getattr(grad_strided, to_to_attr)(*to_params)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    # No gradcheck support for BSR/BSC, so the grads are checked explicitly
*da0073e9SAndroid Build Coastguard Worker                    grad_res = torch.autograd.grad(self_to, self_from, grad_to)[0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(grad_res.layout, self_from.layout)
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(grad_res.to_dense(), grad_strided)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_sparse_mm_backward(self):
*da0073e9SAndroid Build Coastguard Worker        size = (3, 3)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        mm_test_cases = product(*(([False, True],) * 4))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for a_req_grad, a_is_sparse, b_req_grad, b_is_sparse in mm_test_cases:
*da0073e9SAndroid Build Coastguard Worker            # We should only be testing cases with sparse inputs, and at least one
*da0073e9SAndroid Build Coastguard Worker            # input needs to require grad so we can call a backward pass
*da0073e9SAndroid Build Coastguard Worker            if not ((a_is_sparse or b_is_sparse) and (a_req_grad or b_req_grad)):
*da0073e9SAndroid Build Coastguard Worker                continue
*da0073e9SAndroid Build Coastguard Worker            a = torch.randn(size)
*da0073e9SAndroid Build Coastguard Worker            if a_is_sparse:
*da0073e9SAndroid Build Coastguard Worker                # detaching as `a` needs to be a leaf
*da0073e9SAndroid Build Coastguard Worker                a = a.to_sparse().detach()
*da0073e9SAndroid Build Coastguard Worker            b = torch.randn(size)
*da0073e9SAndroid Build Coastguard Worker            if b_is_sparse:
*da0073e9SAndroid Build Coastguard Worker                # detaching as `b` needs to be a leaf
*da0073e9SAndroid Build Coastguard Worker                b = b.to_sparse().detach()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            a = a.requires_grad_(a_req_grad)
*da0073e9SAndroid Build Coastguard Worker            b = b.requires_grad_(b_req_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            r = a.mm(b)
*da0073e9SAndroid Build Coastguard Worker            s = r.sum().backward()
*da0073e9SAndroid Build Coastguard Worker            a_grad = None if a.grad is None else a.grad.clone().detach()
*da0073e9SAndroid Build Coastguard Worker            b_grad = None if b.grad is None else b.grad.clone().detach()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Redo with only dense tensors
*da0073e9SAndroid Build Coastguard Worker            a = (
*da0073e9SAndroid Build Coastguard Worker                (a.to_dense() if a.is_sparse else a)
*da0073e9SAndroid Build Coastguard Worker                .clone()
*da0073e9SAndroid Build Coastguard Worker                .detach()
*da0073e9SAndroid Build Coastguard Worker                .requires_grad_(a_req_grad)
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            b = (
*da0073e9SAndroid Build Coastguard Worker                (b.to_dense() if b.is_sparse else b)
*da0073e9SAndroid Build Coastguard Worker                .clone()
*da0073e9SAndroid Build Coastguard Worker                .detach()
*da0073e9SAndroid Build Coastguard Worker                .requires_grad_(b_req_grad)
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            r = a.mm(b)
*da0073e9SAndroid Build Coastguard Worker            r.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(a_grad, a.grad)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(b_grad, b.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_multi_backward(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        q = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        q2 = q * 2
*da0073e9SAndroid Build Coastguard Worker        z = x + y + q2
*da0073e9SAndroid Build Coastguard Worker        c = a * b + q2
*da0073e9SAndroid Build Coastguard Worker        grad_z = torch.randn(5, 5)
*da0073e9SAndroid Build Coastguard Worker        grad_c = torch.randn(5, 5)
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.backward([z, c], [grad_z, grad_c])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, grad_z)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y.grad, grad_z)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a.grad, grad_c * b)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(b.grad, grad_c * a)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(q.grad, (grad_c + grad_z) * 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_multi_backward_no_grad(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(5, 5, requires_grad=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        z = x + y
*da0073e9SAndroid Build Coastguard Worker        q = y * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # NB: we currently raise an exception if any arguments to backwards
*da0073e9SAndroid Build Coastguard Worker        # have requires_grad=False and don't have a grad_fn. We may want to
*da0073e9SAndroid Build Coastguard Worker        # relax that check to a warning.
*da0073e9SAndroid Build Coastguard Worker        def call_backwards():
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.backward([z, q], [torch.ones(5, 5), torch.ones(5, 5)])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertRaises(RuntimeError, call_backwards)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_backward_with_inputs(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(2, 2, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(2, 2, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn():
*da0073e9SAndroid Build Coastguard Worker            return x**2 + y * x + y**2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        gradient = torch.ones(2, 2)
*da0073e9SAndroid Build Coastguard Worker        x_grad_expected = 2 * x + y
*da0073e9SAndroid Build Coastguard Worker        y_grad_expected = x + 2 * y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        @torch.no_grad()
*da0073e9SAndroid Build Coastguard Worker        def reset_grad():
*da0073e9SAndroid Build Coastguard Worker            x.grad.zero_()
*da0073e9SAndroid Build Coastguard Worker            y.grad.zero_()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.backward(fn(), gradient, inputs=[x, y])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, x_grad_expected)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y.grad, y_grad_expected)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        reset_grad()
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.backward(fn(), gradient, inputs=[x])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, x_grad_expected)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y.grad, torch.zeros(2, 2), exact_dtype=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        reset_grad()
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.backward(fn(), gradient, inputs=[y])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y.grad, y_grad_expected)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, torch.zeros(2, 2), exact_dtype=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        reset_grad()
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.backward(fn(), gradient, inputs=y)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y.grad, y_grad_expected)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, torch.zeros(2, 2), exact_dtype=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        reset_grad()
*da0073e9SAndroid Build Coastguard Worker        self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError,
*da0073e9SAndroid Build Coastguard Worker            "cannot be empty",
*da0073e9SAndroid Build Coastguard Worker            lambda: torch.autograd.backward(fn(), gradient, inputs=[]),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_backward_with_nonleaf_inputs(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(2, 2, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        x_nonleaf = x * 1
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(2, 2, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        z = torch.randn(2, 2, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = x_nonleaf**2 + y * x_nonleaf + y**2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out.backward(
*da0073e9SAndroid Build Coastguard Worker            torch.ones(2, 2, dtype=torch.double),
*da0073e9SAndroid Build Coastguard Worker            create_graph=True,
*da0073e9SAndroid Build Coastguard Worker            inputs=[x, y, x_nonleaf],
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        x_grad_expected = 2 * x + y
*da0073e9SAndroid Build Coastguard Worker        y_grad_expected = x + 2 * y
*da0073e9SAndroid Build Coastguard Worker        x_non_leaf_expected = 2 * x_nonleaf + y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y.grad, y_grad_expected)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, x_grad_expected)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x_nonleaf.grad, x_non_leaf_expected)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # backward doesn't have an allow_unused flag, so the behavior of backward
*da0073e9SAndroid Build Coastguard Worker        # when variable is not part of the graph is as if allow_used were true
*da0073e9SAndroid Build Coastguard Worker        # x.grad will simply be None.
*da0073e9SAndroid Build Coastguard Worker        out.backward(
*da0073e9SAndroid Build Coastguard Worker            torch.ones(2, 2, dtype=torch.double), create_graph=True, inputs=[z]
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(z.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_dependent_backward(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(10, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = x**2
*da0073e9SAndroid Build Coastguard Worker        z = y**3
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        go_y = torch.randn(10)
*da0073e9SAndroid Build Coastguard Worker        go_z = torch.randn(10)
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.backward([y, z], [go_y, go_z])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        xd = x
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, 2 * xd * go_y + 6 * xd.pow(5) * go_z)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_save_output_nr(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(10, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class MultiOutputFn(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x[:5], x[5:]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, *grad):
*da0073e9SAndroid Build Coastguard Worker                return torch.cat(grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a, b = MultiOutputFn.apply(x)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(b.output_nr, 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class TestFn(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, b):
*da0073e9SAndroid Build Coastguard Worker                ctx.save_for_backward(b)
*da0073e9SAndroid Build Coastguard Worker                return b * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_b):
*da0073e9SAndroid Build Coastguard Worker                (b,) = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(b.output_nr, 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        TestFn.apply(b).sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_first_grad_fn_access_in_no_grad_mode(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor([1 + 1j], requires_grad=True).clone()
*da0073e9SAndroid Build Coastguard Worker        v = a.real
*da0073e9SAndroid Build Coastguard Worker        a.add_(1)
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.grad_mode.no_grad():
*da0073e9SAndroid Build Coastguard Worker            v.grad_fn
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfTorchDynamo("too slow")
*da0073e9SAndroid Build Coastguard Worker    def test_free_deep_graph(self):
*da0073e9SAndroid Build Coastguard Worker        def scope():
*da0073e9SAndroid Build Coastguard Worker            depth = 150000
*da0073e9SAndroid Build Coastguard Worker            x = torch.randn(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            y = x.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # build a "chain" computation graph
*da0073e9SAndroid Build Coastguard Worker            for _ in range(depth):
*da0073e9SAndroid Build Coastguard Worker                y = y + y * 0.000001
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # graph deletion occurs when the above locals go out of scope.
*da0073e9SAndroid Build Coastguard Worker            # In this case `del y` will trigger it but it's easier to leave
*da0073e9SAndroid Build Coastguard Worker            # it to Python to delete the locals.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Should not stack overflow
*da0073e9SAndroid Build Coastguard Worker        scope()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfTorchDynamo("too slow")
*da0073e9SAndroid Build Coastguard Worker    def test_free_deep_graph_complicated(self):
*da0073e9SAndroid Build Coastguard Worker        def scope():
*da0073e9SAndroid Build Coastguard Worker            depth = 100000
*da0073e9SAndroid Build Coastguard Worker            randchoice = torch.randint(2, [depth, 2])
*da0073e9SAndroid Build Coastguard Worker            x = torch.randn(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            y = x.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Hold the two previous values
*da0073e9SAndroid Build Coastguard Worker            prev_values = [None, None]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Build a "chain with skip connections" graph
*da0073e9SAndroid Build Coastguard Worker            for _ in range(depth):
*da0073e9SAndroid Build Coastguard Worker                prev_tensors = [
*da0073e9SAndroid Build Coastguard Worker                    tensor for tensor in prev_values[:-1] if tensor is not None
*da0073e9SAndroid Build Coastguard Worker                ]
*da0073e9SAndroid Build Coastguard Worker                prev_values.append(y)
*da0073e9SAndroid Build Coastguard Worker                prev_values.pop(0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # Definitely pick one tensor to add
*da0073e9SAndroid Build Coastguard Worker                y += y * 0.000001
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # Possibly add other tensors
*da0073e9SAndroid Build Coastguard Worker                nprev = len(prev_tensors)
*da0073e9SAndroid Build Coastguard Worker                if nprev == 2:
*da0073e9SAndroid Build Coastguard Worker                    y += randchoice[depth].mul(torch.cat(prev_tensors)).sum()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # graph deletion occurs when the above locals go out of scope.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Should not stack overflow
*da0073e9SAndroid Build Coastguard Worker        scope()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfTorchDynamo("too slow")
*da0073e9SAndroid Build Coastguard Worker    def test_free_deep_graph_pyfunction(self):
*da0073e9SAndroid Build Coastguard Worker        class MyOp(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, tensor1, tensor2):
*da0073e9SAndroid Build Coastguard Worker                return tensor1 + tensor2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_output):
*da0073e9SAndroid Build Coastguard Worker                return grad_output, grad_output
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def scope():
*da0073e9SAndroid Build Coastguard Worker            depth = 150000
*da0073e9SAndroid Build Coastguard Worker            x = torch.randn(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            y = x.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # build deeply nested computation graph
*da0073e9SAndroid Build Coastguard Worker            for _ in range(depth):
*da0073e9SAndroid Build Coastguard Worker                y = MyOp.apply(y, y)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # graph deletion occurs when the above locals go out of scope.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Should not stack overflow
*da0073e9SAndroid Build Coastguard Worker        scope()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_no_unnecessary_save(self):
*da0073e9SAndroid Build Coastguard Worker        # If we kept x in the derivative Function of x * 2 we would
*da0073e9SAndroid Build Coastguard Worker        # get an error in the backward that would complain that we've
*da0073e9SAndroid Build Coastguard Worker        # modified x, which was needed for gradient computation.
*da0073e9SAndroid Build Coastguard Worker        # Since we should elide unnecessary saves, this test should pass.
*da0073e9SAndroid Build Coastguard Worker        mu = torch.ones(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        x = torch.empty(1)
*da0073e9SAndroid Build Coastguard Worker        loss = 0
*da0073e9SAndroid Build Coastguard Worker        for i in range(3):
*da0073e9SAndroid Build Coastguard Worker            x.detach_()
*da0073e9SAndroid Build Coastguard Worker            x.copy_(mu + i)
*da0073e9SAndroid Build Coastguard Worker            ft = torch.tensor([float(i)])
*da0073e9SAndroid Build Coastguard Worker            multiplied = x * ft
*da0073e9SAndroid Build Coastguard Worker            s = multiplied.sum()
*da0073e9SAndroid Build Coastguard Worker            loss += s
*da0073e9SAndroid Build Coastguard Worker        loss.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_no_grad(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.ones(5, 5) * 4
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            w = x + y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def adder(x, y):
*da0073e9SAndroid Build Coastguard Worker            return x + y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        adders = [torch.no_grad()(adder), torch.no_grad(adder)]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for adder in adders:
*da0073e9SAndroid Build Coastguard Worker            z = adder(x, y)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(w.requires_grad)
*da0073e9SAndroid Build Coastguard Worker            self.assertRaises(RuntimeError, lambda: w.backward(torch.ones(5, 5)))
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(w.grad_fn)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(z.requires_grad)
*da0073e9SAndroid Build Coastguard Worker            self.assertRaises(RuntimeError, lambda: z.backward(torch.ones(5, 5)))
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(z.grad_fn)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # test nested decorator and with-statement on no_grad
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker            w = adder(x, y)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_enable_grad_decorator_no_paren(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        @torch.enable_grad
*da0073e9SAndroid Build Coastguard Worker        def doubler(x):
*da0073e9SAndroid Build Coastguard Worker            return x * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            z = doubler(x)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(z.requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_set_grad_generator_functions(self):
*da0073e9SAndroid Build Coastguard Worker        @torch.no_grad()
*da0073e9SAndroid Build Coastguard Worker        def gen_no_grad():
*da0073e9SAndroid Build Coastguard Worker            for i in range(10):
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(torch.is_grad_enabled(), False)
*da0073e9SAndroid Build Coastguard Worker                yield i
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.enable_grad():
*da0073e9SAndroid Build Coastguard Worker            for _ in gen_no_grad():
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(torch.is_grad_enabled(), True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        @torch.enable_grad()
*da0073e9SAndroid Build Coastguard Worker        def gen_enable_grad():
*da0073e9SAndroid Build Coastguard Worker            for i in range(10):
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(torch.is_grad_enabled(), True)
*da0073e9SAndroid Build Coastguard Worker                yield i
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            for _ in gen_enable_grad():
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(torch.is_grad_enabled(), False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_set_grad_generator_functions_recursive(self):
*da0073e9SAndroid Build Coastguard Worker        # enable_grad_decorator_recursive and no_grad_decorator_recursive call each other
*da0073e9SAndroid Build Coastguard Worker        # recursively, to ensure that the decorators preserve the caller's setting
*da0073e9SAndroid Build Coastguard Worker        @torch.enable_grad()
*da0073e9SAndroid Build Coastguard Worker        def enable_grad_decorator_recursive(depth):
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker            if depth > 0:
*da0073e9SAndroid Build Coastguard Worker                no_grad_decorator_recursive(depth - 1)
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        @torch.no_grad()
*da0073e9SAndroid Build Coastguard Worker        def no_grad_decorator_recursive(depth):
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker            if depth > 0:
*da0073e9SAndroid Build Coastguard Worker                enable_grad_decorator_recursive(depth - 1)
*da0073e9SAndroid Build Coastguard Worker                self.assertFalse(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # enable_grad_context_manager_recursive and no_grad_context_manager_recursive call
*da0073e9SAndroid Build Coastguard Worker        # each other recursively, to ensure that the decorators preserve the caller's setting
*da0073e9SAndroid Build Coastguard Worker        def enable_grad_context_manager_recursive(depth):
*da0073e9SAndroid Build Coastguard Worker            with torch.enable_grad():
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker                if depth > 0:
*da0073e9SAndroid Build Coastguard Worker                    no_grad_context_manager_recursive(depth - 1)
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def no_grad_context_manager_recursive(depth):
*da0073e9SAndroid Build Coastguard Worker            with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker                self.assertFalse(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker                if depth > 0:
*da0073e9SAndroid Build Coastguard Worker                    enable_grad_context_manager_recursive(depth - 1)
*da0073e9SAndroid Build Coastguard Worker                    self.assertFalse(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.enable_grad():
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker            enable_grad_decorator_recursive(10)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker            enable_grad_context_manager_recursive(10)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker            enable_grad_decorator_recursive(10)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker            enable_grad_context_manager_recursive(10)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_set_grad_coroutines(self):
*da0073e9SAndroid Build Coastguard Worker        @torch.no_grad()
*da0073e9SAndroid Build Coastguard Worker        def coro_no_grad(n=10):
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker            for i in range(n):
*da0073e9SAndroid Build Coastguard Worker                self.assertFalse(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker                r = yield i
*da0073e9SAndroid Build Coastguard Worker                self.assertFalse(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(i, r)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        @torch.enable_grad()
*da0073e9SAndroid Build Coastguard Worker        def coro_enable_grad(n=10):
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker            for i in range(n):
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker                r = yield i
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(i, r)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.enable_grad():
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker            coro, r = coro_no_grad(), None
*da0073e9SAndroid Build Coastguard Worker            try:
*da0073e9SAndroid Build Coastguard Worker                while True:
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker                    r = coro.send(r)
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            except StopIteration:
*da0073e9SAndroid Build Coastguard Worker                pass
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker            coro, r = coro_enable_grad(), None
*da0073e9SAndroid Build Coastguard Worker            try:
*da0073e9SAndroid Build Coastguard Worker                while True:
*da0073e9SAndroid Build Coastguard Worker                    self.assertFalse(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker                    r = coro.send(r)
*da0073e9SAndroid Build Coastguard Worker                    self.assertFalse(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            except StopIteration:
*da0073e9SAndroid Build Coastguard Worker                pass
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_set_grad_coroutines_benign_exceptions(self):
*da0073e9SAndroid Build Coastguard Worker        class RecoverableException(Exception):
*da0073e9SAndroid Build Coastguard Worker            pass
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        @torch.no_grad()
*da0073e9SAndroid Build Coastguard Worker        def coro_no_grad(n=10):
*da0073e9SAndroid Build Coastguard Worker            has_raised = False
*da0073e9SAndroid Build Coastguard Worker            for i in range(n):
*da0073e9SAndroid Build Coastguard Worker                try:
*da0073e9SAndroid Build Coastguard Worker                    self.assertFalse(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker                    yield (-i if has_raised else i)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                except RecoverableException:
*da0073e9SAndroid Build Coastguard Worker                    self.assertFalse(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker                    has_raised = True
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        @torch.enable_grad()
*da0073e9SAndroid Build Coastguard Worker        def coro_enable_grad(n=10):
*da0073e9SAndroid Build Coastguard Worker            has_raised = False
*da0073e9SAndroid Build Coastguard Worker            for i in range(n):
*da0073e9SAndroid Build Coastguard Worker                try:
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker                    yield (-i if has_raised else i)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                except RecoverableException:
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker                    has_raised = True
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.enable_grad():
*da0073e9SAndroid Build Coastguard Worker            coro = coro_no_grad()
*da0073e9SAndroid Build Coastguard Worker            assert 0 == next(coro)
*da0073e9SAndroid Build Coastguard Worker            try:
*da0073e9SAndroid Build Coastguard Worker                while True:
*da0073e9SAndroid Build Coastguard Worker                    r = coro.throw(RecoverableException)
*da0073e9SAndroid Build Coastguard Worker                    self.assertLess(r, 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            except StopIteration:
*da0073e9SAndroid Build Coastguard Worker                pass
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            coro = coro_enable_grad()
*da0073e9SAndroid Build Coastguard Worker            assert 0 == next(coro)
*da0073e9SAndroid Build Coastguard Worker            try:
*da0073e9SAndroid Build Coastguard Worker                while True:
*da0073e9SAndroid Build Coastguard Worker                    r = coro.throw(RecoverableException)
*da0073e9SAndroid Build Coastguard Worker                    self.assertLess(r, 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            except StopIteration:
*da0073e9SAndroid Build Coastguard Worker                pass
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_set_grad_coroutines_critical_exceptions(self):
*da0073e9SAndroid Build Coastguard Worker        class UnrecoverableException(Exception):
*da0073e9SAndroid Build Coastguard Worker            pass
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class SecondaryException(Exception):
*da0073e9SAndroid Build Coastguard Worker            pass
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        @torch.no_grad()
*da0073e9SAndroid Build Coastguard Worker        def coro_no_grad(n=10):
*da0073e9SAndroid Build Coastguard Worker            has_raised = False
*da0073e9SAndroid Build Coastguard Worker            for i in range(n):
*da0073e9SAndroid Build Coastguard Worker                try:
*da0073e9SAndroid Build Coastguard Worker                    self.assertFalse(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker                    yield (-i if has_raised else i)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                except UnrecoverableException:
*da0073e9SAndroid Build Coastguard Worker                    self.assertFalse(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker                    raise SecondaryException from None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        @torch.enable_grad()
*da0073e9SAndroid Build Coastguard Worker        def coro_enable_grad(n=10):
*da0073e9SAndroid Build Coastguard Worker            has_raised = False
*da0073e9SAndroid Build Coastguard Worker            for i in range(n):
*da0073e9SAndroid Build Coastguard Worker                try:
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker                    yield (-i if has_raised else i)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                except UnrecoverableException:
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker                    raise SecondaryException from None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.enable_grad():
*da0073e9SAndroid Build Coastguard Worker            coro = coro_no_grad()
*da0073e9SAndroid Build Coastguard Worker            assert 0 == next(coro)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaises(SecondaryException):
*da0073e9SAndroid Build Coastguard Worker                coro.throw(UnrecoverableException)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            coro = coro_enable_grad()
*da0073e9SAndroid Build Coastguard Worker            assert 0 == next(coro)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaises(SecondaryException):
*da0073e9SAndroid Build Coastguard Worker                coro.throw(UnrecoverableException)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_set_grad_coroutines_exit(self):
*da0073e9SAndroid Build Coastguard Worker        @torch.no_grad()
*da0073e9SAndroid Build Coastguard Worker        def coro_no_grad(state):
*da0073e9SAndroid Build Coastguard Worker            for i in range(10):
*da0073e9SAndroid Build Coastguard Worker                try:
*da0073e9SAndroid Build Coastguard Worker                    self.assertFalse(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker                    yield i
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                except GeneratorExit:
*da0073e9SAndroid Build Coastguard Worker                    self.assertFalse(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker                    state.add("GeneratorExit")
*da0073e9SAndroid Build Coastguard Worker                    raise
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        @torch.enable_grad()
*da0073e9SAndroid Build Coastguard Worker        def coro_enable_grad(state):
*da0073e9SAndroid Build Coastguard Worker            for i in range(10):
*da0073e9SAndroid Build Coastguard Worker                try:
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker                    yield i
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                except GeneratorExit:
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker                    state.add("GeneratorExit")
*da0073e9SAndroid Build Coastguard Worker                    raise
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        state = set()
*da0073e9SAndroid Build Coastguard Worker        with torch.enable_grad():
*da0073e9SAndroid Build Coastguard Worker            coro = coro_no_grad(state)
*da0073e9SAndroid Build Coastguard Worker            for i in range(5):
*da0073e9SAndroid Build Coastguard Worker                next(coro)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            coro.close()
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue("GeneratorExit" in state)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        state = set()
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            coro = coro_enable_grad(state)
*da0073e9SAndroid Build Coastguard Worker            for i in range(5):
*da0073e9SAndroid Build Coastguard Worker                next(coro)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            coro.close()
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue("GeneratorExit" in state)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_no_grad_python_function(self):
*da0073e9SAndroid Build Coastguard Worker        """Python Functions should respect grad mode."""
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class MyOp(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(self, x):
*da0073e9SAndroid Build Coastguard Worker                return x + 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(self, dy):
*da0073e9SAndroid Build Coastguard Worker                return dy
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            y = MyOp.apply(x)
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(y.requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_indexing(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.arange(1.0, 17).view(4, 4)
*da0073e9SAndroid Build Coastguard Worker        y = Variable(x, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def compare(x, y, idx, indexed_tensor, indexed_var):
*da0073e9SAndroid Build Coastguard Worker            indexed_var_t = indexed_var.data
*da0073e9SAndroid Build Coastguard Worker            if not isinstance(indexed_tensor, torch.Tensor):
*da0073e9SAndroid Build Coastguard Worker                indexed_var_t = indexed_var_t[0]
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(indexed_tensor, indexed_var_t)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            indexed_var.sum().backward()
*da0073e9SAndroid Build Coastguard Worker            expected_grad = torch.empty(x.size()).fill_(0)
*da0073e9SAndroid Build Coastguard Worker            expected_grad[idx] = 1
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(y.grad, expected_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def check_index(x, y, idx):
*da0073e9SAndroid Build Coastguard Worker            if y.grad is not None:
*da0073e9SAndroid Build Coastguard Worker                with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker                    y.grad.zero_()
*da0073e9SAndroid Build Coastguard Worker            indexed_tensor = x[idx]
*da0073e9SAndroid Build Coastguard Worker            indexed_var = y[idx]
*da0073e9SAndroid Build Coastguard Worker            compare(x, y, idx, indexed_tensor, indexed_var)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, 1)
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, (1, 1))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, slice(1, None))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, slice(None, 2))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, (slice(None, 2), 2))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, (slice(1, 2), 2))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, (1, slice(2, None)))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, (slice(None, None), slice(2, None)))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, torch.LongTensor([0, 2]))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, torch.rand(4, 4).bernoulli().bool())
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, (Ellipsis, slice(2, None)))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, ([0], [0]))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, ([1, 2, 3], [0]))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, ([1, 2], [2, 1]))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, ([[1, 2], [3, 0]], [[0, 1], [2, 3]]))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, ([slice(None), [2, 3]]))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, ([[2, 3], slice(None)]))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # advanced indexing, with less dim, or ellipsis
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, ([0]))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, ([0],))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.arange(1.0, 49).view(4, 3, 4)
*da0073e9SAndroid Build Coastguard Worker        y = Variable(x, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, (slice(None), [0], [0]))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, ([0], [0], slice(None)))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, (slice(None), [0, 1, 2], [0]))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, ([0, 1, 2], [0], slice(None)))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, (slice(None), [1, 2], [2, 1]))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, ([1, 2], [2, 1], slice(None)))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, (slice(None), [[1, 2], [2, 0]], [[0, 1], [2, 3]]))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, ([[1, 2], [3, 0]], [[0, 1], [2, 2]], slice(None)))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, (slice(None), slice(None), [2, 1]))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, (slice(None), [2, 1], slice(None)))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, ([2, 1], slice(None), slice(None)))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # advanced indexing, with less dim, or ellipsis
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, ([0],))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, ([0], slice(None)))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, ([0], Ellipsis))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, ([1, 2], [0, 1]))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, ([1, 2], [0, 1], Ellipsis))
*da0073e9SAndroid Build Coastguard Worker        check_index(x, y, (Ellipsis, [1, 2], [0, 1]))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # advanced indexing, with a tensor wrapped in a variable
*da0073e9SAndroid Build Coastguard Worker        z = torch.LongTensor([0, 1])
*da0073e9SAndroid Build Coastguard Worker        zv = Variable(z, requires_grad=False)
*da0073e9SAndroid Build Coastguard Worker        seq = [z, Ellipsis]
*da0073e9SAndroid Build Coastguard Worker        seqv = [zv, Ellipsis]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if y.grad is not None:
*da0073e9SAndroid Build Coastguard Worker            with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker                y.grad.zero_()
*da0073e9SAndroid Build Coastguard Worker        indexed_tensor = x[seq]
*da0073e9SAndroid Build Coastguard Worker        indexed_var = y[seqv]
*da0073e9SAndroid Build Coastguard Worker        compare(x, y, seq, indexed_tensor, indexed_var)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_indexing_duplicates(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.arange(1.0, 17).view(4, 4)
*da0073e9SAndroid Build Coastguard Worker        y = Variable(x, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        idx = torch.LongTensor([1, 1, 3, 2, 1, 2])
*da0073e9SAndroid Build Coastguard Worker        y[idx].sum().backward()
*da0073e9SAndroid Build Coastguard Worker        expected_grad = torch.zeros(4, 4)
*da0073e9SAndroid Build Coastguard Worker        for i in idx:
*da0073e9SAndroid Build Coastguard Worker            expected_grad[i] += 1
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y.grad, expected_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # with advanced indexing
*da0073e9SAndroid Build Coastguard Worker        x = torch.arange(1.0, 17).view(4, 4)
*da0073e9SAndroid Build Coastguard Worker        y = Variable(x, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        idx = [[1, 1, 3, 2, 1, 2], [0]]
*da0073e9SAndroid Build Coastguard Worker        y[idx].sum().backward()
*da0073e9SAndroid Build Coastguard Worker        expected_grad = torch.zeros(4, 4)
*da0073e9SAndroid Build Coastguard Worker        for i in idx[0]:
*da0073e9SAndroid Build Coastguard Worker            for j in idx[1]:
*da0073e9SAndroid Build Coastguard Worker                expected_grad[i][j] += 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y.grad, expected_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.arange(1.0, 17).view(4, 4)
*da0073e9SAndroid Build Coastguard Worker        y = Variable(x, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        idx = [[[1, 2], [0, 0]], [[0, 1], [1, 1]]]
*da0073e9SAndroid Build Coastguard Worker        y[idx].sum().backward()
*da0073e9SAndroid Build Coastguard Worker        expected_grad = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker            [
*da0073e9SAndroid Build Coastguard Worker                [0.0, 2.0, 0.0, 0.0],
*da0073e9SAndroid Build Coastguard Worker                [1.0, 0.0, 0.0, 0.0],
*da0073e9SAndroid Build Coastguard Worker                [0.0, 1.0, 0.0, 0.0],
*da0073e9SAndroid Build Coastguard Worker                [0.0, 0.0, 0.0, 0.0],
*da0073e9SAndroid Build Coastguard Worker            ]
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y.grad, expected_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.arange(1.0, 65).view(4, 4, 4)
*da0073e9SAndroid Build Coastguard Worker        y = Variable(x, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        idx = [[1, 1, 1], slice(None), slice(None)]
*da0073e9SAndroid Build Coastguard Worker        y[idx].sum().backward()
*da0073e9SAndroid Build Coastguard Worker        expected_grad = torch.empty(4, 4, 4).zero_()
*da0073e9SAndroid Build Coastguard Worker        expected_grad[1].fill_(3)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y.grad, expected_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_index_backward_does_not_save_tensor(self):
*da0073e9SAndroid Build Coastguard Worker        # Example from https://github.com/pytorch/pytorch/issues/24853.
*da0073e9SAndroid Build Coastguard Worker        # if `index(tensor, indices)` saves `tensor` for backwards, then it will
*da0073e9SAndroid Build Coastguard Worker        # trigger a version check on `tensor` during the backward pass, which
*da0073e9SAndroid Build Coastguard Worker        # will cause the following code to error because `tensor` gets modified
*da0073e9SAndroid Build Coastguard Worker        # by the indexing line.
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor([1.0, 0, 0])
*da0073e9SAndroid Build Coastguard Worker        b = torch.zeros(3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        tensor = b + 0
*da0073e9SAndroid Build Coastguard Worker        tensor[a != 0] = tensor[a != 0]
*da0073e9SAndroid Build Coastguard Worker        tensor.backward(torch.zeros_like(tensor))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_volatile_deprecated(self):
*da0073e9SAndroid Build Coastguard Worker        v = torch.autograd.torch.randn(3, 3)
*da0073e9SAndroid Build Coastguard Worker        with warnings.catch_warnings(record=True) as w:
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(v.volatile)
*da0073e9SAndroid Build Coastguard Worker        self.assertIn("volatile", str(w[0].message))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_saved_variables_deprecated(self):
*da0073e9SAndroid Build Coastguard Worker        class MyFunction(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, tensor1, tensor2):
*da0073e9SAndroid Build Coastguard Worker                ctx.save_for_backward(tensor1, tensor2)
*da0073e9SAndroid Build Coastguard Worker                return tensor1 + tensor2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_output):
*da0073e9SAndroid Build Coastguard Worker                var1, var2 = ctx.saved_variables
*da0073e9SAndroid Build Coastguard Worker                return (grad_output, grad_output)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with warnings.catch_warnings(record=True) as warns:
*da0073e9SAndroid Build Coastguard Worker            warnings.simplefilter("always")
*da0073e9SAndroid Build Coastguard Worker            x = torch.randn((3, 3), requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            y = torch.randn((3, 3), requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            MyFunction.apply(x, y).sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            has_deprecated = (
*da0073e9SAndroid Build Coastguard Worker                "deprecated" in str(warn) and "saved_variables" in str(warn)
*da0073e9SAndroid Build Coastguard Worker                for warn in warns
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            has_deprecated = reduce(lambda x, y: x or y, has_deprecated)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(has_deprecated)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_requires_grad(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 5)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(5, 5)
*da0073e9SAndroid Build Coastguard Worker        z = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        a = x + y
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(a.requires_grad)
*da0073e9SAndroid Build Coastguard Worker        b = a + z
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(b.requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def error():
*da0073e9SAndroid Build Coastguard Worker            raise RuntimeError
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Make sure backward isn't called on these
*da0073e9SAndroid Build Coastguard Worker        a._backward_hooks = OrderedDict()
*da0073e9SAndroid Build Coastguard Worker        x._backward_hooks = OrderedDict()
*da0073e9SAndroid Build Coastguard Worker        y._backward_hooks = OrderedDict()
*da0073e9SAndroid Build Coastguard Worker        a._backward_hooks["test"] = error
*da0073e9SAndroid Build Coastguard Worker        x._backward_hooks["test"] = error
*da0073e9SAndroid Build Coastguard Worker        y._backward_hooks["test"] = error
*da0073e9SAndroid Build Coastguard Worker        b.backward(torch.ones(5, 5))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_requires_grad_(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 5)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertIs(x, x.requires_grad_())
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(x.requires_grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertIs(y, y.requires_grad_())
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(y.requires_grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertIs(x, x.requires_grad_(True))
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(x.requires_grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertIs(y, y.requires_grad_(True))
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(y.requires_grad)
*da0073e9SAndroid Build Coastguard Worker        z = x * y
*da0073e9SAndroid Build Coastguard Worker        self.assertRaises(RuntimeError, lambda: z.requires_grad_(False))
*da0073e9SAndroid Build Coastguard Worker        self.assertIs(z, z.requires_grad_())
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(z.requires_grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertIs(z, z.requires_grad_(True))
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(z.requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertIs(x, x.requires_grad_(False))
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(x.requires_grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertIs(y, y.requires_grad_(False))
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(y.requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_requires_grad_inplace(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(5, 5)
*da0073e9SAndroid Build Coastguard Worker        b = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        a += b
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(a.requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # non-leaf
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(5, 5) + 0
*da0073e9SAndroid Build Coastguard Worker        b = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        a += b
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(a.requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_no_requires_grad_inplace(self):
*da0073e9SAndroid Build Coastguard Worker        # basic case, should be able to modify inplace while requires_grad is False
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(2, 3)
*da0073e9SAndroid Build Coastguard Worker        a.add_(5)
*da0073e9SAndroid Build Coastguard Worker        a.requires_grad = True
*da0073e9SAndroid Build Coastguard Worker        a.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a.grad, torch.ones(2, 3))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # same but with a view
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(2, 3)
*da0073e9SAndroid Build Coastguard Worker        b = a[:]
*da0073e9SAndroid Build Coastguard Worker        b.add_(5)
*da0073e9SAndroid Build Coastguard Worker        a.requires_grad = True
*da0073e9SAndroid Build Coastguard Worker        a.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a.grad, torch.ones(2, 3))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # should fail if requires_grad = True when we modify inplace
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(2, 3)
*da0073e9SAndroid Build Coastguard Worker        b = a[:]
*da0073e9SAndroid Build Coastguard Worker        a.requires_grad = True
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(RuntimeError):
*da0073e9SAndroid Build Coastguard Worker            a.add_(5)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(RuntimeError):
*da0073e9SAndroid Build Coastguard Worker            b.add_(5)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_attribute_deletion(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn((5, 5), requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        del x.grad
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(x.grad)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(RuntimeError):
*da0073e9SAndroid Build Coastguard Worker            del x.data
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(TypeError):
*da0073e9SAndroid Build Coastguard Worker            x.data = None
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(RuntimeError):
*da0073e9SAndroid Build Coastguard Worker            del x.requires_grad
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(RuntimeError):
*da0073e9SAndroid Build Coastguard Worker            del x._grad_fn
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(RuntimeError):
*da0073e9SAndroid Build Coastguard Worker            del x._backward_hooks
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_duplicate_backward_root(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = a * b
*da0073e9SAndroid Build Coastguard Worker        grad_output = torch.randn_like(x)
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.backward([x, x], [grad_output, grad_output])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a.grad, b * grad_output * 2)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(b.grad, a * grad_output * 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_backward_no_grad(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = a + 2
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(RuntimeError):
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.backward([b], [None])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_backward_twice_with_saved_values(self):
*da0073e9SAndroid Build Coastguard Worker        b = torch.randn(3, requires_grad=True, dtype=torch.double)
*da0073e9SAndroid Build Coastguard Worker        c = torch.zeros(3, dtype=torch.double)
*da0073e9SAndroid Build Coastguard Worker        c[[1, 2]] = b[[1, 1]]
*da0073e9SAndroid Build Coastguard Worker        c.backward(torch.tensor([1, 1, 1], dtype=torch.double))
*da0073e9SAndroid Build Coastguard Worker        self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError,
*da0073e9SAndroid Build Coastguard Worker            "Specify retain_graph=True",
*da0073e9SAndroid Build Coastguard Worker            lambda: c.backward(torch.tensor([1, 1, 1], dtype=torch.double)),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_backward_twice_retained_graph_with_saved_values(self):
*da0073e9SAndroid Build Coastguard Worker        b = torch.randn(3, requires_grad=True, dtype=torch.double)
*da0073e9SAndroid Build Coastguard Worker        c = torch.zeros(3, dtype=torch.double)
*da0073e9SAndroid Build Coastguard Worker        c[[1, 2]] = b[[1, 1]]
*da0073e9SAndroid Build Coastguard Worker        c.backward(torch.tensor([1, 1, 1], dtype=torch.double), retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        c.backward(torch.tensor([1, 1, 1], dtype=torch.double))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_backward_twice_without_saved_values(self):
*da0073e9SAndroid Build Coastguard Worker        b = torch.randn(3, requires_grad=True, dtype=torch.double)
*da0073e9SAndroid Build Coastguard Worker        c = b + 1
*da0073e9SAndroid Build Coastguard Worker        c.backward(torch.tensor([1, 1, 1], dtype=torch.double))
*da0073e9SAndroid Build Coastguard Worker        c.backward(torch.tensor([1, 1, 1], dtype=torch.double))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_backward_twice_retained_graph_without_saved_values(self):
*da0073e9SAndroid Build Coastguard Worker        b = torch.randn(3, requires_grad=True, dtype=torch.double)
*da0073e9SAndroid Build Coastguard Worker        c = torch.zeros(3, dtype=torch.double)
*da0073e9SAndroid Build Coastguard Worker        c[[1, 2]] = b[[1, 1]]
*da0073e9SAndroid Build Coastguard Worker        c.backward(torch.tensor([1, 1, 1], dtype=torch.double), retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        c.backward(torch.tensor([1, 1, 1], dtype=torch.double))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_backward_create_graph_warns(self):
*da0073e9SAndroid Build Coastguard Worker        with set_warn_always_context(True):
*da0073e9SAndroid Build Coastguard Worker            b = torch.randn(3, requires_grad=True, dtype=torch.double)
*da0073e9SAndroid Build Coastguard Worker            c = b * b
*da0073e9SAndroid Build Coastguard Worker            with warnings.catch_warnings(record=True) as ws:
*da0073e9SAndroid Build Coastguard Worker                c.backward(torch.ones_like(c), create_graph=True)
*da0073e9SAndroid Build Coastguard Worker            b.grad = None
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(
*da0073e9SAndroid Build Coastguard Worker                any(
*da0073e9SAndroid Build Coastguard Worker                    "Using backward() with create_graph=True" in str(w.message)
*da0073e9SAndroid Build Coastguard Worker                    for w in ws
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Should not warn for grad
*da0073e9SAndroid Build Coastguard Worker            with warnings.catch_warnings(record=True) as ws:
*da0073e9SAndroid Build Coastguard Worker                torch.autograd.grad(c, b, torch.ones_like(c), create_graph=True)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(
*da0073e9SAndroid Build Coastguard Worker                any(
*da0073e9SAndroid Build Coastguard Worker                    "Using backward() with create_graph=True" in str(w.message)
*da0073e9SAndroid Build Coastguard Worker                    for w in ws
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_next_functions(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = x + y
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNotNone(a.grad_fn)
*da0073e9SAndroid Build Coastguard Worker        next_functions = a.grad_fn.next_functions
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(len(next_functions), 2)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(next_functions[0][0], torch._C._functions.AccumulateGrad)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(next_functions[0][1], 0)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(next_functions[1][0], torch._C._functions.AccumulateGrad)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(next_functions[1][1], 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        b = a + 5
*da0073e9SAndroid Build Coastguard Worker        next_functions = b.grad_fn.next_functions
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(len(next_functions), 2)
*da0073e9SAndroid Build Coastguard Worker        self.assertIs(next_functions[0][0], a.grad_fn)
*da0073e9SAndroid Build Coastguard Worker        self.assertIs(next_functions[1][0], None)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inplace(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = Variable(torch.ones(5, 5) * 4, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        z = x * y
*da0073e9SAndroid Build Coastguard Worker        q = z + y
*da0073e9SAndroid Build Coastguard Worker        w = z * y
*da0073e9SAndroid Build Coastguard Worker        z.add_(2)
*da0073e9SAndroid Build Coastguard Worker        # Add doesn't need it's inputs to do backward, so it shouldn't raise
*da0073e9SAndroid Build Coastguard Worker        q.backward(torch.ones(5, 5), retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        # Mul saves both inputs in forward, so it should raise
*da0073e9SAndroid Build Coastguard Worker        self.assertRaises(RuntimeError, lambda: w.backward(torch.ones(5, 5)))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        z = x * y
*da0073e9SAndroid Build Coastguard Worker        q = z * y
*da0073e9SAndroid Build Coastguard Worker        r = z + y
*da0073e9SAndroid Build Coastguard Worker        w = z.add_(y)
*da0073e9SAndroid Build Coastguard Worker        # w is a the last expression, so this should succeed
*da0073e9SAndroid Build Coastguard Worker        w.backward(torch.ones(5, 5), retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        # r doesn't use the modified value in backward, so it should succeed
*da0073e9SAndroid Build Coastguard Worker        r.backward(torch.ones(5, 5), retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        # q uses dirty z, so it should raise
*da0073e9SAndroid Build Coastguard Worker        self.assertRaises(RuntimeError, lambda: q.backward(torch.ones(5, 5)))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            x.grad.zero_()
*da0073e9SAndroid Build Coastguard Worker        m = x / 2
*da0073e9SAndroid Build Coastguard Worker        z = m + y / 8
*da0073e9SAndroid Build Coastguard Worker        q = z * y
*da0073e9SAndroid Build Coastguard Worker        r = z + y
*da0073e9SAndroid Build Coastguard Worker        prev_version = z._version
*da0073e9SAndroid Build Coastguard Worker        w = z.exp_()
*da0073e9SAndroid Build Coastguard Worker        self.assertNotEqual(z._version, prev_version)
*da0073e9SAndroid Build Coastguard Worker        r.backward(torch.ones(5, 5), retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, torch.ones(5, 5) / 2)
*da0073e9SAndroid Build Coastguard Worker        w.backward(torch.ones(5, 5), retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, torch.empty(5, 5).fill_((1 + math.e) / 2))
*da0073e9SAndroid Build Coastguard Worker        self.assertRaises(RuntimeError, lambda: q.backward(torch.ones(5, 5)))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        leaf = torch.ones(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        x = leaf.clone()
*da0073e9SAndroid Build Coastguard Worker        x.add_(10)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x, torch.ones(5, 5) * 11)
*da0073e9SAndroid Build Coastguard Worker        # x should be still usable
*da0073e9SAndroid Build Coastguard Worker        y = x + 2
*da0073e9SAndroid Build Coastguard Worker        y.backward(torch.ones(5, 5))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(leaf.grad, torch.ones(5, 5))
*da0073e9SAndroid Build Coastguard Worker        z = x * y
*da0073e9SAndroid Build Coastguard Worker        x.add_(2)
*da0073e9SAndroid Build Coastguard Worker        self.assertRaises(RuntimeError, lambda: z.backward(torch.ones(5, 5)))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_mark_non_differentiable(self):
*da0073e9SAndroid Build Coastguard Worker        class MyFunction(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, input):
*da0073e9SAndroid Build Coastguard Worker                output = input > 0
*da0073e9SAndroid Build Coastguard Worker                ctx.mark_non_differentiable(output)
*da0073e9SAndroid Build Coastguard Worker                return output
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_output):
*da0073e9SAndroid Build Coastguard Worker                return (grad_output * 0).to(torch.double)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        mask = MyFunction.apply(x)
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(mask.requires_grad)
*da0073e9SAndroid Build Coastguard Worker        y = x.masked_fill(mask, 0)
*da0073e9SAndroid Build Coastguard Worker        y.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfTorchDynamo("compile tested in test/dynamo/test_autograd_function.py")
*da0073e9SAndroid Build Coastguard Worker    def test_mark_non_differentiable_mixed(self):
*da0073e9SAndroid Build Coastguard Worker        class MyFunction(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, input):
*da0073e9SAndroid Build Coastguard Worker                a = input + 1
*da0073e9SAndroid Build Coastguard Worker                b = input + 2
*da0073e9SAndroid Build Coastguard Worker                ctx.mark_non_differentiable(a)
*da0073e9SAndroid Build Coastguard Worker                return a, b
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_a, grad_b):
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue((grad_a == 0).all())
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue((grad_b == 1).all())
*da0073e9SAndroid Build Coastguard Worker                return grad_b
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        a, b = MyFunction.apply(x)
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(a.requires_grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(b.requires_grad)
*da0073e9SAndroid Build Coastguard Worker        b.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, torch.ones(5, 5))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_mark_non_differentiable_none(self):
*da0073e9SAndroid Build Coastguard Worker        # This used to segfault because MyFunction would send back null
*da0073e9SAndroid Build Coastguard Worker        # gradients to MulBackward, which is implemented in C++. C++
*da0073e9SAndroid Build Coastguard Worker        # implemented functions expect incoming grad_outputs to be non-null.
*da0073e9SAndroid Build Coastguard Worker        class MyFunction(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, input):
*da0073e9SAndroid Build Coastguard Worker                output = input.clone()
*da0073e9SAndroid Build Coastguard Worker                ctx.mark_non_differentiable(output)
*da0073e9SAndroid Build Coastguard Worker                return output
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_output):
*da0073e9SAndroid Build Coastguard Worker                return None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        r = MyFunction.apply(x * x)
*da0073e9SAndroid Build Coastguard Worker        (r * x).sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_return_duplicate(self):
*da0073e9SAndroid Build Coastguard Worker        class DoubleDuplicate(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                output = x * 2
*da0073e9SAndroid Build Coastguard Worker                return output, output
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad1, grad2):
*da0073e9SAndroid Build Coastguard Worker                return grad1 * 2 + grad2 * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn(x):
*da0073e9SAndroid Build Coastguard Worker            a, b = DoubleDuplicate.apply(x)
*da0073e9SAndroid Build Coastguard Worker            self.assertIs(a, b)
*da0073e9SAndroid Build Coastguard Worker            return a + b
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 5, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        gradcheck(fn, [x])
*da0073e9SAndroid Build Coastguard Worker        gradgradcheck(fn, [x])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_return_duplicate_inplace(self):
*da0073e9SAndroid Build Coastguard Worker        class DoubleInplace(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                x.mul_(2)
*da0073e9SAndroid Build Coastguard Worker                ctx.mark_dirty(x)
*da0073e9SAndroid Build Coastguard Worker                return x, x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad1, grad2):
*da0073e9SAndroid Build Coastguard Worker                return grad1 * 2 + grad2 * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def inplace_fn(x):
*da0073e9SAndroid Build Coastguard Worker            a, b = DoubleInplace.apply(x.clone())
*da0073e9SAndroid Build Coastguard Worker            self.assertIs(a, b)
*da0073e9SAndroid Build Coastguard Worker            return a + b
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 5, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        gradcheck(inplace_fn, [x])
*da0073e9SAndroid Build Coastguard Worker        gradgradcheck(inplace_fn, [x])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Can't modify leaf variables in-place
*da0073e9SAndroid Build Coastguard Worker        self.assertRaises(RuntimeError, lambda: InplaceFunction.apply(x))
*da0073e9SAndroid Build Coastguard Worker        # Functions which modify views in-place must return only one output
*da0073e9SAndroid Build Coastguard Worker        self.assertRaises(RuntimeError, lambda: InplaceFunction.apply(x.clone()[0]))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _test_setitem(self, size, index):
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(*size, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = x + 2
*da0073e9SAndroid Build Coastguard Worker        y_version = y._version
*da0073e9SAndroid Build Coastguard Worker        y[index] = 2
*da0073e9SAndroid Build Coastguard Worker        self.assertNotEqual(y._version, y_version)
*da0073e9SAndroid Build Coastguard Worker        y.backward(torch.ones(*size))
*da0073e9SAndroid Build Coastguard Worker        expected_grad = torch.ones(*size)
*da0073e9SAndroid Build Coastguard Worker        expected_grad[index] = 0
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, expected_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _test_setitem_tensor(self, size, index):
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(*size, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = x + 2
*da0073e9SAndroid Build Coastguard Worker        y_version = y._version
*da0073e9SAndroid Build Coastguard Worker        value = x.new(x[index].size()).fill_(7)
*da0073e9SAndroid Build Coastguard Worker        value.requires_grad = True
*da0073e9SAndroid Build Coastguard Worker        y[index] = value
*da0073e9SAndroid Build Coastguard Worker        self.assertNotEqual(y._version, y_version)
*da0073e9SAndroid Build Coastguard Worker        y.backward(torch.ones(*size))
*da0073e9SAndroid Build Coastguard Worker        expected_grad_input = torch.ones(*size)
*da0073e9SAndroid Build Coastguard Worker        expected_grad_input[index] = 0
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, expected_grad_input)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(value.grad, torch.ones_like(value))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # case when x broadcasts to as y[1]
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(4, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.zeros(2, 3, 4)
*da0073e9SAndroid Build Coastguard Worker        y[1] = x
*da0073e9SAndroid Build Coastguard Worker        y.backward(torch.randn(2, 3, 4))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.size(), x.grad.size())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_setitem(self):
*da0073e9SAndroid Build Coastguard Worker        self._test_setitem((5, 5), 1)
*da0073e9SAndroid Build Coastguard Worker        self._test_setitem((5,), 1)
*da0073e9SAndroid Build Coastguard Worker        self._test_setitem((1,), 0)
*da0073e9SAndroid Build Coastguard Worker        self._test_setitem((10,), [[0, 4, 2]])
*da0073e9SAndroid Build Coastguard Worker        self._test_setitem((5, 5), [[0, 4], [2, 2]])
*da0073e9SAndroid Build Coastguard Worker        self._test_setitem((5, 5, 5), [slice(None), slice(None), [1, 3]])
*da0073e9SAndroid Build Coastguard Worker        self._test_setitem((5, 5, 5), [slice(None), [1, 3], slice(None)])
*da0073e9SAndroid Build Coastguard Worker        self._test_setitem((5, 5, 5), [[1, 3], slice(None), slice(None)])
*da0073e9SAndroid Build Coastguard Worker        self._test_setitem((5, 5, 5), [slice(None), [2, 4], [1, 3]])
*da0073e9SAndroid Build Coastguard Worker        self._test_setitem((5, 5, 5), [[1, 3], [2, 4], slice(None)])
*da0073e9SAndroid Build Coastguard Worker        self._test_setitem_tensor((5, 5), 3)
*da0073e9SAndroid Build Coastguard Worker        self._test_setitem_tensor((5, 5), [[0, 1], [1, 0]])
*da0073e9SAndroid Build Coastguard Worker        self._test_setitem_tensor((5,), 3)
*da0073e9SAndroid Build Coastguard Worker        self._test_setitem_tensor(
*da0073e9SAndroid Build Coastguard Worker            (5,), Variable(torch.LongTensor([3]), requires_grad=False).sum()
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self._test_setitem_tensor((5,), [[0, 1, 2, 3]])
*da0073e9SAndroid Build Coastguard Worker        self._test_setitem_tensor((5, 5, 5), [slice(None), slice(None), [1, 3]])
*da0073e9SAndroid Build Coastguard Worker        self._test_setitem_tensor((5, 5, 5), [slice(None), [1, 3], slice(None)])
*da0073e9SAndroid Build Coastguard Worker        self._test_setitem_tensor((5, 5, 5), [[1, 3], slice(None), slice(None)])
*da0073e9SAndroid Build Coastguard Worker        self._test_setitem_tensor((5, 5, 5), [slice(None), [2, 4], [1, 3]])
*da0073e9SAndroid Build Coastguard Worker        self._test_setitem_tensor((5, 5, 5), [[1, 3], [2, 4], slice(None)])
*da0073e9SAndroid Build Coastguard Worker        self._test_setitem_tensor(
*da0073e9SAndroid Build Coastguard Worker            (5, 5, 5),
*da0073e9SAndroid Build Coastguard Worker            [
*da0073e9SAndroid Build Coastguard Worker                Variable(torch.LongTensor([1, 3]), requires_grad=False),
*da0073e9SAndroid Build Coastguard Worker                [2, 4],
*da0073e9SAndroid Build Coastguard Worker                slice(None),
*da0073e9SAndroid Build Coastguard Worker            ],
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_setitem_mask(self):
*da0073e9SAndroid Build Coastguard Worker        mask = torch.BoolTensor(5, 5).bernoulli_()
*da0073e9SAndroid Build Coastguard Worker        self._test_setitem((5, 5), Variable(mask))
*da0073e9SAndroid Build Coastguard Worker        self._test_setitem((5,), Variable(mask[0]))
*da0073e9SAndroid Build Coastguard Worker        self._test_setitem((1,), Variable(mask[0, 0:1]))
*da0073e9SAndroid Build Coastguard Worker        self._test_setitem_tensor((5, 5), Variable(mask))
*da0073e9SAndroid Build Coastguard Worker        self._test_setitem_tensor((5,), Variable(mask[0]))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_select_sum(self):
*da0073e9SAndroid Build Coastguard Worker        # both select and sum return Scalars in ATen; ensure they work together.
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(10, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def func(x):
*da0073e9SAndroid Build Coastguard Worker            return x.select(0, 1).sum()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        gradcheck(func, [x])
*da0073e9SAndroid Build Coastguard Worker        gradgradcheck(func, [x])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_diagonal_expanded_v(self):
*da0073e9SAndroid Build Coastguard Worker        value = torch.rand([])
*da0073e9SAndroid Build Coastguard Worker        v_expanded = torch.tensor(value).expand(10)
*da0073e9SAndroid Build Coastguard Worker        a = torch.rand(10, 10, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        (result,) = torch.autograd.grad(a.diagonal(), a, v_expanded)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(result, torch.eye(10, dtype=torch.double) * value)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_select_expanded_v(self):
*da0073e9SAndroid Build Coastguard Worker        v_expanded = torch.rand(10).expand(10, 10)
*da0073e9SAndroid Build Coastguard Worker        a = torch.rand(10, 10, 10, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        (result,) = torch.autograd.grad(a[0], a, v_expanded)
*da0073e9SAndroid Build Coastguard Worker        expected = torch.zeros(10, 10, 10)
*da0073e9SAndroid Build Coastguard Worker        expected[0] = v_expanded
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(result, expected)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_slice_expanded_v(self):
*da0073e9SAndroid Build Coastguard Worker        v_expanded = torch.rand(10, 1).expand(2, 10, 10)
*da0073e9SAndroid Build Coastguard Worker        a = torch.rand(10, 10, 10, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        (result,) = torch.autograd.grad(a[3:5], a, v_expanded)
*da0073e9SAndroid Build Coastguard Worker        expected = torch.zeros(10, 10, 10)
*da0073e9SAndroid Build Coastguard Worker        expected[3:5] = v_expanded
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(result, expected)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_unused_output(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(10, 10, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        outputs = x.chunk(5)
*da0073e9SAndroid Build Coastguard Worker        o = outputs[2]
*da0073e9SAndroid Build Coastguard Worker        o = o * 4 + 2
*da0073e9SAndroid Build Coastguard Worker        o.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        expected_grad = torch.zeros(10, 10)
*da0073e9SAndroid Build Coastguard Worker        expected_grad[4:6] = 4
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, expected_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            x.grad.zero_()
*da0073e9SAndroid Build Coastguard Worker        grad_output = torch.randn(2, 10)
*da0073e9SAndroid Build Coastguard Worker        outputs = x.chunk(5)
*da0073e9SAndroid Build Coastguard Worker        outputs[0].backward(grad_output)
*da0073e9SAndroid Build Coastguard Worker        expected_grad = torch.zeros(10, 10)
*da0073e9SAndroid Build Coastguard Worker        expected_grad[:2] = grad_output
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, expected_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # TODO: opinfo this or move to the sparse test suite
*da0073e9SAndroid Build Coastguard Worker    def _test_sparse_gather(self, size_x, size_ind, dim):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(size_x, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        if len(size_ind) > 0 and len(size_x) > 0:
*da0073e9SAndroid Build Coastguard Worker            ind = torch.randint(x.size(dim), size_ind)
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            ind = torch.zeros(size_ind, dtype=torch.int64)
*da0073e9SAndroid Build Coastguard Worker        out = torch.gather(x, dim, ind, sparse_grad=False)
*da0073e9SAndroid Build Coastguard Worker        grad = torch.rand_like(out)
*da0073e9SAndroid Build Coastguard Worker        out.backward(grad)
*da0073e9SAndroid Build Coastguard Worker        grad_dense = x.grad.clone()
*da0073e9SAndroid Build Coastguard Worker        x.grad = None
*da0073e9SAndroid Build Coastguard Worker        out = torch.gather(x, dim, ind, sparse_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out.backward(grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(grad_dense, x.grad.to_dense())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_sparse_gather_dim0(self):
*da0073e9SAndroid Build Coastguard Worker        self._test_sparse_gather((10, 10), (5, 10), 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_sparse_gather_dim1(self):
*da0073e9SAndroid Build Coastguard Worker        self._test_sparse_gather((10, 10, 5), (10, 5, 5), 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_sparse_gather_dim_neg(self):
*da0073e9SAndroid Build Coastguard Worker        self._test_sparse_gather((10, 10, 5), (10, 10, 2), -1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_sparse_gather_ind_scalar(self):
*da0073e9SAndroid Build Coastguard Worker        self._test_sparse_gather((10,), (), 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_sparse_gather_x_scalar(self):
*da0073e9SAndroid Build Coastguard Worker        self._test_sparse_gather((), (2,), 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_sparse_gather_both_scalar(self):
*da0073e9SAndroid Build Coastguard Worker        self._test_sparse_gather((), (), 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_gc_in_destructor(self):
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        Previously, if a Function destructor triggered a garbage collection,
*da0073e9SAndroid Build Coastguard Worker        the Variable's tp_dealloc handler would get called twice leading to a
*da0073e9SAndroid Build Coastguard Worker        segfault.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class CollectOnDelete(Function):
*da0073e9SAndroid Build Coastguard Worker            def forward(self, x):
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def backward(self, grad_output):
*da0073e9SAndroid Build Coastguard Worker                return grad_output
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def __del__(self):
*da0073e9SAndroid Build Coastguard Worker                gc.collect()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for _ in range(10):
*da0073e9SAndroid Build Coastguard Worker            CollectOnDelete().forward(torch.randn(1, requires_grad=True)).backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_naughty_autograd_function_attribute_access(self):
*da0073e9SAndroid Build Coastguard Worker        class Id(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_x):
*da0073e9SAndroid Build Coastguard Worker                return grad_x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertWarnsRegex(DeprecationWarning, "should not be instantiated"):
*da0073e9SAndroid Build Coastguard Worker            f = Id()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # After raising warning, should still return an instance
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(f, Id)
*da0073e9SAndroid Build Coastguard Worker        x = torch.zeros(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, "non-static forward method is deprecated"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            f(x)
*da0073e9SAndroid Build Coastguard Worker        t = Id.apply(x)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(t.grad_fn.name(), "IdBackward")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # THPFunction is the base class of both grad_fn and autograd functions,
*da0073e9SAndroid Build Coastguard Worker        # which means that a lot of accessors on them may segfault. Test that we
*da0073e9SAndroid Build Coastguard Worker        # properly error in this case.
*da0073e9SAndroid Build Coastguard Worker        t = torch.ones(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        t._backward_hooks = {}
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, "Attribute '_register_hook_dict' is invalid"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            f._register_hook_dict(t)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, "Attribute 'register_hook' is invalid"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            f.register_hook(lambda x, y: None)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, "Attribute 'next_functions' is invalid"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            f.next_functions
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "Attribute 'name' is invalid"):
*da0073e9SAndroid Build Coastguard Worker            f.name()
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, "underlying PyNode has already been deallocated"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            f.metadata
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @unittest.expectedFailure
*da0073e9SAndroid Build Coastguard Worker    def test_naughty_anomaly_access(self):
*da0073e9SAndroid Build Coastguard Worker        class MyFunction(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, g):
*da0073e9SAndroid Build Coastguard Worker                return g
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.zeros(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = MyFunction.apply(x)
*da0073e9SAndroid Build Coastguard Worker        y.backward()
*da0073e9SAndroid Build Coastguard Worker        y.grad_fn.metadata
*da0073e9SAndroid Build Coastguard Worker        g = y.grad_fn
*da0073e9SAndroid Build Coastguard Worker        del y
*da0073e9SAndroid Build Coastguard Worker        g.metadata  # this currently fails, but shouldn't
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_naughty_autograd_function_stashing_ctx(self):
*da0073e9SAndroid Build Coastguard Worker        saved_ctx = []
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class Id(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                ctx.save_for_backward(x)
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_x):
*da0073e9SAndroid Build Coastguard Worker                saved_ctx.append(ctx)
*da0073e9SAndroid Build Coastguard Worker                return ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        p = torch.zeros(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        loss = Id.apply(p)
*da0073e9SAndroid Build Coastguard Worker        loss.backward(retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        del loss
*da0073e9SAndroid Build Coastguard Worker        # At this point in time, it complains that the graph has been freed
*da0073e9SAndroid Build Coastguard Worker        # (which indeed true, although a somewhat indirect way of stating the
*da0073e9SAndroid Build Coastguard Worker        # problem).
*da0073e9SAndroid Build Coastguard Worker        self.assertRaises(RuntimeError, lambda: saved_ctx[0].saved_tensors)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_custom_autograd_repeated_grad_grad(self):
*da0073e9SAndroid Build Coastguard Worker        # This test failed the equality check in PR #22983; it's an interesting
*da0073e9SAndroid Build Coastguard Worker        # and different test case worth enshrining.  mult1 is not testing
*da0073e9SAndroid Build Coastguard Worker        # anything that interesting, but mult2 is the interesting case.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def mult1(x):
*da0073e9SAndroid Build Coastguard Worker            return x.prod(dim=-1).prod(dim=-1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class Mult(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                y = mult1(x)
*da0073e9SAndroid Build Coastguard Worker                ctx.save_for_backward(x, y)
*da0073e9SAndroid Build Coastguard Worker                return y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_output):
*da0073e9SAndroid Build Coastguard Worker                x, y = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                return (grad_output * y)[:, None, None] / x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        mult2 = Mult.apply
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def check_gradgrad_repeated(x, y):
*da0073e9SAndroid Build Coastguard Worker            (gy,) = torch.autograd.grad(y[0], x, create_graph=True)
*da0073e9SAndroid Build Coastguard Worker            (ggy_1,) = torch.autograd.grad(gy[0, 0, 0], x, retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker            (gy,) = torch.autograd.grad(y[0], x, create_graph=True)
*da0073e9SAndroid Build Coastguard Worker            (ggy_2,) = torch.autograd.grad(gy[0, 0, 0], x, retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(ggy_1[0, 0, 1], ggy_2[0, 0, 1])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(2, 4, 4).requires_grad_()
*da0073e9SAndroid Build Coastguard Worker        check_gradgrad_repeated(x, mult1(x))
*da0073e9SAndroid Build Coastguard Worker        check_gradgrad_repeated(x, mult2(x))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_custom_autograd_no_early_free(self):
*da0073e9SAndroid Build Coastguard Worker        # This test failed complaining that buffers had already been freed
*da0073e9SAndroid Build Coastguard Worker        # prior to #22983.  Also pretty interesting test case.
*da0073e9SAndroid Build Coastguard Worker        class Double(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                y = x**2
*da0073e9SAndroid Build Coastguard Worker                ctx.save_for_backward(x, y)
*da0073e9SAndroid Build Coastguard Worker                return y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_output):
*da0073e9SAndroid Build Coastguard Worker                x, _ = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                return grad_output * 2 * x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # this is equivalent, but uses the output of .forward() in .backward()
*da0073e9SAndroid Build Coastguard Worker        class Double2(Double):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_output):
*da0073e9SAndroid Build Coastguard Worker                x, y = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                return grad_output * 2 * y / x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        double = Double.apply
*da0073e9SAndroid Build Coastguard Worker        double2 = Double2.apply
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.tensor(2).double().requires_grad_()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(gradcheck(double, x))
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(gradgradcheck(double, x))
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(gradcheck(double2, x))
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(gradgradcheck(double2, x))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        y = double(x)
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.grad(y, x, create_graph=True)
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.grad(y, x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        y = double2(x)
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.grad(y, x, create_graph=True)
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.grad(y, x)  # should not error!
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_detach(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(10, 10, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = x + 2
*da0073e9SAndroid Build Coastguard Worker        y = y.detach()
*da0073e9SAndroid Build Coastguard Worker        z = y * 4 + 2
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(y.requires_grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(z.requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(10, 10, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = x * 2
*da0073e9SAndroid Build Coastguard Worker        y = y.detach()
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(y.requires_grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(y.grad_fn)
*da0073e9SAndroid Build Coastguard Worker        z = x + y
*da0073e9SAndroid Build Coastguard Worker        z.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        # This is an incorrect gradient, but we assume that's what the user
*da0073e9SAndroid Build Coastguard Worker        # wanted. detach() is an advanced option.
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, torch.ones(10, 10))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # in-place detach
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(10, 10, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(10, 10, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        a = x * 2
*da0073e9SAndroid Build Coastguard Worker        (y + a).sum().backward(retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        a.detach_()
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(a.requires_grad)
*da0073e9SAndroid Build Coastguard Worker        (y + a).sum().backward()  # this won't backprop to x
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, torch.ones(10, 10) * 2)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y.grad, torch.ones(10, 10) * 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # in-place detach on a view raises an exception
*da0073e9SAndroid Build Coastguard Worker        view = x.narrow(0, 1, 4)
*da0073e9SAndroid Build Coastguard Worker        self.assertRaisesRegex(RuntimeError, "view", lambda: view.detach_())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_detach_base(self):
*da0073e9SAndroid Build Coastguard Worker        "detaching base does not detach view"
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(10, 10, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        view = x.narrow(0, 1, 4)
*da0073e9SAndroid Build Coastguard Worker        x.detach_()
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(x.requires_grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(view.requires_grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNotNone(view.grad_fn)
*da0073e9SAndroid Build Coastguard Worker        self.assertIs(view._base, x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_detach_then_inplace_raises_in_autograd(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn([], requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        orig_x = x.detach().clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        y = x**2  # saves x
*da0073e9SAndroid Build Coastguard Worker        z = x.detach()
*da0073e9SAndroid Build Coastguard Worker        z.zero_()
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "has been modified by an inplace"):
*da0073e9SAndroid Build Coastguard Worker            y.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _test_type_conversion_backward(self, t):
*da0073e9SAndroid Build Coastguard Worker        fvar = Variable(t(torch.randn(5, 5).float()), requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        fvar.double().sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(fvar.grad, torch.ones_like(fvar))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(type(fvar.grad), type(fvar))
*da0073e9SAndroid Build Coastguard Worker        dvar = Variable(t(torch.randn(5, 5).double()), requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        dvar.float().sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(dvar.grad, torch.ones_like(dvar))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(type(dvar.grad), type(dvar))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_type_conversions(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 5)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(x.float(), torch.FloatTensor)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(x.int(), torch.IntTensor)
*da0073e9SAndroid Build Coastguard Worker        if torch.cuda.is_available():
*da0073e9SAndroid Build Coastguard Worker            self.assertIsInstance(x.float().cuda(), torch.cuda.FloatTensor)
*da0073e9SAndroid Build Coastguard Worker            self.assertIsInstance(x.int().cuda(), torch.cuda.IntTensor)
*da0073e9SAndroid Build Coastguard Worker            self.assertIsInstance(x.int().cuda().cpu(), torch.IntTensor)
*da0073e9SAndroid Build Coastguard Worker            if torch.cuda.device_count() >= 2:
*da0073e9SAndroid Build Coastguard Worker                x2 = x.float().cuda(1)
*da0073e9SAndroid Build Coastguard Worker                self.assertIsInstance(x2, torch.cuda.FloatTensor)
*da0073e9SAndroid Build Coastguard Worker                self.assertIs(x2.get_device(), 1)
*da0073e9SAndroid Build Coastguard Worker                x2 = x.float().cuda()
*da0073e9SAndroid Build Coastguard Worker                self.assertIsInstance(x2, torch.cuda.FloatTensor)
*da0073e9SAndroid Build Coastguard Worker                self.assertIs(x2.get_device(), 0)
*da0073e9SAndroid Build Coastguard Worker                x2 = x2.cuda(1)
*da0073e9SAndroid Build Coastguard Worker                self.assertIsInstance(x2, torch.cuda.FloatTensor)
*da0073e9SAndroid Build Coastguard Worker                self.assertIs(x2.get_device(), 1)
*da0073e9SAndroid Build Coastguard Worker                y = Variable(torch.randn(5).cuda(1), requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker                y.cpu().sum().backward()
*da0073e9SAndroid Build Coastguard Worker                self.assertIs(y.grad.get_device(), 1)
*da0073e9SAndroid Build Coastguard Worker                self.assertIs(y.long().get_device(), 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for t in [
*da0073e9SAndroid Build Coastguard Worker            torch.DoubleTensor,
*da0073e9SAndroid Build Coastguard Worker            torch.FloatTensor,
*da0073e9SAndroid Build Coastguard Worker            torch.IntTensor,
*da0073e9SAndroid Build Coastguard Worker            torch.ByteTensor,
*da0073e9SAndroid Build Coastguard Worker        ]:
*da0073e9SAndroid Build Coastguard Worker            for y_var in (True, False):
*da0073e9SAndroid Build Coastguard Worker                y = torch.randint(5, (5, 5), dtype=t.dtype)
*da0073e9SAndroid Build Coastguard Worker                y = Variable(y) if y_var else y
*da0073e9SAndroid Build Coastguard Worker                self.assertIsInstance(x.type(t), t)
*da0073e9SAndroid Build Coastguard Worker                self.assertIsInstance(x.type_as(y), t)
*da0073e9SAndroid Build Coastguard Worker                # TODO: t.dtype should work
*da0073e9SAndroid Build Coastguard Worker                t_dtype = t().dtype
*da0073e9SAndroid Build Coastguard Worker                self.assertIsInstance(x.type(t_dtype), t)
*da0073e9SAndroid Build Coastguard Worker                self.assertIs(t_dtype, x.type(t_dtype).dtype)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(y.data_ptr(), y.type(t).data_ptr())
*da0073e9SAndroid Build Coastguard Worker                if torch.cuda.is_available():
*da0073e9SAndroid Build Coastguard Worker                    for x_cuda in (True, False):
*da0073e9SAndroid Build Coastguard Worker                        for y_cuda in (True, False):
*da0073e9SAndroid Build Coastguard Worker                            x_c = x.cuda() if x_cuda else x
*da0073e9SAndroid Build Coastguard Worker                            y_c = y.cuda() if y_cuda else y
*da0073e9SAndroid Build Coastguard Worker                            _, y_type = y_c.type().rsplit(".", 1)
*da0073e9SAndroid Build Coastguard Worker                            y_typestr = ("torch.cuda." if y_cuda else "torch.") + y_type
*da0073e9SAndroid Build Coastguard Worker                            self.assertEqual(y_c.type(), x_c.type(y_typestr).type())
*da0073e9SAndroid Build Coastguard Worker                            self.assertIs(y_c.dtype, x_c.type(y_c.dtype).dtype)
*da0073e9SAndroid Build Coastguard Worker                            self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker                                y_c.data_ptr(),
*da0073e9SAndroid Build Coastguard Worker                                y_c.cuda().data_ptr() if y_cuda else y_c.data_ptr(),
*da0073e9SAndroid Build Coastguard Worker                            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self._test_type_conversion_backward(lambda x: x)
*da0073e9SAndroid Build Coastguard Worker        if torch.cuda.is_available():
*da0073e9SAndroid Build Coastguard Worker            self._test_type_conversion_backward(lambda x: x.cuda())
*da0073e9SAndroid Build Coastguard Worker            if torch.cuda.device_count() >= 2:
*da0073e9SAndroid Build Coastguard Worker                # one of these has to be the non-default device
*da0073e9SAndroid Build Coastguard Worker                self._test_type_conversion_backward(lambda x: x.cuda(0))
*da0073e9SAndroid Build Coastguard Worker                self._test_type_conversion_backward(lambda x: x.cuda(1))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_isolated_node(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = x + y
*da0073e9SAndroid Build Coastguard Worker        b = torch.max(a, 1, True)[1].repeat(1, 5).double()
*da0073e9SAndroid Build Coastguard Worker        o = (b + a).sum()
*da0073e9SAndroid Build Coastguard Worker        o.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_shape(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(3, 4)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(2, len(x.shape))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.shape[0], 3)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.shape[1], 4)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_numpy_requires_grad(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        err_msg_outputs = r"Can't call numpy\(\) on Tensor that requires grad. Use tensor.detach\(\).numpy\(\) instead."
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, err_msg_outputs):
*da0073e9SAndroid Build Coastguard Worker            x.numpy()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            x.numpy()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(2, 2)
*da0073e9SAndroid Build Coastguard Worker        x.numpy()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            x.numpy()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_return_leaf(self):
*da0073e9SAndroid Build Coastguard Worker        class Identity(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, a, b):
*da0073e9SAndroid Build Coastguard Worker                return a, a + b
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_a, grad_b):
*da0073e9SAndroid Build Coastguard Worker                return grad_a + grad_b, grad_b
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        hook_called = [False]
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        q, p = Identity.apply(x, y)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Make sure hooks only receive grad from usage of q, not x.
*da0073e9SAndroid Build Coastguard Worker        def hook(grad):
*da0073e9SAndroid Build Coastguard Worker            hook_called[0] = True
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(grad, torch.ones(5, 5))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        q.register_hook(hook)
*da0073e9SAndroid Build Coastguard Worker        (q + p + x).sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, torch.ones(5, 5) * 3)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y.grad, torch.ones(5, 5))
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(hook_called[0])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_return_leaf_inplace(self):
*da0073e9SAndroid Build Coastguard Worker        class Inplace(InplaceFunction):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, a, b):
*da0073e9SAndroid Build Coastguard Worker                ctx.mark_dirty(a)
*da0073e9SAndroid Build Coastguard Worker                return a.add_(b), b + 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_a, grad_b):
*da0073e9SAndroid Build Coastguard Worker                return grad_a, grad_a + grad_b
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 5)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        q, p = Inplace.apply(x, y)
*da0073e9SAndroid Build Coastguard Worker        self.assertIs(q, x)
*da0073e9SAndroid Build Coastguard Worker        self.assertIs(q.grad_fn.__class__, Inplace._backward_cls)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(q.requires_grad)
*da0073e9SAndroid Build Coastguard Worker        q.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y.grad, torch.ones(5, 5))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_leaf_assignment(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 5)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        z = torch.randn(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x[0] = y
*da0073e9SAndroid Build Coastguard Worker        x[1] = 2 * z
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(x.requires_grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNot(x.grad_fn, None)
*da0073e9SAndroid Build Coastguard Worker        x.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y.grad, torch.ones(5))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(z.grad, torch.ones(5) * 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_no_grad_assignment(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(5)
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            x[0] = y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(x.requires_grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(x.grad_fn)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_no_grad_modifies_version(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        z = (x * y).sum()
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            x *= 2
*da0073e9SAndroid Build Coastguard Worker        self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, "modified by an inplace operation", lambda: z.backward()
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_increment_version(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.rand(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        v = a._version
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.graph.increment_version(a)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a._version, v + 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.zeros(5, dtype=torch.int)
*da0073e9SAndroid Build Coastguard Worker        v = a._version
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.graph.increment_version(a)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a._version, v + 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.inference_mode():
*da0073e9SAndroid Build Coastguard Worker            a = torch.rand(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            # does not error
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.graph.increment_version(a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # does not error
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.graph.increment_version(a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_no_grad_input(self):
*da0073e9SAndroid Build Coastguard Worker        class MyFunction(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(self, x):
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(self, grad_output):
*da0073e9SAndroid Build Coastguard Worker                return grad_output
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            y = MyFunction.apply(x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(x.requires_grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(y.grad_fn)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_backward_copy(self):
*da0073e9SAndroid Build Coastguard Worker        # This tests checks backward engine for a very subtle bug that appreared
*da0073e9SAndroid Build Coastguard Worker        # in one of the initial versions of autograd. Gradients tensors were
*da0073e9SAndroid Build Coastguard Worker        # simply stored in lists while the function waited for all its gradients
*da0073e9SAndroid Build Coastguard Worker        # to be computed. However, sometimes an output was used multiple times,
*da0073e9SAndroid Build Coastguard Worker        # so the gradients needed to be summed. Engine used to keep a need_copy
*da0073e9SAndroid Build Coastguard Worker        # set of tensors that will need a clone upon next addition and removed
*da0073e9SAndroid Build Coastguard Worker        # them from the set as soon as the clone was performed. However, this
*da0073e9SAndroid Build Coastguard Worker        # could lead to incorrect results if the same gradient tensor was
*da0073e9SAndroid Build Coastguard Worker        # buffered in three places in the graph:
*da0073e9SAndroid Build Coastguard Worker        # 1. When accumulating gradients in one of these places it was cloned
*da0073e9SAndroid Build Coastguard Worker        #    and removed from need_copy set.
*da0073e9SAndroid Build Coastguard Worker        # 2. When accumulating in second place, it wasn't in the need_copy set,
*da0073e9SAndroid Build Coastguard Worker        #    so the gradients were simply accumulated in-place (which already
*da0073e9SAndroid Build Coastguard Worker        #    modified the grad in 3rd place)
*da0073e9SAndroid Build Coastguard Worker        # 3. When accumulating in the third place, it wasn't in the need_copy set
*da0073e9SAndroid Build Coastguard Worker        #    as well, so the incoming gradient was summed in-place, yielding
*da0073e9SAndroid Build Coastguard Worker        #    incorrect results in all functions, except the first one.
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.ones(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        # Simulate that we're in the middle of the graph
*da0073e9SAndroid Build Coastguard Worker        a = x + 2
*da0073e9SAndroid Build Coastguard Worker        b = y + 2
*da0073e9SAndroid Build Coastguard Worker        c = x + 2
*da0073e9SAndroid Build Coastguard Worker        # This op will just return grad_output two times in backward
*da0073e9SAndroid Build Coastguard Worker        add1 = a + b
*da0073e9SAndroid Build Coastguard Worker        add2 = add1 + c
*da0073e9SAndroid Build Coastguard Worker        # Simulate a long branch, so grad_output will get buffered.
*da0073e9SAndroid Build Coastguard Worker        for _ in range(4):
*da0073e9SAndroid Build Coastguard Worker            a = a * 2
*da0073e9SAndroid Build Coastguard Worker            b = b * 2
*da0073e9SAndroid Build Coastguard Worker            c = c * 2
*da0073e9SAndroid Build Coastguard Worker        branch = a + b + c
*da0073e9SAndroid Build Coastguard Worker        out = add2 + branch
*da0073e9SAndroid Build Coastguard Worker        # expected gradients are:
*da0073e9SAndroid Build Coastguard Worker        # for x: 34 (16 from final a, 16 from final c, 2 from add2)
*da0073e9SAndroid Build Coastguard Worker        # for y: 17 (16 from final b, 1 from add2)
*da0073e9SAndroid Build Coastguard Worker        grad_output = torch.ones(5, 5)
*da0073e9SAndroid Build Coastguard Worker        out.backward(grad_output)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, torch.ones(5, 5) * 34)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y.grad, torch.ones(5, 5) * 17)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_save_none_for_backward(self):
*da0073e9SAndroid Build Coastguard Worker        test_case = self
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class MyFn(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, input):
*da0073e9SAndroid Build Coastguard Worker                ctx.save_for_backward(None, input, None)
*da0073e9SAndroid Build Coastguard Worker                return input * input
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_output):
*da0073e9SAndroid Build Coastguard Worker                n1, input, n2 = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                test_case.assertIsNone(n1)
*da0073e9SAndroid Build Coastguard Worker                test_case.assertIsNone(n2)
*da0073e9SAndroid Build Coastguard Worker                return 2 * input * grad_output
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = MyFn.apply(x)
*da0073e9SAndroid Build Coastguard Worker        y.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, 2 * x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_too_many_grads(self):
*da0073e9SAndroid Build Coastguard Worker        class MyFn(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, input):
*da0073e9SAndroid Build Coastguard Worker                return input
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_output):
*da0073e9SAndroid Build Coastguard Worker                return grad_output, None, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = MyFn.apply(x)
*da0073e9SAndroid Build Coastguard Worker        y.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, torch.ones_like(x))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_pickle(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(10, 10, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(10, 10, requires_grad=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def assert_strict_equal(var1, var2):
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(var1, var2)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(var1.requires_grad, var2.requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        serialized = [pickle.dumps([x, y], protocol=p) for p in range(3)]
*da0073e9SAndroid Build Coastguard Worker        for dump in serialized:
*da0073e9SAndroid Build Coastguard Worker            xc, yc = pickle.loads(dump)
*da0073e9SAndroid Build Coastguard Worker            assert_strict_equal(xc, x)
*da0073e9SAndroid Build Coastguard Worker            assert_strict_equal(yc, y)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfTorchDynamo("compile tested in test/dynamo/test_autograd_function.py")
*da0073e9SAndroid Build Coastguard Worker    def test_dep_nograd(self):
*da0073e9SAndroid Build Coastguard Worker        class F1(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, input):
*da0073e9SAndroid Build Coastguard Worker                out = torch.randn(input.size())
*da0073e9SAndroid Build Coastguard Worker                ctx.mark_non_differentiable(out)
*da0073e9SAndroid Build Coastguard Worker                return input, out
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_output, ignored):
*da0073e9SAndroid Build Coastguard Worker                return grad_output
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class F2(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, input, ignored):
*da0073e9SAndroid Build Coastguard Worker                return input
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_output):
*da0073e9SAndroid Build Coastguard Worker                return grad_output, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        a, b = F1.apply(x)
*da0073e9SAndroid Build Coastguard Worker        b = b + 1  # separate F1 from F2 by another op
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(a.requires_grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(b.requires_grad)
*da0073e9SAndroid Build Coastguard Worker        c = F2.apply(a, b)
*da0073e9SAndroid Build Coastguard Worker        c.backward(torch.ones(c.size()))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, torch.ones(x.size()))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_set_grad_enabled(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.tensor([1.0], requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        with torch.set_grad_enabled(False):
*da0073e9SAndroid Build Coastguard Worker            y = x * 2
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(y.requires_grad)
*da0073e9SAndroid Build Coastguard Worker        with torch.set_grad_enabled(True):
*da0073e9SAndroid Build Coastguard Worker            y = x * 2
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(y.requires_grad)
*da0073e9SAndroid Build Coastguard Worker        with torch.set_grad_enabled(False):
*da0073e9SAndroid Build Coastguard Worker            torch.set_grad_enabled(True)
*da0073e9SAndroid Build Coastguard Worker            y = x * 2
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(y.requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_set_grad_enabled_wraps(self):
*da0073e9SAndroid Build Coastguard Worker        for decorator in [True, False]:
*da0073e9SAndroid Build Coastguard Worker            with torch.enable_grad():
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                if decorator:
*da0073e9SAndroid Build Coastguard Worker                    # This should not mutate the global grad mode!
*da0073e9SAndroid Build Coastguard Worker                    @torch.set_grad_enabled(False)
*da0073e9SAndroid Build Coastguard Worker                    def inner_func(x):
*da0073e9SAndroid Build Coastguard Worker                        return x.sin()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    def inner_func(x):
*da0073e9SAndroid Build Coastguard Worker                        return x.sin()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    # This is non-idiomatic usage!
*da0073e9SAndroid Build Coastguard Worker                    # More idiomatic usage: torch.set_grad_enabled(False)(inner_func)
*da0073e9SAndroid Build Coastguard Worker                    obj = torch.set_grad_enabled(False)
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(not torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    # this will consume the set_grad_enabled global mutation!
*da0073e9SAndroid Build Coastguard Worker                    inner_func = obj(inner_func)
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(torch.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                x = torch.zeros(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(not inner_func(x).requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_simple_reentrant(self):
*da0073e9SAndroid Build Coastguard Worker        y_data = torch.randn(2, 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class Reenter(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                with torch.enable_grad():
*da0073e9SAndroid Build Coastguard Worker                    ctx.x = Variable(x, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker                    ctx.y = Variable(y_data, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker                    ctx.output_var = ctx.x * ctx.y
*da0073e9SAndroid Build Coastguard Worker                return ctx.output_var.detach()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_output):
*da0073e9SAndroid Build Coastguard Worker                with torch.enable_grad():
*da0073e9SAndroid Build Coastguard Worker                    ctx.output_var.sum().backward()
*da0073e9SAndroid Build Coastguard Worker                return ctx.x.grad * grad_output
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Reentrant starts on CPU thread, finishs on GPU thread
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out = Reenter.apply(x)
*da0073e9SAndroid Build Coastguard Worker        out.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, y_data)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_reentrant_child_error(self):
*da0073e9SAndroid Build Coastguard Worker        # Parent graph.
*da0073e9SAndroid Build Coastguard Worker        a = torch.rand(3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        c = a * a
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Reentrant child graph.
*da0073e9SAndroid Build Coastguard Worker        b = torch.rand(3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        e = b * b
*da0073e9SAndroid Build Coastguard Worker        f = TestAutograd.SimulateBackwardError.apply(e)
*da0073e9SAndroid Build Coastguard Worker        reentrant_root = f.sum()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class ReentrantFunc(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, inp):
*da0073e9SAndroid Build Coastguard Worker                return inp.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad):
*da0073e9SAndroid Build Coastguard Worker                # Reentrant backward in child will throw an error.
*da0073e9SAndroid Build Coastguard Worker                reentrant_root.backward()
*da0073e9SAndroid Build Coastguard Worker                return grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        d = ReentrantFunc.apply(c)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(Exception, "Simulate error"):
*da0073e9SAndroid Build Coastguard Worker            d.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_var_mean_differentiable(self):
*da0073e9SAndroid Build Coastguard Worker        dim = [2, 4]
*da0073e9SAndroid Build Coastguard Worker        keepdim = False
*da0073e9SAndroid Build Coastguard Worker        input1 = torch.randn(3, 4, 5, 6, 2, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        input2 = deepcopy(input1)
*da0073e9SAndroid Build Coastguard Worker        var1, mean1 = torch.var_mean(input1, dim=dim, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker        var2 = input2.var(dim=dim, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker        mean2 = input2.mean(dim=dim, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker        grad = torch.randn(3, 4, 6, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        r1 = var1 * var1 * mean1 * mean1
*da0073e9SAndroid Build Coastguard Worker        r2 = var2 * var2 * mean2 * mean2
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(r1, r2, rtol=0.01, atol=0.0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.backward(r1, grad)
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.backward(r2, grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(input1.grad, input2.grad, rtol=0.01, atol=0.0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfNoLapack
*da0073e9SAndroid Build Coastguard Worker    def test_lobpcg(self):
*da0073e9SAndroid Build Coastguard Worker        def func(k, A, largest=True, B=None):
*da0073e9SAndroid Build Coastguard Worker            X_shape = list(A.shape)
*da0073e9SAndroid Build Coastguard Worker            X_shape[-1] = k
*da0073e9SAndroid Build Coastguard Worker            X = torch.eye(A.size(-2), k, dtype=A.dtype, device=A.device)
*da0073e9SAndroid Build Coastguard Worker            if A.dim() > 2:
*da0073e9SAndroid Build Coastguard Worker                X = X.expand(X_shape)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            D, U = torch.lobpcg(A=A, k=k, B=B, X=X, largest=largest)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # LOBPCG uses a random initial eigenspace approximation
*da0073e9SAndroid Build Coastguard Worker            # if parameter `X` is not provided.
*da0073e9SAndroid Build Coastguard Worker            # This may cause a non-deterministic behavior
*da0073e9SAndroid Build Coastguard Worker            # when it comes to the sign of an eigenvector
*da0073e9SAndroid Build Coastguard Worker            # (note if v is an eigenvector, so is -v),
*da0073e9SAndroid Build Coastguard Worker            # hence we eliminate this non-determinism
*da0073e9SAndroid Build Coastguard Worker            # by making sure that each column of U
*da0073e9SAndroid Build Coastguard Worker            # gets multiplied by the sign of its max (in absolute value) element.
*da0073e9SAndroid Build Coastguard Worker            # Also, gradcheck changes the content of the input by +/- eps (default to 1e-06)
*da0073e9SAndroid Build Coastguard Worker            # to compute the numerical gradient which can also cause the signs to flip.
*da0073e9SAndroid Build Coastguard Worker            _, idx = U.abs().max(-2, keepdim=True)
*da0073e9SAndroid Build Coastguard Worker            sign = U.gather(-2, idx).sign()
*da0073e9SAndroid Build Coastguard Worker            U = U * sign
*da0073e9SAndroid Build Coastguard Worker            return D, U
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # TODO: review if this can be ported to OpInfos or moved to test_linalg.py
*da0073e9SAndroid Build Coastguard Worker        def run_symeig_test(k, sizes, largest=True):
*da0073e9SAndroid Build Coastguard Worker            A = torch.rand(*sizes).double()
*da0073e9SAndroid Build Coastguard Worker            A = (A @ A.mT) / 10
*da0073e9SAndroid Build Coastguard Worker            A.requires_grad_(True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            gradcheck(lambda A: func(k, A, largest), A, check_batched_grad=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Custom gradient vectors for better stability due to some
*da0073e9SAndroid Build Coastguard Worker            # non-determinism in the lobpcg's forward.
*da0073e9SAndroid Build Coastguard Worker            # Note it is not required if symeig is in forward instead (tested).
*da0073e9SAndroid Build Coastguard Worker            D_grad = torch.rand(*A.shape[:-2], k) / 100
*da0073e9SAndroid Build Coastguard Worker            U_grad = torch.rand(*A.shape[:-1], k) / 100
*da0073e9SAndroid Build Coastguard Worker            gradgradcheck(
*da0073e9SAndroid Build Coastguard Worker                lambda A: func(k, A, largest),
*da0073e9SAndroid Build Coastguard Worker                A,
*da0073e9SAndroid Build Coastguard Worker                [D_grad, U_grad],
*da0073e9SAndroid Build Coastguard Worker                atol=1e-4,
*da0073e9SAndroid Build Coastguard Worker                check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # check whether A.grad is symmetric
*da0073e9SAndroid Build Coastguard Worker            A = A.detach().requires_grad_(True)
*da0073e9SAndroid Build Coastguard Worker            D, U = func(k, A, largest)
*da0073e9SAndroid Build Coastguard Worker            (D.sum() + U.sum()).backward()
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(A.grad, A.grad.mT)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for largest in [True, False]:
*da0073e9SAndroid Build Coastguard Worker            run_symeig_test(1, (6, 6), largest=largest)
*da0073e9SAndroid Build Coastguard Worker            run_symeig_test(1, (2, 6, 6), largest=largest)
*da0073e9SAndroid Build Coastguard Worker            run_symeig_test(1, (2, 2, 6, 6), largest=largest)
*da0073e9SAndroid Build Coastguard Worker            run_symeig_test(2, (6, 6), largest=largest)
*da0073e9SAndroid Build Coastguard Worker            run_symeig_test(2, (2, 6, 6), largest=largest)
*da0073e9SAndroid Build Coastguard Worker            run_symeig_test(2, (2, 2, 6, 6), largest=largest)
*da0073e9SAndroid Build Coastguard Worker            run_symeig_test(3, (9, 9), largest=largest)
*da0073e9SAndroid Build Coastguard Worker            run_symeig_test(3, (2, 9, 9), largest=largest)
*da0073e9SAndroid Build Coastguard Worker            run_symeig_test(3, (2, 2, 9, 9), largest=largest)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_variable_traverse(self):
*da0073e9SAndroid Build Coastguard Worker        def get_out_and_unrefed_cycle():
*da0073e9SAndroid Build Coastguard Worker            inp = torch.randn(10, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            tmp = inp.view(10, 1)
*da0073e9SAndroid Build Coastguard Worker            out = tmp.view(10)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Create a reference cycle that contains an
*da0073e9SAndroid Build Coastguard Worker            # intermediary Variable in the graph
*da0073e9SAndroid Build Coastguard Worker            my_list = []
*da0073e9SAndroid Build Coastguard Worker            my_list.append(tmp)
*da0073e9SAndroid Build Coastguard Worker            my_list.append(my_list)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            return out
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = get_out_and_unrefed_cycle()
*da0073e9SAndroid Build Coastguard Worker        gc.collect()
*da0073e9SAndroid Build Coastguard Worker        # This will segfault if things have been erroneously released
*da0073e9SAndroid Build Coastguard Worker        out.backward(torch.randn(out.size()))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # TODO: review porting these to OpInfo tests
*da0073e9SAndroid Build Coastguard Worker    def test_pow_zero_tensor_gradient(self):
*da0073e9SAndroid Build Coastguard Worker        def run_test(input_size, exponent):
*da0073e9SAndroid Build Coastguard Worker            input = torch.zeros(*input_size, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            input.pow(exponent).sum().backward()
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(input.grad.abs().sum(), 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        run_test((10,), torch.zeros(10))
*da0073e9SAndroid Build Coastguard Worker        run_test((10, 10), torch.zeros(10, 10))
*da0073e9SAndroid Build Coastguard Worker        run_test((10,), 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_current_graph_task_id(self):
*da0073e9SAndroid Build Coastguard Worker        id = [-1]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def hook(_):
*da0073e9SAndroid Build Coastguard Worker            id[0] = torch._C._current_graph_task_id()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        t = torch.tensor(1.0, requires_grad=True).clone()
*da0073e9SAndroid Build Coastguard Worker        t.register_hook(hook)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        t.backward(retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        base = id[0]
*da0073e9SAndroid Build Coastguard Worker        t.backward(retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(id[0] - base, 1)
*da0073e9SAndroid Build Coastguard Worker        t.backward(retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(id[0] - base, 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(torch._C._current_graph_task_id(), -1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_current_graph_task_execution_order(self):
*da0073e9SAndroid Build Coastguard Worker        predicted = [None]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def hook(_):
*da0073e9SAndroid Build Coastguard Worker            predicted[0] = torch._C._current_graph_task_execution_order()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def names(nodes):
*da0073e9SAndroid Build Coastguard Worker            return ", ".join([node.name().split(" ")[-1] for node in nodes]) + "\n"
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def grad_fns(*tensors):
*da0073e9SAndroid Build Coastguard Worker            # or grad accumulator
*da0073e9SAndroid Build Coastguard Worker            out = []
*da0073e9SAndroid Build Coastguard Worker            for t in tensors:
*da0073e9SAndroid Build Coastguard Worker                if t.requires_grad and t.grad_fn is None:
*da0073e9SAndroid Build Coastguard Worker                    out.append(t.clone().grad_fn.next_functions[0][0])
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    out.append(t.grad_fn)
*da0073e9SAndroid Build Coastguard Worker            return out
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        actual = []
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def register_logging_hooks(*tensors):
*da0073e9SAndroid Build Coastguard Worker            # register hooks that log the order in which they are called
*da0073e9SAndroid Build Coastguard Worker            def get_hook(i):
*da0073e9SAndroid Build Coastguard Worker                def hook(t_):
*da0073e9SAndroid Build Coastguard Worker                    actual.append(tensors[i])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                return hook
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            for i, t in enumerate(tensors):
*da0073e9SAndroid Build Coastguard Worker                t.register_hook(get_hook(i))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Basic example: single path
*da0073e9SAndroid Build Coastguard Worker        t = torch.tensor(1.0, requires_grad=True).clone().sin().exp()
*da0073e9SAndroid Build Coastguard Worker        t.register_hook(hook)
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.set_multithreading_enabled(False):
*da0073e9SAndroid Build Coastguard Worker            t.backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertExpectedInline(
*da0073e9SAndroid Build Coastguard Worker            names(predicted[0]),
*da0073e9SAndroid Build Coastguard Worker            """\
*da0073e9SAndroid Build Coastguard WorkerExpBackward0, SinBackward0, CloneBackward0, torch::autograd::AccumulateGrad
*da0073e9SAndroid Build Coastguard Worker""",
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # We don't exactly follow sequence_nr order
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = torch.tensor(2.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        c = b.sin()
*da0073e9SAndroid Build Coastguard Worker        d = a.cos()
*da0073e9SAndroid Build Coastguard Worker        out = c * d
*da0073e9SAndroid Build Coastguard Worker        register_logging_hooks(a, b, c, d, out)
*da0073e9SAndroid Build Coastguard Worker        out.register_hook(hook)
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.set_multithreading_enabled(False):
*da0073e9SAndroid Build Coastguard Worker            out.backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(predicted[0], grad_fns(*actual))
*da0073e9SAndroid Build Coastguard Worker        actual = []
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Accumulate grad node has more than one input
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = a.sin()
*da0073e9SAndroid Build Coastguard Worker        c = a.cos()
*da0073e9SAndroid Build Coastguard Worker        out = b * c
*da0073e9SAndroid Build Coastguard Worker        register_logging_hooks(a, b, c, out)
*da0073e9SAndroid Build Coastguard Worker        out.register_hook(hook)
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.set_multithreading_enabled(False):
*da0073e9SAndroid Build Coastguard Worker            out.backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(predicted[0], grad_fns(*actual))
*da0073e9SAndroid Build Coastguard Worker        actual = []
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Multiple roots are also OK
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = a * 2
*da0073e9SAndroid Build Coastguard Worker        out = b.sin()
*da0073e9SAndroid Build Coastguard Worker        out2 = b.cos()
*da0073e9SAndroid Build Coastguard Worker        out3 = b.cos()
*da0073e9SAndroid Build Coastguard Worker        register_logging_hooks(a, b, out, out2, out3)
*da0073e9SAndroid Build Coastguard Worker        out3.register_hook(hook)
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.set_multithreading_enabled(False):
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.grad((out, out3, out2), inputs=(a,))
*da0073e9SAndroid Build Coastguard Worker        self.assertExpectedInline(
*da0073e9SAndroid Build Coastguard Worker            names(predicted[0]),
*da0073e9SAndroid Build Coastguard Worker            """\
*da0073e9SAndroid Build Coastguard WorkerCosBackward0, CosBackward0, SinBackward0, MulBackward0, torch::autograd::AccumulateGrad
*da0073e9SAndroid Build Coastguard Worker""",
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        # TODO: Uncomment after update to hooks behavior
*da0073e9SAndroid Build Coastguard Worker        # self.assertEqual(predicted[0], grad_fns(*actual))
*da0073e9SAndroid Build Coastguard Worker        actual = []
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Case where next node is nullptr
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = a * 2
*da0073e9SAndroid Build Coastguard Worker        out = b.sin()
*da0073e9SAndroid Build Coastguard Worker        register_logging_hooks(a, b, out)
*da0073e9SAndroid Build Coastguard Worker        out.register_hook(hook)
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.set_multithreading_enabled(False):
*da0073e9SAndroid Build Coastguard Worker            out.backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(predicted[0], grad_fns(*actual))
*da0073e9SAndroid Build Coastguard Worker        actual = []
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Case where two `inputs` on the same path
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = a * 2
*da0073e9SAndroid Build Coastguard Worker        out = b.sin()
*da0073e9SAndroid Build Coastguard Worker        register_logging_hooks(a, b, out)
*da0073e9SAndroid Build Coastguard Worker        out.register_hook(hook)
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.set_multithreading_enabled(False):
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.grad((out,), inputs=(a, b))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            names(predicted[0]),
*da0073e9SAndroid Build Coastguard Worker            """\
*da0073e9SAndroid Build Coastguard WorkerSinBackward0, MulBackward0, torch::autograd::AccumulateGrad
*da0073e9SAndroid Build Coastguard Worker""",
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        # TODO: Uncomment after update to hooks behavior
*da0073e9SAndroid Build Coastguard Worker        # self.assertEqual(predicted[0], grad_fns(*actual))
*da0073e9SAndroid Build Coastguard Worker        actual = []
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Case where `inputs` specifies a subgraph
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        c = a * b
*da0073e9SAndroid Build Coastguard Worker        out = c.sin()
*da0073e9SAndroid Build Coastguard Worker        register_logging_hooks(a, b, c, out)
*da0073e9SAndroid Build Coastguard Worker        out.register_hook(hook)
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.set_multithreading_enabled(False):
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.grad((out,), inputs=(a,))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            names(predicted[0]),
*da0073e9SAndroid Build Coastguard Worker            """\
*da0073e9SAndroid Build Coastguard WorkerSinBackward0, MulBackward0, torch::autograd::AccumulateGrad
*da0073e9SAndroid Build Coastguard Worker""",
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        # TODO: Uncomment after update to hooks behavior
*da0073e9SAndroid Build Coastguard Worker        # self.assertEqual(predicted[0], grad_fns(*actual))
*da0073e9SAndroid Build Coastguard Worker        actual = []
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Errors when not called in a backward
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, "should only be called during the backward pass"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            torch._C._current_graph_task_execution_order()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Errors when context manager not enabled
*da0073e9SAndroid Build Coastguard Worker        t = torch.tensor(1.0, requires_grad=True).clone().sin().exp()
*da0073e9SAndroid Build Coastguard Worker        t.register_hook(hook)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError,
*da0073e9SAndroid Build Coastguard Worker            "expects the current backward to be executed with multithreading disabled",
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            t.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_view_replay_enabled(self):
*da0073e9SAndroid Build Coastguard Worker        def f(x):
*da0073e9SAndroid Build Coastguard Worker            out = x.clone().view(-1)
*da0073e9SAndroid Build Coastguard Worker            # mutate the view, triggering autograd view-replay logic
*da0073e9SAndroid Build Coastguard Worker            out.add_(1)
*da0073e9SAndroid Build Coastguard Worker            return out
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Test as a context manager
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd._force_original_view_tracking(False):
*da0073e9SAndroid Build Coastguard Worker            out = f(x)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue("AsStridedBackward" in str(out.grad_fn))
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(torch.autograd.is_view_replay_enabled())
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(torch.autograd.is_view_replay_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd._force_original_view_tracking(True):
*da0073e9SAndroid Build Coastguard Worker            out = f(x)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue("ViewBackward" in str(out.grad_fn))
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.autograd.is_view_replay_enabled())
*da0073e9SAndroid Build Coastguard Worker        out = f(x)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue("AsStridedBackward" in str(out.grad_fn))
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(torch.autograd.is_view_replay_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd._force_original_view_tracking(False):
*da0073e9SAndroid Build Coastguard Worker            torch.autograd._force_original_view_tracking(True)
*da0073e9SAndroid Build Coastguard Worker            out = f(x)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue("ViewBackward" in str(out.grad_fn))
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.autograd.is_view_replay_enabled())
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(torch.autograd.is_view_replay_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Test as a function
*da0073e9SAndroid Build Coastguard Worker        torch.autograd._force_original_view_tracking(False)
*da0073e9SAndroid Build Coastguard Worker        out = f(x)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue("AsStridedBackward" in str(out.grad_fn))
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(torch.autograd.is_view_replay_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        torch.autograd._force_original_view_tracking(True)
*da0073e9SAndroid Build Coastguard Worker        out = f(x)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue("ViewBackward" in str(out.grad_fn))
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(torch.autograd.is_view_replay_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_unsafe_set_version_counter(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(2, requires_grad=True).clone()
*da0073e9SAndroid Build Coastguard Worker        x.add_(1)
*da0073e9SAndroid Build Coastguard Worker        x.add_(2)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(2, x._version)
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd._unsafe_preserve_version_counter(x):
*da0073e9SAndroid Build Coastguard Worker            x.mul_(2)
*da0073e9SAndroid Build Coastguard Worker            x.mul_(3)
*da0073e9SAndroid Build Coastguard Worker        # version counter doesn't change inside of the context manager
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(2, x._version)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        torch._C._autograd._unsafe_set_version_counter(x, 0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(0, x._version)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "Cannot set"):
*da0073e9SAndroid Build Coastguard Worker            torch._C._autograd._unsafe_set_version_counter(x, -1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_current_node(self):
*da0073e9SAndroid Build Coastguard Worker        pr = []
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class MyMode(TorchDispatchMode):
*da0073e9SAndroid Build Coastguard Worker            def __torch_dispatch__(self, func, types, args, kwargs=None):
*da0073e9SAndroid Build Coastguard Worker                node = torch._C._current_autograd_node()
*da0073e9SAndroid Build Coastguard Worker                # Don't use node.name() here as it is not consistent on windows
*da0073e9SAndroid Build Coastguard Worker                node_name = node.__class__.__name__ if node else "None"
*da0073e9SAndroid Build Coastguard Worker                pr.append(f"Running {func} from within {node_name}")
*da0073e9SAndroid Build Coastguard Worker                return func(*args, **(kwargs or {}))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with MyMode():
*da0073e9SAndroid Build Coastguard Worker            pr.append("FW")
*da0073e9SAndroid Build Coastguard Worker            a = torch.rand(10, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            b = a.mul(2).div(3).sum()
*da0073e9SAndroid Build Coastguard Worker            pr.append("BW")
*da0073e9SAndroid Build Coastguard Worker            b.backward()
*da0073e9SAndroid Build Coastguard Worker            pr.append("Done")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertExpectedInline(
*da0073e9SAndroid Build Coastguard Worker            "\n".join(pr),
*da0073e9SAndroid Build Coastguard Worker            """\
*da0073e9SAndroid Build Coastguard WorkerFW
*da0073e9SAndroid Build Coastguard WorkerRunning aten.rand.default from within None
*da0073e9SAndroid Build Coastguard WorkerRunning aten.mul.Tensor from within None
*da0073e9SAndroid Build Coastguard WorkerRunning aten.div.Tensor from within None
*da0073e9SAndroid Build Coastguard WorkerRunning aten.sum.default from within None
*da0073e9SAndroid Build Coastguard WorkerBW
*da0073e9SAndroid Build Coastguard WorkerRunning aten.ones_like.default from within None
*da0073e9SAndroid Build Coastguard WorkerRunning aten.expand.default from within SumBackward0
*da0073e9SAndroid Build Coastguard WorkerRunning aten.div.Tensor from within DivBackward0
*da0073e9SAndroid Build Coastguard WorkerRunning aten.mul.Tensor from within MulBackward0
*da0073e9SAndroid Build Coastguard WorkerRunning aten.detach.default from within AccumulateGrad
*da0073e9SAndroid Build Coastguard WorkerRunning aten.detach.default from within AccumulateGrad
*da0073e9SAndroid Build Coastguard WorkerDone""",
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_profiler(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(10, 10)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with profile(use_kineto=kineto_available()) as p:
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.autograd._profiler_enabled())
*da0073e9SAndroid Build Coastguard Worker            y = x * 2 + 4
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(torch.autograd._profiler_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        names = ["aten::mul", "aten::add"]
*da0073e9SAndroid Build Coastguard Worker        found_indices = set()
*da0073e9SAndroid Build Coastguard Worker        for evt in p.function_events:
*da0073e9SAndroid Build Coastguard Worker            if evt.name in names:
*da0073e9SAndroid Build Coastguard Worker                found_indices.add(names.index(evt.name))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(len(found_indices), len(names))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_profiler_seq_nr(self):
*da0073e9SAndroid Build Coastguard Worker        with profile(use_kineto=kineto_available()) as p:
*da0073e9SAndroid Build Coastguard Worker            x = torch.randn(10, 10, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            y = torch.randn(10, 10, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            z = x + y
*da0073e9SAndroid Build Coastguard Worker            s = z.sum(dim=None)
*da0073e9SAndroid Build Coastguard Worker            s.backward()
*da0073e9SAndroid Build Coastguard Worker        print(p.key_averages().table(sort_by="self_cpu_time_total", row_limit=-1))
*da0073e9SAndroid Build Coastguard Worker        # expecting aten::add, aten::sum to have the sequence numbers,
*da0073e9SAndroid Build Coastguard Worker        # expecting the corresponding backward nodes to have the same numbers
*da0073e9SAndroid Build Coastguard Worker        # as the forward ops
*da0073e9SAndroid Build Coastguard Worker        autograd_ops = {
*da0073e9SAndroid Build Coastguard Worker            ("aten::add", "Add"): [],
*da0073e9SAndroid Build Coastguard Worker            ("aten::sum", "Sum"): [],
*da0073e9SAndroid Build Coastguard Worker        }
*da0073e9SAndroid Build Coastguard Worker        accumulate_ops = []
*da0073e9SAndroid Build Coastguard Worker        found_empty = False
*da0073e9SAndroid Build Coastguard Worker        for e in p.function_events:
*da0073e9SAndroid Build Coastguard Worker            for (fwd_name, bwd_name), ops in autograd_ops.items():
*da0073e9SAndroid Build Coastguard Worker                if e.name == fwd_name or (bwd_name in e.name and "Backward" in e.name):
*da0073e9SAndroid Build Coastguard Worker                    ops.append(e)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            if "AccumulateGrad" in e.name:
*da0073e9SAndroid Build Coastguard Worker                accumulate_ops.append(e)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # check that nested ops (e.g. empty) don't have
*da0073e9SAndroid Build Coastguard Worker            # sequence number
*da0073e9SAndroid Build Coastguard Worker            if e.name == "aten::empty":
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(e.sequence_nr, -1)
*da0073e9SAndroid Build Coastguard Worker                found_empty = True
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for idx, ((fwd_name, bwd_name), ops) in enumerate(autograd_ops.items()):
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(len(ops), 3)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(ops[0].name, fwd_name)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker                ops[1].name,
*da0073e9SAndroid Build Coastguard Worker                f"autograd::engine::evaluate_function: {bwd_name}Backward{idx}",
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(ops[2].name, f"{bwd_name}Backward{idx}")
*da0073e9SAndroid Build Coastguard Worker            self.assertGreaterEqual(ops[0].sequence_nr, 0)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(ops[1].sequence_nr, ops[0].sequence_nr)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(ops[2].sequence_nr, ops[0].sequence_nr)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(ops[0].fwd_thread, 0)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(ops[1].fwd_thread, ops[0].thread)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(ops[2].fwd_thread, ops[0].thread)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(found_empty)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_profiler_unboxed_only(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(3, 4)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.profiler.profile(use_kineto=kineto_available()) as prof:
*da0073e9SAndroid Build Coastguard Worker            x.resize_([3, 2])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_profiler_propagation(self):
*da0073e9SAndroid Build Coastguard Worker        def foo(x):
*da0073e9SAndroid Build Coastguard Worker            with record_function("in_foo") as rf:
*da0073e9SAndroid Build Coastguard Worker                return x * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(3, 4)
*da0073e9SAndroid Build Coastguard Worker        traced_foo = torch.jit.trace(foo, x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def bar(x):
*da0073e9SAndroid Build Coastguard Worker            with record_function("in_bar") as rf:
*da0073e9SAndroid Build Coastguard Worker                # we expect that profiler will be able
*da0073e9SAndroid Build Coastguard Worker                # propagate across fork
*da0073e9SAndroid Build Coastguard Worker                fut = torch.jit._fork(traced_foo, x)
*da0073e9SAndroid Build Coastguard Worker                y = torch.jit._wait(fut)
*da0073e9SAndroid Build Coastguard Worker                # note: continuation (and rf's end) can
*da0073e9SAndroid Build Coastguard Worker                # be executed in a different thread
*da0073e9SAndroid Build Coastguard Worker                with record_function("in_bar_after_wait") as rf2:
*da0073e9SAndroid Build Coastguard Worker                    y = y * 2
*da0073e9SAndroid Build Coastguard Worker                return y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        traced_bar = torch.jit.trace(bar, x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with profile(use_kineto=kineto_available()) as p:
*da0073e9SAndroid Build Coastguard Worker            traced_bar(x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        found_foo = False
*da0073e9SAndroid Build Coastguard Worker        found_bar = False
*da0073e9SAndroid Build Coastguard Worker        found_bar_after_wait = False
*da0073e9SAndroid Build Coastguard Worker        for info in p.function_events:
*da0073e9SAndroid Build Coastguard Worker            if info.name == "in_foo":
*da0073e9SAndroid Build Coastguard Worker                self.assertFalse(found_foo)
*da0073e9SAndroid Build Coastguard Worker                found_foo = True
*da0073e9SAndroid Build Coastguard Worker            elif info.name == "in_bar":
*da0073e9SAndroid Build Coastguard Worker                self.assertFalse(found_bar)
*da0073e9SAndroid Build Coastguard Worker                found_bar = True
*da0073e9SAndroid Build Coastguard Worker            elif info.name == "in_bar_after_wait":
*da0073e9SAndroid Build Coastguard Worker                self.assertFalse(found_bar_after_wait)
*da0073e9SAndroid Build Coastguard Worker                found_bar_after_wait = True
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(found_foo)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(found_bar)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(found_bar_after_wait)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_record_function_callbacks(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(10, 10)
*da0073e9SAndroid Build Coastguard Worker        with profile(use_kineto=kineto_available()) as p:
*da0073e9SAndroid Build Coastguard Worker            with record_function("foo"):
*da0073e9SAndroid Build Coastguard Worker                y = x * 2 + 4
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        function_events = p.function_events
*da0073e9SAndroid Build Coastguard Worker        foo_event = next(event for event in function_events if "foo" in event.name)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(foo_event.count, 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_record_function_legacy(self):
*da0073e9SAndroid Build Coastguard Worker        # Test the new _record_function ops work
*da0073e9SAndroid Build Coastguard Worker        # Note: Remove once record_function uses these directly
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(10, 10)
*da0073e9SAndroid Build Coastguard Worker        with profile(use_kineto=kineto_available()) as p:
*da0073e9SAndroid Build Coastguard Worker            handle = torch.ops.profiler._record_function_enter("bar", None)
*da0073e9SAndroid Build Coastguard Worker            try:
*da0073e9SAndroid Build Coastguard Worker                y = x * 2 + 4
*da0073e9SAndroid Build Coastguard Worker            finally:
*da0073e9SAndroid Build Coastguard Worker                torch.ops.profiler._record_function_exit(handle)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        function_events = p.function_events
*da0073e9SAndroid Build Coastguard Worker        foo_event = next(event for event in function_events if "bar" in event.name)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(foo_event.count, 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_profiler_aggregation_fake(self):
*da0073e9SAndroid Build Coastguard Worker        events = EventList()
*da0073e9SAndroid Build Coastguard Worker        id = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def get_id():
*da0073e9SAndroid Build Coastguard Worker            id[0] = id[0] + 1
*da0073e9SAndroid Build Coastguard Worker            return id[0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # [[thread_id, [(start, end, id), ....]], ...]
*da0073e9SAndroid Build Coastguard Worker        # Using list instead of a dict so order is guaranteed for any Python
*da0073e9SAndroid Build Coastguard Worker        # version
*da0073e9SAndroid Build Coastguard Worker        threads = [
*da0073e9SAndroid Build Coastguard Worker            [1, [(0, 1, get_id()), (1, 2, get_id())]],
*da0073e9SAndroid Build Coastguard Worker            [0, [(0, 2, get_id()), (1, 2, get_id()), (1, 3, get_id())]],
*da0073e9SAndroid Build Coastguard Worker        ]
*da0073e9SAndroid Build Coastguard Worker        for thread, ranges in threads:
*da0073e9SAndroid Build Coastguard Worker            for range in ranges:
*da0073e9SAndroid Build Coastguard Worker                assert len(range) == 3
*da0073e9SAndroid Build Coastguard Worker                events.append(
*da0073e9SAndroid Build Coastguard Worker                    FunctionEvent(
*da0073e9SAndroid Build Coastguard Worker                        id=range[2],
*da0073e9SAndroid Build Coastguard Worker                        node_id=0,
*da0073e9SAndroid Build Coastguard Worker                        name="",
*da0073e9SAndroid Build Coastguard Worker                        thread=thread,
*da0073e9SAndroid Build Coastguard Worker                        start_us=range[0],
*da0073e9SAndroid Build Coastguard Worker                        end_us=range[1],
*da0073e9SAndroid Build Coastguard Worker                    )
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        events._populate_cpu_children()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Note that [1, 3] pushes out [0, 2] first. Then we record [1, 2]
*da0073e9SAndroid Build Coastguard Worker        # as a child of [1, 3]
*da0073e9SAndroid Build Coastguard Worker        res = [[], [], [], [], [4]]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def get_children_ids(event):
*da0073e9SAndroid Build Coastguard Worker            return [child.id for child in event.cpu_children]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        assert [get_children_ids(event) for event in events] == res
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_profiler_aggregation_table(self):
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        Test if the profiling result is aggregated for `str(prof)`
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        See: https://github.com/pytorch/pytorch/issues/37500
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(1024)
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.profiler.profile(use_kineto=kineto_available()) as prof:
*da0073e9SAndroid Build Coastguard Worker            torch.einsum("i->", x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        prof_str = str(prof)
*da0073e9SAndroid Build Coastguard Worker        prof_table = prof.table()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(prof_table, prof_str)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_profiler_function_event_avg(self):
*da0073e9SAndroid Build Coastguard Worker        avg = FunctionEventAvg()
*da0073e9SAndroid Build Coastguard Worker        avg.add(
*da0073e9SAndroid Build Coastguard Worker            FunctionEvent(id=0, node_id=0, name="foo", thread=0, start_us=10, end_us=15)
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        avg.add(
*da0073e9SAndroid Build Coastguard Worker            FunctionEvent(id=1, node_id=0, name="foo", thread=0, start_us=20, end_us=30)
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        avg.add(avg)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(avg.key, "foo")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # aggregate stats
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(avg.count, 4)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(avg.cpu_time_total, 30)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(avg.self_cpu_time_total, 30)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(avg.device_time_total, 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # average stats
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(avg.cpu_time, 7.5)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(avg.device_time_total, 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_profiler_shapes(self):
*da0073e9SAndroid Build Coastguard Worker        print()
*da0073e9SAndroid Build Coastguard Worker        layer1 = torch.nn.Linear(20, 30)
*da0073e9SAndroid Build Coastguard Worker        layer2 = torch.nn.Linear(30, 40)
*da0073e9SAndroid Build Coastguard Worker        input = torch.randn(128, 20)
*da0073e9SAndroid Build Coastguard Worker        with profile(record_shapes=True, use_kineto=kineto_available()) as prof:
*da0073e9SAndroid Build Coastguard Worker            layer2(layer1(input))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        print(prof.function_events)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        linear_expected_shapes = [
*da0073e9SAndroid Build Coastguard Worker            [[128, 20], [30, 20], [30]],
*da0073e9SAndroid Build Coastguard Worker            [[128, 30], [40, 30], [40]],
*da0073e9SAndroid Build Coastguard Worker        ]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        found_indices = set()
*da0073e9SAndroid Build Coastguard Worker        for event in prof.function_events:
*da0073e9SAndroid Build Coastguard Worker            if event.name == "aten::linear":
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(event.input_shapes in linear_expected_shapes)
*da0073e9SAndroid Build Coastguard Worker                found_indices.add(linear_expected_shapes.index(event.input_shapes))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(len(found_indices), len(linear_expected_shapes))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_profiler_aggregation_lstm(self):
*da0073e9SAndroid Build Coastguard Worker        print()
*da0073e9SAndroid Build Coastguard Worker        rnn = torch.nn.LSTM(10, 20, 2)
*da0073e9SAndroid Build Coastguard Worker        total_time_s = 0
*da0073e9SAndroid Build Coastguard Worker        with profile(record_shapes=True, use_kineto=kineto_available()) as prof:
*da0073e9SAndroid Build Coastguard Worker            for i in range(20):
*da0073e9SAndroid Build Coastguard Worker                input = torch.randn(5, 3, 10)
*da0073e9SAndroid Build Coastguard Worker                h = torch.randn(2, 3, 20)
*da0073e9SAndroid Build Coastguard Worker                c = torch.randn(2, 3, 20)
*da0073e9SAndroid Build Coastguard Worker                start = time.time()
*da0073e9SAndroid Build Coastguard Worker                rnn(input, (h, c))
*da0073e9SAndroid Build Coastguard Worker                end = time.time()
*da0073e9SAndroid Build Coastguard Worker                total_time_s += end - start
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        print(prof.table(sort_by="self_cpu_time_total", row_limit=10, header="TEST"))
*da0073e9SAndroid Build Coastguard Worker        print(
*da0073e9SAndroid Build Coastguard Worker            prof.key_averages(group_by_input_shape=True).table(
*da0073e9SAndroid Build Coastguard Worker                sort_by="self_cpu_time_total", row_limit=10
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        print(
*da0073e9SAndroid Build Coastguard Worker            prof.table(
*da0073e9SAndroid Build Coastguard Worker                sort_by="self_cpu_time_total",
*da0073e9SAndroid Build Coastguard Worker                row_limit=10,
*da0073e9SAndroid Build Coastguard Worker                max_src_column_width=300,
*da0073e9SAndroid Build Coastguard Worker                header="TEST",
*da0073e9SAndroid Build Coastguard Worker                top_level_events_only=True,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        print(
*da0073e9SAndroid Build Coastguard Worker            prof.key_averages(group_by_input_shape=True).table(
*da0073e9SAndroid Build Coastguard Worker                sort_by="self_cpu_time_total", row_limit=10, top_level_events_only=True
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        total_time_us = (
*da0073e9SAndroid Build Coastguard Worker            total_time_s * 1000.0 * 1000.0
*da0073e9SAndroid Build Coastguard Worker        )  # make it us which is profiler default
*da0073e9SAndroid Build Coastguard Worker        print("Total time based on python measurements: ", _format_time(total_time_us))
*da0073e9SAndroid Build Coastguard Worker        print(
*da0073e9SAndroid Build Coastguard Worker            f"CPU time measurement python side overhead: {(total_time_us / prof.self_cpu_time_total - 1.0) * 100.0:.2f}%"
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if sys.platform != "win32":
*da0073e9SAndroid Build Coastguard Worker            with tempfile.NamedTemporaryFile() as trace_file:
*da0073e9SAndroid Build Coastguard Worker                prof.export_chrome_trace(trace_file.name)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_record_function(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(10, 10)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def forward(x):
*da0073e9SAndroid Build Coastguard Worker            with record_function("outer"):
*da0073e9SAndroid Build Coastguard Worker                y = x * 2 + 4
*da0073e9SAndroid Build Coastguard Worker                with record_function("inner"):
*da0073e9SAndroid Build Coastguard Worker                    y = y - 1
*da0073e9SAndroid Build Coastguard Worker            y = y / 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        forward(x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with profile(use_kineto=kineto_available()) as p:
*da0073e9SAndroid Build Coastguard Worker            forward(x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        events = p.function_events
*da0073e9SAndroid Build Coastguard Worker        important_events = [
*da0073e9SAndroid Build Coastguard Worker            "outer",
*da0073e9SAndroid Build Coastguard Worker            "aten::mul",
*da0073e9SAndroid Build Coastguard Worker            "aten::add",
*da0073e9SAndroid Build Coastguard Worker            "inner",
*da0073e9SAndroid Build Coastguard Worker            "aten::sub",
*da0073e9SAndroid Build Coastguard Worker            "aten::div",
*da0073e9SAndroid Build Coastguard Worker        ]
*da0073e9SAndroid Build Coastguard Worker        idx = 0
*da0073e9SAndroid Build Coastguard Worker        for info in events:
*da0073e9SAndroid Build Coastguard Worker            if info.name == important_events[idx]:
*da0073e9SAndroid Build Coastguard Worker                idx = idx + 1
*da0073e9SAndroid Build Coastguard Worker            if idx == len(important_events):
*da0073e9SAndroid Build Coastguard Worker                break
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(idx, len(important_events))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # We can also use record_function to decorate arbitrary function
*da0073e9SAndroid Build Coastguard Worker        @record_function("my_func")
*da0073e9SAndroid Build Coastguard Worker        def f(x, y):
*da0073e9SAndroid Build Coastguard Worker            return x + y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with profile(use_kineto=kineto_available()) as p:
*da0073e9SAndroid Build Coastguard Worker            f(1, 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue("my_func" in str(p))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_record_function_multithreaded(self):
*da0073e9SAndroid Build Coastguard Worker        rf = record_function("outer")
*da0073e9SAndroid Build Coastguard Worker        rf.__enter__()
*da0073e9SAndroid Build Coastguard Worker        with record_function("inner"):
*da0073e9SAndroid Build Coastguard Worker            # test that exiting the record function after starting another one
*da0073e9SAndroid Build Coastguard Worker            # doesn't throw.
*da0073e9SAndroid Build Coastguard Worker            rf.__exit__(None, None, None)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with record_function("inner"):
*da0073e9SAndroid Build Coastguard Worker            rf.__enter__()
*da0073e9SAndroid Build Coastguard Worker        # test that exiting the record function after ending another one
*da0073e9SAndroid Build Coastguard Worker        # doesn't throw.
*da0073e9SAndroid Build Coastguard Worker        rf.__exit__(None, None, None)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_dir(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(10, 10)
*da0073e9SAndroid Build Coastguard Worker        keys = dir(x)
*da0073e9SAndroid Build Coastguard Worker        self.assertIn("shape", keys)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # real and imag are only implemented for complex tensors.
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(10, 10, dtype=torch.cfloat)
*da0073e9SAndroid Build Coastguard Worker        imag_key = "imag"
*da0073e9SAndroid Build Coastguard Worker        self.assertRaises(RuntimeError, lambda: hasattr(x, imag_key))
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(hasattr(y, imag_key))
*da0073e9SAndroid Build Coastguard Worker        keys.remove(imag_key)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for key in keys:
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(hasattr(x, key))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inplace_on_view_saved_output(self):
*da0073e9SAndroid Build Coastguard Worker        # Test an in-place operation on a view in which the in-place op saves
*da0073e9SAndroid Build Coastguard Worker        # its output. Previously, this created a reference cycle.
*da0073e9SAndroid Build Coastguard Worker        dealloc = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class IncrementOnDelete:
*da0073e9SAndroid Build Coastguard Worker            def __del__(self):
*da0073e9SAndroid Build Coastguard Worker                dealloc[0] += 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def test():
*da0073e9SAndroid Build Coastguard Worker            root = torch.randn(3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            copy = root.clone()
*da0073e9SAndroid Build Coastguard Worker            copy.grad_fn.register_hook(IncrementOnDelete())
*da0073e9SAndroid Build Coastguard Worker            view = copy.view(9)
*da0073e9SAndroid Build Coastguard Worker            torch.nn.functional.relu(view, inplace=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        test()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(dealloc[0], 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inplace_on_view_leaf_errors(self):
*da0073e9SAndroid Build Coastguard Worker        # Issue #21875: Fail faster (when we try to modify the view vs. in backward())
*da0073e9SAndroid Build Coastguard Worker        x = torch.zeros(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = x.view_as(x)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError,
*da0073e9SAndroid Build Coastguard Worker            "a view of a leaf Variable that "
*da0073e9SAndroid Build Coastguard Worker            "requires grad is being used in "
*da0073e9SAndroid Build Coastguard Worker            "an in-place operation.",
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            y.add_(1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inplace_on_view_backward(self):
*da0073e9SAndroid Build Coastguard Worker        # Issue #10532: Make sure that this does not raise RuntimeError.
*da0073e9SAndroid Build Coastguard Worker        net = nn.Sequential(nn.InstanceNorm2d(2), nn.ReLU(True))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.tensor([[[[1.0, 1.0]]]], requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        (g,) = torch.autograd.grad(
*da0073e9SAndroid Build Coastguard Worker            net(x).pow(2), [x], grad_outputs=x.new_ones(x.shape), create_graph=True
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.grad(g.sum(), [x])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x, torch.tensor([[[[1.0, 1.0]]]]))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # https://discuss.pytorch.org/t/freeing-buffer-strange-behavior/31955/8
*da0073e9SAndroid Build Coastguard Worker        inputs = torch.ones((1, 3, 256, 256), requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        tmp1 = (inputs + 1).view_as(inputs)
*da0073e9SAndroid Build Coastguard Worker        tmp2 = torch.nn.functional.threshold(tmp1, 0.0, 0.0, True)
*da0073e9SAndroid Build Coastguard Worker        prob_interpolated = torch.sigmoid(tmp2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        gradients = torch.autograd.grad(
*da0073e9SAndroid Build Coastguard Worker            outputs=prob_interpolated,
*da0073e9SAndroid Build Coastguard Worker            inputs=inputs,
*da0073e9SAndroid Build Coastguard Worker            grad_outputs=torch.ones(prob_interpolated.size()),
*da0073e9SAndroid Build Coastguard Worker            create_graph=True,
*da0073e9SAndroid Build Coastguard Worker            retain_graph=True,
*da0073e9SAndroid Build Coastguard Worker        )[0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        gradient_penalty = gradients.sum()
*da0073e9SAndroid Build Coastguard Worker        gradient_penalty.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        fn = gradient_penalty.grad_fn.next_functions[0][0].next_functions[1][0]
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(fn.name(), "ThresholdBackwardBackward0")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inplace_on_view_weak_grad_fn(self):
*da0073e9SAndroid Build Coastguard Worker        # Issue 23502: Test that b's grad_fn is preserved.
*da0073e9SAndroid Build Coastguard Worker        a = torch.arange(10.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        b = a.narrow(0, 0, 2).clone().view(-1)
*da0073e9SAndroid Build Coastguard Worker        b.relu_()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        c = b.clone()
*da0073e9SAndroid Build Coastguard Worker        del b
*da0073e9SAndroid Build Coastguard Worker        gc.collect()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        s = c.sum()
*da0073e9SAndroid Build Coastguard Worker        s.backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(s, torch.tensor(1.0))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Issue #21875: Fail faster (when we try to modify the view vs. in backward())
*da0073e9SAndroid Build Coastguard Worker        a = torch.rand(10, requires_grad=True).narrow(0, 0, 10)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(RuntimeError):
*da0073e9SAndroid Build Coastguard Worker            b = a.relu_()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_out_variant_raises_when_inputs_require_grad(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = torch.randn(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        x = torch.zeros_like(a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # out=... functions don't support automatic differentiation currently
*da0073e9SAndroid Build Coastguard Worker        self.assertRaisesRegex(RuntimeError, "out=", lambda: torch.mul(a, b, out=x))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # the inputs can require grad if we're in no_grad() mode
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            torch.mul(a, b, out=x)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(x, a * b)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(2, 2)
*da0073e9SAndroid Build Coastguard Worker        b = torch.randn(2, 2)
*da0073e9SAndroid Build Coastguard Worker        x = torch.zeros(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        # we should throw an exception if the output requires grad
*da0073e9SAndroid Build Coastguard Worker        self.assertRaisesRegex(RuntimeError, "out=", lambda: torch.mul(a, b, out=x))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_anomaly_detect_nan(self):
*da0073e9SAndroid Build Coastguard Worker        size = 10
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class MyFunc(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, inp1, inp2, fail_0th):
*da0073e9SAndroid Build Coastguard Worker                ctx.fail_0th = fail_0th
*da0073e9SAndroid Build Coastguard Worker                return inp1.sum(0, keepdim=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                gI = gO.clone().expand(size)
*da0073e9SAndroid Build Coastguard Worker                gI[0] = 0
*da0073e9SAndroid Build Coastguard Worker                gI[0] /= 0  # Generate a nan
*da0073e9SAndroid Build Coastguard Worker                if ctx.fail_0th:
*da0073e9SAndroid Build Coastguard Worker                    return gI, None, None
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    return None, gI, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        inp = torch.rand(size, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out = MyFunc.apply(inp, inp, True)
*da0073e9SAndroid Build Coastguard Worker        out.backward()  # Should not fail
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        inp = torch.rand(size, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out = MyFunc.apply(inp, inp, True)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError,
*da0073e9SAndroid Build Coastguard Worker            "Function 'MyFuncBackward' returned nan values in its 0th output.",
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            with warnings.catch_warnings(record=True) as w:
*da0073e9SAndroid Build Coastguard Worker                with detect_anomaly():
*da0073e9SAndroid Build Coastguard Worker                    out.backward()
*da0073e9SAndroid Build Coastguard Worker            self.assertIn("No forward pass information", str(w[0].message))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        inp = torch.rand(size, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError,
*da0073e9SAndroid Build Coastguard Worker            "Function 'MyFuncBackward' returned nan values in its 1th output.",
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            with warnings.catch_warnings(record=True) as w:
*da0073e9SAndroid Build Coastguard Worker                with detect_anomaly():
*da0073e9SAndroid Build Coastguard Worker                    out = MyFunc.apply(inp, inp, False)
*da0073e9SAndroid Build Coastguard Worker                    out.backward()
*da0073e9SAndroid Build Coastguard Worker            self.assertIn("MyFunc.apply", str(w[0].message))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_calculate_shape_util(self):
*da0073e9SAndroid Build Coastguard Worker        out = torch.randn(10, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        grad = torch.randn(5, 10, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out_shape, grad_shape = _calculate_shape(out, grad, False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        assert out_shape == torch.Size([10, 5])
*da0073e9SAndroid Build Coastguard Worker        assert grad_shape == torch.Size([5, 10])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = torch.nested.as_nested_tensor(
*da0073e9SAndroid Build Coastguard Worker            [
*da0073e9SAndroid Build Coastguard Worker                torch.randn(10, 5, requires_grad=True),
*da0073e9SAndroid Build Coastguard Worker                torch.randn(10, 5, requires_grad=True),
*da0073e9SAndroid Build Coastguard Worker                torch.randn(10, 5, requires_grad=True),
*da0073e9SAndroid Build Coastguard Worker            ]
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        grad = torch.nested.as_nested_tensor(
*da0073e9SAndroid Build Coastguard Worker            [
*da0073e9SAndroid Build Coastguard Worker                torch.randn(5, 10, requires_grad=True),
*da0073e9SAndroid Build Coastguard Worker                torch.randn(5, 10, requires_grad=True),
*da0073e9SAndroid Build Coastguard Worker            ]
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        out_shape, grad_shape = _calculate_shape(out, grad, False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        assert torch.equal(out_shape, torch.tensor([[10, 5], [10, 5], [10, 5]]))
*da0073e9SAndroid Build Coastguard Worker        assert torch.equal(grad_shape, torch.tensor([[5, 10], [5, 10]]))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_nested_anomaly_detect_nan(self):
*da0073e9SAndroid Build Coastguard Worker        size = 10
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class MyFunc(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, inp1, fail_0th):
*da0073e9SAndroid Build Coastguard Worker                ctx.fail_0th = fail_0th
*da0073e9SAndroid Build Coastguard Worker                ctx.save_for_backward(inp1)
*da0073e9SAndroid Build Coastguard Worker                return inp1.sum(0, keepdim=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                (inp,) = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                fail_0th = ctx.fail_0th
*da0073e9SAndroid Build Coastguard Worker                g = gO.clone().expand(size)
*da0073e9SAndroid Build Coastguard Worker                gI = MyFunc2.apply(g * inp, g + inp, fail_0th)
*da0073e9SAndroid Build Coastguard Worker                return gI, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class MyFunc2(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, inp1, inp2, fail_0th):
*da0073e9SAndroid Build Coastguard Worker                ctx.fail_0th = fail_0th
*da0073e9SAndroid Build Coastguard Worker                return inp1 * 2.0 + inp2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                fail_0th = ctx.fail_0th
*da0073e9SAndroid Build Coastguard Worker                g1 = gO.clone()
*da0073e9SAndroid Build Coastguard Worker                g2 = gO.clone()
*da0073e9SAndroid Build Coastguard Worker                g1[0] = 0
*da0073e9SAndroid Build Coastguard Worker                g2[0] = 0
*da0073e9SAndroid Build Coastguard Worker                # generate a nan
*da0073e9SAndroid Build Coastguard Worker                if fail_0th:
*da0073e9SAndroid Build Coastguard Worker                    g1[0] /= 0
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    g2[0] /= 0
*da0073e9SAndroid Build Coastguard Worker                return g1, g2, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        inp = torch.rand(size, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out = MyFunc.apply(inp, True)
*da0073e9SAndroid Build Coastguard Worker        (ginp,) = torch.autograd.grad(out, (inp,), create_graph=True)
*da0073e9SAndroid Build Coastguard Worker        gsum = ginp.sum()
*da0073e9SAndroid Build Coastguard Worker        gsum.backward()  # should not fail
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        inp = torch.rand(size, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out = MyFunc.apply(inp, True)
*da0073e9SAndroid Build Coastguard Worker        (ginp,) = torch.autograd.grad(out, (inp,), create_graph=True)
*da0073e9SAndroid Build Coastguard Worker        gsum = ginp.sum()
*da0073e9SAndroid Build Coastguard Worker        with warnings.catch_warnings(record=True) as w:
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError,
*da0073e9SAndroid Build Coastguard Worker                "Function 'MyFunc2Backward' returned nan values in its 0th output.",
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                with detect_anomaly():
*da0073e9SAndroid Build Coastguard Worker                    gsum.backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertIn("No forward pass information", str(w[1].message))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        inp = torch.rand(size, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        with warnings.catch_warnings(record=True) as w:
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError,
*da0073e9SAndroid Build Coastguard Worker                "Function 'MyFunc2Backward' returned nan values in its 1th output.",
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                with detect_anomaly():
*da0073e9SAndroid Build Coastguard Worker                    out = MyFunc.apply(inp, False)
*da0073e9SAndroid Build Coastguard Worker                    (ginp,) = torch.autograd.grad(out, (inp,), create_graph=True)
*da0073e9SAndroid Build Coastguard Worker                    gsum = ginp.sum()
*da0073e9SAndroid Build Coastguard Worker                    gsum.backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertIn("MyFunc2.apply", str(w[1].message))
*da0073e9SAndroid Build Coastguard Worker        self.assertIn("MyFunc.apply", str(w[2].message))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_anomaly_grad_warnings(self):
*da0073e9SAndroid Build Coastguard Worker        # PyTorch won't throw warnings if there is an error
*da0073e9SAndroid Build Coastguard Worker        # but we'd want to at least see them in stderr
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class StdErrDiverter:
*da0073e9SAndroid Build Coastguard Worker            def __enter__(self):
*da0073e9SAndroid Build Coastguard Worker                self.stderr_orig = sys.stderr
*da0073e9SAndroid Build Coastguard Worker                self.stderr_new = io.StringIO()
*da0073e9SAndroid Build Coastguard Worker                sys.stderr = self.stderr_new
*da0073e9SAndroid Build Coastguard Worker                return self
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def __exit__(self, *args):
*da0073e9SAndroid Build Coastguard Worker                self.captured = self.stderr_new.getvalue()
*da0073e9SAndroid Build Coastguard Worker                sys.stderr = self.stderr_orig
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # if the warnings don't throw, they will be handled as regular warnings
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError,
*da0073e9SAndroid Build Coastguard Worker            "one of the variables needed for gradient computation has been "
*da0073e9SAndroid Build Coastguard Worker            "modified by an inplace operation",
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            with warnings.catch_warnings(record=True) as w:
*da0073e9SAndroid Build Coastguard Worker                with detect_anomaly():
*da0073e9SAndroid Build Coastguard Worker                    a = torch.randn(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker                    d1 = a + 1
*da0073e9SAndroid Build Coastguard Worker                    d2 = d1**2
*da0073e9SAndroid Build Coastguard Worker                    d1 += 1
*da0073e9SAndroid Build Coastguard Worker                    torch.autograd.grad(d2.sum(), a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(len(w), 2)
*da0073e9SAndroid Build Coastguard Worker        self.assertIn("Anomaly Detection has been enabled", str(w[0].message))
*da0073e9SAndroid Build Coastguard Worker        self.assertIn("Error detected in PowBackward0", str(w[1].message))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # if the warning throws, it will be printed to sys.stderr
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError,
*da0073e9SAndroid Build Coastguard Worker            "one of the variables needed for gradient computation has been "
*da0073e9SAndroid Build Coastguard Worker            "modified by an inplace operation",
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            with warnings.catch_warnings(record=True) as w:
*da0073e9SAndroid Build Coastguard Worker                with detect_anomaly():
*da0073e9SAndroid Build Coastguard Worker                    warnings.simplefilter("error")
*da0073e9SAndroid Build Coastguard Worker                    with StdErrDiverter() as s:
*da0073e9SAndroid Build Coastguard Worker                        a = torch.randn(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker                        d1 = a + 1
*da0073e9SAndroid Build Coastguard Worker                        d2 = d1**2
*da0073e9SAndroid Build Coastguard Worker                        d1 += 1
*da0073e9SAndroid Build Coastguard Worker                        torch.autograd.grad(d2.sum(), a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(len(w), 1)
*da0073e9SAndroid Build Coastguard Worker        self.assertIn("Anomaly Detection has been enabled", str(w[0].message))
*da0073e9SAndroid Build Coastguard Worker        self.assertIn("Error detected in PowBackward0", s.captured)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_anomaly_assign_parent_cleanup(self):
*da0073e9SAndroid Build Coastguard Worker        # Test that python objects created are properly cleaned up when assign_parent is called
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def get_ref():
*da0073e9SAndroid Build Coastguard Worker            # we use torch.exp here but any function that will construct a new node in its
*da0073e9SAndroid Build Coastguard Worker            # backward call in grad mode will work
*da0073e9SAndroid Build Coastguard Worker            x = torch.randn(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            t = x.exp()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # ExpBackward calls mul, creating the MulBackward node when create_graph=True.
*da0073e9SAndroid Build Coastguard Worker            # In anomaly mode, a PyObject referencing MulBackward's "parent" ExpBackward is added to
*da0073e9SAndroid Build Coastguard Worker            # MulBackward's anomaly metadata dict, creating the following reference chain:
*da0073e9SAndroid Build Coastguard Worker            #
*da0073e9SAndroid Build Coastguard Worker            # grad -> MulBackward -> PyObject -> ExpBackward
*da0073e9SAndroid Build Coastguard Worker            #
*da0073e9SAndroid Build Coastguard Worker            with detect_anomaly():
*da0073e9SAndroid Build Coastguard Worker                grad = torch.autograd.grad(t, x, torch.ones_like(t), create_graph=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # We add a weak reference to a new Foo object, which we insert into ExpBackward's metadata dict
*da0073e9SAndroid Build Coastguard Worker            #
*da0073e9SAndroid Build Coastguard Worker            # (PyObject) -> ExpBackward -> dict -> *Foo*
*da0073e9SAndroid Build Coastguard Worker            #            t ----^        WeakRef ---^
*da0073e9SAndroid Build Coastguard Worker            #
*da0073e9SAndroid Build Coastguard Worker            # We want to test that when grad goes out of scope at the end of this function that PyObject is destroyed
*da0073e9SAndroid Build Coastguard Worker            # We can test this by seeing whether Foo is not kept alive once t is destroyed
*da0073e9SAndroid Build Coastguard Worker            class Foo:
*da0073e9SAndroid Build Coastguard Worker                pass
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            my_obj = Foo()
*da0073e9SAndroid Build Coastguard Worker            meta_dict = t.grad_fn.metadata
*da0073e9SAndroid Build Coastguard Worker            meta_dict[0] = my_obj
*da0073e9SAndroid Build Coastguard Worker            ref = weakref.ref(my_obj)
*da0073e9SAndroid Build Coastguard Worker            return t, ref
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        t, ref = get_ref()
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNotNone(ref())
*da0073e9SAndroid Build Coastguard Worker        del t
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(ref())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_nested_anomaly_printstack_cleanup(self):
*da0073e9SAndroid Build Coastguard Worker        # Test if metadata dict PyObject is properly destroyed
*da0073e9SAndroid Build Coastguard Worker        def get_ref():
*da0073e9SAndroid Build Coastguard Worker            # This is similar to the construction in test_anomaly_assign_parent_cleanup:
*da0073e9SAndroid Build Coastguard Worker            #
*da0073e9SAndroid Build Coastguard Worker            # MyFuncBackward2 -> PyObject -> MyFuncBackward -> dict -> Foo
*da0073e9SAndroid Build Coastguard Worker            #                               out ---^         WeakRef ---^
*da0073e9SAndroid Build Coastguard Worker            #
*da0073e9SAndroid Build Coastguard Worker            # We want to check that Foo is still properly destroyed even when MyFunc2Backward's
*da0073e9SAndroid Build Coastguard Worker            # AnomalyMetadata calls printstack, which does some python object manipulation.
*da0073e9SAndroid Build Coastguard Worker            #
*da0073e9SAndroid Build Coastguard Worker            # You might be wondering why we still have to test_anomaly_assign_parent_cleanup,
*da0073e9SAndroid Build Coastguard Worker            # since if PyObject is not destroyed here, wouldn't this test would detect that also?
*da0073e9SAndroid Build Coastguard Worker            # The answer is that custom function's PyObject (THPFunction) actually only hold
*da0073e9SAndroid Build Coastguard Worker            # a weak reference to the c++ node!
*da0073e9SAndroid Build Coastguard Worker            class MyFunc(Function):
*da0073e9SAndroid Build Coastguard Worker                @staticmethod
*da0073e9SAndroid Build Coastguard Worker                def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                    ctx.save_for_backward(x)
*da0073e9SAndroid Build Coastguard Worker                    return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                @staticmethod
*da0073e9SAndroid Build Coastguard Worker                def backward(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                    (x,) = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                    return MyFunc2.apply(x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            class MyFunc2(Function):
*da0073e9SAndroid Build Coastguard Worker                @staticmethod
*da0073e9SAndroid Build Coastguard Worker                def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                    return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                @staticmethod
*da0073e9SAndroid Build Coastguard Worker                def backward(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                    return gO + float("NaN")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            inp = torch.rand(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            out = MyFunc.apply(inp)
*da0073e9SAndroid Build Coastguard Worker            (ginp,) = torch.autograd.grad(out, (inp,), create_graph=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            with warnings.catch_warnings(record=True) as w:
*da0073e9SAndroid Build Coastguard Worker                with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                    RuntimeError,
*da0073e9SAndroid Build Coastguard Worker                    "Function 'MyFunc2Backward' returned nan values in its 0th output.",
*da0073e9SAndroid Build Coastguard Worker                ):
*da0073e9SAndroid Build Coastguard Worker                    with detect_anomaly():
*da0073e9SAndroid Build Coastguard Worker                        ginp.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            class Foo:
*da0073e9SAndroid Build Coastguard Worker                pass
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            my_obj = Foo()
*da0073e9SAndroid Build Coastguard Worker            meta_dict = out.grad_fn.metadata
*da0073e9SAndroid Build Coastguard Worker            meta_dict[0] = my_obj
*da0073e9SAndroid Build Coastguard Worker            ref = weakref.ref(my_obj)
*da0073e9SAndroid Build Coastguard Worker            return out, ref
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        t, ref = get_ref()
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNotNone(ref())
*da0073e9SAndroid Build Coastguard Worker        del t
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(ref())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_anomaly_mode_no_check_nan(self):
*da0073e9SAndroid Build Coastguard Worker        class MyFunc(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, inp):
*da0073e9SAndroid Build Coastguard Worker                return inp.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                return torch.tensor(float("nan")).expand(10, 10)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def run_fn(a):
*da0073e9SAndroid Build Coastguard Worker            out = MyFunc.apply(a)
*da0073e9SAndroid Build Coastguard Worker            return out.sum()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with warnings.catch_warnings(record=True) as w:
*da0073e9SAndroid Build Coastguard Worker            with torch.autograd.detect_anomaly(check_nan=False):
*da0073e9SAndroid Build Coastguard Worker                inp = torch.rand(10, 10, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker                out = run_fn(inp)
*da0073e9SAndroid Build Coastguard Worker                out.backward(retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                with torch.autograd.detect_anomaly(check_nan=True):
*da0073e9SAndroid Build Coastguard Worker                    with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                        RuntimeError,
*da0073e9SAndroid Build Coastguard Worker                        "Function 'MyFuncBackward' returned nan values in its 0th output.",
*da0073e9SAndroid Build Coastguard Worker                    ):
*da0073e9SAndroid Build Coastguard Worker                        out.backward(retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                out.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_no_grad_copy(self):
*da0073e9SAndroid Build Coastguard Worker        # create autograd function that saves grad pointer as class static
*da0073e9SAndroid Build Coastguard Worker        class MyFunc(Function):
*da0073e9SAndroid Build Coastguard Worker            static_grad_ptr = None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, inp1, inp2):
*da0073e9SAndroid Build Coastguard Worker                return inp1 + inp2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad):
*da0073e9SAndroid Build Coastguard Worker                MyFunc.static_grad_ptr = grad.data_ptr()
*da0073e9SAndroid Build Coastguard Worker                return grad, grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class NonContGradFunc(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, inp1):
*da0073e9SAndroid Build Coastguard Worker                ctx.size = inp1.size()
*da0073e9SAndroid Build Coastguard Worker                return torch.tensor([1.0])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad):
*da0073e9SAndroid Build Coastguard Worker                return torch.ones(1).expand(ctx.size)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(5, 6, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = torch.randn(5, 6, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        # non-contiguous grad should be copied
*da0073e9SAndroid Build Coastguard Worker        NonContGradFunc.apply(MyFunc.apply(a, b)).backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(a.grad.data_ptr() == MyFunc.static_grad_ptr)
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(b.grad.data_ptr() == MyFunc.static_grad_ptr)
*da0073e9SAndroid Build Coastguard Worker        # test case that should trigger no copy for one of a,b
*da0073e9SAndroid Build Coastguard Worker        a.grad = b.grad = None
*da0073e9SAndroid Build Coastguard Worker        MyFunc.apply(a, b)[1][0].backward()
*da0073e9SAndroid Build Coastguard Worker        p_g = MyFunc.static_grad_ptr
*da0073e9SAndroid Build Coastguard Worker        p_a = a.grad.data_ptr()
*da0073e9SAndroid Build Coastguard Worker        p_b = b.grad.data_ptr()
*da0073e9SAndroid Build Coastguard Worker        # check a,b uses different grad buffer
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(p_a == p_b)
*da0073e9SAndroid Build Coastguard Worker        # check one of them is using the computed buffer
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(p_a == p_g or p_b == p_g)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_no_grad_copy_sparse(self):
*da0073e9SAndroid Build Coastguard Worker        # create autograd function that saves grad pointer as class static
*da0073e9SAndroid Build Coastguard Worker        class MyFunc(Function):
*da0073e9SAndroid Build Coastguard Worker            static_grad_ptr = None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, inp1, inp2):
*da0073e9SAndroid Build Coastguard Worker                return inp1 + inp2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad):
*da0073e9SAndroid Build Coastguard Worker                MyFunc.static_grad_ptr = grad._values().data_ptr()
*da0073e9SAndroid Build Coastguard Worker                return grad, grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class NonContGradFunc(Function):
*da0073e9SAndroid Build Coastguard Worker            static_grad_ptr = None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, inp1, inp2):
*da0073e9SAndroid Build Coastguard Worker                return inp1 + inp2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad):
*da0073e9SAndroid Build Coastguard Worker                # Create a sparse tensor with non-contigous indices and values
*da0073e9SAndroid Build Coastguard Worker                # and return as grad.
*da0073e9SAndroid Build Coastguard Worker                v = torch.rand(1, 3)
*da0073e9SAndroid Build Coastguard Worker                i = torch.ones(1, 1, dtype=torch.long)
*da0073e9SAndroid Build Coastguard Worker                nv = v.expand(8, 3)
*da0073e9SAndroid Build Coastguard Worker                ni = i.expand(1, 8)
*da0073e9SAndroid Build Coastguard Worker                ngrad = torch.sparse_coo_tensor(ni, nv, (10, 3), dtype=torch.float32)
*da0073e9SAndroid Build Coastguard Worker                NonContGradFunc.static_grad_ptr = ngrad._values().data_ptr()
*da0073e9SAndroid Build Coastguard Worker                return ngrad, ngrad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(10, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = torch.randn(10, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        input = torch.tensor([1, 2, 4, 5, 4, 3, 2, 9])
*da0073e9SAndroid Build Coastguard Worker        offsets = torch.tensor([0, 4])
*da0073e9SAndroid Build Coastguard Worker        import torch.nn.functional as F
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # test case that should trigger no copy for one of a,b
*da0073e9SAndroid Build Coastguard Worker        emb_matrix = MyFunc.apply(a, b)
*da0073e9SAndroid Build Coastguard Worker        loss = F.embedding_bag(emb_matrix, input, offsets, sparse=True).sum()
*da0073e9SAndroid Build Coastguard Worker        loss.backward(retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        p_g = MyFunc.static_grad_ptr
*da0073e9SAndroid Build Coastguard Worker        p_a = a.grad._values().data_ptr()
*da0073e9SAndroid Build Coastguard Worker        p_b = b.grad._values().data_ptr()
*da0073e9SAndroid Build Coastguard Worker        # check a,b uses different grad buffer
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(p_a == p_b)
*da0073e9SAndroid Build Coastguard Worker        # check one of them is using the computed buffer
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(p_a == p_g or p_b == p_g)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Run backwards multiple times to ensure accumulation works.
*da0073e9SAndroid Build Coastguard Worker        for i in range(10):
*da0073e9SAndroid Build Coastguard Worker            loss.backward(retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # non-contiguous indices and value, we should trigger a copy.
*da0073e9SAndroid Build Coastguard Worker        a.grad = b.grad = None
*da0073e9SAndroid Build Coastguard Worker        emb_matrix = NonContGradFunc.apply(a, b)
*da0073e9SAndroid Build Coastguard Worker        loss = F.embedding_bag(emb_matrix, input, offsets, sparse=True).sum()
*da0073e9SAndroid Build Coastguard Worker        loss.backward(retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        p_g = NonContGradFunc.static_grad_ptr
*da0073e9SAndroid Build Coastguard Worker        p_a = a.grad._values().data_ptr()
*da0073e9SAndroid Build Coastguard Worker        p_b = b.grad._values().data_ptr()
*da0073e9SAndroid Build Coastguard Worker        # check a,b uses different grad buffer
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(p_a == p_b)
*da0073e9SAndroid Build Coastguard Worker        # Verify we cloned both grads.
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(p_a == p_g)
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(p_b == p_g)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Run backwards multiple times to ensure accumulation works.
*da0073e9SAndroid Build Coastguard Worker        for i in range(10):
*da0073e9SAndroid Build Coastguard Worker            loss.backward(retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_gradcheck_single_input(self):
*da0073e9SAndroid Build Coastguard Worker        def check(fast_mode):
*da0073e9SAndroid Build Coastguard Worker            def f(inp):
*da0073e9SAndroid Build Coastguard Worker                return inp.mul(5)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            gradcheck(
*da0073e9SAndroid Build Coastguard Worker                f,
*da0073e9SAndroid Build Coastguard Worker                torch.rand(10, dtype=torch.float64, requires_grad=True),
*da0073e9SAndroid Build Coastguard Worker                fast_mode=fast_mode,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            gradgradcheck(
*da0073e9SAndroid Build Coastguard Worker                f,
*da0073e9SAndroid Build Coastguard Worker                torch.rand(10, dtype=torch.float64, requires_grad=True),
*da0073e9SAndroid Build Coastguard Worker                fast_mode=fast_mode,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        check(fast_mode=True)
*da0073e9SAndroid Build Coastguard Worker        check(fast_mode=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @parametrize(
*da0073e9SAndroid Build Coastguard Worker        "layout",
*da0073e9SAndroid Build Coastguard Worker        (
*da0073e9SAndroid Build Coastguard Worker            torch.sparse_coo,
*da0073e9SAndroid Build Coastguard Worker            torch.sparse_csr,
*da0073e9SAndroid Build Coastguard Worker            torch.sparse_csc,
*da0073e9SAndroid Build Coastguard Worker            torch.sparse_bsr,
*da0073e9SAndroid Build Coastguard Worker            torch.sparse_bsc,
*da0073e9SAndroid Build Coastguard Worker        ),
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    def test_gradcheck_input(self, layout):
*da0073e9SAndroid Build Coastguard Worker        if layout in {torch.sparse_bsr, torch.sparse_bsc}:
*da0073e9SAndroid Build Coastguard Worker            blocksize = (2, 2)
*da0073e9SAndroid Build Coastguard Worker            size = (4, 8)
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            blocksize = None
*da0073e9SAndroid Build Coastguard Worker            size = (2, 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def check(fast_mode, masked):
*da0073e9SAndroid Build Coastguard Worker            def fn(sparse):
*da0073e9SAndroid Build Coastguard Worker                return torch.sum(sparse)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            gradcheck(
*da0073e9SAndroid Build Coastguard Worker                fn,
*da0073e9SAndroid Build Coastguard Worker                torch.rand(size, dtype=torch.double)
*da0073e9SAndroid Build Coastguard Worker                .to_sparse(layout=layout, blocksize=blocksize)
*da0073e9SAndroid Build Coastguard Worker                .requires_grad_(),
*da0073e9SAndroid Build Coastguard Worker                masked=masked,
*da0073e9SAndroid Build Coastguard Worker                check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker                fast_mode=fast_mode,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for fast_mode, masked in product(*[(True, False)] * 2):
*da0073e9SAndroid Build Coastguard Worker            check(fast_mode=fast_mode, masked=masked)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_gradcheck_nondeterministic(self):
*da0073e9SAndroid Build Coastguard Worker        class NonDetFunc(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x, jitter=0.0):
*da0073e9SAndroid Build Coastguard Worker                ctx._jitter = jitter
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_out):
*da0073e9SAndroid Build Coastguard Worker                return (
*da0073e9SAndroid Build Coastguard Worker                    NonDetFunc.apply(grad_out, ctx._jitter)
*da0073e9SAndroid Build Coastguard Worker                    * (1 + torch.rand_like(grad_out) * ctx._jitter),
*da0073e9SAndroid Build Coastguard Worker                    None,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def check(fast_mode):
*da0073e9SAndroid Build Coastguard Worker            inp = torch.randn(5, 5, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            gradcheck(
*da0073e9SAndroid Build Coastguard Worker                lambda x: NonDetFunc.apply(x, 0.0),
*da0073e9SAndroid Build Coastguard Worker                inp,
*da0073e9SAndroid Build Coastguard Worker                check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker                fast_mode=fast_mode,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, "Backward is not reentrant"):
*da0073e9SAndroid Build Coastguard Worker                gradcheck(
*da0073e9SAndroid Build Coastguard Worker                    lambda x: NonDetFunc.apply(x, 1e-6),
*da0073e9SAndroid Build Coastguard Worker                    inp,
*da0073e9SAndroid Build Coastguard Worker                    check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker                    fast_mode=fast_mode,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, "Backward is not reentrant"):
*da0073e9SAndroid Build Coastguard Worker                gradgradcheck(
*da0073e9SAndroid Build Coastguard Worker                    lambda x: NonDetFunc.apply(x, 1e-12),
*da0073e9SAndroid Build Coastguard Worker                    inp,
*da0073e9SAndroid Build Coastguard Worker                    check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker                    fast_mode=fast_mode,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            gradcheck(
*da0073e9SAndroid Build Coastguard Worker                lambda x: NonDetFunc.apply(x, 0.0),
*da0073e9SAndroid Build Coastguard Worker                inp,
*da0073e9SAndroid Build Coastguard Worker                nondet_tol=1e-5,
*da0073e9SAndroid Build Coastguard Worker                check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker                fast_mode=fast_mode,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            gradcheck(
*da0073e9SAndroid Build Coastguard Worker                lambda x: NonDetFunc.apply(x, 1e-6),
*da0073e9SAndroid Build Coastguard Worker                inp,
*da0073e9SAndroid Build Coastguard Worker                nondet_tol=1e-5,
*da0073e9SAndroid Build Coastguard Worker                check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker                fast_mode=fast_mode,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            gradgradcheck(
*da0073e9SAndroid Build Coastguard Worker                lambda x: NonDetFunc.apply(x, 1e-12),
*da0073e9SAndroid Build Coastguard Worker                inp,
*da0073e9SAndroid Build Coastguard Worker                nondet_tol=1e-5,
*da0073e9SAndroid Build Coastguard Worker                check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker                fast_mode=fast_mode,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        check(fast_mode=True)
*da0073e9SAndroid Build Coastguard Worker        check(fast_mode=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_gradcheck_validates_inputs(self):
*da0073e9SAndroid Build Coastguard Worker        def check(fast_mode):
*da0073e9SAndroid Build Coastguard Worker            x = torch.rand(10, requires_grad=True).to_sparse()
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(
*da0073e9SAndroid Build Coastguard Worker                gradcheck(
*da0073e9SAndroid Build Coastguard Worker                    lambda x: x.to_dense(),
*da0073e9SAndroid Build Coastguard Worker                    (x,),
*da0073e9SAndroid Build Coastguard Worker                    check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker                    atol=1e-1,
*da0073e9SAndroid Build Coastguard Worker                    fast_mode=fast_mode,
*da0073e9SAndroid Build Coastguard Worker                    masked=True,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(
*da0073e9SAndroid Build Coastguard Worker                gradcheck(
*da0073e9SAndroid Build Coastguard Worker                    lambda x: x.to_dense(),
*da0073e9SAndroid Build Coastguard Worker                    (x,),
*da0073e9SAndroid Build Coastguard Worker                    masked=False,
*da0073e9SAndroid Build Coastguard Worker                    check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker                    raise_exception=False,
*da0073e9SAndroid Build Coastguard Worker                    fast_mode=fast_mode,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(
*da0073e9SAndroid Build Coastguard Worker                gradcheck(
*da0073e9SAndroid Build Coastguard Worker                    lambda x: x.to_dense(masked_grad=False),
*da0073e9SAndroid Build Coastguard Worker                    (x,),
*da0073e9SAndroid Build Coastguard Worker                    masked=False,
*da0073e9SAndroid Build Coastguard Worker                    atol=1e-1,
*da0073e9SAndroid Build Coastguard Worker                    check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker                    raise_exception=False,
*da0073e9SAndroid Build Coastguard Worker                    fast_mode=fast_mode,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # when none of the inputs require grad (always raises even if raise_exception=False)
*da0073e9SAndroid Build Coastguard Worker            x = torch.rand(10, requires_grad=False)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                ValueError, "at least one input tensor to require gradient"
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                gradcheck(lambda x: x, (x,), raise_exception=False, fast_mode=fast_mode)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # (warning) when inputs are not double precision
*da0073e9SAndroid Build Coastguard Worker            x = torch.ones(1, dtype=torch.float32, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            with self.assertWarnsRegex(
*da0073e9SAndroid Build Coastguard Worker                UserWarning, "Input #0 requires gradient and is not a double precision"
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(
*da0073e9SAndroid Build Coastguard Worker                    gradcheck(lambda x: x, (x,), atol=1e-1, fast_mode=fast_mode)
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # when layout is not mkldnn(aka has strides) and input has a dimension with stride 0. (always raises
*da0073e9SAndroid Build Coastguard Worker            # even if raise_exception=False)
*da0073e9SAndroid Build Coastguard Worker            x = torch.ones(1, dtype=torch.float64, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            x = x.expand((2, 2))
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError, "The 0th input has a dimension with stride 0"
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                gradcheck(lambda x: x, (x,), raise_exception=False, fast_mode=fast_mode)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        check(fast_mode=True)
*da0073e9SAndroid Build Coastguard Worker        check(fast_mode=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @unittest.skipIf(
*da0073e9SAndroid Build Coastguard Worker        not torch.backends.mkldnn.is_available(), "MKL-DNN build is disabled"
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    def test_gradcheck_validates_input_mkldnn(self):
*da0073e9SAndroid Build Coastguard Worker        # when mkldnn inputs, forward mode testing is not allowed
*da0073e9SAndroid Build Coastguard Worker        # Update tolerances below to make sure the gradient match even in single precision floats
*da0073e9SAndroid Build Coastguard Worker        # Use the warning assert to hide the float32 warning
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(1).to_mkldnn().requires_grad_()
*da0073e9SAndroid Build Coastguard Worker        with self.assertWarnsRegex(
*da0073e9SAndroid Build Coastguard Worker            UserWarning, "Input #0 requires gradient and is not a double precision"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                ValueError, "MKLDNN inputs are not support for forward AD gradcheck."
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                gradcheck(
*da0073e9SAndroid Build Coastguard Worker                    lambda x: x.to_dense(),
*da0073e9SAndroid Build Coastguard Worker                    (x,),
*da0073e9SAndroid Build Coastguard Worker                    raise_exception=False,
*da0073e9SAndroid Build Coastguard Worker                    fast_mode=False,
*da0073e9SAndroid Build Coastguard Worker                    check_forward_ad=True,
*da0073e9SAndroid Build Coastguard Worker                    atol=1e-1,
*da0073e9SAndroid Build Coastguard Worker                    rtol=1e-1,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertWarnsRegex(
*da0073e9SAndroid Build Coastguard Worker            UserWarning, "Input #0 requires gradient and is not a double precision"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                ValueError, "MKLDNN inputs are not support for forward AD gradcheck."
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                gradcheck(
*da0073e9SAndroid Build Coastguard Worker                    lambda x: x.to_dense(),
*da0073e9SAndroid Build Coastguard Worker                    (x,),
*da0073e9SAndroid Build Coastguard Worker                    raise_exception=False,
*da0073e9SAndroid Build Coastguard Worker                    fast_mode=True,
*da0073e9SAndroid Build Coastguard Worker                    check_forward_ad=True,
*da0073e9SAndroid Build Coastguard Worker                    atol=1e-1,
*da0073e9SAndroid Build Coastguard Worker                    rtol=1e-1,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @unittest.skipIf(
*da0073e9SAndroid Build Coastguard Worker        not torch.backends.mkldnn.is_available(), "MKL-DNN build is disabled"
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    def test_gradcheck_test_outputs(self):
*da0073e9SAndroid Build Coastguard Worker        def check(fast_mode):
*da0073e9SAndroid Build Coastguard Worker            # when sparse outputs (always raise even if raise_exception=False)
*da0073e9SAndroid Build Coastguard Worker            x = torch.rand(10, requires_grad=True).to_sparse()
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                ValueError, "Sparse output is not supported at gradcheck yet"
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                gradcheck(
*da0073e9SAndroid Build Coastguard Worker                    lambda x: x,
*da0073e9SAndroid Build Coastguard Worker                    (x,),
*da0073e9SAndroid Build Coastguard Worker                    masked=True,
*da0073e9SAndroid Build Coastguard Worker                    check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker                    raise_exception=False,
*da0073e9SAndroid Build Coastguard Worker                    fast_mode=fast_mode,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # when mkldnn outputs (always raise even if raise_exception=False)
*da0073e9SAndroid Build Coastguard Worker            root = torch.randn(4, 5, dtype=torch.float32, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                ValueError, "MKLDNN output is not supported at gradcheck yet"
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                gradcheck(
*da0073e9SAndroid Build Coastguard Worker                    lambda x: x.to_mkldnn(),
*da0073e9SAndroid Build Coastguard Worker                    (root,),
*da0073e9SAndroid Build Coastguard Worker                    check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker                    raise_exception=False,
*da0073e9SAndroid Build Coastguard Worker                    fast_mode=fast_mode,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        check(fast_mode=True)
*da0073e9SAndroid Build Coastguard Worker        check(fast_mode=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_gradcheck_check_no_differentiable_outputs(self):
*da0073e9SAndroid Build Coastguard Worker        def check(fast_mode):
*da0073e9SAndroid Build Coastguard Worker            # When none of the outputs are differentiable, but numerical gradient is not zero
*da0073e9SAndroid Build Coastguard Worker            x = torch.ones((1,), requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError, "Numerical gradient for function expected to be zero"
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                gradcheck(lambda x: torch.tensor([x]), x)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(
*da0073e9SAndroid Build Coastguard Worker                gradcheck(
*da0073e9SAndroid Build Coastguard Worker                    lambda x: torch.tensor([x]),
*da0073e9SAndroid Build Coastguard Worker                    x,
*da0073e9SAndroid Build Coastguard Worker                    raise_exception=False,
*da0073e9SAndroid Build Coastguard Worker                    fast_mode=fast_mode,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # succeed when no outputs at all
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(gradcheck(lambda x: (), (x,), fast_mode=fast_mode))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        check(fast_mode=True)
*da0073e9SAndroid Build Coastguard Worker        check(fast_mode=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_gradcheck_check_batched_grad(self):
*da0073e9SAndroid Build Coastguard Worker        def check(fast_mode):
*da0073e9SAndroid Build Coastguard Worker            x = torch.rand(10, dtype=torch.double, requires_grad=True).to_sparse()
*da0073e9SAndroid Build Coastguard Worker            # runtime error while compute batched grad (print big error)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError,
*da0073e9SAndroid Build Coastguard Worker                "gradcheck or gradgradcheck failed while testing batched gradient",
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                gradcheck(
*da0073e9SAndroid Build Coastguard Worker                    lambda x: x.to_dense(),
*da0073e9SAndroid Build Coastguard Worker                    (x,),
*da0073e9SAndroid Build Coastguard Worker                    masked=True,
*da0073e9SAndroid Build Coastguard Worker                    check_batched_grad=True,
*da0073e9SAndroid Build Coastguard Worker                    fast_mode=fast_mode,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(
*da0073e9SAndroid Build Coastguard Worker                gradcheck(
*da0073e9SAndroid Build Coastguard Worker                    lambda x: x.to_dense(),
*da0073e9SAndroid Build Coastguard Worker                    (x,),
*da0073e9SAndroid Build Coastguard Worker                    masked=True,
*da0073e9SAndroid Build Coastguard Worker                    check_batched_grad=True,
*da0073e9SAndroid Build Coastguard Worker                    raise_exception=False,
*da0073e9SAndroid Build Coastguard Worker                    fast_mode=fast_mode,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        check(fast_mode=True)
*da0073e9SAndroid Build Coastguard Worker        check(fast_mode=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_gradcheck_backward_mul_by_grad_output(self):
*da0073e9SAndroid Build Coastguard Worker        # when grad_input is sparse and has incorrect sparse_dim/dense_dim
*da0073e9SAndroid Build Coastguard Worker        def check(fast_mode):
*da0073e9SAndroid Build Coastguard Worker            def fn(x):
*da0073e9SAndroid Build Coastguard Worker                def hook(grad):
*da0073e9SAndroid Build Coastguard Worker                    if grad is not None:
*da0073e9SAndroid Build Coastguard Worker                        return grad.to_dense().to_sparse(1)
*da0073e9SAndroid Build Coastguard Worker                    return grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                y = x.clone()
*da0073e9SAndroid Build Coastguard Worker                y.register_hook(hook)
*da0073e9SAndroid Build Coastguard Worker                return y.to_dense()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            x = torch.ones((2, 2), dtype=torch.double, requires_grad=True).to_sparse()
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError, "grad is sparse tensor, but has incorrect sparse_dim"
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                gradcheck(
*da0073e9SAndroid Build Coastguard Worker                    fn,
*da0073e9SAndroid Build Coastguard Worker                    (x,),
*da0073e9SAndroid Build Coastguard Worker                    atol=1e-1,
*da0073e9SAndroid Build Coastguard Worker                    masked=True,
*da0073e9SAndroid Build Coastguard Worker                    check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker                    fast_mode=fast_mode,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(
*da0073e9SAndroid Build Coastguard Worker                gradcheck(
*da0073e9SAndroid Build Coastguard Worker                    fn,
*da0073e9SAndroid Build Coastguard Worker                    (x,),
*da0073e9SAndroid Build Coastguard Worker                    atol=1e-1,
*da0073e9SAndroid Build Coastguard Worker                    masked=True,
*da0073e9SAndroid Build Coastguard Worker                    check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker                    raise_exception=False,
*da0073e9SAndroid Build Coastguard Worker                    fast_mode=fast_mode,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # when backward not multiplied by grad_output (non-sparse case)
*da0073e9SAndroid Build Coastguard Worker            def fn2(x):
*da0073e9SAndroid Build Coastguard Worker                y = x.clone()
*da0073e9SAndroid Build Coastguard Worker                y.register_hook(lambda x: x + 1e-2)
*da0073e9SAndroid Build Coastguard Worker                return y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            x = torch.ones(1, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError, "backward not multiplied by grad_output"
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                gradcheck(fn2, (x,), atol=1e-1, fast_mode=fast_mode)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(
*da0073e9SAndroid Build Coastguard Worker                gradcheck(
*da0073e9SAndroid Build Coastguard Worker                    fn2, (x,), atol=1e-1, raise_exception=False, fast_mode=fast_mode
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # when backward not multiplied by grad_output (sparse case)
*da0073e9SAndroid Build Coastguard Worker            def fn3(x):
*da0073e9SAndroid Build Coastguard Worker                y = x.clone().to_dense()
*da0073e9SAndroid Build Coastguard Worker                y.register_hook(lambda x: x + 1e-2)
*da0073e9SAndroid Build Coastguard Worker                return y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            x = torch.ones(1, dtype=torch.double, requires_grad=True).to_sparse()
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError, "backward not multiplied by grad_output"
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                gradcheck(
*da0073e9SAndroid Build Coastguard Worker                    fn3,
*da0073e9SAndroid Build Coastguard Worker                    (x,),
*da0073e9SAndroid Build Coastguard Worker                    atol=1e-1,
*da0073e9SAndroid Build Coastguard Worker                    masked=True,
*da0073e9SAndroid Build Coastguard Worker                    check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker                    fast_mode=fast_mode,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(
*da0073e9SAndroid Build Coastguard Worker                gradcheck(
*da0073e9SAndroid Build Coastguard Worker                    fn3,
*da0073e9SAndroid Build Coastguard Worker                    (x,),
*da0073e9SAndroid Build Coastguard Worker                    atol=1e-1,
*da0073e9SAndroid Build Coastguard Worker                    masked=True,
*da0073e9SAndroid Build Coastguard Worker                    check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker                    raise_exception=False,
*da0073e9SAndroid Build Coastguard Worker                    fast_mode=fast_mode,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # when layout of grad_input is not the same as input
*da0073e9SAndroid Build Coastguard Worker            class Test(Function):
*da0073e9SAndroid Build Coastguard Worker                @staticmethod
*da0073e9SAndroid Build Coastguard Worker                def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                    return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                @staticmethod
*da0073e9SAndroid Build Coastguard Worker                def backward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                    return x.to_sparse()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            x = torch.ones(1, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, "grad is incorrect layout"):
*da0073e9SAndroid Build Coastguard Worker                gradcheck(
*da0073e9SAndroid Build Coastguard Worker                    Test.apply, (x,), check_batched_grad=False, fast_mode=fast_mode
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(
*da0073e9SAndroid Build Coastguard Worker                gradcheck(
*da0073e9SAndroid Build Coastguard Worker                    Test.apply,
*da0073e9SAndroid Build Coastguard Worker                    (x,),
*da0073e9SAndroid Build Coastguard Worker                    check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker                    raise_exception=False,
*da0073e9SAndroid Build Coastguard Worker                    fast_mode=fast_mode,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        check(fast_mode=True)
*da0073e9SAndroid Build Coastguard Worker        check(fast_mode=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_gradcheck_undefined_grad(self):
*da0073e9SAndroid Build Coastguard Worker        def check(fast_mode):
*da0073e9SAndroid Build Coastguard Worker            # when encounter runtime error while running backward
*da0073e9SAndroid Build Coastguard Worker            def fn(x):
*da0073e9SAndroid Build Coastguard Worker                def hook(x):
*da0073e9SAndroid Build Coastguard Worker                    if x is None:
*da0073e9SAndroid Build Coastguard Worker                        raise RuntimeError("x is undefined")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                y = x.clone()
*da0073e9SAndroid Build Coastguard Worker                y.register_hook(hook)
*da0073e9SAndroid Build Coastguard Worker                return y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            x = torch.ones(1, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            with self.assertWarnsRegex(
*da0073e9SAndroid Build Coastguard Worker                UserWarning,
*da0073e9SAndroid Build Coastguard Worker                "Backwards compatibility: New undefined gradient support checking feature",
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                    RuntimeError,
*da0073e9SAndroid Build Coastguard Worker                    "Expected backward function to handle undefined output grads",
*da0073e9SAndroid Build Coastguard Worker                ):
*da0073e9SAndroid Build Coastguard Worker                    gradcheck(fn, (x,), fast_mode=fast_mode)
*da0073e9SAndroid Build Coastguard Worker                self.assertFalse(
*da0073e9SAndroid Build Coastguard Worker                    gradcheck(fn, (x,), raise_exception=False, fast_mode=fast_mode)
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        check(fast_mode=True)
*da0073e9SAndroid Build Coastguard Worker        check(fast_mode=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_gradcheck_jacobian_mismatch(self):
*da0073e9SAndroid Build Coastguard Worker        def check(fast_mode):
*da0073e9SAndroid Build Coastguard Worker            def fn(x):  # R -> R, C -> C
*da0073e9SAndroid Build Coastguard Worker                y = x.clone()
*da0073e9SAndroid Build Coastguard Worker                y.register_hook(lambda x: x + 1e-2)
*da0073e9SAndroid Build Coastguard Worker                return y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            x = torch.ones(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError, "Jacobian mismatch for output 0 with respect to input 0"
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                gradcheck(fn, (x,), fast_mode=fast_mode)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(
*da0073e9SAndroid Build Coastguard Worker                gradcheck(fn, (x,), raise_exception=False, fast_mode=fast_mode)
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            x_c = torch.ones(2, 2, requires_grad=True, dtype=torch.complex128)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError,
*da0073e9SAndroid Build Coastguard Worker                "While considering the imaginary part of complex outputs only",
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                gradcheck(fn, (x_c,), fast_mode=False)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(
*da0073e9SAndroid Build Coastguard Worker                gradcheck(fn, (x_c,), raise_exception=False, fast_mode=False)
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def fn2(x):  # R -> C
*da0073e9SAndroid Build Coastguard Worker                y = torch.complex(x, x)
*da0073e9SAndroid Build Coastguard Worker                y.register_hook(lambda x: x + 1e-2)
*da0073e9SAndroid Build Coastguard Worker                return y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            x = torch.ones(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError,
*da0073e9SAndroid Build Coastguard Worker                "While considering the imaginary part of complex outputs only",
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                gradcheck(fn2, (x,), fast_mode=False)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(
*da0073e9SAndroid Build Coastguard Worker                gradcheck(fn2, (x,), raise_exception=False, fast_mode=False)
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def fn3(x):  # C -> R
*da0073e9SAndroid Build Coastguard Worker                y = torch.real(x)
*da0073e9SAndroid Build Coastguard Worker                y.register_hook(lambda x: x + 1e-2)
*da0073e9SAndroid Build Coastguard Worker                return y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError, "Jacobian mismatch for output 0 with respect to input 0"
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                gradcheck(fn3, (x_c,), fast_mode=False)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(
*da0073e9SAndroid Build Coastguard Worker                gradcheck(fn3, (x_c,), raise_exception=False, fast_mode=False)
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        check(fast_mode=True)
*da0073e9SAndroid Build Coastguard Worker        check(fast_mode=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_gradcheck_dense_and_sparse_inputs(self):
*da0073e9SAndroid Build Coastguard Worker        def check(fast_mode):
*da0073e9SAndroid Build Coastguard Worker            def fn(x, y):
*da0073e9SAndroid Build Coastguard Worker                return x * y.coalesce().to_dense()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            a = torch.rand(2, 2, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            b = torch.rand(2, 2, dtype=torch.double).to_sparse().requires_grad_(True)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(
*da0073e9SAndroid Build Coastguard Worker                gradcheck(
*da0073e9SAndroid Build Coastguard Worker                    fn,
*da0073e9SAndroid Build Coastguard Worker                    (a, b),
*da0073e9SAndroid Build Coastguard Worker                    masked=True,
*da0073e9SAndroid Build Coastguard Worker                    check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker                    fast_mode=fast_mode,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        check(fast_mode=True)
*da0073e9SAndroid Build Coastguard Worker        check(fast_mode=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @unittest.skipIf(
*da0073e9SAndroid Build Coastguard Worker        not torch.backends.mkldnn.is_available(), "MKL-DNN build is disabled"
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    def test_gradcheck_multiple_mkldnn_inputs(self):
*da0073e9SAndroid Build Coastguard Worker        def check(fast_mode):
*da0073e9SAndroid Build Coastguard Worker            def fn(x, y):
*da0073e9SAndroid Build Coastguard Worker                return x + y.to_dense()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            a = torch.rand(10, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            b = torch.rand(10, dtype=torch.float32).to_mkldnn().requires_grad_(True)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(
*da0073e9SAndroid Build Coastguard Worker                gradcheck(
*da0073e9SAndroid Build Coastguard Worker                    fn, (a, b), atol=1e-1, check_batched_grad=False, fast_mode=fast_mode
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def fn2(x, y):
*da0073e9SAndroid Build Coastguard Worker                return x.to_dense() + y.to_dense()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            c = torch.rand(10, dtype=torch.float32).to_mkldnn().requires_grad_(True)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(
*da0073e9SAndroid Build Coastguard Worker                gradcheck(
*da0073e9SAndroid Build Coastguard Worker                    fn, (a, c), atol=1e-1, check_batched_grad=False, fast_mode=fast_mode
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        check(fast_mode=True)
*da0073e9SAndroid Build Coastguard Worker        check(fast_mode=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_gradcheck_output_shape_or_dtype_depend_on_values(self):
*da0073e9SAndroid Build Coastguard Worker        def check(fast_mode):
*da0073e9SAndroid Build Coastguard Worker            def fn(x):
*da0073e9SAndroid Build Coastguard Worker                if torch.all(x >= 1):
*da0073e9SAndroid Build Coastguard Worker                    return torch.cat([x, x])
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            a = torch.ones(1, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                AssertionError,
*da0073e9SAndroid Build Coastguard Worker                "return outputs with the same shape when inputs are perturbed",
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(gradcheck(fn, (a,), fast_mode=fast_mode))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def fn2(x):
*da0073e9SAndroid Build Coastguard Worker                if torch.all(x >= 1):
*da0073e9SAndroid Build Coastguard Worker                    return x.to(torch.float32)
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                AssertionError,
*da0073e9SAndroid Build Coastguard Worker                "return outputs with the same dtype when inputs are perturbed",
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(gradcheck(fn2, (a,), fast_mode=fast_mode))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        check(fast_mode=True)
*da0073e9SAndroid Build Coastguard Worker        check(fast_mode=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_gradcheck_complex_non_complex_outputs(self):
*da0073e9SAndroid Build Coastguard Worker        def fn(x, y):
*da0073e9SAndroid Build Coastguard Worker            z = torch.complex(x, y)
*da0073e9SAndroid Build Coastguard Worker            return z, x + 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.ones(2, 2, requires_grad=True, dtype=torch.float64)
*da0073e9SAndroid Build Coastguard Worker        b = torch.ones(2, 2, requires_grad=True, dtype=torch.float64)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(gradcheck(fn, (a, b)))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn2(z):
*da0073e9SAndroid Build Coastguard Worker            return z, torch.real(z)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        c = torch.ones(2, 2, requires_grad=True, dtype=torch.complex128)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(gradcheck(fn2, (c)))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_gradcheck_get_numerical_jacobian(self):
*da0073e9SAndroid Build Coastguard Worker        # get_numerical_jacobian is deprecated and no longer used internally by gradcheck
*da0073e9SAndroid Build Coastguard Worker        from torch.autograd.gradcheck import get_numerical_jacobian
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn(inputs):
*da0073e9SAndroid Build Coastguard Worker            # get_numerical_jacobian requires fn to take inputs as a tuple
*da0073e9SAndroid Build Coastguard Worker            # and returns the jacobian wrt the first output
*da0073e9SAndroid Build Coastguard Worker            x = inputs[0]
*da0073e9SAndroid Build Coastguard Worker            y = inputs[1]
*da0073e9SAndroid Build Coastguard Worker            return 2 * x + y, x + 2 * y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.rand(2, 2, requires_grad=True, dtype=torch.float64)
*da0073e9SAndroid Build Coastguard Worker        b = torch.rand(2, 2, requires_grad=True, dtype=torch.float64)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertWarnsRegex(
*da0073e9SAndroid Build Coastguard Worker            FutureWarning, "`get_numerical_jacobian` was part of PyTorch's private API"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            jacobian = get_numerical_jacobian(fn, (a, b), target=a, eps=1e-6)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(jacobian[0], 2 * torch.eye(4, dtype=torch.double))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertWarnsRegex(
*da0073e9SAndroid Build Coastguard Worker            FutureWarning, "`get_numerical_jacobian` was part of PyTorch's private API"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            jacobian = get_numerical_jacobian(fn, (a, b), eps=1e-6)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(jacobian[0], 2 * torch.eye(4, dtype=torch.double))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(jacobian[1], 1 * torch.eye(4, dtype=torch.double))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(ValueError, "Expected grad_out to be 1.0"):
*da0073e9SAndroid Build Coastguard Worker            jacobian = get_numerical_jacobian(fn, (a, b), eps=1e-6, grad_out=2.0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_gradcheck_get_analytical_jacobian(self):
*da0073e9SAndroid Build Coastguard Worker        from torch.autograd.gradcheck import get_analytical_jacobian
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn(x, y):
*da0073e9SAndroid Build Coastguard Worker            return 2 * x + y, x + 2 * y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.rand(2, 2, requires_grad=True, dtype=torch.float64)
*da0073e9SAndroid Build Coastguard Worker        b = torch.rand(2, 2, requires_grad=True, dtype=torch.float64)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        outputs = fn(a, b)
*da0073e9SAndroid Build Coastguard Worker        with self.assertWarnsRegex(
*da0073e9SAndroid Build Coastguard Worker            FutureWarning, "`get_analytical_jacobian` was part of PyTorch's private API"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            (
*da0073e9SAndroid Build Coastguard Worker                jacobians,
*da0073e9SAndroid Build Coastguard Worker                reentrant,
*da0073e9SAndroid Build Coastguard Worker                correct_grad_sizes,
*da0073e9SAndroid Build Coastguard Worker                correct_grad_types,
*da0073e9SAndroid Build Coastguard Worker            ) = get_analytical_jacobian((a, b), outputs[0])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(jacobians[0], 2 * torch.eye(4, dtype=torch.double))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(jacobians[1], 1 * torch.eye(4, dtype=torch.double))
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(reentrant)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class NonDetFunc(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x, jitter=0.0):
*da0073e9SAndroid Build Coastguard Worker                ctx._jitter = jitter
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_out):
*da0073e9SAndroid Build Coastguard Worker                return (
*da0073e9SAndroid Build Coastguard Worker                    NonDetFunc.apply(grad_out, ctx._jitter)
*da0073e9SAndroid Build Coastguard Worker                    * (1 + torch.rand_like(grad_out) * ctx._jitter),
*da0073e9SAndroid Build Coastguard Worker                    None,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        outputs = NonDetFunc.apply(a, 1e-6)
*da0073e9SAndroid Build Coastguard Worker        with self.assertWarnsRegex(
*da0073e9SAndroid Build Coastguard Worker            FutureWarning, "`get_analytical_jacobian` was part of PyTorch's private API"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            (
*da0073e9SAndroid Build Coastguard Worker                jacobians,
*da0073e9SAndroid Build Coastguard Worker                reentrant,
*da0073e9SAndroid Build Coastguard Worker                correct_grad_sizes,
*da0073e9SAndroid Build Coastguard Worker                correct_grad_types,
*da0073e9SAndroid Build Coastguard Worker            ) = get_analytical_jacobian((a,), outputs)
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(reentrant)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(ValueError, "Expected grad_out to be 1.0"):
*da0073e9SAndroid Build Coastguard Worker            jacobians, _, _, _ = get_analytical_jacobian((a,), outputs, grad_out=2.0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_gradcheck_custom_error(self):
*da0073e9SAndroid Build Coastguard Worker        from torch.autograd.gradcheck import GradcheckError
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def check(fast_mode):
*da0073e9SAndroid Build Coastguard Worker            def fn(x):
*da0073e9SAndroid Build Coastguard Worker                y = x.clone()
*da0073e9SAndroid Build Coastguard Worker                y.register_hook(lambda x: x + 1e-2)
*da0073e9SAndroid Build Coastguard Worker                return y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            x = torch.ones(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                GradcheckError, "Jacobian mismatch for output 0 with respect to input 0"
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                gradcheck(fn, (x,), fast_mode=fast_mode)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError, "Jacobian mismatch for output 0 with respect to input 0"
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                gradcheck(fn, (x,), fast_mode=fast_mode)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(
*da0073e9SAndroid Build Coastguard Worker                gradcheck(fn, (x,), raise_exception=False, fast_mode=fast_mode)
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def fn2(x):
*da0073e9SAndroid Build Coastguard Worker                raise RuntimeError("Not a GradcheckError!")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Checks that when raise_exception=False, non-GradcheckErrors are not caught by gradcheck
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, "Not a GradcheckError!"):
*da0073e9SAndroid Build Coastguard Worker                gradcheck(fn2, (x,), fast_mode=fast_mode, raise_exception=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        check(fast_mode=True)
*da0073e9SAndroid Build Coastguard Worker        check(fast_mode=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_gradcheck_forward_ad(self):
*da0073e9SAndroid Build Coastguard Worker        def fn(x, y):
*da0073e9SAndroid Build Coastguard Worker            return x + y, y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def bad_fn(x, y):
*da0073e9SAndroid Build Coastguard Worker            # Hacky way to check if we're currently inside a forward ad level
*da0073e9SAndroid Build Coastguard Worker            is_running_forward_ad = fwAD._current_level >= 0
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            if is_running_forward_ad:
*da0073e9SAndroid Build Coastguard Worker                y_p, y_d = fwAD.unpack_dual(y)
*da0073e9SAndroid Build Coastguard Worker                y = fwAD.make_dual(y_p, y_d * 1.1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            return x + y, y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        err_msg = "Jacobian computed with forward mode mismatch for output 0 with respect to input 1"
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for fast_mode in [True, False]:
*da0073e9SAndroid Build Coastguard Worker            # Test for all inputs and outputs being real
*da0073e9SAndroid Build Coastguard Worker            x = torch.rand(2, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            y = torch.rand(2, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            gradcheck(fn, (x, y), check_forward_ad=True, fast_mode=fast_mode)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, err_msg):
*da0073e9SAndroid Build Coastguard Worker                gradcheck(bad_fn, (x, y), check_forward_ad=True, fast_mode=fast_mode)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def basic_mul(x):
*da0073e9SAndroid Build Coastguard Worker                return torch.view_as_real(torch.resolve_conj(x * 1j))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            gradcheck(basic_mul, x, check_forward_ad=True, fast_mode=fast_mode)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Test for one input and one output being complex
*da0073e9SAndroid Build Coastguard Worker            x = torch.rand(2, dtype=torch.cdouble, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            gradcheck(fn, (x, y), check_forward_ad=True, fast_mode=fast_mode)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, err_msg):
*da0073e9SAndroid Build Coastguard Worker                gradcheck(bad_fn, (x, y), check_forward_ad=True, fast_mode=fast_mode)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Test for all inputs and outputs being complex
*da0073e9SAndroid Build Coastguard Worker            y = torch.rand(2, dtype=torch.cdouble, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            gradcheck(fn, (x, y), check_forward_ad=True, fast_mode=fast_mode)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, err_msg):
*da0073e9SAndroid Build Coastguard Worker                gradcheck(bad_fn, (x, y), check_forward_ad=True, fast_mode=fast_mode)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_gradcheck_forward_ad_runs_with_no_requires_grad(self):
*da0073e9SAndroid Build Coastguard Worker        # Currently requires_grad is used as a easy way for gradcheck to know
*da0073e9SAndroid Build Coastguard Worker        # which inputs of the function are meant to be differentiable
*da0073e9SAndroid Build Coastguard Worker        # This test checks that when the inputs are passed to the function they should not have
*da0073e9SAndroid Build Coastguard Worker        # requires_grad=True even though they may have requires_grad=True when passed
*da0073e9SAndroid Build Coastguard Worker        # to gradcheck
*da0073e9SAndroid Build Coastguard Worker        class UserFn(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x, y):
*da0073e9SAndroid Build Coastguard Worker                if fwAD._current_level >= 0:
*da0073e9SAndroid Build Coastguard Worker                    self.assertFalse(x.requires_grad)
*da0073e9SAndroid Build Coastguard Worker                    self.assertFalse(y.requires_grad)
*da0073e9SAndroid Build Coastguard Worker                return x.clone(), y.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def jvp(ctx, x_t, y_t):
*da0073e9SAndroid Build Coastguard Worker                return x_t, y_t
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(2, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.rand(2, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        gradcheck(
*da0073e9SAndroid Build Coastguard Worker            UserFn.apply,
*da0073e9SAndroid Build Coastguard Worker            (x, y),
*da0073e9SAndroid Build Coastguard Worker            check_forward_ad=True,
*da0073e9SAndroid Build Coastguard Worker            check_undefined_grad=False,
*da0073e9SAndroid Build Coastguard Worker            check_backward_ad=False,
*da0073e9SAndroid Build Coastguard Worker            check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker            check_batched_forward_grad=False,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        gradcheck(
*da0073e9SAndroid Build Coastguard Worker            UserFn.apply,
*da0073e9SAndroid Build Coastguard Worker            (x, y),
*da0073e9SAndroid Build Coastguard Worker            check_forward_ad=True,
*da0073e9SAndroid Build Coastguard Worker            check_undefined_grad=True,
*da0073e9SAndroid Build Coastguard Worker            check_backward_ad=False,
*da0073e9SAndroid Build Coastguard Worker            check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker            check_batched_forward_grad=False,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        gradcheck(
*da0073e9SAndroid Build Coastguard Worker            UserFn.apply,
*da0073e9SAndroid Build Coastguard Worker            (x, y),
*da0073e9SAndroid Build Coastguard Worker            check_forward_ad=True,
*da0073e9SAndroid Build Coastguard Worker            check_undefined_grad=True,
*da0073e9SAndroid Build Coastguard Worker            check_backward_ad=False,
*da0073e9SAndroid Build Coastguard Worker            check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker            check_batched_forward_grad=True,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(2, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.rand(2, dtype=torch.double, requires_grad=False)
*da0073e9SAndroid Build Coastguard Worker        gradcheck(
*da0073e9SAndroid Build Coastguard Worker            UserFn.apply,
*da0073e9SAndroid Build Coastguard Worker            (x, y),
*da0073e9SAndroid Build Coastguard Worker            check_forward_ad=True,
*da0073e9SAndroid Build Coastguard Worker            check_undefined_grad=True,
*da0073e9SAndroid Build Coastguard Worker            check_backward_ad=False,
*da0073e9SAndroid Build Coastguard Worker            check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker            check_batched_forward_grad=True,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_gradcheck_forward_ad_respects_requires_grad(self):
*da0073e9SAndroid Build Coastguard Worker        # Currently requires_grad is used as a easy way for gradcheck to know
*da0073e9SAndroid Build Coastguard Worker        # which inputs of the function are meant to be differentiable
*da0073e9SAndroid Build Coastguard Worker        jvp_count = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class UserFn(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x, y):
*da0073e9SAndroid Build Coastguard Worker                return x.clone(), y.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def jvp(ctx, x_t, y_t):
*da0073e9SAndroid Build Coastguard Worker                jvp_count[0] += 1
*da0073e9SAndroid Build Coastguard Worker                return x_t, y_t
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # NB: In slow gradcheck we need to loop through numel times so use numel = 1 to ensure
*da0073e9SAndroid Build Coastguard Worker        #     that fast and slow have the same counts
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(1, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.rand(1, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        gradcheck(
*da0073e9SAndroid Build Coastguard Worker            UserFn.apply,
*da0073e9SAndroid Build Coastguard Worker            (x, y),
*da0073e9SAndroid Build Coastguard Worker            check_forward_ad=True,
*da0073e9SAndroid Build Coastguard Worker            check_undefined_grad=False,
*da0073e9SAndroid Build Coastguard Worker            check_backward_ad=False,
*da0073e9SAndroid Build Coastguard Worker            check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker            check_batched_forward_grad=False,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(jvp_count[0], 2)  # (2) once per input
*da0073e9SAndroid Build Coastguard Worker        jvp_count = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        gradcheck(
*da0073e9SAndroid Build Coastguard Worker            UserFn.apply,
*da0073e9SAndroid Build Coastguard Worker            (x, y),
*da0073e9SAndroid Build Coastguard Worker            check_forward_ad=True,
*da0073e9SAndroid Build Coastguard Worker            check_undefined_grad=True,
*da0073e9SAndroid Build Coastguard Worker            check_backward_ad=False,
*da0073e9SAndroid Build Coastguard Worker            check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker            check_batched_forward_grad=False,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            jvp_count[0], 6
*da0073e9SAndroid Build Coastguard Worker        )  # (+4): (once with normal ZT (+1), once with efficient ZT (+1)) for each input (x2)
*da0073e9SAndroid Build Coastguard Worker        jvp_count = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        gradcheck(
*da0073e9SAndroid Build Coastguard Worker            UserFn.apply,
*da0073e9SAndroid Build Coastguard Worker            (x, y),
*da0073e9SAndroid Build Coastguard Worker            check_forward_ad=True,
*da0073e9SAndroid Build Coastguard Worker            check_undefined_grad=True,
*da0073e9SAndroid Build Coastguard Worker            check_backward_ad=False,
*da0073e9SAndroid Build Coastguard Worker            check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker            check_batched_forward_grad=True,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            jvp_count[0], 12
*da0073e9SAndroid Build Coastguard Worker        )  # (+6): (compute batch of 2 with vmap (+1), with a loop (+2)) for each input (x2)
*da0073e9SAndroid Build Coastguard Worker        jvp_count = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Repeat the previous test except we mark one input with requires_grad=False
*da0073e9SAndroid Build Coastguard Worker        # NB: _test_undefined_forward_mode is only (+1), when function has single differentiable input, not (+2)!
*da0073e9SAndroid Build Coastguard Worker        #     Otherwise, other counts are halved.
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(1, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.rand(1, dtype=torch.double, requires_grad=False)
*da0073e9SAndroid Build Coastguard Worker        gradcheck(
*da0073e9SAndroid Build Coastguard Worker            UserFn.apply,
*da0073e9SAndroid Build Coastguard Worker            (x, y),
*da0073e9SAndroid Build Coastguard Worker            check_forward_ad=True,
*da0073e9SAndroid Build Coastguard Worker            check_undefined_grad=True,
*da0073e9SAndroid Build Coastguard Worker            check_backward_ad=False,
*da0073e9SAndroid Build Coastguard Worker            check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker            check_batched_forward_grad=True,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(jvp_count[0], 5)  # 1 + 1 + 3
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_gradcheck_check_forward_or_backward_only(self):
*da0073e9SAndroid Build Coastguard Worker        """Depending on settings for check_forward_ad and check_backward_ad, the
*da0073e9SAndroid Build Coastguard Worker        correct codepaths should be reached (or not reached)
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        fwd_fail_err_msg = "FAIL FWD"
*da0073e9SAndroid Build Coastguard Worker        bwd_fail_err_msg = "FAIL BWD"
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class UserFn(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, foo, fwd_bad, bwd_bad):
*da0073e9SAndroid Build Coastguard Worker                ctx.fwd_bad = fwd_bad
*da0073e9SAndroid Build Coastguard Worker                ctx.bwd_bad = bwd_bad
*da0073e9SAndroid Build Coastguard Worker                return foo * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def vjp(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                if ctx.bwd_bad:
*da0073e9SAndroid Build Coastguard Worker                    raise RuntimeError(bwd_fail_err_msg)
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    return 2 * gO, None, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def jvp(ctx, gI, _1, _2):
*da0073e9SAndroid Build Coastguard Worker                if ctx.fwd_bad:
*da0073e9SAndroid Build Coastguard Worker                    raise RuntimeError(fwd_fail_err_msg)
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    return 2 * gI
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for fast_mode in (True, False):
*da0073e9SAndroid Build Coastguard Worker            for check_forward_ad in (True, False):
*da0073e9SAndroid Build Coastguard Worker                for check_backward_ad in (True, False):
*da0073e9SAndroid Build Coastguard Worker                    for fwd_bad in (True, False):
*da0073e9SAndroid Build Coastguard Worker                        for bwd_bad in (True, False):
*da0073e9SAndroid Build Coastguard Worker                            fwd_should_fail = fwd_bad and check_forward_ad
*da0073e9SAndroid Build Coastguard Worker                            bwd_should_fail = bwd_bad and check_backward_ad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                            def run():
*da0073e9SAndroid Build Coastguard Worker                                gradcheck(
*da0073e9SAndroid Build Coastguard Worker                                    UserFn.apply,
*da0073e9SAndroid Build Coastguard Worker                                    (x, fwd_bad, bwd_bad),
*da0073e9SAndroid Build Coastguard Worker                                    check_forward_ad=check_forward_ad,
*da0073e9SAndroid Build Coastguard Worker                                    check_backward_ad=check_backward_ad,
*da0073e9SAndroid Build Coastguard Worker                                    check_undefined_grad=check_backward_ad,
*da0073e9SAndroid Build Coastguard Worker                                    check_batched_grad=check_backward_ad,
*da0073e9SAndroid Build Coastguard Worker                                    fast_mode=fast_mode,
*da0073e9SAndroid Build Coastguard Worker                                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                            x = torch.rand(2, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                            if not check_forward_ad and not check_backward_ad:
*da0073e9SAndroid Build Coastguard Worker                                with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                                    AssertionError, "Expected at least one of"
*da0073e9SAndroid Build Coastguard Worker                                ):
*da0073e9SAndroid Build Coastguard Worker                                    run()
*da0073e9SAndroid Build Coastguard Worker                                continue
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                            if not fwd_should_fail and not bwd_should_fail:
*da0073e9SAndroid Build Coastguard Worker                                run()
*da0073e9SAndroid Build Coastguard Worker                            else:
*da0073e9SAndroid Build Coastguard Worker                                # If both fail, backward AD failure "hides" forward AD failure
*da0073e9SAndroid Build Coastguard Worker                                if fwd_should_fail:
*da0073e9SAndroid Build Coastguard Worker                                    fail_msg = fwd_fail_err_msg
*da0073e9SAndroid Build Coastguard Worker                                if bwd_should_fail:
*da0073e9SAndroid Build Coastguard Worker                                    fail_msg = bwd_fail_err_msg
*da0073e9SAndroid Build Coastguard Worker                                with self.assertRaisesRegex(RuntimeError, fail_msg):
*da0073e9SAndroid Build Coastguard Worker                                    run()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_gradcheck_forward_ad_batched_grad(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(2, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # multiple inputs and outputs with non-tensors inputs
*da0073e9SAndroid Build Coastguard Worker        def fn1(a: torch.Tensor, b: int):
*da0073e9SAndroid Build Coastguard Worker            return a.clone(), a + 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        gradcheck(
*da0073e9SAndroid Build Coastguard Worker            fn1,
*da0073e9SAndroid Build Coastguard Worker            (x, 1),
*da0073e9SAndroid Build Coastguard Worker            check_forward_ad=True,
*da0073e9SAndroid Build Coastguard Worker            check_backward_ad=False,
*da0073e9SAndroid Build Coastguard Worker            check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker            check_undefined_grad=False,
*da0073e9SAndroid Build Coastguard Worker            check_batched_forward_grad=True,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # unrelated inputs: tangent for c is None
*da0073e9SAndroid Build Coastguard Worker        def fn2(a: torch.Tensor, c: torch.Tensor):
*da0073e9SAndroid Build Coastguard Worker            return a.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        gradcheck(
*da0073e9SAndroid Build Coastguard Worker            fn2,
*da0073e9SAndroid Build Coastguard Worker            (x, x.clone()),
*da0073e9SAndroid Build Coastguard Worker            check_forward_ad=True,
*da0073e9SAndroid Build Coastguard Worker            check_backward_ad=False,
*da0073e9SAndroid Build Coastguard Worker            check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker            check_undefined_grad=False,
*da0073e9SAndroid Build Coastguard Worker            check_batched_forward_grad=True,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class Fn(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, foo):
*da0073e9SAndroid Build Coastguard Worker                return foo * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def vjp(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                return gO * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def jvp(ctx, gI):
*da0073e9SAndroid Build Coastguard Worker                torch.randn_like(gI)
*da0073e9SAndroid Build Coastguard Worker                return gI * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        msg = "vmap: We do not yet support calling random operations inside of vmap"
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, msg):
*da0073e9SAndroid Build Coastguard Worker            gradcheck(
*da0073e9SAndroid Build Coastguard Worker                Fn.apply, (x,), check_forward_ad=True, check_batched_forward_grad=True
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_version_counter(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(1, 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # In-place op bumps version
*da0073e9SAndroid Build Coastguard Worker        x_saved_version = x._version
*da0073e9SAndroid Build Coastguard Worker        x.add_(1).add_(1)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(x._version > x_saved_version)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Differentiable view shares version counter
*da0073e9SAndroid Build Coastguard Worker        xz = x[:]
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(x._version == xz._version)
*da0073e9SAndroid Build Coastguard Worker        xz.add_(1)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(x._version == xz._version)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # `x.data = y` preserves version counter of `x`
*da0073e9SAndroid Build Coastguard Worker        x_saved_version = x._version
*da0073e9SAndroid Build Coastguard Worker        x.data = torch.randn(2, 3)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(x._version == x_saved_version)
*da0073e9SAndroid Build Coastguard Worker        x.add_(1)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(x._version > x_saved_version)
*da0073e9SAndroid Build Coastguard Worker        # Make sure `x` is still using the same version counter it shares with `xz`
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(x._version == xz._version)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # In-place op on `xz` also updates version of `x`,
*da0073e9SAndroid Build Coastguard Worker        # because they share the version counter
*da0073e9SAndroid Build Coastguard Worker        xz.add_(1)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(x._version == xz._version)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_set_data_tensorimpl_type(self):
*da0073e9SAndroid Build Coastguard Worker        # Dense tensor has impl of type `TensorImpl`, while sparse tensor has impl
*da0073e9SAndroid Build Coastguard Worker        # of type `SparseTensorImpl`.
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(1, 2)
*da0073e9SAndroid Build Coastguard Worker        x_s = torch.sparse_coo_tensor(torch.zeros([1, 1]), torch.ones([1]))
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "incompatible tensor type"):
*da0073e9SAndroid Build Coastguard Worker            x.data = x_s
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_set_data_preserve_pyobj(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(1, 2)
*da0073e9SAndroid Build Coastguard Worker        b = torch.randn(1, 2)
*da0073e9SAndroid Build Coastguard Worker        b_id_saved = id(b)
*da0073e9SAndroid Build Coastguard Worker        b.data = a
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(b_id_saved == id(b))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_set_data_self_requires_grad(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = torch.tensor(2.0)
*da0073e9SAndroid Build Coastguard Worker        c = torch.tensor(3, dtype=torch.int64)
*da0073e9SAndroid Build Coastguard Worker        a.data = b
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, "must be floating point or complex dtype"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            a.data = c
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @unittest.skipIf(IS_WINDOWS, "Skipping because doesn't work for windows")
*da0073e9SAndroid Build Coastguard Worker    def test_thread_shutdown(self):
*da0073e9SAndroid Build Coastguard Worker        code = """import torch
*da0073e9SAndroid Build Coastguard Workerfrom torch.autograd import Function
*da0073e9SAndroid Build Coastguard Workerclass MyFunction(Function):
*da0073e9SAndroid Build Coastguard Worker    @staticmethod
*da0073e9SAndroid Build Coastguard Worker    def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker        return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @staticmethod
*da0073e9SAndroid Build Coastguard Worker    def backward(ctx, grad):
*da0073e9SAndroid Build Coastguard Worker        return grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker# Run on cuda if it is available to ensure that the worker thread
*da0073e9SAndroid Build Coastguard Worker# is properly initialized by the time we exit.
*da0073e9SAndroid Build Coastguard Workerdevice = "cuda" if torch.cuda.is_available() else "cpu"
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerfor shape in [(1,), ()]:
*da0073e9SAndroid Build Coastguard Worker    v = torch.ones(shape, requires_grad=True, device=device)
*da0073e9SAndroid Build Coastguard Worker    MyFunction.apply(v).backward()
*da0073e9SAndroid Build Coastguard Worker"""
*da0073e9SAndroid Build Coastguard Worker        s = TestCase.runWithPytorchAPIUsageStderr(code)
*da0073e9SAndroid Build Coastguard Worker        # The autograd engine creates worker threads only when GPU devices are present.
*da0073e9SAndroid Build Coastguard Worker        # So make sure that we do shutdown threads when we're testing cuda and make sure
*da0073e9SAndroid Build Coastguard Worker        # that there is no thread to shutdown when we're not using cuda.
*da0073e9SAndroid Build Coastguard Worker        if TEST_CUDA or torch.backends.mps.is_available() or torch.xpu.is_available():
*da0073e9SAndroid Build Coastguard Worker            self.assertRegex(s, "PYTORCH_API_USAGE torch.autograd.thread_shutdown")
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            self.assertNotRegex(s, "PYTORCH_API_USAGE torch.autograd.thread_shutdown")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @unittest.skipIf(
*da0073e9SAndroid Build Coastguard Worker        IS_MACOS,
*da0073e9SAndroid Build Coastguard Worker        "Fails with SIGBUS on macOS; https://github.com/pytorch/pytorch/issues/25941",
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    def test_deep_reentrant(self):
*da0073e9SAndroid Build Coastguard Worker        class DeepReentrant(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                with torch.enable_grad():
*da0073e9SAndroid Build Coastguard Worker                    ctx.x = Variable(x.detach(), requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker                    ctx.x = ctx.x - 1
*da0073e9SAndroid Build Coastguard Worker                return ctx.x.detach()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                if ctx.x < 0:
*da0073e9SAndroid Build Coastguard Worker                    return x
*da0073e9SAndroid Build Coastguard Worker                with torch.enable_grad():
*da0073e9SAndroid Build Coastguard Worker                    DeepReentrant.apply(ctx.x).sum().backward()
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Test stack overflow escape mechanism
*da0073e9SAndroid Build Coastguard Worker        v = torch.tensor(2000.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        # This will cause stack overflow if reentrant calls are handled
*da0073e9SAndroid Build Coastguard Worker        # in the same thread recursively
*da0073e9SAndroid Build Coastguard Worker        DeepReentrant.apply(v).sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Test stack overflow escape mechanism multiple times
*da0073e9SAndroid Build Coastguard Worker        # to ensure reusing workers in the pool works fine
*da0073e9SAndroid Build Coastguard Worker        v2 = torch.tensor(200.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        DeepReentrant.apply(v2).sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_reentrant_priority(self):
*da0073e9SAndroid Build Coastguard Worker        order = []
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class MyFunction(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                order.append("MyFunction")
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class Reentrant(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                with torch.enable_grad():
*da0073e9SAndroid Build Coastguard Worker                    ctx.x = Variable(x.detach(), requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker                    ctx.x = ctx.x - 1
*da0073e9SAndroid Build Coastguard Worker                return ctx.x.detach()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                order.append("Reentrant")
*da0073e9SAndroid Build Coastguard Worker                if ctx.x < 0:
*da0073e9SAndroid Build Coastguard Worker                    return x
*da0073e9SAndroid Build Coastguard Worker                with torch.enable_grad():
*da0073e9SAndroid Build Coastguard Worker                    Reentrant.apply(ctx.x).backward()
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = MyFunction.apply(torch.tensor(6.0, requires_grad=True))
*da0073e9SAndroid Build Coastguard Worker        b = Reentrant.apply(torch.tensor(9.0, requires_grad=True))
*da0073e9SAndroid Build Coastguard Worker        v = a * b
*da0073e9SAndroid Build Coastguard Worker        v.backward()
*da0073e9SAndroid Build Coastguard Worker        # The tasks for the Reentrant and MyFunction backward() will be added
*da0073e9SAndroid Build Coastguard Worker        # to the queue in the autograd engine at the same time. The backward
*da0073e9SAndroid Build Coastguard Worker        # for Reentrant will be executed first, which will then add other
*da0073e9SAndroid Build Coastguard Worker        # backward tasks to the queue. We want to ensure all the reentrant tasks
*da0073e9SAndroid Build Coastguard Worker        # are prioritized over the MyFunction backward task regardless of their
*da0073e9SAndroid Build Coastguard Worker        # sequence numbers
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(len(order), 11)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(order.count("Reentrant"), 10)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(order[-1], "MyFunction")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @slowTest
*da0073e9SAndroid Build Coastguard Worker    def test_checkpointing(self):
*da0073e9SAndroid Build Coastguard Worker        num_inp = 2000
*da0073e9SAndroid Build Coastguard Worker        nz_inp = 10
*da0073e9SAndroid Build Coastguard Worker        nz_out = 10
*da0073e9SAndroid Build Coastguard Worker        nz_bottleneck = 1000
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # small proxy network for some complex reasoning we want to do per input
*da0073e9SAndroid Build Coastguard Worker        module = nn.Sequential(
*da0073e9SAndroid Build Coastguard Worker            nn.Linear(nz_inp, nz_bottleneck),
*da0073e9SAndroid Build Coastguard Worker            nn.ReLU(),
*da0073e9SAndroid Build Coastguard Worker            nn.Linear(nz_bottleneck, nz_inp),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        feat_combined = []
*da0073e9SAndroid Build Coastguard Worker        for r in range(num_inp):
*da0073e9SAndroid Build Coastguard Worker            data_r = torch.empty(1, nz_inp)
*da0073e9SAndroid Build Coastguard Worker            data_r.uniform_()
*da0073e9SAndroid Build Coastguard Worker            data_r.requires_grad = True
*da0073e9SAndroid Build Coastguard Worker            feat_r = checkpoint(module, data_r, use_reentrant=True)
*da0073e9SAndroid Build Coastguard Worker            feat_combined.append(feat_r)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # compute mean as a proxy for some joint reasoning
*da0073e9SAndroid Build Coastguard Worker        mean_combined = torch.stack(feat_combined).mean()
*da0073e9SAndroid Build Coastguard Worker        mean_combined.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _test_checkpointing_non_reentrant_autocast(self, device_type):
*da0073e9SAndroid Build Coastguard Worker        for enabled in [True, False]:
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def foo(x, y, z):
*da0073e9SAndroid Build Coastguard Worker                # torch.mm is on autocast's list of ops that should run in
*da0073e9SAndroid Build Coastguard Worker                # the autocast precision
*da0073e9SAndroid Build Coastguard Worker                x = torch.mm(x, y)
*da0073e9SAndroid Build Coastguard Worker                y = torch.mm(x, z)
*da0073e9SAndroid Build Coastguard Worker                z = torch.mm(z, z)
*da0073e9SAndroid Build Coastguard Worker                expected_dtype = torch.float32 if not enabled else torch.bfloat16
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(expected_dtype, z.dtype)
*da0073e9SAndroid Build Coastguard Worker                return z
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            x = torch.randn(3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            y = torch.randn(3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            z = torch.randn(3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            if device_type == "cuda":
*da0073e9SAndroid Build Coastguard Worker                x = x.cuda()
*da0073e9SAndroid Build Coastguard Worker                y = y.cuda()
*da0073e9SAndroid Build Coastguard Worker                z = z.cuda()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            with torch.autocast(
*da0073e9SAndroid Build Coastguard Worker                enabled=enabled, device_type=device_type, dtype=torch.bfloat16
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                loss = checkpoint(foo, x, y, z, use_reentrant=False)
*da0073e9SAndroid Build Coastguard Worker                loss = loss.sum()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Without saving + recasting the autocast type, would raise error in autograd
*da0073e9SAndroid Build Coastguard Worker            # about mismatched dtypes.
*da0073e9SAndroid Build Coastguard Worker            loss.backward()  # triggers recomputation to check it runs in bfloat
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_checkpointing_non_reentrant_autocast_cpu(self):
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        Test that autocast args such as the dtype are preserved during non-reentrant
*da0073e9SAndroid Build Coastguard Worker        checkpoint recomputation on CPU.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        self._test_checkpointing_non_reentrant_autocast(device_type="cpu")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @unittest.skipIf(
*da0073e9SAndroid Build Coastguard Worker        not torch.cuda.is_available() or not torch.cuda.is_bf16_supported(),
*da0073e9SAndroid Build Coastguard Worker        "Test requires CUDA bf16 support",
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    def test_checkpointing_non_reentrant_autocast_gpu(self):
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        Test that autocast args/kwargs such as the dtype are preserved during
*da0073e9SAndroid Build Coastguard Worker        non-reentrant checkpoint recomputation on GPU.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        self._test_checkpointing_non_reentrant_autocast(device_type="cuda")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @unittest.skipIf(not torch.cuda.is_available(), "Test requires CUDA")
*da0073e9SAndroid Build Coastguard Worker    @slowTest
*da0073e9SAndroid Build Coastguard Worker    def test_checkpointing_without_reentrant_memory_savings(self):
*da0073e9SAndroid Build Coastguard Worker        class MyModel(nn.Module):
*da0073e9SAndroid Build Coastguard Worker            def __init__(self, n, use_checkpoint, use_reentrant):
*da0073e9SAndroid Build Coastguard Worker                super().__init__()
*da0073e9SAndroid Build Coastguard Worker                self.n = n
*da0073e9SAndroid Build Coastguard Worker                self.use_checkpoint = use_checkpoint
*da0073e9SAndroid Build Coastguard Worker                self.use_reentrant = use_reentrant
*da0073e9SAndroid Build Coastguard Worker                self.layers = nn.ModuleList()
*da0073e9SAndroid Build Coastguard Worker                for i in range(self.n):
*da0073e9SAndroid Build Coastguard Worker                    layer = nn.Sequential(
*da0073e9SAndroid Build Coastguard Worker                        nn.Linear(256, 256), nn.Linear(256, 256), nn.Linear(256, 256)
*da0073e9SAndroid Build Coastguard Worker                    )
*da0073e9SAndroid Build Coastguard Worker                    self.layers.append(layer)
*da0073e9SAndroid Build Coastguard Worker                # pre-allocate the grad so that increased memory usage is mainly
*da0073e9SAndroid Build Coastguard Worker                # due to activations.
*da0073e9SAndroid Build Coastguard Worker                for layer in self.layers:
*da0073e9SAndroid Build Coastguard Worker                    for lin in layer:
*da0073e9SAndroid Build Coastguard Worker                        lin.weight.grad = torch.ones_like(lin.weight)
*da0073e9SAndroid Build Coastguard Worker                        lin.bias.grad = torch.ones_like(lin.bias)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def forward(self, x):
*da0073e9SAndroid Build Coastguard Worker                for i in range(self.n):
*da0073e9SAndroid Build Coastguard Worker                    if not self.use_checkpoint:
*da0073e9SAndroid Build Coastguard Worker                        x = self.layers[i](x)
*da0073e9SAndroid Build Coastguard Worker                    else:
*da0073e9SAndroid Build Coastguard Worker                        x = checkpoint(
*da0073e9SAndroid Build Coastguard Worker                            self.layers[i], x, use_reentrant=self.use_reentrant
*da0073e9SAndroid Build Coastguard Worker                        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        model_no_checkpoint = MyModel(
*da0073e9SAndroid Build Coastguard Worker            8, use_checkpoint=False, use_reentrant=False
*da0073e9SAndroid Build Coastguard Worker        ).cuda()
*da0073e9SAndroid Build Coastguard Worker        model_reentrant_checkpoint = MyModel(
*da0073e9SAndroid Build Coastguard Worker            8, use_checkpoint=True, use_reentrant=True
*da0073e9SAndroid Build Coastguard Worker        ).cuda()
*da0073e9SAndroid Build Coastguard Worker        model_no_reentrant_checkpoint = MyModel(
*da0073e9SAndroid Build Coastguard Worker            8, use_checkpoint=True, use_reentrant=False
*da0073e9SAndroid Build Coastguard Worker        ).cuda()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(100, 256, requires_grad=True, device="cuda")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        torch.cuda.reset_peak_memory_stats()
*da0073e9SAndroid Build Coastguard Worker        loss = model_no_checkpoint(x.clone()).sum()
*da0073e9SAndroid Build Coastguard Worker        loss.backward()
*da0073e9SAndroid Build Coastguard Worker        mem_no_checkpoint = torch.cuda.max_memory_allocated()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        torch.cuda.reset_peak_memory_stats()
*da0073e9SAndroid Build Coastguard Worker        loss = model_reentrant_checkpoint(x.clone()).sum()
*da0073e9SAndroid Build Coastguard Worker        loss.backward()
*da0073e9SAndroid Build Coastguard Worker        mem_reentrant_checkpoint = torch.cuda.max_memory_allocated()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        torch.cuda.reset_peak_memory_stats()
*da0073e9SAndroid Build Coastguard Worker        loss = model_no_reentrant_checkpoint(x.clone()).sum()
*da0073e9SAndroid Build Coastguard Worker        loss.backward()
*da0073e9SAndroid Build Coastguard Worker        mem_no_reentrant_checkpoint = torch.cuda.max_memory_allocated()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(mem_reentrant_checkpoint < mem_no_checkpoint)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(mem_no_reentrant_checkpoint < mem_no_checkpoint)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_checkpointing_without_reentrant_custom_function_works(self):
*da0073e9SAndroid Build Coastguard Worker        msg = "Unpack is being triggered for a tensor that was already unpacked once"
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class MyFunc(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x, y, z):
*da0073e9SAndroid Build Coastguard Worker                w = x * y * z
*da0073e9SAndroid Build Coastguard Worker                out = w + w
*da0073e9SAndroid Build Coastguard Worker                ctx.save_for_backward(x, y, z, w, out)
*da0073e9SAndroid Build Coastguard Worker                return out
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_out):
*da0073e9SAndroid Build Coastguard Worker                x, y, z, w, out = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                # Accessing the saved Tensors a second time will raise because
*da0073e9SAndroid Build Coastguard Worker                # recomputed tensors get cleared as soon as they are unpacked.
*da0073e9SAndroid Build Coastguard Worker                # A recomputation is only triggered if your backward has a new
*da0073e9SAndroid Build Coastguard Worker                # graph-task id.
*da0073e9SAndroid Build Coastguard Worker                with self.assertRaisesRegex(RuntimeError, msg):
*da0073e9SAndroid Build Coastguard Worker                    x_2, y_2, z_2, w_2, out_2 = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                return x, y, z
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.tensor(2.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        z = torch.tensor(3.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def foo(x, y, z):
*da0073e9SAndroid Build Coastguard Worker            x = x * y * z
*da0073e9SAndroid Build Coastguard Worker            y = y * y * z
*da0073e9SAndroid Build Coastguard Worker            z = z * z
*da0073e9SAndroid Build Coastguard Worker            out = MyFunc.apply(x, y, z)
*da0073e9SAndroid Build Coastguard Worker            return out
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = checkpoint(foo, x, y, z, use_reentrant=False)
*da0073e9SAndroid Build Coastguard Worker        out.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_checkpointing_without_reentrant_with_context_fn(self):
*da0073e9SAndroid Build Coastguard Worker        class VerboseTorchDispatchMode(TorchDispatchMode):
*da0073e9SAndroid Build Coastguard Worker            def __init__(self) -> None:
*da0073e9SAndroid Build Coastguard Worker                self.operators = []
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def __torch_dispatch__(self, func, types, args=(), kwargs=None):
*da0073e9SAndroid Build Coastguard Worker                if kwargs is None:
*da0073e9SAndroid Build Coastguard Worker                    kwargs = {}
*da0073e9SAndroid Build Coastguard Worker                self.operators.append(func.__name__)
*da0073e9SAndroid Build Coastguard Worker                return func(*args, **kwargs)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        verbose_mode = VerboseTorchDispatchMode()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def context_fn():
*da0073e9SAndroid Build Coastguard Worker            return verbose_mode, contextlib.nullcontext()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = checkpoint(
*da0073e9SAndroid Build Coastguard Worker            lambda x: x.exp(), x, use_reentrant=False, context_fn=context_fn
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(verbose_mode.operators, ["exp.default"])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        verbose_mode.operators = []
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def context_fn():
*da0073e9SAndroid Build Coastguard Worker            return contextlib.nullcontext(), verbose_mode
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = checkpoint(
*da0073e9SAndroid Build Coastguard Worker            lambda x: x.exp(), x, use_reentrant=False, context_fn=context_fn
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        out.backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            verbose_mode.operators, ["exp.default", "detach.default", "detach.default"]
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            Exception, "only supported when use_reentrant=False"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            out = checkpoint(
*da0073e9SAndroid Build Coastguard Worker                lambda x: x.sin(), x, use_reentrant=True, context_fn=context_fn
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_checkpoint_warns_if_use_reentrant_not_passed_explcitly(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Passing explicitly should not warn
*da0073e9SAndroid Build Coastguard Worker        self.assertNotWarn(lambda: checkpoint(lambda x: x, a, use_reentrant=False))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Not passing explicitly warns
*da0073e9SAndroid Build Coastguard Worker        with self.assertWarnsOnceRegex(
*da0073e9SAndroid Build Coastguard Worker            UserWarning, ".*the use_reentrant parameter should be passed explicitly.*"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            checkpoint(lambda x: x, a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_checkpoint_sequential_warns_if_use_reentrant_not_passed_explcitly(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        modules_list = [
*da0073e9SAndroid Build Coastguard Worker            torch.nn.Linear(3, 3),
*da0073e9SAndroid Build Coastguard Worker            torch.nn.Linear(3, 3),
*da0073e9SAndroid Build Coastguard Worker            torch.nn.Linear(3, 3),
*da0073e9SAndroid Build Coastguard Worker        ]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Passing explicitly should not warn
*da0073e9SAndroid Build Coastguard Worker        self.assertNotWarn(
*da0073e9SAndroid Build Coastguard Worker            lambda: checkpoint_sequential(modules_list, 3, a, use_reentrant=False)
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Not passing explicitly warns
*da0073e9SAndroid Build Coastguard Worker        with self.assertWarnsOnceRegex(
*da0073e9SAndroid Build Coastguard Worker            UserWarning, ".*the use_reentrant parameter should be passed explicitly.*"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            checkpoint_sequential(modules_list, 3, a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_checkpoint_detects_non_determinism(self):
*da0073e9SAndroid Build Coastguard Worker        def save_3_tensors(x):
*da0073e9SAndroid Build Coastguard Worker            out = x.sin().exp()
*da0073e9SAndroid Build Coastguard Worker            out = out.sin()
*da0073e9SAndroid Build Coastguard Worker            return out
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def save_2_tensors(x):
*da0073e9SAndroid Build Coastguard Worker            return x.sin().exp()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def save_2_tensors_alt(x):
*da0073e9SAndroid Build Coastguard Worker            return x.sin() * torch.tensor([1.0, 2.0])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def get_non_det_fn(orig_fn, recompute_fn):
*da0073e9SAndroid Build Coastguard Worker            counter = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def fn(x):
*da0073e9SAndroid Build Coastguard Worker                if counter[0] == 0:
*da0073e9SAndroid Build Coastguard Worker                    counter[0] += 1
*da0073e9SAndroid Build Coastguard Worker                    return orig_fn(x)
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    return recompute_fn(x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            return fn
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Save fewer tensors during recompute
*da0073e9SAndroid Build Coastguard Worker        fn = get_non_det_fn(orig_fn=save_3_tensors, recompute_fn=save_2_tensors)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, "A different number of tensors was saved"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            out = checkpoint(fn, a, use_reentrant=False)
*da0073e9SAndroid Build Coastguard Worker            out.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Save more tensors during recompute
*da0073e9SAndroid Build Coastguard Worker        fn = get_non_det_fn(orig_fn=save_2_tensors, recompute_fn=save_3_tensors)
*da0073e9SAndroid Build Coastguard Worker        with torch.utils.checkpoint.set_checkpoint_early_stop(False):
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError, "trying to save more tensors during recomputation"
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                out = checkpoint(fn, a, use_reentrant=False)
*da0073e9SAndroid Build Coastguard Worker                out.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        fn = get_non_det_fn(orig_fn=save_2_tensors, recompute_fn=save_3_tensors)
*da0073e9SAndroid Build Coastguard Worker        # If early stopping is enabled, we would not raise (the results would be correct anyway)
*da0073e9SAndroid Build Coastguard Worker        out = checkpoint(fn, a, use_reentrant=False)
*da0073e9SAndroid Build Coastguard Worker        out.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Save the same number of tensors but the shape is different
*da0073e9SAndroid Build Coastguard Worker        fn = get_non_det_fn(orig_fn=save_2_tensors, recompute_fn=save_2_tensors_alt)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "tensors have different metadata"):
*da0073e9SAndroid Build Coastguard Worker            out = checkpoint(fn, a, use_reentrant=False)
*da0073e9SAndroid Build Coastguard Worker            out.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Get the debug message if debug=True
*da0073e9SAndroid Build Coastguard Worker        fn = get_non_det_fn(orig_fn=save_2_tensors, recompute_fn=save_2_tensors_alt)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError,
*da0073e9SAndroid Build Coastguard Worker            "You are seeing this error because you passed `debug=True` to checkpoint",
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            out = checkpoint(fn, a, use_reentrant=False, debug=True)
*da0073e9SAndroid Build Coastguard Worker            out.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        fn = get_non_det_fn(orig_fn=save_2_tensors, recompute_fn=save_2_tensors_alt)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError,
*da0073e9SAndroid Build Coastguard Worker            "You are seeing this error because you passed `debug=True` to checkpoint",
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            with torch.utils.checkpoint.set_checkpoint_debug_enabled(True):
*da0073e9SAndroid Build Coastguard Worker                out = checkpoint(fn, a, use_reentrant=False, debug=False)
*da0073e9SAndroid Build Coastguard Worker                out.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        fn = get_non_det_fn(orig_fn=save_2_tensors, recompute_fn=save_2_tensors_alt)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, "Recomputed values for the following tensors have different"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            with torch.utils.checkpoint.set_checkpoint_debug_enabled(False):
*da0073e9SAndroid Build Coastguard Worker                out = checkpoint(fn, a, use_reentrant=False, debug=True)
*da0073e9SAndroid Build Coastguard Worker                out.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_access_saved_tensor_twice_without_recomputation_works(self):
*da0073e9SAndroid Build Coastguard Worker        count = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def foo(a):
*da0073e9SAndroid Build Coastguard Worker            count[0] += 1
*da0073e9SAndroid Build Coastguard Worker            b = a * a
*da0073e9SAndroid Build Coastguard Worker            c = a * b
*da0073e9SAndroid Build Coastguard Worker            d = torch.exp(a)
*da0073e9SAndroid Build Coastguard Worker            return d
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        d = checkpoint(foo, a, use_reentrant=False)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(count[0], 1)
*da0073e9SAndroid Build Coastguard Worker        # Recomputed variables only persist within a particular backward call.
*da0073e9SAndroid Build Coastguard Worker        # If _saved_result is accessed outside of a backward, it will trigger
*da0073e9SAndroid Build Coastguard Worker        # a recompute. And afterwards, those recomputed results are immediately
*da0073e9SAndroid Build Coastguard Worker        # cleared.
*da0073e9SAndroid Build Coastguard Worker        d.grad_fn._saved_result
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(count[0], 2)
*da0073e9SAndroid Build Coastguard Worker        # Second access will trigger another recompute
*da0073e9SAndroid Build Coastguard Worker        d.grad_fn._saved_result
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(count[0], 3)
*da0073e9SAndroid Build Coastguard Worker        # Backward clears the saved variable
*da0073e9SAndroid Build Coastguard Worker        d.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(count[0], 4)
*da0073e9SAndroid Build Coastguard Worker        # Now it raises an error
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError,
*da0073e9SAndroid Build Coastguard Worker            "or directly access saved tensors after they have already been freed",
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            d.grad_fn._saved_result
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @slowTest
*da0073e9SAndroid Build Coastguard Worker    @parametrize("input_requires_grad", [True, False])
*da0073e9SAndroid Build Coastguard Worker    def test_checkpointing_without_reentrant(self, input_requires_grad):
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        Basic test for checkpoint without reentrant autograd.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        num_inp = 2000
*da0073e9SAndroid Build Coastguard Worker        nz_inp = 10
*da0073e9SAndroid Build Coastguard Worker        nz_out = 10
*da0073e9SAndroid Build Coastguard Worker        nz_bottleneck = 1000
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # small proxy network for some complex reasoning we want to do per input
*da0073e9SAndroid Build Coastguard Worker        module = nn.Sequential(
*da0073e9SAndroid Build Coastguard Worker            nn.Linear(nz_inp, nz_bottleneck),
*da0073e9SAndroid Build Coastguard Worker            nn.ReLU(),
*da0073e9SAndroid Build Coastguard Worker            nn.Linear(nz_bottleneck, nz_inp),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Module holder for testing activation checkpointing with no_reentrant
*da0073e9SAndroid Build Coastguard Worker        # supports kwargs.
*da0073e9SAndroid Build Coastguard Worker        class MyModule(nn.Module):
*da0073e9SAndroid Build Coastguard Worker            def __init__(self, mod):
*da0073e9SAndroid Build Coastguard Worker                super().__init__()
*da0073e9SAndroid Build Coastguard Worker                self.module = mod
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def forward(self, data):
*da0073e9SAndroid Build Coastguard Worker                return self.module(data)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        module = MyModule(mod=module)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Run model with and without checkpointing and verify gradients are
*da0073e9SAndroid Build Coastguard Worker        # equivalent, regardless of if inputs require grads or not.
*da0073e9SAndroid Build Coastguard Worker        module_copy = deepcopy(module)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        feat_combined = []
*da0073e9SAndroid Build Coastguard Worker        feat_combined_no_checkpoint = []
*da0073e9SAndroid Build Coastguard Worker        for r in range(num_inp):
*da0073e9SAndroid Build Coastguard Worker            data_r = torch.empty(1, nz_inp)
*da0073e9SAndroid Build Coastguard Worker            data_r.uniform_()
*da0073e9SAndroid Build Coastguard Worker            data_r.requires_grad = input_requires_grad
*da0073e9SAndroid Build Coastguard Worker            data_r_copy = data_r.clone()
*da0073e9SAndroid Build Coastguard Worker            feat_r = checkpoint(module, data=data_r, use_reentrant=False)
*da0073e9SAndroid Build Coastguard Worker            feat_combined.append(feat_r)
*da0073e9SAndroid Build Coastguard Worker            feat_r_no_checkpoint = module_copy(data_r)
*da0073e9SAndroid Build Coastguard Worker            feat_combined_no_checkpoint.append(feat_r_no_checkpoint)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # compute mean as a proxy for some joint reasoning
*da0073e9SAndroid Build Coastguard Worker        mean_combined = torch.stack(feat_combined).mean()
*da0073e9SAndroid Build Coastguard Worker        mean_combined.backward()
*da0073e9SAndroid Build Coastguard Worker        mean_combined_no_checkpoint = torch.stack(feat_combined_no_checkpoint).mean()
*da0073e9SAndroid Build Coastguard Worker        mean_combined_no_checkpoint.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for checkpoint_param, param in zip(
*da0073e9SAndroid Build Coastguard Worker            module.parameters(), module_copy.parameters()
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(checkpoint_param.grad, param.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_checkpoint_valid_reset_on_error(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            Exception, "torch.utils.checkpoint is incompatible"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            b = checkpoint(torch.exp, a, use_reentrant=True).sum()
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.grad(b, (a,))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        c = checkpoint(torch.exp, a, use_reentrant=True).sum()
*da0073e9SAndroid Build Coastguard Worker        c.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @parametrize("use_reentrant", [True, False])
*da0073e9SAndroid Build Coastguard Worker    def test_checkpointing_without_reentrant_detached_tensor(self, use_reentrant):
*da0073e9SAndroid Build Coastguard Worker        class NoGradModule(torch.nn.Module):
*da0073e9SAndroid Build Coastguard Worker            def __init__(self) -> None:
*da0073e9SAndroid Build Coastguard Worker                super().__init__()
*da0073e9SAndroid Build Coastguard Worker                self.linear = nn.Linear(2, 2, bias=False)
*da0073e9SAndroid Build Coastguard Worker                self.lin2 = nn.Linear(2, 2, bias=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def forward(self, x):
*da0073e9SAndroid Build Coastguard Worker                with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker                    return self.lin2(self.linear(x))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        module = NoGradModule()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        err_ctx = (
*da0073e9SAndroid Build Coastguard Worker            self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError, "none of output has requires_grad=True"
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            if use_reentrant
*da0073e9SAndroid Build Coastguard Worker            else contextlib.nullcontext()
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        for _ in range(3):
*da0073e9SAndroid Build Coastguard Worker            with err_ctx:
*da0073e9SAndroid Build Coastguard Worker                # out does not require grad
*da0073e9SAndroid Build Coastguard Worker                out = checkpoint(module, a, use_reentrant=use_reentrant)
*da0073e9SAndroid Build Coastguard Worker                # Make loss require grad, otherwise we would run into
*da0073e9SAndroid Build Coastguard Worker                # "element 0 of tensors does not require grad and does not have a grad_fn"
*da0073e9SAndroid Build Coastguard Worker                out += a
*da0073e9SAndroid Build Coastguard Worker                out.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_checkpointing_without_reentrant_saved_object_identity(self):
*da0073e9SAndroid Build Coastguard Worker        x_backward = None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class Test(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x, y):
*da0073e9SAndroid Build Coastguard Worker                ctx.save_for_backward(y)
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                nonlocal x_backward
*da0073e9SAndroid Build Coastguard Worker                (x_backward,) = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                return x, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = torch.tensor(1.0, requires_grad=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        Test.apply(a, b).backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertIs(b, x_backward)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x_backward = None
*da0073e9SAndroid Build Coastguard Worker        checkpoint(Test.apply, a, b, use_reentrant=False).backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertIs(b, x_backward)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_checkpointing_without_reentrant_correct_grad(self):
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        Verifies that correct gradients are calculated for checkpoint
*da0073e9SAndroid Build Coastguard Worker        without reentrant autograd, for both backward() and autograd.grad().
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        b = torch.exp(a).sum()
*da0073e9SAndroid Build Coastguard Worker        b.backward()
*da0073e9SAndroid Build Coastguard Worker        b_grad = a.grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a.grad = None
*da0073e9SAndroid Build Coastguard Worker        c = checkpoint(torch.exp, a, use_reentrant=False).sum()
*da0073e9SAndroid Build Coastguard Worker        c.backward()
*da0073e9SAndroid Build Coastguard Worker        c_grad = a.grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a.grad = None
*da0073e9SAndroid Build Coastguard Worker        d = checkpoint(torch.exp, a, use_reentrant=False).sum()
*da0073e9SAndroid Build Coastguard Worker        (d_grad,) = torch.autograd.grad(d, (a,))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(b_grad, c_grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(b_grad, d_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # PYTORCH_TEST_WITH_DYNAMO=1 test fails on CI but can't repro locally
*da0073e9SAndroid Build Coastguard Worker    @skipIfTorchDynamo("https://github.com/pytorch/pytorch/issues/127115")
*da0073e9SAndroid Build Coastguard Worker    def test_checkpointing_without_reentrant_dataparallel(self):
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        Verifies gradient correctness when checkpoint without reentrant autograd
*da0073e9SAndroid Build Coastguard Worker        is used in conjunction with DataParallel.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class LinearModule(torch.nn.Module):
*da0073e9SAndroid Build Coastguard Worker            def __init__(self) -> None:
*da0073e9SAndroid Build Coastguard Worker                super().__init__()
*da0073e9SAndroid Build Coastguard Worker                self.linear = nn.Linear(2, 2, bias=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def forward(self, inp):
*da0073e9SAndroid Build Coastguard Worker                return self.linear(inp)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        if torch.cuda.is_available():
*da0073e9SAndroid Build Coastguard Worker            a = a.cuda()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        model = LinearModule()
*da0073e9SAndroid Build Coastguard Worker        if torch.cuda.is_available():
*da0073e9SAndroid Build Coastguard Worker            model = model.cuda()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        b = deepcopy(model)(a).sum()
*da0073e9SAndroid Build Coastguard Worker        b.backward()
*da0073e9SAndroid Build Coastguard Worker        b_grad = a.grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a.grad = None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        module = torch.nn.DataParallel(deepcopy(model))
*da0073e9SAndroid Build Coastguard Worker        c = checkpoint(module, a, use_reentrant=False).sum()
*da0073e9SAndroid Build Coastguard Worker        c.backward()
*da0073e9SAndroid Build Coastguard Worker        c_grad = a.grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(b_grad, c_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_checkpointing_without_reentrant_parameter_used_in_an_out(self):
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        Ensures that gradient hooks are only called once per tensor.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        w = torch.randn(10, 10, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        count = 0
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def hook(grad):
*da0073e9SAndroid Build Coastguard Worker            nonlocal count
*da0073e9SAndroid Build Coastguard Worker            count += 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        w.register_hook(hook)
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(10, 10, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        h = w * x  # Using w outside the checkpoint
*da0073e9SAndroid Build Coastguard Worker        out = checkpoint(
*da0073e9SAndroid Build Coastguard Worker            lambda x: w * x, h, use_reentrant=False
*da0073e9SAndroid Build Coastguard Worker        )  # Using w inside the checkpoint
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        # should only call hook once
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(count, 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # https://github.com/pytorch/pytorch/issues/127115
*da0073e9SAndroid Build Coastguard Worker    @xfailIfTorchDynamo
*da0073e9SAndroid Build Coastguard Worker    def test_checkpointing_without_reentrant_arbitrary_input_output(self):
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        Ensures checkpointing without reentrant autograd works with functions
*da0073e9SAndroid Build Coastguard Worker        with arbitrary input/output structures.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class MyModel(torch.nn.Module):
*da0073e9SAndroid Build Coastguard Worker            def __init__(self) -> None:
*da0073e9SAndroid Build Coastguard Worker                super().__init__()
*da0073e9SAndroid Build Coastguard Worker                self.layer = torch.nn.Linear(5, 5, bias=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def forward(self, dict_input):
*da0073e9SAndroid Build Coastguard Worker                tensor = dict_input["tensor"]
*da0073e9SAndroid Build Coastguard Worker                return {"result": self.layer(tensor)}
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        model_no_checkpoint = MyModel()
*da0073e9SAndroid Build Coastguard Worker        model_checkpoint_without_reentrant = deepcopy(model_no_checkpoint)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        inp = {"tensor": torch.randn(5, 5)}
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out_no_checkpoint = model_no_checkpoint(inp)["result"].sum()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out_checkpoint = checkpoint(
*da0073e9SAndroid Build Coastguard Worker            model_checkpoint_without_reentrant, inp, use_reentrant=False
*da0073e9SAndroid Build Coastguard Worker        )["result"].sum()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(out_checkpoint, out_no_checkpoint)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out_no_checkpoint.backward()
*da0073e9SAndroid Build Coastguard Worker        out_checkpoint.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for param, checkpoint_param in zip(
*da0073e9SAndroid Build Coastguard Worker            model_no_checkpoint.parameters(),
*da0073e9SAndroid Build Coastguard Worker            model_checkpoint_without_reentrant.parameters(),
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(param.grad, checkpoint_param.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_callback_adds_callback(self):
*da0073e9SAndroid Build Coastguard Worker        called = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def callback_final():
*da0073e9SAndroid Build Coastguard Worker            called[0] += 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def callback_adds_callback():
*da0073e9SAndroid Build Coastguard Worker            called[0] += 1
*da0073e9SAndroid Build Coastguard Worker            Variable._execution_engine.queue_callback(callback_final)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class MyFunc(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, input):
*da0073e9SAndroid Build Coastguard Worker                return input
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            @once_differentiable
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad):
*da0073e9SAndroid Build Coastguard Worker                Variable._execution_engine.queue_callback(callback_adds_callback)
*da0073e9SAndroid Build Coastguard Worker                return grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.rand((3, 3), requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = MyFunc.apply(a)
*da0073e9SAndroid Build Coastguard Worker        b.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(called[0], 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @unittest.skipIf(not TEST_CUDA, "test requires CUDA")
*da0073e9SAndroid Build Coastguard Worker    def test_callback_propagates_errors_from_device_thread(self):
*da0073e9SAndroid Build Coastguard Worker        def callback():
*da0073e9SAndroid Build Coastguard Worker            raise RuntimeError("blah")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def hook_with_callback(*args):
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.Variable._execution_engine.queue_callback(callback)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        t = torch.tensor([1.0, 2.0], requires_grad=True, device=torch.device("cuda"))
*da0073e9SAndroid Build Coastguard Worker        t.register_hook(hook_with_callback)
*da0073e9SAndroid Build Coastguard Worker        output = t**2
*da0073e9SAndroid Build Coastguard Worker        loss = output.sum()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "blah"):
*da0073e9SAndroid Build Coastguard Worker            loss.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _test_reentrant_with_callbacks(self, install_callbacks_in_depths):
*da0073e9SAndroid Build Coastguard Worker        counter = {}
*da0073e9SAndroid Build Coastguard Worker        counter["inner"] = 0
*da0073e9SAndroid Build Coastguard Worker        counter["outer"] = 0
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def inc_inner_counter():
*da0073e9SAndroid Build Coastguard Worker            counter["inner"] += 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def inc_outer_counter():
*da0073e9SAndroid Build Coastguard Worker            counter["outer"] += 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class MyFunc(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, input):
*da0073e9SAndroid Build Coastguard Worker                return input
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            @once_differentiable
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, input):
*da0073e9SAndroid Build Coastguard Worker                if 1 in install_callbacks_in_depths:
*da0073e9SAndroid Build Coastguard Worker                    # Add a callback to execute.
*da0073e9SAndroid Build Coastguard Worker                    Variable._execution_engine.queue_callback(inc_inner_counter)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                return input
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class MyReentrantFunc(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, input):
*da0073e9SAndroid Build Coastguard Worker                return input
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            @once_differentiable
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, input):
*da0073e9SAndroid Build Coastguard Worker                if 0 in install_callbacks_in_depths:
*da0073e9SAndroid Build Coastguard Worker                    # Add a callback to execute.
*da0073e9SAndroid Build Coastguard Worker                    Variable._execution_engine.queue_callback(inc_outer_counter)
*da0073e9SAndroid Build Coastguard Worker                # Reentrant backward call.
*da0073e9SAndroid Build Coastguard Worker                tmp_inp = input.detach().requires_grad_()
*da0073e9SAndroid Build Coastguard Worker                with torch.enable_grad():
*da0073e9SAndroid Build Coastguard Worker                    tmp_out = (MyFunc.apply(tmp_inp)).sum()
*da0073e9SAndroid Build Coastguard Worker                tmp_out.backward()
*da0073e9SAndroid Build Coastguard Worker                return input
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        t1 = torch.rand((3, 3), requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        t2 = MyReentrantFunc.apply(t1)
*da0073e9SAndroid Build Coastguard Worker        t3 = t2.sum()
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.backward([t3])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        return counter
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_reentrant_with_callbacks_depth_0(self):
*da0073e9SAndroid Build Coastguard Worker        # Verify callback is called only once.
*da0073e9SAndroid Build Coastguard Worker        ret = self._test_reentrant_with_callbacks([0])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(1, ret["outer"])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(0, ret["inner"])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_reentrant_with_callbacks_depth_1(self):
*da0073e9SAndroid Build Coastguard Worker        # Verify callback is called only once.
*da0073e9SAndroid Build Coastguard Worker        ret = self._test_reentrant_with_callbacks([1])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(0, ret["outer"])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(1, ret["inner"])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_reentrant_with_callbacks_both_depths(self):
*da0073e9SAndroid Build Coastguard Worker        # Verify callback is called twice.
*da0073e9SAndroid Build Coastguard Worker        ret = self._test_reentrant_with_callbacks([0, 1])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(1, ret["outer"])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(1, ret["inner"])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_reentrant_with_leaf_variable_hook(self):
*da0073e9SAndroid Build Coastguard Worker        handle = None
*da0073e9SAndroid Build Coastguard Worker        param = torch.rand(10, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def add_gradient_penalty_to_grad(grad):
*da0073e9SAndroid Build Coastguard Worker            handle.remove()
*da0073e9SAndroid Build Coastguard Worker            old_param_grad = grad
*da0073e9SAndroid Build Coastguard Worker            param.grad = None
*da0073e9SAndroid Build Coastguard Worker            # Add some sort of gradient penalty by directly updating the gradients
*da0073e9SAndroid Build Coastguard Worker            with torch.enable_grad():
*da0073e9SAndroid Build Coastguard Worker                g = grad.detach().requires_grad_()
*da0073e9SAndroid Build Coastguard Worker                new_param = param.detach().requires_grad_()
*da0073e9SAndroid Build Coastguard Worker                out = ((g * 2) + new_param).sum()
*da0073e9SAndroid Build Coastguard Worker                out.backward()
*da0073e9SAndroid Build Coastguard Worker            res = g.grad + grad
*da0073e9SAndroid Build Coastguard Worker            param.grad = old_param_grad
*da0073e9SAndroid Build Coastguard Worker            return res
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        handle = param.register_hook(add_gradient_penalty_to_grad)
*da0073e9SAndroid Build Coastguard Worker        # Forward pass
*da0073e9SAndroid Build Coastguard Worker        tmp = param * param
*da0073e9SAndroid Build Coastguard Worker        loss = tmp.sum()
*da0073e9SAndroid Build Coastguard Worker        # Compute the gradients
*da0073e9SAndroid Build Coastguard Worker        loss.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_reentrant_with_non_leaf_variable_hook(self):
*da0073e9SAndroid Build Coastguard Worker        handle = None
*da0073e9SAndroid Build Coastguard Worker        param = torch.rand(10, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def manual_increase_gradient(grad):
*da0073e9SAndroid Build Coastguard Worker            handle.remove()
*da0073e9SAndroid Build Coastguard Worker            # Add some sort of gradient penalty by directly updating the gradients
*da0073e9SAndroid Build Coastguard Worker            with torch.enable_grad():
*da0073e9SAndroid Build Coastguard Worker                g = grad.detach().requires_grad_()
*da0073e9SAndroid Build Coastguard Worker                out = ((g * 2) + 5).sum()
*da0073e9SAndroid Build Coastguard Worker                out.backward()
*da0073e9SAndroid Build Coastguard Worker            res = g.grad + grad
*da0073e9SAndroid Build Coastguard Worker            return res
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Forward pass
*da0073e9SAndroid Build Coastguard Worker        tmp = param * param
*da0073e9SAndroid Build Coastguard Worker        handle = tmp.register_hook(manual_increase_gradient)
*da0073e9SAndroid Build Coastguard Worker        loss = tmp.sum()
*da0073e9SAndroid Build Coastguard Worker        # Compute the gradients
*da0073e9SAndroid Build Coastguard Worker        loss.backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(param.grad, 6 * param)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_grad_fn_attr_bindings(self):
*da0073e9SAndroid Build Coastguard Worker        # Check that the getter of each type returns what we want
*da0073e9SAndroid Build Coastguard Worker        # See `gen_autograd_functions.py` for how the getters are generated
*da0073e9SAndroid Build Coastguard Worker        #
*da0073e9SAndroid Build Coastguard Worker        # This test is only meant to check if the codegen'd bindings work
*da0073e9SAndroid Build Coastguard Worker        # Please help update this test if you update the names of any the fields we check!
*da0073e9SAndroid Build Coastguard Worker        #
*da0073e9SAndroid Build Coastguard Worker        a = torch.ones(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = torch.zeros(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out1 = torch.stack([a, b], dim=0)
*da0073e9SAndroid Build Coastguard Worker        out2 = (a * 2) * b
*da0073e9SAndroid Build Coastguard Worker        # TODO: I don't think we have a backward saving a list of tensors
*da0073e9SAndroid Build Coastguard Worker        #       at the moment. It used to be stack, but for no reason...
*da0073e9SAndroid Build Coastguard Worker        #       see discussion in #84993
*da0073e9SAndroid Build Coastguard Worker        # self.assertEqual(out.grad_fn._saved_tensors, (a, b))              # TewnsorList -> Tuple[Tensor]
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(out2.grad_fn._saved_self, a * 2)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(out2.grad_fn._saved_self, torch.Tensor)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(
*da0073e9SAndroid Build Coastguard Worker            out2.grad_fn._raw_saved_self, torch._C._autograd.SavedTensor
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(out1.grad_fn._saved_dim, 0)  # int64_t -> int
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(out1.grad_fn._saved_dim, int)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out2.grad_fn._raw_saved_self.register_hooks(lambda x: x, lambda x: x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out2.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "after they have already been freed"):
*da0073e9SAndroid Build Coastguard Worker            out2.grad_fn._saved_self
*da0073e9SAndroid Build Coastguard Worker        # TODO: interestingly, this only happens if indexing into a list grad_fn._raw_saved_tensors[0],
*da0073e9SAndroid Build Coastguard Worker        #       not when using a saved tensor, see discussion in #84993
*da0073e9SAndroid Build Coastguard Worker        # with self.assertRaisesRegex(RuntimeError, "after they have already been freed"):
*da0073e9SAndroid Build Coastguard Worker        #     out2.grad_fn._raw_saved_self
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(out1.grad_fn._saved_dim, 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.ones(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        indices = torch.tensor([0, 1])
*da0073e9SAndroid Build Coastguard Worker        out = a[:, indices]
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            out.grad_fn._saved_indices, (None, indices)
*da0073e9SAndroid Build Coastguard Worker        )  # c10::List<std::optional<Tensor>> -> Tuple[Tensor?]
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(out.grad_fn._saved_indices[1], torch.Tensor)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(
*da0073e9SAndroid Build Coastguard Worker            out.grad_fn._raw_saved_indices[1], torch._C._autograd.SavedTensor
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            out.grad_fn._saved_self_sym_sizes, a.shape
*da0073e9SAndroid Build Coastguard Worker        )  # SymIntArrayRef -> Tuple[SymInt]
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(out.grad_fn._saved_self_sym_sizes[0], int)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out.grad_fn._raw_saved_indices[1].register_hooks(lambda x: x, lambda x: x)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "None is forbidden"):
*da0073e9SAndroid Build Coastguard Worker            out.grad_fn._raw_saved_indices[0].register_hooks(lambda x: x, lambda x: x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = a.mean()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            out.grad_fn._saved_self_sym_sizes, a.shape
*da0073e9SAndroid Build Coastguard Worker        )  # IntArrayRef -> Tuple[int]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.ones(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out = a * a
*da0073e9SAndroid Build Coastguard Worker        out.grad_fn._raw_saved_self.register_hooks(lambda x: x, lambda x: x)
*da0073e9SAndroid Build Coastguard Worker        out.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "after it has been freed"):
*da0073e9SAndroid Build Coastguard Worker            out.grad_fn._raw_saved_self.register_hooks(lambda x: x, lambda x: x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.ones(1, 1, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out = torch.nn.functional.interpolate(a, 4, mode="linear")
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            out.grad_fn._saved_output_size, (4,)
*da0073e9SAndroid Build Coastguard Worker        )  # std::optional<IntArrayRef> -> int[]?
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(out.grad_fn._saved_output_size[0], int)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(out.grad_fn._saved_align_corners, False)  # bool -> bool
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(out.grad_fn._saved_align_corners, bool)
*da0073e9SAndroid Build Coastguard Worker        if hasattr(out.grad_fn, "_saved_scale_factors"):
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(
*da0073e9SAndroid Build Coastguard Worker                out.grad_fn._saved_scale_factors
*da0073e9SAndroid Build Coastguard Worker            )  # std::optional<ArrayRef<double>> -> float[]?
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(
*da0073e9SAndroid Build Coastguard Worker                out.grad_fn._saved_scales
*da0073e9SAndroid Build Coastguard Worker            )  # std::optional<ArrayRef<double>> -> float[]?
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.ones(1, 1, 3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out = nn.Conv2d(1, 1, 3)(a)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            out.grad_fn._saved_bias_sym_sizes_opt, (1,)
*da0073e9SAndroid Build Coastguard Worker        )  # std::optional<SymIntArrayRef> -> SymInt[]?
*da0073e9SAndroid Build Coastguard Worker        out = nn.Conv2d(1, 1, 3, bias=False)(a)
*da0073e9SAndroid Build Coastguard Worker        # TODO: This is BAD! we converted a std::nullopt into a (0,)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(out.grad_fn._saved_bias_sym_sizes_opt, (0,))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.ones(1, 3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out = torch.addbmm(a.squeeze(0), a, a)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(out.grad_fn._saved_batch1_sym_argsize_0, 1)  # int64_t
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(out.grad_fn._saved_batch1_sym_argsize_1, 3)  # int64_t
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.ones(1, 1, 3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out = torch.nn.functional.unfold(a, 3)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(out.grad_fn._saved_self_sym_argsize_minus_2, 3)  # SymInt
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(out.grad_fn._saved_self_sym_argsize_minus_1, 3)  # SymInt
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.ones(1, 1, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out = torch.nn.functional.interpolate(a, scale_factor=0.5, mode="linear")
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(out.grad_fn._saved_scales, 0.5)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.ones(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out = torch.pdist(a, p=1)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(out.grad_fn._saved_p, 1.0)  # double -> float
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(out.grad_fn._saved_p, float)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.ones(1, 1, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out = torch.logit(a, 1.0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(out.grad_fn._saved_eps, 1.0)  # c10:optional<double> -> float?
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(out.grad_fn._saved_eps, float)
*da0073e9SAndroid Build Coastguard Worker        out = torch.logit(a)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(out.grad_fn._saved_eps)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if torch._C.has_lapack:
*da0073e9SAndroid Build Coastguard Worker            a = torch.ones(1, 1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            q, r = torch.linalg.qr(a, mode="reduced")
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(q.grad_fn._saved_mode, "reduced")  # std::string -> str
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor([1.0], requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out = torch.div(a, 2.0, rounding_mode="trunc")
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            out.grad_fn._saved_rounding_mode, "trunc"
*da0073e9SAndroid Build Coastguard Worker        )  # std::optional<std::string> -> str?
*da0073e9SAndroid Build Coastguard Worker        out = torch.div(a, 2.0, rounding_mode=None)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(
*da0073e9SAndroid Build Coastguard Worker            out.grad_fn._saved_rounding_mode
*da0073e9SAndroid Build Coastguard Worker        )  # std::optional<std::string> -> str?
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.zeros(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out = torch.threshold(x, threshold=(1 + 0j), value=(1 + 0j))
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(
*da0073e9SAndroid Build Coastguard Worker            out.grad_fn._saved_threshold, complex
*da0073e9SAndroid Build Coastguard Worker        )  # Scalar(complex double) -> complex
*da0073e9SAndroid Build Coastguard Worker        cfloat = torch.tensor(1 + 0j, dtype=torch.complex64)
*da0073e9SAndroid Build Coastguard Worker        out = torch.threshold(x, threshold=cfloat, value=(1 + 0j))
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(
*da0073e9SAndroid Build Coastguard Worker            out.grad_fn._saved_threshold, complex
*da0073e9SAndroid Build Coastguard Worker        )  # Scalar(complex float) -> complex
*da0073e9SAndroid Build Coastguard Worker        out = torch.threshold(x, threshold=1.0, value=1.0)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(
*da0073e9SAndroid Build Coastguard Worker            out.grad_fn._saved_threshold, float
*da0073e9SAndroid Build Coastguard Worker        )  # Scalar(floating point) -> float
*da0073e9SAndroid Build Coastguard Worker        out = torch.threshold(x, threshold=1, value=1)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(
*da0073e9SAndroid Build Coastguard Worker            out.grad_fn._saved_threshold, int
*da0073e9SAndroid Build Coastguard Worker        )  # Scalar(integral) -> int
*da0073e9SAndroid Build Coastguard Worker        out = torch.threshold(x, threshold=False, value=False)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(
*da0073e9SAndroid Build Coastguard Worker            out.grad_fn._saved_threshold, bool
*da0073e9SAndroid Build Coastguard Worker        )  # Scalar(bool) -> bool
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.ones(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out = a.as_strided((3,), (1,), 1)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            out.grad_fn._saved_storage_offset, 1
*da0073e9SAndroid Build Coastguard Worker        )  # c10:optional<int64_t> -> int?
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(out.grad_fn._saved_storage_offset, int)
*da0073e9SAndroid Build Coastguard Worker        out = a.as_strided((3,), (1,))
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(out.grad_fn._saved_storage_offset)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.ones(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out = torch.tanh(a)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(out, out.grad_fn._saved_result)  # saved variable when output
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(3, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = torch.tensor([1, 0, 4])
*da0073e9SAndroid Build Coastguard Worker        loss = nn.NLLLoss()
*da0073e9SAndroid Build Coastguard Worker        out = loss(a, b)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(out.grad_fn._saved_weight)
*da0073e9SAndroid Build Coastguard Worker        loss = nn.NLLLoss(weight=torch.ones((5,)))
*da0073e9SAndroid Build Coastguard Worker        out = loss(a, b)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            out.grad_fn._saved_weight, torch.ones((5,))
*da0073e9SAndroid Build Coastguard Worker        )  # c10:optional<Tensor> -> Tensor?
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "after they have already been freed"):
*da0073e9SAndroid Build Coastguard Worker            out.grad_fn._saved_weight
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        num_tensors = 3
*da0073e9SAndroid Build Coastguard Worker        input_tensors = [
*da0073e9SAndroid Build Coastguard Worker            torch.ones(2, 2, requires_grad=True) for _ in range(num_tensors)
*da0073e9SAndroid Build Coastguard Worker        ]
*da0073e9SAndroid Build Coastguard Worker        scalars = [
*da0073e9SAndroid Build Coastguard Worker            0.0 for _ in range(num_tensors)
*da0073e9SAndroid Build Coastguard Worker        ]  # ArrayRef<Scalar> -> Tuple[Scalar, ...]
*da0073e9SAndroid Build Coastguard Worker        results = torch._foreach_maximum(input_tensors, scalars)
*da0073e9SAndroid Build Coastguard Worker        for t in results:
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(t.grad_fn._saved_scalars, scalars)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_cant_create_saved_tensors(self):
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError,
*da0073e9SAndroid Build Coastguard Worker            "Trying to create a SavedTensor object from Python is forbidden",
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.SavedTensor()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_custom_function_saved_tensors(self):
*da0073e9SAndroid Build Coastguard Worker        def getFn(save=True):
*da0073e9SAndroid Build Coastguard Worker            class MyFn(Function):
*da0073e9SAndroid Build Coastguard Worker                @staticmethod
*da0073e9SAndroid Build Coastguard Worker                def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                    if save:
*da0073e9SAndroid Build Coastguard Worker                        ctx.save_for_backward(x, None)
*da0073e9SAndroid Build Coastguard Worker                    return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                @staticmethod
*da0073e9SAndroid Build Coastguard Worker                def backward(ctx, g):
*da0073e9SAndroid Build Coastguard Worker                    return g
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            return MyFn
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        y = getFn(True).apply(a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual((a, None), y.grad_fn.saved_tensors)
*da0073e9SAndroid Build Coastguard Worker        saved = y.grad_fn._raw_saved_tensors
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(saved[0], torch._C._autograd.SavedTensor)
*da0073e9SAndroid Build Coastguard Worker        # We can't tell the underlying tensor is None without unpacking it
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(saved[1], torch._C._autograd.SavedTensor)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # We catch that error when the user calls register_hooks on it
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "None is forbidden"):
*da0073e9SAndroid Build Coastguard Worker            saved[1].register_hooks(lambda x: x, lambda x: x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(TypeError, "incompatible function arguments"):
*da0073e9SAndroid Build Coastguard Worker            saved[0].register_hooks(lambda x: x)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(TypeError, "incompatible function arguments"):
*da0073e9SAndroid Build Coastguard Worker            saved[0].register_hooks(1, 1)
*da0073e9SAndroid Build Coastguard Worker        saved[0].register_hooks(lambda x: x, lambda x: x)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "already been set"):
*da0073e9SAndroid Build Coastguard Worker            saved[0].register_hooks(lambda x: x, lambda x: x)
*da0073e9SAndroid Build Coastguard Worker        y.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Using a reference to the SavedTensor object after the
*da0073e9SAndroid Build Coastguard Worker        # saved variables have been released can lead to undefined behavior
*da0073e9SAndroid Build Coastguard Worker        del saved
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "after they have already been freed"):
*da0073e9SAndroid Build Coastguard Worker            y.grad_fn._raw_saved_tensors
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "after they have already been freed"):
*da0073e9SAndroid Build Coastguard Worker            y.grad_fn.saved_tensors
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        y = getFn(False).apply(a)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y.grad_fn.saved_tensors, ())
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y.grad_fn._raw_saved_tensors, ())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_autograd_node_isinstance(self):
*da0073e9SAndroid Build Coastguard Worker        # Node is a "virtual" base class of codegen'd nodes. This means that
*da0073e9SAndroid Build Coastguard Worker        # isinstance and issubclass are overridden, but mro is unchanged
*da0073e9SAndroid Build Coastguard Worker        Node = torch.autograd.graph.Node
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.rand(3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = a.exp()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Some nodes have codegened registrations to the torch._C._function module
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(b.grad_fn, Node)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(issubclass(type(b.grad_fn), Node))
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(Node not in type(b.grad_fn).mro())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Other nodes have manual registrations to the torch._C._function module
*da0073e9SAndroid Build Coastguard Worker        self.assertNotIsInstance(torch._C._functions.AccumulateGrad, Node)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(issubclass(torch._C._functions.AccumulateGrad, Node))
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(b.grad_fn.next_functions[0][0], Node)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(issubclass(torch._C._functions.DelayedError, Node))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Special cases
*da0073e9SAndroid Build Coastguard Worker        self.assertNotIsInstance(None, Node)
*da0073e9SAndroid Build Coastguard Worker        self.assertNotIsInstance(1, Node)
*da0073e9SAndroid Build Coastguard Worker        self.assertNotIsInstance(Node, Node)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(issubclass(Node, Node))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Custom function case
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(issubclass(torch.autograd.function.BackwardCFunction, Node))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class Func(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                self.assertIsInstance(ctx, Node)
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                self.assertIsInstance(ctx, Node)
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = Func.apply(a)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(out.grad_fn, Node)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(issubclass(type(out.grad_fn), Node))
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(Node not in type(out.grad_fn).mro())
*da0073e9SAndroid Build Coastguard Worker        out.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_autograd_views_codegen(self):
*da0073e9SAndroid Build Coastguard Worker        # This is not necessarily the absolute correct behavior, but this is the current
*da0073e9SAndroid Build Coastguard Worker        # one. This test is here to make sure that any change to this behavior is detected
*da0073e9SAndroid Build Coastguard Worker        # and not silent. The TODOs below mark the places with unexpected behavior.
*da0073e9SAndroid Build Coastguard Worker        # Note that any change in these test will be BC-breaking and should be done carefully.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # This test checks the behavior of two codegen functions (view_as and unbind)
*da0073e9SAndroid Build Coastguard Worker        # with respect to view tracking and inplace operation on the output.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def run_test(grad_mode, requires_grad, is_view, should_raise_tuple):
*da0073e9SAndroid Build Coastguard Worker            def maybe_check_raise(fn, should_raise):
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(should_raise is None or isinstance(should_raise, str))
*da0073e9SAndroid Build Coastguard Worker                if should_raise is not None:
*da0073e9SAndroid Build Coastguard Worker                    with self.assertRaisesRegex(RuntimeError, should_raise):
*da0073e9SAndroid Build Coastguard Worker                        fn()
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    fn()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            inp = torch.rand(2, requires_grad=requires_grad).clone()
*da0073e9SAndroid Build Coastguard Worker            with torch.set_grad_enabled(grad_mode):
*da0073e9SAndroid Build Coastguard Worker                out = inp.view_as(inp)
*da0073e9SAndroid Build Coastguard Worker            # Are they differentiable views?
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(out._is_view() == is_view)
*da0073e9SAndroid Build Coastguard Worker            # Are inplace allowed?
*da0073e9SAndroid Build Coastguard Worker            maybe_check_raise(lambda: out.add_(1), should_raise_tuple[0])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            inp = torch.rand(2, requires_grad=requires_grad).clone()
*da0073e9SAndroid Build Coastguard Worker            with torch.set_grad_enabled(grad_mode):
*da0073e9SAndroid Build Coastguard Worker                out = inp.unbind()
*da0073e9SAndroid Build Coastguard Worker            # Are they differentiable views?
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(out[0]._is_view() == is_view)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(out[1]._is_view() == is_view)
*da0073e9SAndroid Build Coastguard Worker            # Are inplace allowed?
*da0073e9SAndroid Build Coastguard Worker            maybe_check_raise(lambda: out[0].add_(1), should_raise_tuple[1])
*da0073e9SAndroid Build Coastguard Worker            maybe_check_raise(lambda: out[1].add_(1), should_raise_tuple[2])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # should_raise contains None if it should not raise
*da0073e9SAndroid Build Coastguard Worker        # should_raise contains a string of the error if it should raise
*da0073e9SAndroid Build Coastguard Worker        # The 3 elements are for view_as, first output of unbind and second output of unbind
*da0073e9SAndroid Build Coastguard Worker        run_test(
*da0073e9SAndroid Build Coastguard Worker            grad_mode=True,
*da0073e9SAndroid Build Coastguard Worker            requires_grad=False,
*da0073e9SAndroid Build Coastguard Worker            is_view=True,
*da0073e9SAndroid Build Coastguard Worker            should_raise_tuple=(None, None, None),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        inp_change_err = (
*da0073e9SAndroid Build Coastguard Worker            "Output {} of UnbindBackward0 is a view and is being modified inplace."
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        run_test(
*da0073e9SAndroid Build Coastguard Worker            grad_mode=True,
*da0073e9SAndroid Build Coastguard Worker            requires_grad=True,
*da0073e9SAndroid Build Coastguard Worker            is_view=True,
*da0073e9SAndroid Build Coastguard Worker            should_raise_tuple=(
*da0073e9SAndroid Build Coastguard Worker                None,
*da0073e9SAndroid Build Coastguard Worker                inp_change_err.format("0"),
*da0073e9SAndroid Build Coastguard Worker                inp_change_err.format("1"),
*da0073e9SAndroid Build Coastguard Worker            ),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        leaf_grad_err = (
*da0073e9SAndroid Build Coastguard Worker            "A view was created in no_grad mode and is being modified inplace"
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        run_test(
*da0073e9SAndroid Build Coastguard Worker            grad_mode=False,
*da0073e9SAndroid Build Coastguard Worker            requires_grad=True,
*da0073e9SAndroid Build Coastguard Worker            is_view=True,
*da0073e9SAndroid Build Coastguard Worker            should_raise_tuple=(leaf_grad_err, leaf_grad_err, leaf_grad_err),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        run_test(
*da0073e9SAndroid Build Coastguard Worker            grad_mode=False,
*da0073e9SAndroid Build Coastguard Worker            requires_grad=False,
*da0073e9SAndroid Build Coastguard Worker            is_view=True,
*da0073e9SAndroid Build Coastguard Worker            should_raise_tuple=(None, None, None),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inplace_not_requires_grad(self):
*da0073e9SAndroid Build Coastguard Worker        class MyFn(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, inp):
*da0073e9SAndroid Build Coastguard Worker                return inp.view_as(inp)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad):
*da0073e9SAndroid Build Coastguard Worker                return grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Original Tensor does not require grad
*da0073e9SAndroid Build Coastguard Worker        a = torch.rand(1, 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Tensor being written does require grad
*da0073e9SAndroid Build Coastguard Worker        b = torch.rand(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Take an invalid view on 'a' that should raise an error (warns during deprecation)
*da0073e9SAndroid Build Coastguard Worker        view_a = MyFn.apply(a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, "This view was created inside a custom Function"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            view_a += b
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Extra test for copy_ that is a manual implementation and could be easily
*da0073e9SAndroid Build Coastguard Worker        # forgotten when the codegen is updated (warns during deprecation)
*da0073e9SAndroid Build Coastguard Worker        a = torch.rand(1, 2)
*da0073e9SAndroid Build Coastguard Worker        b = torch.rand(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        view_a = MyFn.apply(a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, "This view was created inside a custom Function"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            view_a.copy_(b)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Functions that should throw must properly throw
*da0073e9SAndroid Build Coastguard Worker        a = torch.rand(1, 2)
*da0073e9SAndroid Build Coastguard Worker        b = torch.rand(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        view_a = a.unbind()[0]
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError,
*da0073e9SAndroid Build Coastguard Worker            "This view is the output of a function that returns " "multiple views.",
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            view_a.copy_(b)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Sanity check that views that should work still work
*da0073e9SAndroid Build Coastguard Worker        a = torch.rand(1, 2)
*da0073e9SAndroid Build Coastguard Worker        b = torch.rand(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        a.select(1, 0).copy_(b)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _do_test_autograd_simple_views_python(self, dtype):
*da0073e9SAndroid Build Coastguard Worker        # This is not necessarily the absolute correct behavior, but this is the current
*da0073e9SAndroid Build Coastguard Worker        # one. This test is here to make sure that any change to this behavior is detected
*da0073e9SAndroid Build Coastguard Worker        # and not silent. The TODOs below mark the places with unexpected behavior.
*da0073e9SAndroid Build Coastguard Worker        # Note that any change in these test will be BC-breaking and should be done carefully.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # This checks the autograd.Function behavior when we return one or multiple outputs
*da0073e9SAndroid Build Coastguard Worker        # while one of these is an input, a view of an input or of a temporary tensor.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # This indicator is used to track how many times the backward function was called
*da0073e9SAndroid Build Coastguard Worker        bw_called = [0]
*da0073e9SAndroid Build Coastguard Worker        # This indicator is used to check if the argument `ga` contains non-zero values
*da0073e9SAndroid Build Coastguard Worker        ga_nz = [False]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class IdOneOutput(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, a, b, make_view):
*da0073e9SAndroid Build Coastguard Worker                if make_view:
*da0073e9SAndroid Build Coastguard Worker                    a = a.narrow(0, 0, 2)
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    a = a.clone()
*da0073e9SAndroid Build Coastguard Worker                return a
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, ga):
*da0073e9SAndroid Build Coastguard Worker                bw_called[0] += 1
*da0073e9SAndroid Build Coastguard Worker                return ga, None, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class IdTwoOutput(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, a, b, make_view):
*da0073e9SAndroid Build Coastguard Worker                if make_view:
*da0073e9SAndroid Build Coastguard Worker                    a = a.narrow(0, 0, 2)
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    a = a.clone()
*da0073e9SAndroid Build Coastguard Worker                return a, a + b
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, ga, gab):
*da0073e9SAndroid Build Coastguard Worker                bw_called[0] += 1
*da0073e9SAndroid Build Coastguard Worker                if ga.eq(0).all():
*da0073e9SAndroid Build Coastguard Worker                    ga_nz[0] = False
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    ga_nz[0] = True
*da0073e9SAndroid Build Coastguard Worker                return ga + gab, gab, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class ViewOfTemp(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, a, make_view):
*da0073e9SAndroid Build Coastguard Worker                ctx.save_for_backward(a)
*da0073e9SAndroid Build Coastguard Worker                if make_view:
*da0073e9SAndroid Build Coastguard Worker                    a = a.narrow(0, 0, 2)
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    a = a.clone()
*da0073e9SAndroid Build Coastguard Worker                b = a.clone()
*da0073e9SAndroid Build Coastguard Worker                return b.select(0, 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad):
*da0073e9SAndroid Build Coastguard Worker                bw_called[0] += 1
*da0073e9SAndroid Build Coastguard Worker                (a,) = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                res = torch.zeros_like(a)
*da0073e9SAndroid Build Coastguard Worker                res.select(0, 0).copy_(grad)
*da0073e9SAndroid Build Coastguard Worker                return res, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        fn_id_to_inplace_on_view_err_msg = {
*da0073e9SAndroid Build Coastguard Worker            "one_output": (
*da0073e9SAndroid Build Coastguard Worker                "Output 0 of IdOneOutputBackward is a view and is being "
*da0073e9SAndroid Build Coastguard Worker                "modified inplace. This view was created inside a custom Function"
*da0073e9SAndroid Build Coastguard Worker            ),
*da0073e9SAndroid Build Coastguard Worker            "two_output": (
*da0073e9SAndroid Build Coastguard Worker                "Output 0 of IdTwoOutputBackward is a view and is being modified inplace."
*da0073e9SAndroid Build Coastguard Worker                " This view is the output of a function that returns multiple views."
*da0073e9SAndroid Build Coastguard Worker            ),
*da0073e9SAndroid Build Coastguard Worker            "view_of_temp": (
*da0073e9SAndroid Build Coastguard Worker                "Output 0 of ViewOfTempBackward is a view and is being "
*da0073e9SAndroid Build Coastguard Worker                "modified inplace. This view was created inside a custom Function"
*da0073e9SAndroid Build Coastguard Worker            ),
*da0073e9SAndroid Build Coastguard Worker        }
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for fn_id in ["one_output", "two_output", "view_of_temp"]:
*da0073e9SAndroid Build Coastguard Worker            for inplace in [True, False]:
*da0073e9SAndroid Build Coastguard Worker                for make_view in [True, False]:
*da0073e9SAndroid Build Coastguard Worker                    # Used for special casing the tests below
*da0073e9SAndroid Build Coastguard Worker                    output_is_a_view = make_view or fn_id == "view_of_temp"
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    def fn(a, b):
*da0073e9SAndroid Build Coastguard Worker                        # never modify a, b inplace for gracheck
*da0073e9SAndroid Build Coastguard Worker                        a = a.clone()
*da0073e9SAndroid Build Coastguard Worker                        b = b.clone()
*da0073e9SAndroid Build Coastguard Worker                        if fn_id == "two_output":
*da0073e9SAndroid Build Coastguard Worker                            tmp1, tmp2 = IdTwoOutput.apply(a, b, make_view)
*da0073e9SAndroid Build Coastguard Worker                            if inplace:
*da0073e9SAndroid Build Coastguard Worker                                tmp1 += 3
*da0073e9SAndroid Build Coastguard Worker                                tmp2 += 3
*da0073e9SAndroid Build Coastguard Worker                            else:
*da0073e9SAndroid Build Coastguard Worker                                tmp1 = tmp1 + 3
*da0073e9SAndroid Build Coastguard Worker                                tmp2 = tmp2 + 3
*da0073e9SAndroid Build Coastguard Worker                            tmp = tmp1 * tmp2
*da0073e9SAndroid Build Coastguard Worker                        else:
*da0073e9SAndroid Build Coastguard Worker                            if fn_id == "one_output":
*da0073e9SAndroid Build Coastguard Worker                                tmp = IdOneOutput.apply(a, b, make_view)
*da0073e9SAndroid Build Coastguard Worker                            else:
*da0073e9SAndroid Build Coastguard Worker                                tmp = ViewOfTemp.apply(a + b, make_view)
*da0073e9SAndroid Build Coastguard Worker                            if inplace:
*da0073e9SAndroid Build Coastguard Worker                                tmp += 3
*da0073e9SAndroid Build Coastguard Worker                            else:
*da0073e9SAndroid Build Coastguard Worker                                tmp = tmp + 3
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                        return tmp.sum()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    a = torch.ones(2, dtype=dtype, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker                    b = torch.ones(2, dtype=dtype, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    err_msg = fn_id_to_inplace_on_view_err_msg[fn_id]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    if not inplace or not output_is_a_view:
*da0073e9SAndroid Build Coastguard Worker                        gradcheck(fn, (a, b), check_batched_grad=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    # Was the custom backward called properly
*da0073e9SAndroid Build Coastguard Worker                    bw_called[0] = 0
*da0073e9SAndroid Build Coastguard Worker                    ga_nz[0] = True  # For the case where the backward is called
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    if inplace and output_is_a_view:
*da0073e9SAndroid Build Coastguard Worker                        with self.assertRaisesRegex(RuntimeError, err_msg):
*da0073e9SAndroid Build Coastguard Worker                            fn(a, b)
*da0073e9SAndroid Build Coastguard Worker                    else:
*da0073e9SAndroid Build Coastguard Worker                        fn(a, b).abs().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    expected_called = 1
*da0073e9SAndroid Build Coastguard Worker                    expected_ga_nz = True
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    if output_is_a_view and inplace:
*da0073e9SAndroid Build Coastguard Worker                        expected_called = 0
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(bw_called[0] == expected_called)
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(ga_nz[0] == expected_ga_nz)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_autograd_simple_views_python(self):
*da0073e9SAndroid Build Coastguard Worker        self._do_test_autograd_simple_views_python(torch.double)
*da0073e9SAndroid Build Coastguard Worker        self._do_test_autograd_simple_views_python(torch.cdouble)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_autograd_inplace_views_creation_meta(self):
*da0073e9SAndroid Build Coastguard Worker        # Tests creation_meta properly handled for inplace views
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class Func(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x.view_as(x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        view_custom = Func.apply
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def run_test(
*da0073e9SAndroid Build Coastguard Worker            fn, fn_type, grad_mode_view, grad_mode_iview, requires_grad, error1, error2
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            # This test checks the behavior of inplace-view functions when
*da0073e9SAndroid Build Coastguard Worker            # the views are created in grad mode or not
*da0073e9SAndroid Build Coastguard Worker            base = torch.rand(2, 3, requires_grad=requires_grad).clone()
*da0073e9SAndroid Build Coastguard Worker            # 1. Create a view with `grad_mode=grad_mode_view`
*da0073e9SAndroid Build Coastguard Worker            with torch.set_grad_enabled(grad_mode_view):
*da0073e9SAndroid Build Coastguard Worker                if fn_type == "multi_view":
*da0073e9SAndroid Build Coastguard Worker                    inp = base.unbind()[0]
*da0073e9SAndroid Build Coastguard Worker                elif fn_type == "custom":
*da0073e9SAndroid Build Coastguard Worker                    inp = view_custom(base)
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    inp = base.view_as(base)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # 2. Perform inplace view with `grad_mode=grad_mode_iview`
*da0073e9SAndroid Build Coastguard Worker            with torch.set_grad_enabled(grad_mode_iview):
*da0073e9SAndroid Build Coastguard Worker                if error1 is not None:
*da0073e9SAndroid Build Coastguard Worker                    with self.assertRaisesRegex(RuntimeError, error1):
*da0073e9SAndroid Build Coastguard Worker                        fn(inp)
*da0073e9SAndroid Build Coastguard Worker                    return
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    # If error is None, check that runs without error
*da0073e9SAndroid Build Coastguard Worker                    fn(inp)
*da0073e9SAndroid Build Coastguard Worker            # 3. Do inplace on the (new) view
*da0073e9SAndroid Build Coastguard Worker            if error2 is not None:
*da0073e9SAndroid Build Coastguard Worker                with self.assertRaisesRegex(RuntimeError, error2):
*da0073e9SAndroid Build Coastguard Worker                    inp.add_(1)
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                # If error is None, check that runs without error
*da0073e9SAndroid Build Coastguard Worker                inp.add_(1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        no_grad_err = "A view was created in no_grad mode"
*da0073e9SAndroid Build Coastguard Worker        multi_view_err = "function that returns multiple views"
*da0073e9SAndroid Build Coastguard Worker        custom_err = "view was created inside a custom Function"
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def run_tests(fn):
*da0073e9SAndroid Build Coastguard Worker            for fn_type in ("normal", "multi_view", "custom"):
*da0073e9SAndroid Build Coastguard Worker                for grad_mode_view in (True, False):
*da0073e9SAndroid Build Coastguard Worker                    for grad_mode_iview in (True, False):
*da0073e9SAndroid Build Coastguard Worker                        for requires_grad in (True, False):
*da0073e9SAndroid Build Coastguard Worker                            error1 = None  # expected error when we do inplace_view on original view
*da0073e9SAndroid Build Coastguard Worker                            error2 = None  # expected error when we do inplace on the resulting view
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                            if requires_grad:
*da0073e9SAndroid Build Coastguard Worker                                if not grad_mode_view and grad_mode_iview:
*da0073e9SAndroid Build Coastguard Worker                                    error1 = no_grad_err
*da0073e9SAndroid Build Coastguard Worker                                if not grad_mode_view and not grad_mode_iview:
*da0073e9SAndroid Build Coastguard Worker                                    error2 = no_grad_err
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                                if fn_type == "multi_view":
*da0073e9SAndroid Build Coastguard Worker                                    if grad_mode_view and grad_mode_iview:
*da0073e9SAndroid Build Coastguard Worker                                        error1 = multi_view_err
*da0073e9SAndroid Build Coastguard Worker                                    if grad_mode_view and not grad_mode_iview:
*da0073e9SAndroid Build Coastguard Worker                                        error2 = multi_view_err
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                                if fn_type == "custom":
*da0073e9SAndroid Build Coastguard Worker                                    if grad_mode_view and grad_mode_iview:
*da0073e9SAndroid Build Coastguard Worker                                        error1 = custom_err
*da0073e9SAndroid Build Coastguard Worker                                    if grad_mode_view and not grad_mode_iview:
*da0073e9SAndroid Build Coastguard Worker                                        error2 = custom_err
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                            run_test(
*da0073e9SAndroid Build Coastguard Worker                                fn,
*da0073e9SAndroid Build Coastguard Worker                                fn_type,
*da0073e9SAndroid Build Coastguard Worker                                grad_mode_view,
*da0073e9SAndroid Build Coastguard Worker                                grad_mode_iview,
*da0073e9SAndroid Build Coastguard Worker                                requires_grad,
*da0073e9SAndroid Build Coastguard Worker                                error1,
*da0073e9SAndroid Build Coastguard Worker                                error2,
*da0073e9SAndroid Build Coastguard Worker                            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # This list was created by logging gen_inplace_or_view_type.py
*da0073e9SAndroid Build Coastguard Worker        #   detach_ is excluded for this test because it cannot be applied to
*da0073e9SAndroid Build Coastguard Worker        #   views and thus does not return a view
*da0073e9SAndroid Build Coastguard Worker        run_tests(lambda v: v.as_strided_((1, 0), (2, 2)))
*da0073e9SAndroid Build Coastguard Worker        run_tests(lambda v: v.transpose_(0, 0))
*da0073e9SAndroid Build Coastguard Worker        run_tests(lambda v: v.t_())
*da0073e9SAndroid Build Coastguard Worker        run_tests(lambda v: v.squeeze_(0))
*da0073e9SAndroid Build Coastguard Worker        run_tests(lambda v: v.unsqueeze_(0))
*da0073e9SAndroid Build Coastguard Worker        run_tests(lambda v: v.swapdims_(0, 0))
*da0073e9SAndroid Build Coastguard Worker        run_tests(lambda v: v.swapaxes_(0, 0))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_autograd_print_tensor(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.ones(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        a_clone = a.clone()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(repr(a), "tensor([1.], requires_grad=True)")
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(repr(a_clone), "tensor([1.], grad_fn=<CloneBackward0>)")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            b = a[:]
*da0073e9SAndroid Build Coastguard Worker            b *= 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Special handling for printing view created in no-grad and modified
*da0073e9SAndroid Build Coastguard Worker        # in-placed in no-grad.
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(repr(b), "tensor([2.], grad_fn=<Invalid>)")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class Func(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        c = Func.apply(a)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(repr(c), "tensor([2.], grad_fn=<FuncBackward>)")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_autograd_inplace_view_of_view(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.zeros(2)
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            y = x.view(2)
*da0073e9SAndroid Build Coastguard Worker        y.requires_grad_(True)
*da0073e9SAndroid Build Coastguard Worker        z = y.view(2)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, "a view of a view .* is being .* inside the no_grad block"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            z /= 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.zeros(2)
*da0073e9SAndroid Build Coastguard Worker        with torch.inference_mode():
*da0073e9SAndroid Build Coastguard Worker            y = x.view(2)
*da0073e9SAndroid Build Coastguard Worker        y.requires_grad_(True)
*da0073e9SAndroid Build Coastguard Worker        z = y.view(2)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, "a view of a view .* is being .* inside the inference_mode"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            z /= 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # TODO This is not the correct behavior -
*da0073e9SAndroid Build Coastguard Worker    # See https://github.com/pytorch/pytorch/issues/49825#issuecomment-794466627
*da0073e9SAndroid Build Coastguard Worker    def test_autograd_inplace_views_cross_dtype(self):
*da0073e9SAndroid Build Coastguard Worker        # This test is here to make sure that any change to this behavior is detected
*da0073e9SAndroid Build Coastguard Worker        # and not silent. The TODOs below mark the places with unexpected behavior.
*da0073e9SAndroid Build Coastguard Worker        a_orig = torch.rand(3, 3, requires_grad=True, dtype=torch.complex64)
*da0073e9SAndroid Build Coastguard Worker        a = a_orig.clone()
*da0073e9SAndroid Build Coastguard Worker        b = torch.view_as_real(a)
*da0073e9SAndroid Build Coastguard Worker        b = b.transpose(0, 1)
*da0073e9SAndroid Build Coastguard Worker        b += 1
*da0073e9SAndroid Build Coastguard Worker        b.backward(torch.arange(0, 18, dtype=torch.float).view(3, 3, 2))
*da0073e9SAndroid Build Coastguard Worker        non_inplace_grad = a_orig.grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a_orig = torch.rand(3, 3, requires_grad=True, dtype=torch.complex64)
*da0073e9SAndroid Build Coastguard Worker        a = a_orig.clone()
*da0073e9SAndroid Build Coastguard Worker        b = torch.view_as_real(a)
*da0073e9SAndroid Build Coastguard Worker        b.transpose_(0, 1)
*da0073e9SAndroid Build Coastguard Worker        b += 1
*da0073e9SAndroid Build Coastguard Worker        b.backward(torch.arange(0, 18, dtype=torch.float).view(3, 3, 2))
*da0073e9SAndroid Build Coastguard Worker        inplace_grad = a_orig.grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # TODO: this is a bug!
*da0073e9SAndroid Build Coastguard Worker        # once this is fixed, it should have the transpose removed:
*da0073e9SAndroid Build Coastguard Worker        # self.assertEqual(non_inplace_grad, inplace_grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(non_inplace_grad.T, inplace_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_autograd_multiple_views_python(self):
*da0073e9SAndroid Build Coastguard Worker        # This is not necessarily the absolute correct behavior, but this is the current
*da0073e9SAndroid Build Coastguard Worker        # one. This test is here to make sure that any change to this behavior is detected
*da0073e9SAndroid Build Coastguard Worker        # and not silent. The TODOs below mark the places with unexpected behavior.
*da0073e9SAndroid Build Coastguard Worker        # Note that any change in these test will be BC-breaking and should be done carefully.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # This checks that multiples views in the forward are properly traced and how they
*da0073e9SAndroid Build Coastguard Worker        # behave with respect to inplace operations.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # This indicator is used to track how many times the backward function was called
*da0073e9SAndroid Build Coastguard Worker        bw_called = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class ComplexView(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, a, idx):
*da0073e9SAndroid Build Coastguard Worker                res = a.narrow(0, idx, 1)
*da0073e9SAndroid Build Coastguard Worker                res = a.select(0, idx)
*da0073e9SAndroid Build Coastguard Worker                ctx.save_for_backward(a)
*da0073e9SAndroid Build Coastguard Worker                ctx.idx = idx
*da0073e9SAndroid Build Coastguard Worker                return res
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad):
*da0073e9SAndroid Build Coastguard Worker                bw_called[0] += 1
*da0073e9SAndroid Build Coastguard Worker                (a,) = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                res = torch.zeros_like(a)
*da0073e9SAndroid Build Coastguard Worker                res.select(0, ctx.idx).copy_(grad)
*da0073e9SAndroid Build Coastguard Worker                return res, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.ones(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        idx = 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        bw_called[0] = 0
*da0073e9SAndroid Build Coastguard Worker        out = ComplexView.apply(a.clone(), idx)
*da0073e9SAndroid Build Coastguard Worker        out.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(bw_called[0] == 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = ComplexView.apply(a.clone(), idx)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError,
*da0073e9SAndroid Build Coastguard Worker            "Output 0 of ComplexViewBackward is a view and is being modified inplace",
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            out += 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_autograd_python_custom_function_inplace(self):
*da0073e9SAndroid Build Coastguard Worker        # This is not necessarily the absolute correct behavior, but this is the current
*da0073e9SAndroid Build Coastguard Worker        # one. This test is here to make sure that any change to this behavior is detected
*da0073e9SAndroid Build Coastguard Worker        # and not silent. The TODOs below mark the places with unexpected behavior.
*da0073e9SAndroid Build Coastguard Worker        # Note that any change in these test will be BC-breaking and should be done carefully.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # This test checks custom autograd.Function that perform inplace operations
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        bw_called = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # I) Single output
*da0073e9SAndroid Build Coastguard Worker        class MyAdder(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, a, b):
*da0073e9SAndroid Build Coastguard Worker                a.add_(b)
*da0073e9SAndroid Build Coastguard Worker                ctx.mark_dirty(a)
*da0073e9SAndroid Build Coastguard Worker                return a
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad):
*da0073e9SAndroid Build Coastguard Worker                bw_called[0] += 1
*da0073e9SAndroid Build Coastguard Worker                return grad, grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.ones(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = torch.ones(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # No extra inplace
*da0073e9SAndroid Build Coastguard Worker        c = MyAdder.apply(a.clone(), b)
*da0073e9SAndroid Build Coastguard Worker        c.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(bw_called[0] == 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # With extra inplace on the output
*da0073e9SAndroid Build Coastguard Worker        bw_called[0] = 0
*da0073e9SAndroid Build Coastguard Worker        c = MyAdder.apply(a.clone(), b)
*da0073e9SAndroid Build Coastguard Worker        c += 2
*da0073e9SAndroid Build Coastguard Worker        c.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(bw_called[0] == 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # The input is a view
*da0073e9SAndroid Build Coastguard Worker        bw_called[0] = 0
*da0073e9SAndroid Build Coastguard Worker        c = MyAdder.apply(a.clone().view_as(a), b)
*da0073e9SAndroid Build Coastguard Worker        c.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(bw_called[0] == 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Should not give non-inputs to mark_dirty
*da0073e9SAndroid Build Coastguard Worker        class MyAdderBad(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, a, b):
*da0073e9SAndroid Build Coastguard Worker                c = 3 * a
*da0073e9SAndroid Build Coastguard Worker                c.add_(b)
*da0073e9SAndroid Build Coastguard Worker                ctx.mark_dirty(c)
*da0073e9SAndroid Build Coastguard Worker                return c
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad):
*da0073e9SAndroid Build Coastguard Worker                bw_called[0] += 1
*da0073e9SAndroid Build Coastguard Worker                grad = 3 * grad
*da0073e9SAndroid Build Coastguard Worker                return grad, grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.ones(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = torch.ones(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with warnings.catch_warnings(record=True) as w:
*da0073e9SAndroid Build Coastguard Worker            MyAdderBad.apply(a.clone(), b)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(len(w), 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # II) Multiple outputs
*da0073e9SAndroid Build Coastguard Worker        class MyBadAdder(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, a, b):
*da0073e9SAndroid Build Coastguard Worker                a.add_(b)
*da0073e9SAndroid Build Coastguard Worker                ctx.mark_dirty(a)
*da0073e9SAndroid Build Coastguard Worker                return a, a + b
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, ga, gab):
*da0073e9SAndroid Build Coastguard Worker                bw_called[0] += 1
*da0073e9SAndroid Build Coastguard Worker                return ga + gab, ga + gab
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # No extra inplace
*da0073e9SAndroid Build Coastguard Worker        bw_called[0] = 0
*da0073e9SAndroid Build Coastguard Worker        c, d = MyBadAdder.apply(a.clone(), b)
*da0073e9SAndroid Build Coastguard Worker        (c * d).sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(bw_called[0] == 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # With extra inplace on the output
*da0073e9SAndroid Build Coastguard Worker        bw_called[0] = 0
*da0073e9SAndroid Build Coastguard Worker        c, d = MyBadAdder.apply(a.clone(), b)
*da0073e9SAndroid Build Coastguard Worker        c += 2
*da0073e9SAndroid Build Coastguard Worker        (c * d).sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(bw_called[0] == 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # The input is a view
*da0073e9SAndroid Build Coastguard Worker        inplace_on_view_err = (
*da0073e9SAndroid Build Coastguard Worker            "your Function modifies inplace an input that is a view of another Tensor"
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, inplace_on_view_err):
*da0073e9SAndroid Build Coastguard Worker            c, d = MyBadAdder.apply(a.clone().view_as(a), b)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # III) Inplace + other op
*da0073e9SAndroid Build Coastguard Worker        class MyOutPlaceAdder(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, a, b):
*da0073e9SAndroid Build Coastguard Worker                a.add_(b)
*da0073e9SAndroid Build Coastguard Worker                ctx.mark_dirty(a)
*da0073e9SAndroid Build Coastguard Worker                return a.clone(), a + b
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, ga, gab):
*da0073e9SAndroid Build Coastguard Worker                bw_called[0] += 1
*da0073e9SAndroid Build Coastguard Worker                return ga + gab, ga + 2 * gab
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # We don't reuse the input
*da0073e9SAndroid Build Coastguard Worker        def fn(a, b):
*da0073e9SAndroid Build Coastguard Worker            orig_a = a.clone().view_as(a)
*da0073e9SAndroid Build Coastguard Worker            c, d = MyOutPlaceAdder.apply(orig_a, b)
*da0073e9SAndroid Build Coastguard Worker            return (c * d).sum()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        bad_mark_dirty_err = "Some elements marked as dirty during the forward method were not returned as output."
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, bad_mark_dirty_err):
*da0073e9SAndroid Build Coastguard Worker            fn(a, b)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_custom_function_mark_dirty_not_differentiable(self):
*da0073e9SAndroid Build Coastguard Worker        def get_custom_fn(jvp_err):
*da0073e9SAndroid Build Coastguard Worker            class InplaceMul(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker                @staticmethod
*da0073e9SAndroid Build Coastguard Worker                def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                    result = x.mul_(2)
*da0073e9SAndroid Build Coastguard Worker                    ctx.mark_dirty(result)
*da0073e9SAndroid Build Coastguard Worker                    return result
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                @staticmethod
*da0073e9SAndroid Build Coastguard Worker                def backward(ctx, grad_output):
*da0073e9SAndroid Build Coastguard Worker                    pass
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                @staticmethod
*da0073e9SAndroid Build Coastguard Worker                def jvp(ctx, x_t):
*da0073e9SAndroid Build Coastguard Worker                    if jvp_err:
*da0073e9SAndroid Build Coastguard Worker                        return x_t
*da0073e9SAndroid Build Coastguard Worker                    else:
*da0073e9SAndroid Build Coastguard Worker                        return x_t.mul_(2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            return InplaceMul
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for requires_grad, jvp_err in product([True, False], repeat=2):
*da0073e9SAndroid Build Coastguard Worker            InplaceMul = get_custom_fn(jvp_err)
*da0073e9SAndroid Build Coastguard Worker            # Make sure that tensor is always returned as-is if marked dirty
*da0073e9SAndroid Build Coastguard Worker            z = torch.tensor(1.0, requires_grad=requires_grad)
*da0073e9SAndroid Build Coastguard Worker            x = z.clone()
*da0073e9SAndroid Build Coastguard Worker            y = InplaceMul.apply(x)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(x is y)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(x, z * 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # jvp must properly modify the input grad if mark_dirty is set
*da0073e9SAndroid Build Coastguard Worker            with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker                x_tangent = torch.ones_like(x)
*da0073e9SAndroid Build Coastguard Worker                x_dual = fwAD.make_dual(x, x_tangent)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                if jvp_err:
*da0073e9SAndroid Build Coastguard Worker                    bad_mark_dirty_err = (
*da0073e9SAndroid Build Coastguard Worker                        "jvp function must modify the corresponding gradient inplace"
*da0073e9SAndroid Build Coastguard Worker                    )
*da0073e9SAndroid Build Coastguard Worker                    with self.assertRaisesRegex(RuntimeError, bad_mark_dirty_err):
*da0073e9SAndroid Build Coastguard Worker                        InplaceMul.apply(x_dual)
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    out_dual = InplaceMul.apply(x_dual)
*da0073e9SAndroid Build Coastguard Worker                    _, out_tangent = fwAD.unpack_dual(out_dual)
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(out_dual is x_dual)
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(out_tangent is x_tangent)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_named_tensor_for_complex_views(self):
*da0073e9SAndroid Build Coastguard Worker        names = ["batch", "height", "width", "complex"]
*da0073e9SAndroid Build Coastguard Worker        z = torch.ones((2, 1, 2, 2), requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        z_named = z.refine_names(*names)
*da0073e9SAndroid Build Coastguard Worker        z_complex = torch.view_as_complex(z_named.rename(None)).refine_names(
*da0073e9SAndroid Build Coastguard Worker            *names[:-1]
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        z_complex.sum().abs().backward()
*da0073e9SAndroid Build Coastguard Worker        expected = torch.ones_like(z_complex).rename(None)
*da0073e9SAndroid Build Coastguard Worker        abs_1_1j = abs(1 + 1j)
*da0073e9SAndroid Build Coastguard Worker        expected.fill_(complex(abs_1_1j / 2, abs_1_1j / 2))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(z.grad, torch.view_as_real(expected))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_custom_function_return_view_in_nograd(self):
*da0073e9SAndroid Build Coastguard Worker        class Alias(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x[:]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, gx):
*da0073e9SAndroid Build Coastguard Worker                return gx
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        inp = torch.rand(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            output = Alias.apply(inp)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            expected_output = inp[:]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Calling the custom function should operate as if we called an equivalent op
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(output.requires_grad, expected_output.requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Check that in-place modification on view throws
*da0073e9SAndroid Build Coastguard Worker        leaf_grad_err = (
*da0073e9SAndroid Build Coastguard Worker            "A view was created in no_grad mode and is being modified inplace"
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, leaf_grad_err):
*da0073e9SAndroid Build Coastguard Worker            output.zero_()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_custom_function_preserve_torch_function_when_return_as_is(self):
*da0073e9SAndroid Build Coastguard Worker        class Custom(torch.Tensor):
*da0073e9SAndroid Build Coastguard Worker            def __init__(self, data):
*da0073e9SAndroid Build Coastguard Worker                super().__init__()
*da0073e9SAndroid Build Coastguard Worker                self._data = data
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @classmethod
*da0073e9SAndroid Build Coastguard Worker            def __torch_function__(cls, func, types, args=(), kwargs=None):
*da0073e9SAndroid Build Coastguard Worker                kwargs = {} if kwargs is None else kwargs
*da0073e9SAndroid Build Coastguard Worker                args = tuple(a._data if isinstance(a, cls) else a for a in args)
*da0073e9SAndroid Build Coastguard Worker                out = func(*args, **kwargs)
*da0073e9SAndroid Build Coastguard Worker                if isinstance(out, torch.Tensor):
*da0073e9SAndroid Build Coastguard Worker                    out = cls(out)
*da0073e9SAndroid Build Coastguard Worker                return out
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class Fn(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, input):
*da0073e9SAndroid Build Coastguard Worker                return input
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx):
*da0073e9SAndroid Build Coastguard Worker                pass
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = Custom(torch.randn(2, 3))
*da0073e9SAndroid Build Coastguard Worker        y = Fn.apply(x)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(isinstance(y, Custom))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_grad_mode_restored_reentrant(self):
*da0073e9SAndroid Build Coastguard Worker        class MyFunction(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, inp):
*da0073e9SAndroid Build Coastguard Worker                return inp.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, go):
*da0073e9SAndroid Build Coastguard Worker                original = torch._C.is_grad_enabled()
*da0073e9SAndroid Build Coastguard Worker                with torch.enable_grad():
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(torch._C.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker                    foo = torch.rand(go.size(), requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker                    (grad,) = torch.autograd.grad(foo**3, foo, grad_outputs=go)
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(torch._C.is_grad_enabled())
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(torch._C.is_grad_enabled() == original)
*da0073e9SAndroid Build Coastguard Worker                return grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        inp = torch.rand(3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Case where original==False
*da0073e9SAndroid Build Coastguard Worker        MyFunction.apply(inp).sum().backward()
*da0073e9SAndroid Build Coastguard Worker        # Case where original==True
*da0073e9SAndroid Build Coastguard Worker        MyFunction.apply(inp).sum().backward(create_graph=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_power_function(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor([0.0, 0.0, 0.0])
*da0073e9SAndroid Build Coastguard Worker        b = torch.tensor([-1.0, 0.0, 1.0], requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        c = torch.sum(a**b)
*da0073e9SAndroid Build Coastguard Worker        c.backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(b.grad, torch.tensor([-inf, 0.0, 0.0]))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        s = 0
*da0073e9SAndroid Build Coastguard Worker        b = torch.tensor([-1.0, 0.0, 1.0], requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        c = torch.sum(s**b)
*da0073e9SAndroid Build Coastguard Worker        c.backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(b.grad, torch.tensor([-inf, 0.0, 0.0]))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_custom_function_error(self):
*da0073e9SAndroid Build Coastguard Worker        class BadFw(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, foo):
*da0073e9SAndroid Build Coastguard Worker                return foo
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class BadBw(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, foo):
*da0073e9SAndroid Build Coastguard Worker                return foo.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class BadBw2(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, foo):
*da0073e9SAndroid Build Coastguard Worker                return foo.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, foo):
*da0073e9SAndroid Build Coastguard Worker                return foo
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def vjp(ctx, foo):
*da0073e9SAndroid Build Coastguard Worker                return foo
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class BadJvp(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, foo):
*da0073e9SAndroid Build Coastguard Worker                return foo.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        inp = torch.rand(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(NotImplementedError, "must implement the forward"):
*da0073e9SAndroid Build Coastguard Worker            BadFw.apply(inp)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "must implement either the backward"):
*da0073e9SAndroid Build Coastguard Worker            BadBw.apply(inp).sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, "Implementing both 'backward' and 'vjp'"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            BadBw2.apply(inp).sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "must implement the jvp function"):
*da0073e9SAndroid Build Coastguard Worker            with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker                d = fwAD.make_dual(inp, torch.rand_like(inp))
*da0073e9SAndroid Build Coastguard Worker                res = BadJvp.apply(d)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_custom_function_forward_mode_view_checks(self):
*da0073e9SAndroid Build Coastguard Worker        flag_to_error = {
*da0073e9SAndroid Build Coastguard Worker            "ok": None,
*da0073e9SAndroid Build Coastguard Worker            "not_a_view": "jvp is not returning a view",
*da0073e9SAndroid Build Coastguard Worker            "not_a_view_of_inp": "jvp is not returning a view of the given",
*da0073e9SAndroid Build Coastguard Worker            "not_a_view_of_inp_base": "jvp is not returning a view of the same base",
*da0073e9SAndroid Build Coastguard Worker        }
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class ViewFn(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, foo, flag):
*da0073e9SAndroid Build Coastguard Worker                ctx.flag = flag
*da0073e9SAndroid Build Coastguard Worker                ctx.size = foo.size()
*da0073e9SAndroid Build Coastguard Worker                return foo.narrow(0, 0, 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def vjp(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                gI = gO.new_zeros(ctx.size)
*da0073e9SAndroid Build Coastguard Worker                gI.narrow(0, 0, 2).copy_(gO)
*da0073e9SAndroid Build Coastguard Worker                return gI, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def jvp(ctx, gI, _):
*da0073e9SAndroid Build Coastguard Worker                res = gI.narrow(0, 0, 2)
*da0073e9SAndroid Build Coastguard Worker                if ctx.flag != "ok":
*da0073e9SAndroid Build Coastguard Worker                    # Break the view in the gradients!
*da0073e9SAndroid Build Coastguard Worker                    res = res.clone()
*da0073e9SAndroid Build Coastguard Worker                if ctx.flag in ["not_a_view_of_inp", "not_a_view_of_inp_base"]:
*da0073e9SAndroid Build Coastguard Worker                    # Result should be a view, just of the wrong thing
*da0073e9SAndroid Build Coastguard Worker                    res = res.view_as(res)
*da0073e9SAndroid Build Coastguard Worker                return res
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        inp = torch.rand(4, 4, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for flag, msg in flag_to_error.items():
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def test_fn(inp):
*da0073e9SAndroid Build Coastguard Worker                if flag == "not_a_view_of_inp_base":
*da0073e9SAndroid Build Coastguard Worker                    inp = inp.view_as(inp)
*da0073e9SAndroid Build Coastguard Worker                return ViewFn.apply(inp, flag)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            if msg is None:
*da0073e9SAndroid Build Coastguard Worker                gradcheck(test_fn, inp, check_forward_ad=True)
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                with self.assertRaisesRegex(RuntimeError, msg):
*da0073e9SAndroid Build Coastguard Worker                    gradcheck(test_fn, inp, check_forward_ad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_custom_function_forward_mode_inplace_checks(self):
*da0073e9SAndroid Build Coastguard Worker        class InplaceFn(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, foo, flag):
*da0073e9SAndroid Build Coastguard Worker                ctx.mark_dirty(foo)
*da0073e9SAndroid Build Coastguard Worker                ctx.flag = flag
*da0073e9SAndroid Build Coastguard Worker                foo.mul_(2)
*da0073e9SAndroid Build Coastguard Worker                return foo
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def vjp(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                return 2 * gO, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def jvp(ctx, gI, _):
*da0073e9SAndroid Build Coastguard Worker                if ctx.flag:
*da0073e9SAndroid Build Coastguard Worker                    # Don't do the change inplace
*da0073e9SAndroid Build Coastguard Worker                    return 2 * gI
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    gI.mul_(2)
*da0073e9SAndroid Build Coastguard Worker                    return gI
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        inp = torch.rand(4, 4, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def test_fn(inp, flag):
*da0073e9SAndroid Build Coastguard Worker            inp = inp.clone()
*da0073e9SAndroid Build Coastguard Worker            return InplaceFn.apply(inp, flag)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        gradcheck(test_fn, (inp, False), check_forward_ad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError,
*da0073e9SAndroid Build Coastguard Worker            "inplace custom Function is not modifying the forward mode gradients inplace",
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            gradcheck(test_fn, (inp, True), check_forward_ad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_custom_function_forward_mode_wrong_formula(self):
*da0073e9SAndroid Build Coastguard Worker        class UserFn(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, foo, should_fail):
*da0073e9SAndroid Build Coastguard Worker                ctx.should_fail = should_fail
*da0073e9SAndroid Build Coastguard Worker                return foo * 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def vjp(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                return 2 * gO, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def jvp(ctx, gI, _):
*da0073e9SAndroid Build Coastguard Worker                if ctx.should_fail:
*da0073e9SAndroid Build Coastguard Worker                    # Wrong gradient formula
*da0073e9SAndroid Build Coastguard Worker                    return 3 * gI
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    return 2 * gI
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        inp = torch.rand(10, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        gradcheck(UserFn.apply, (inp, False), check_forward_ad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, "Jacobian computed with forward mode mismatch for output 0"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            gradcheck(UserFn.apply, (inp, True), check_forward_ad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_custom_function_forward_mode_non_tensor_before_tensor_args(self):
*da0073e9SAndroid Build Coastguard Worker        class MyFn(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, nt, x, nt2, y):
*da0073e9SAndroid Build Coastguard Worker                return x * 2 + y * 3
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def jvp(ctx, nt, x_t, nt2, y_t):
*da0073e9SAndroid Build Coastguard Worker                self.assertIsNone(nt)
*da0073e9SAndroid Build Coastguard Worker                self.assertIsNone(nt2)
*da0073e9SAndroid Build Coastguard Worker                return x_t * 2 + y_t * 3
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.tensor(1.0, dtype=torch.double)
*da0073e9SAndroid Build Coastguard Worker        t = torch.tensor(1.0, dtype=torch.double)
*da0073e9SAndroid Build Coastguard Worker        y = torch.tensor(1.0, dtype=torch.double)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            dual_x = fwAD.make_dual(x, t)
*da0073e9SAndroid Build Coastguard Worker            MyFn.apply(1, dual_x, 1, y)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        gradcheck(
*da0073e9SAndroid Build Coastguard Worker            MyFn.apply,
*da0073e9SAndroid Build Coastguard Worker            (1, x.requires_grad_(True), 1, y.requires_grad_(True)),
*da0073e9SAndroid Build Coastguard Worker            check_forward_ad=True,
*da0073e9SAndroid Build Coastguard Worker            check_backward_ad=False,
*da0073e9SAndroid Build Coastguard Worker            check_batched_grad=False,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_custom_function_forward_mode_forward_is_no_op(self):
*da0073e9SAndroid Build Coastguard Worker        error_regex = (
*da0073e9SAndroid Build Coastguard Worker            "A custom Function's forward is returning a view \\(or an input as-is\\)"
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        return_lambdas = {
*da0073e9SAndroid Build Coastguard Worker            # If we return an input as-is in forward, that is treated
*da0073e9SAndroid Build Coastguard Worker            # as if self.view_as(self) is performed. If jvp returns x.view_as(x),
*da0073e9SAndroid Build Coastguard Worker            # this is OK.
*da0073e9SAndroid Build Coastguard Worker            "view_as": lambda x: x.view_as(x),
*da0073e9SAndroid Build Coastguard Worker            # Expect this to raise an error
*da0073e9SAndroid Build Coastguard Worker            "self": lambda x: x,
*da0073e9SAndroid Build Coastguard Worker            # Expect this to raise the same error
*da0073e9SAndroid Build Coastguard Worker            "mul_by_2": lambda x: x * 2,
*da0073e9SAndroid Build Coastguard Worker        }
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for k, fn in return_lambdas.items():
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            class MyFn(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker                @staticmethod
*da0073e9SAndroid Build Coastguard Worker                def forward(ctx, x, y):
*da0073e9SAndroid Build Coastguard Worker                    return x + y, x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                @staticmethod
*da0073e9SAndroid Build Coastguard Worker                def vjp(ctx, gO1, gO2):
*da0073e9SAndroid Build Coastguard Worker                    return gO1 + gO2, gO1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                @staticmethod
*da0073e9SAndroid Build Coastguard Worker                def jvp(ctx, x_t, y_t):
*da0073e9SAndroid Build Coastguard Worker                    return x_t + y_t, fn(x_t)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            a = torch.tensor(1.0, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            t = torch.tensor(1.0, dtype=torch.double)
*da0073e9SAndroid Build Coastguard Worker            b = torch.tensor(1.0, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            c = torch.tensor(1.0, dtype=torch.double)
*da0073e9SAndroid Build Coastguard Worker            t2 = torch.tensor(1.0, dtype=torch.double)
*da0073e9SAndroid Build Coastguard Worker            d = torch.tensor(1.0, dtype=torch.double)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker                a_dual = fwAD.make_dual(a, t)
*da0073e9SAndroid Build Coastguard Worker                c_dual = fwAD.make_dual(c, t2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                if k == "view_as":
*da0073e9SAndroid Build Coastguard Worker                    _, out2 = MyFn.apply(a_dual, b)
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(fwAD.unpack_dual(out2).tangent._base is t)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    _, out2 = MyFn.apply(c_dual, d)
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(fwAD.unpack_dual(out2).tangent._base is t2)
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    with self.assertRaisesRegex(RuntimeError, error_regex):
*da0073e9SAndroid Build Coastguard Worker                        MyFn.apply(a_dual, b)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    with self.assertRaisesRegex(RuntimeError, error_regex):
*da0073e9SAndroid Build Coastguard Worker                        MyFn.apply(c_dual, d)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            if k == "view_as":
*da0073e9SAndroid Build Coastguard Worker                gradcheck(MyFn.apply, (a, c), check_forward_ad=True)
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                with self.assertRaisesRegex(RuntimeError, error_regex):
*da0073e9SAndroid Build Coastguard Worker                    gradcheck(MyFn.apply, (a, c), check_forward_ad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_custom_function_save_for_forward(self):
*da0073e9SAndroid Build Coastguard Worker        class Func(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x: torch.Tensor, y: torch.Tensor, z: int):
*da0073e9SAndroid Build Coastguard Worker                ctx.save_for_backward(x, y)
*da0073e9SAndroid Build Coastguard Worker                ctx.save_for_forward(x, y)
*da0073e9SAndroid Build Coastguard Worker                ctx.z = z
*da0073e9SAndroid Build Coastguard Worker                ctx.prod = x * y
*da0073e9SAndroid Build Coastguard Worker                return z * ctx.prod
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def jvp(ctx, x_t, y_t, _):
*da0073e9SAndroid Build Coastguard Worker                x_p, y_p = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                z = ctx.z
*da0073e9SAndroid Build Coastguard Worker                return z * (y_p * x_t + x_p * y_t)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def vjp(ctx, grad_out):
*da0073e9SAndroid Build Coastguard Worker                x, y = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                z = ctx.z
*da0073e9SAndroid Build Coastguard Worker                return z * grad_out * y, z * grad_out * x, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True, dtype=torch.double)
*da0073e9SAndroid Build Coastguard Worker        t = torch.tensor(1.0, dtype=torch.double)
*da0073e9SAndroid Build Coastguard Worker        b = torch.tensor(2.0, requires_grad=True, dtype=torch.double)
*da0073e9SAndroid Build Coastguard Worker        c = 4
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            a_dual = fwAD.make_dual(a, t)
*da0073e9SAndroid Build Coastguard Worker            out = Func.apply(a_dual, b, c)
*da0073e9SAndroid Build Coastguard Worker            out.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        gradcheck(Func.apply, (a, b, c), check_forward_ad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # When saved for backward, but not saved for forward
*da0073e9SAndroid Build Coastguard Worker        class Func(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x: torch.Tensor):
*da0073e9SAndroid Build Coastguard Worker                ctx.save_for_backward(x)
*da0073e9SAndroid Build Coastguard Worker                return x.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def jvp(ctx, x_t):
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(len(ctx.saved_tensors), 0)
*da0073e9SAndroid Build Coastguard Worker                return x_t
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def vjp(ctx, grad_out):
*da0073e9SAndroid Build Coastguard Worker                (x,) = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(len(ctx.saved_tensors), 1)
*da0073e9SAndroid Build Coastguard Worker                return grad_out
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            a_dual = fwAD.make_dual(a, t)
*da0073e9SAndroid Build Coastguard Worker            out = Func.apply(a_dual)
*da0073e9SAndroid Build Coastguard Worker            out.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        gradcheck(Func.apply, (a,), check_forward_ad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfTorchDynamo("compile tested in test/dynamo/test_autograd_function.py")
*da0073e9SAndroid Build Coastguard Worker    def test_custom_function_forward_mode_non_differentiable(self):
*da0073e9SAndroid Build Coastguard Worker        # returns differentiable type, marked non-differentiable
*da0073e9SAndroid Build Coastguard Worker        class Func(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x, y):
*da0073e9SAndroid Build Coastguard Worker                out = y.clone()
*da0073e9SAndroid Build Coastguard Worker                ctx.mark_non_differentiable(out)
*da0073e9SAndroid Build Coastguard Worker                return x.clone(), out
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def jvp(ctx, x_tangent, y_tangent):
*da0073e9SAndroid Build Coastguard Worker                return x_tangent, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.tensor(2.0)
*da0073e9SAndroid Build Coastguard Worker        x_tangent = torch.tensor(1.0)
*da0073e9SAndroid Build Coastguard Worker        y = torch.tensor(3.0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            x_dual = fwAD.make_dual(x, x_tangent)
*da0073e9SAndroid Build Coastguard Worker            _, out2_dual = Func.apply(x_dual, y)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(fwAD.unpack_dual(out2_dual).tangent, None)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        y = torch.tensor(3)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # returns non-differentiable type, NOT marked non-differentiable
*da0073e9SAndroid Build Coastguard Worker        class Func(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x, y):
*da0073e9SAndroid Build Coastguard Worker                return x.clone(), y.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def jvp(ctx, x_tangent, y_tangent):
*da0073e9SAndroid Build Coastguard Worker                self.assertIsNone(y_tangent)
*da0073e9SAndroid Build Coastguard Worker                return x_tangent, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            x_dual = fwAD.make_dual(x, x_tangent)
*da0073e9SAndroid Build Coastguard Worker            _, out2_dual = Func.apply(x_dual, y)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(fwAD.unpack_dual(out2_dual).tangent, None)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class FuncWrong(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x, y):
*da0073e9SAndroid Build Coastguard Worker                out = y.clone()
*da0073e9SAndroid Build Coastguard Worker                ctx.mark_non_differentiable(out)
*da0073e9SAndroid Build Coastguard Worker                return x.clone(), out
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def jvp(ctx, x_tangent, y_tangent):
*da0073e9SAndroid Build Coastguard Worker                return x_tangent, x_tangent.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            x_dual = fwAD.make_dual(x, x_tangent)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError, "You should return None at that position instead"
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                FuncWrong.apply(x_dual, y)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # returns non-tensor
*da0073e9SAndroid Build Coastguard Worker        class Func(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x.clone(), object(), x.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def jvp(ctx, x_tangent):
*da0073e9SAndroid Build Coastguard Worker                return x_tangent, None, x_tangent
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            x_dual = fwAD.make_dual(x, x_tangent)
*da0073e9SAndroid Build Coastguard Worker            out_dual, _, out2_dual = Func.apply(x_dual)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(fwAD.unpack_dual(out_dual).tangent, x_tangent)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(fwAD.unpack_dual(out2_dual).tangent, x_tangent)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_custom_function_local_inplace(self):
*da0073e9SAndroid Build Coastguard Worker        class MyFn(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, inp, inplace):
*da0073e9SAndroid Build Coastguard Worker                view = inp.clone()[:3]
*da0073e9SAndroid Build Coastguard Worker                if inplace:
*da0073e9SAndroid Build Coastguard Worker                    view += 2
*da0073e9SAndroid Build Coastguard Worker                return view
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad):
*da0073e9SAndroid Build Coastguard Worker                return grad, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        base = torch.rand(10, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        foo = MyFn.apply(base, False)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(foo.grad_fn.__class__.__name__, "MyFnBackward")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        foo = MyFn.apply(base, True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(foo.grad_fn.__class__.__name__, "MyFnBackward")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_integer_outputs(self):
*da0073e9SAndroid Build Coastguard Worker        inp = torch.rand(4, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = inp.argmax()
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(out.dtype.is_floating_point)
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(out.requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = inp.argmin()
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(out.dtype.is_floating_point)
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(out.requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = inp.argsort()
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(out.dtype.is_floating_point)
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(out.requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        val = torch.rand((), requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = torch.searchsorted(inp, val)
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(out.dtype.is_floating_point)
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(out.requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        bins = torch.linspace(0, 1.0, steps=100, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        vals = torch.rand(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out = torch.bucketize(vals, bins)
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(out.dtype.is_floating_point)
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(out.requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        val = torch.empty(5).requires_grad_()
*da0073e9SAndroid Build Coastguard Worker        out = val.count_nonzero()
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(out.requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def assert_only_first_requires_grad(res):
*da0073e9SAndroid Build Coastguard Worker            if not isinstance(res, tuple):
*da0073e9SAndroid Build Coastguard Worker                res = (res,)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(res[0].requires_grad)
*da0073e9SAndroid Build Coastguard Worker            for out in res[1:]:
*da0073e9SAndroid Build Coastguard Worker                if out is not None:
*da0073e9SAndroid Build Coastguard Worker                    self.assertFalse(out.requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for sort in [True, False]:
*da0073e9SAndroid Build Coastguard Worker            for return_inverse in [True, False]:
*da0073e9SAndroid Build Coastguard Worker                for return_counts in [True, False]:
*da0073e9SAndroid Build Coastguard Worker                    res = torch.unique(
*da0073e9SAndroid Build Coastguard Worker                        inp,
*da0073e9SAndroid Build Coastguard Worker                        sorted=sort,
*da0073e9SAndroid Build Coastguard Worker                        return_inverse=return_inverse,
*da0073e9SAndroid Build Coastguard Worker                        return_counts=return_counts,
*da0073e9SAndroid Build Coastguard Worker                    )
*da0073e9SAndroid Build Coastguard Worker                    assert_only_first_requires_grad(res)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    res = torch.unique(
*da0073e9SAndroid Build Coastguard Worker                        inp,
*da0073e9SAndroid Build Coastguard Worker                        sorted=sort,
*da0073e9SAndroid Build Coastguard Worker                        return_inverse=return_inverse,
*da0073e9SAndroid Build Coastguard Worker                        return_counts=return_counts,
*da0073e9SAndroid Build Coastguard Worker                        dim=0,
*da0073e9SAndroid Build Coastguard Worker                    )
*da0073e9SAndroid Build Coastguard Worker                    assert_only_first_requires_grad(res)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    res = torch.unique_consecutive(
*da0073e9SAndroid Build Coastguard Worker                        inp, return_inverse=return_inverse, return_counts=return_counts
*da0073e9SAndroid Build Coastguard Worker                    )
*da0073e9SAndroid Build Coastguard Worker                    assert_only_first_requires_grad(res)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    res = torch.unique_consecutive(
*da0073e9SAndroid Build Coastguard Worker                        inp,
*da0073e9SAndroid Build Coastguard Worker                        return_inverse=return_inverse,
*da0073e9SAndroid Build Coastguard Worker                        return_counts=return_counts,
*da0073e9SAndroid Build Coastguard Worker                        dim=0,
*da0073e9SAndroid Build Coastguard Worker                    )
*da0073e9SAndroid Build Coastguard Worker                    assert_only_first_requires_grad(res)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    # Here we test the internal functions to make sure all of them are
*da0073e9SAndroid Build Coastguard Worker                    # covered on top of the public API
*da0073e9SAndroid Build Coastguard Worker                    res = torch._unique(inp, sorted=sort, return_inverse=return_inverse)
*da0073e9SAndroid Build Coastguard Worker                    assert_only_first_requires_grad(res)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    # This looks public but is actually manually deleted from the
*da0073e9SAndroid Build Coastguard Worker                    # torch namespace in torch/functional.py
*da0073e9SAndroid Build Coastguard Worker                    res = torch._VF.unique_dim(
*da0073e9SAndroid Build Coastguard Worker                        inp,
*da0073e9SAndroid Build Coastguard Worker                        dim=0,
*da0073e9SAndroid Build Coastguard Worker                        sorted=sort,
*da0073e9SAndroid Build Coastguard Worker                        return_inverse=return_inverse,
*da0073e9SAndroid Build Coastguard Worker                        return_counts=return_counts,
*da0073e9SAndroid Build Coastguard Worker                    )
*da0073e9SAndroid Build Coastguard Worker                    assert_only_first_requires_grad(res)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    # We don't test `unique_dim_consecutive` here.
*da0073e9SAndroid Build Coastguard Worker                    # It looks public but the python binding is actually manually disabled in
*da0073e9SAndroid Build Coastguard Worker                    # tools/autograd/gen_python_functions.py
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    res = torch._unique2(
*da0073e9SAndroid Build Coastguard Worker                        inp,
*da0073e9SAndroid Build Coastguard Worker                        sorted=sort,
*da0073e9SAndroid Build Coastguard Worker                        return_inverse=return_inverse,
*da0073e9SAndroid Build Coastguard Worker                        return_counts=return_counts,
*da0073e9SAndroid Build Coastguard Worker                    )
*da0073e9SAndroid Build Coastguard Worker                    assert_only_first_requires_grad(res)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_custom_function_cycle(self):
*da0073e9SAndroid Build Coastguard Worker        class MyFn(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x, metadata):
*da0073e9SAndroid Build Coastguard Worker                x = x.clone()
*da0073e9SAndroid Build Coastguard Worker                ctx.meta = metadata
*da0073e9SAndroid Build Coastguard Worker                ctx.save_for_backward(x)
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                (x,) = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(x, 3.14)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(ctx.meta["foo"], 3.14)
*da0073e9SAndroid Build Coastguard Worker                return gO * x, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def get_refs(with_backward):
*da0073e9SAndroid Build Coastguard Worker            a = torch.tensor(3.14, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            metadata = {}
*da0073e9SAndroid Build Coastguard Worker            out = MyFn.apply(a, metadata)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            metadata["foo"] = out
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            if with_backward:
*da0073e9SAndroid Build Coastguard Worker                out.sum().backward()
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(a.grad, a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            return torch._C._WeakTensorRef(out)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with disable_gc():
*da0073e9SAndroid Build Coastguard Worker            ref = get_refs(False)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(ref.expired())
*da0073e9SAndroid Build Coastguard Worker        gc.collect()
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(ref.expired())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # The backward clears the saved_variables but not the __dict__
*da0073e9SAndroid Build Coastguard Worker        with disable_gc():
*da0073e9SAndroid Build Coastguard Worker            ref = get_refs(True)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(ref.expired())
*da0073e9SAndroid Build Coastguard Worker        gc.collect()
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(ref.expired())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_create_graph_and_full_backward_hook_cycle(self):
*da0073e9SAndroid Build Coastguard Worker        # If BackwardHook saves grad_output, it can create a cycle when we perform backward
*da0073e9SAndroid Build Coastguard Worker        # with create_graph=True
*da0073e9SAndroid Build Coastguard Worker        #
*da0073e9SAndroid Build Coastguard Worker        #   grad_output -> grad_output.grad_fn -> graph -> hook -> grad_output
*da0073e9SAndroid Build Coastguard Worker        #
*da0073e9SAndroid Build Coastguard Worker        class TestCls:
*da0073e9SAndroid Build Coastguard Worker            # Dummy class for the purpose of creating a weakref
*da0073e9SAndroid Build Coastguard Worker            pass
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def get_ref(input_requires_grad, nb_hooks):
*da0073e9SAndroid Build Coastguard Worker            t = torch.randn(10, requires_grad=input_requires_grad)
*da0073e9SAndroid Build Coastguard Worker            a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            class Test(nn.Module):
*da0073e9SAndroid Build Coastguard Worker                def forward(self, x):
*da0073e9SAndroid Build Coastguard Worker                    return x**2 * a**2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            mod = Test()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            for _ in range(nb_hooks):
*da0073e9SAndroid Build Coastguard Worker                mod.register_full_backward_hook(lambda a, b, c: None)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            tmp = mod(t)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Save dummy object to graph and get a weak ref to it
*da0073e9SAndroid Build Coastguard Worker            test = TestCls()
*da0073e9SAndroid Build Coastguard Worker            ref = weakref.ref(test)
*da0073e9SAndroid Build Coastguard Worker            tmp.grad_fn.metadata["a"] = test
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            with set_warn_always_context(True):
*da0073e9SAndroid Build Coastguard Worker                with warnings.catch_warnings(record=True) as w:
*da0073e9SAndroid Build Coastguard Worker                    tmp.exp().sum().backward(create_graph=True)
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(len(w) == 1)
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(
*da0073e9SAndroid Build Coastguard Worker                        "Using backward() with create_graph=True" in str(w[0].message)
*da0073e9SAndroid Build Coastguard Worker                    )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Remove the backward + create_graph=True cycle
*da0073e9SAndroid Build Coastguard Worker            a.grad = None
*da0073e9SAndroid Build Coastguard Worker            t.grad = None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            return ref
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for nb_hooks in (1, 2, 3):
*da0073e9SAndroid Build Coastguard Worker            for input_requires_grad in (True, False):
*da0073e9SAndroid Build Coastguard Worker                ref_ = get_ref(
*da0073e9SAndroid Build Coastguard Worker                    input_requires_grad=input_requires_grad,
*da0073e9SAndroid Build Coastguard Worker                    nb_hooks=nb_hooks,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                gc.collect()
*da0073e9SAndroid Build Coastguard Worker                self.assertIsNone(ref_())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @parametrize("use_custom_function", [True, False])
*da0073e9SAndroid Build Coastguard Worker    @parametrize("use_tensor_hook", [True, False])
*da0073e9SAndroid Build Coastguard Worker    def test_hook_closure_cycle(self, use_custom_function, use_tensor_hook):
*da0073e9SAndroid Build Coastguard Worker        # This creates a cycle between the hook and grad_fn_b
*da0073e9SAndroid Build Coastguard Worker        # hook -> closure -> grad_fn_b (python) -> grad_fn (cpp) -> hook (cpp)
*da0073e9SAndroid Build Coastguard Worker        # -> dict -> hook
*da0073e9SAndroid Build Coastguard Worker        #
*da0073e9SAndroid Build Coastguard Worker        # This test is testing that the grad_fn_b (python) only traverses the
*da0073e9SAndroid Build Coastguard Worker        # dict if it is the only one holding a reference to the grad_fn_b (cpp)
*da0073e9SAndroid Build Coastguard Worker        # shared_ptr
*da0073e9SAndroid Build Coastguard Worker        #
*da0073e9SAndroid Build Coastguard Worker        # See: https://github.com/pytorch/pytorch/issues/102174
*da0073e9SAndroid Build Coastguard Worker        class Function(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad):
*da0073e9SAndroid Build Coastguard Worker                return grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class Test:
*da0073e9SAndroid Build Coastguard Worker            pass
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        count = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def scope():
*da0073e9SAndroid Build Coastguard Worker            a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            if use_custom_function:
*da0073e9SAndroid Build Coastguard Worker                b = Function.apply(a)
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                b = a.clone()
*da0073e9SAndroid Build Coastguard Worker            grad_fn_b = b.grad_fn
*da0073e9SAndroid Build Coastguard Worker            obj = Test()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def hook(*args):
*da0073e9SAndroid Build Coastguard Worker                # Make sure this hook's closure holds onto grad_fn_b
*da0073e9SAndroid Build Coastguard Worker                # This forms a cycle between the hook and grad_fn_b
*da0073e9SAndroid Build Coastguard Worker                # We also hold onto a sentinel object 'obj' to track
*da0073e9SAndroid Build Coastguard Worker                # whether this cycle is still alive. See 'ref' below.
*da0073e9SAndroid Build Coastguard Worker                grad_fn_b
*da0073e9SAndroid Build Coastguard Worker                obj
*da0073e9SAndroid Build Coastguard Worker                count[0] += 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            if use_tensor_hook:
*da0073e9SAndroid Build Coastguard Worker                b.register_hook(hook)
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                b.grad_fn.register_hook(hook)
*da0073e9SAndroid Build Coastguard Worker            c = b.clone()
*da0073e9SAndroid Build Coastguard Worker            ref = weakref.ref(obj)
*da0073e9SAndroid Build Coastguard Worker            return c, ref
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with disable_gc():
*da0073e9SAndroid Build Coastguard Worker            out, ref = scope()
*da0073e9SAndroid Build Coastguard Worker            out.backward(retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            gc.collect()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Make sure gc does not clear the cycle noted above.
*da0073e9SAndroid Build Coastguard Worker            # e.g. the hook is alive and gets fired even after gc runs
*da0073e9SAndroid Build Coastguard Worker            out.backward(retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(count[0], 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # ref is still alive because the use_count of the cpp grad_fn
*da0073e9SAndroid Build Coastguard Worker            # shared_ptr > 1 since (1) the python grad_fn is alive, and (2) the
*da0073e9SAndroid Build Coastguard Worker            # rest of the graph holds onto the shared_ptr
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNotNone(ref())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Then delete the rest of the graph and check that ref is dead
*da0073e9SAndroid Build Coastguard Worker            del out
*da0073e9SAndroid Build Coastguard Worker            gc.collect()
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(ref())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_full_backward_hook_double_backward(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.rand_like(x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        func = torch.nn.MSELoss()
*da0073e9SAndroid Build Coastguard Worker        counter = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def hook(module, grad_input, grad_output):
*da0073e9SAndroid Build Coastguard Worker            counter[0] += 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        func.register_full_backward_hook(hook)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        f = func(x, y)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        (gradx_f,) = torch.autograd.grad(f, x, create_graph=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(counter[0], 1)
*da0073e9SAndroid Build Coastguard Worker        _ = torch.autograd.grad(gradx_f, x)
*da0073e9SAndroid Build Coastguard Worker        # We should not error, and counter should not be incremented
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(counter[0], 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_input_buffer_accum(self):
*da0073e9SAndroid Build Coastguard Worker        leaf = torch.rand(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # An op that returns sparse gradients
*da0073e9SAndroid Build Coastguard Worker        ind = torch.tensor([[0, 0]], dtype=torch.long)
*da0073e9SAndroid Build Coastguard Worker        out2 = leaf.gather(0, ind, sparse_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # An op that returns the gradients as-is
*da0073e9SAndroid Build Coastguard Worker        out1 = leaf.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        grad_out1_original = torch.rand_like(out1)
*da0073e9SAndroid Build Coastguard Worker        grad_out1 = grad_out1_original.clone()
*da0073e9SAndroid Build Coastguard Worker        grad_out2 = torch.rand_like(out2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.backward((out1, out2), (grad_out1, grad_out2))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Given gradients should not be modified inplace
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(grad_out1, grad_out1_original)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_no_unnecessary_unwrapping(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        a_orig = a.detach().clone()
*da0073e9SAndroid Build Coastguard Worker        b = a * a
*da0073e9SAndroid Build Coastguard Worker        c = a * b
*da0073e9SAndroid Build Coastguard Worker        d = torch.exp(a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # a is leaf
*da0073e9SAndroid Build Coastguard Worker        self.assertIs(b.grad_fn._saved_self, a)
*da0073e9SAndroid Build Coastguard Worker        self.assertIs(b.grad_fn._saved_other, a)
*da0073e9SAndroid Build Coastguard Worker        self.assertIs(c.grad_fn._saved_self, a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # b is not an output
*da0073e9SAndroid Build Coastguard Worker        self.assertIs(c.grad_fn._saved_other, b)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # d is an output
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(d.grad_fn._saved_result, d)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNot(d.grad_fn._saved_result, d)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        c.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "after they have already been freed"):
*da0073e9SAndroid Build Coastguard Worker            c.grad_fn._saved_self
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # a is left untouched
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a, a_orig)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_saved_variable_version_counter(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.rand(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        b = torch.exp(a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        b_unpacked = b.grad_fn._saved_result
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(b, b_unpacked)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(b._version, b_unpacked._version)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            b += 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(b, b_unpacked)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(b._version, b_unpacked._version)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_saved_variable_packing_unpacking_saved_original_with_hooks(self):
*da0073e9SAndroid Build Coastguard Worker        # Tests that packing/unpacking a SavedVariable works correctly with user-defined hooks
*da0073e9SAndroid Build Coastguard Worker        # The saved_original / did_not_save_original distinction corresponds to the `save_original`
*da0073e9SAndroid Build Coastguard Worker        # attribute of `SavedVariable`.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def test(get_input, is_leaf):
*da0073e9SAndroid Build Coastguard Worker            a = get_input()
*da0073e9SAndroid Build Coastguard Worker            grad_fn = a.grad_fn
*da0073e9SAndroid Build Coastguard Worker            y = a * a
*da0073e9SAndroid Build Coastguard Worker            y.grad_fn._raw_saved_self.register_hooks(lambda x: 2 * x, lambda x: x / 2)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(a, y.grad_fn._saved_self)
*da0073e9SAndroid Build Coastguard Worker            if not is_leaf:
*da0073e9SAndroid Build Coastguard Worker                self.assertIs(grad_fn, y.grad_fn._saved_self.grad_fn)
*da0073e9SAndroid Build Coastguard Worker                y.sum().backward()
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                y.sum().backward()
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(2 * a, a.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            a = get_input()
*da0073e9SAndroid Build Coastguard Worker            grad_fn = a.grad_fn
*da0073e9SAndroid Build Coastguard Worker            y = a * a
*da0073e9SAndroid Build Coastguard Worker            y.grad_fn._raw_saved_self.register_hooks(lambda x: 2 * x, lambda x: x)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(2 * a, y.grad_fn._saved_self)
*da0073e9SAndroid Build Coastguard Worker            if not is_leaf:
*da0073e9SAndroid Build Coastguard Worker                self.assertIs(grad_fn, y.grad_fn._saved_self.grad_fn)
*da0073e9SAndroid Build Coastguard Worker                y.sum().backward()
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                y.sum().backward()
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(3 * a, a.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # double backward
*da0073e9SAndroid Build Coastguard Worker            a = get_input()
*da0073e9SAndroid Build Coastguard Worker            grad_fn = a.grad_fn
*da0073e9SAndroid Build Coastguard Worker            y = a**3
*da0073e9SAndroid Build Coastguard Worker            y.grad_fn._raw_saved_self.register_hooks(lambda x: x, lambda x: x)
*da0073e9SAndroid Build Coastguard Worker            s = torch.sum(y)
*da0073e9SAndroid Build Coastguard Worker            (g,) = torch.autograd.grad(s, (a,), create_graph=True)
*da0073e9SAndroid Build Coastguard Worker            if not is_leaf:
*da0073e9SAndroid Build Coastguard Worker                self.assertIs(grad_fn, y.grad_fn._saved_self.grad_fn)
*da0073e9SAndroid Build Coastguard Worker                g.sum().backward()
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                g.sum().backward()
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(6 * a, a.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            a = get_input()
*da0073e9SAndroid Build Coastguard Worker            y = a * a
*da0073e9SAndroid Build Coastguard Worker            y.grad_fn._raw_saved_self.register_hooks(lambda x: x, lambda x: 1)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                TypeError, "Output of saved tensor unpack_hook expected to be a Tensor"
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                print(y.grad_fn._saved_self)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            a = get_input()
*da0073e9SAndroid Build Coastguard Worker            y = a * a
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                TypeError, "missing 1 required positional argument"
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                y.grad_fn._raw_saved_self.register_hooks(lambda x, b: x, lambda x: x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            a = get_input()
*da0073e9SAndroid Build Coastguard Worker            y = a * a
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                TypeError, "missing 1 required positional argument"
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                y.grad_fn._raw_saved_self.register_hooks(
*da0073e9SAndroid Build Coastguard Worker                    lambda x, b: (x, b), lambda x: x
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def inplace_double(x):
*da0073e9SAndroid Build Coastguard Worker                x *= 2
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            a = get_input()
*da0073e9SAndroid Build Coastguard Worker            t = a * a
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError,
*da0073e9SAndroid Build Coastguard Worker                "A saved tensor pack hook is modifying its input in place.",
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                t.grad_fn._raw_saved_self.register_hooks(
*da0073e9SAndroid Build Coastguard Worker                    inplace_double, lambda x: x / 2
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # leaf
*da0073e9SAndroid Build Coastguard Worker        test(lambda: torch.randn(5, requires_grad=True), True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # not leaf, not output
*da0073e9SAndroid Build Coastguard Worker        test(lambda: (1 + torch.randn(5, requires_grad=True)), False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_saved_variable_saved_original_inplace_detach(self):
*da0073e9SAndroid Build Coastguard Worker        # Detaching a tensor that is saved input raises
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True).clone()
*da0073e9SAndroid Build Coastguard Worker        b = a.sin()
*da0073e9SAndroid Build Coastguard Worker        a.detach_()
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, "Trying to use a saved tensor that has been detached"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            b.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Detaching a tensor that is saved as output is OK
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True).clone()
*da0073e9SAndroid Build Coastguard Worker        b = a.exp()
*da0073e9SAndroid Build Coastguard Worker        a.detach_()
*da0073e9SAndroid Build Coastguard Worker        b.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_saved_variable_packing_unpacking_did_not_save_original_with_hooks(self):
*da0073e9SAndroid Build Coastguard Worker        # Tests that packing/unpacking a SavedVariable works correctly with user-defined hooks
*da0073e9SAndroid Build Coastguard Worker        # The saved_original / did_not_save_original distinction corresponds to the `save_original`
*da0073e9SAndroid Build Coastguard Worker        # attribute of `SavedVariable`.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.exp(a)
*da0073e9SAndroid Build Coastguard Worker        y.grad_fn._raw_saved_result.register_hooks(lambda x: x, lambda x: x)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y, y.grad_fn._saved_result)
*da0073e9SAndroid Build Coastguard Worker        self.assertIs(y.grad_fn, y.grad_fn._saved_result.grad_fn)
*da0073e9SAndroid Build Coastguard Worker        y.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a.grad, y)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_saved_variable_packing_unpacking_saved_original_with_default_hooks(self):
*da0073e9SAndroid Build Coastguard Worker        # Tests that default hooks are properly registered, used and reset
*da0073e9SAndroid Build Coastguard Worker        # The saved_original / did_not_save_original distinction corresponds to the `save_original`
*da0073e9SAndroid Build Coastguard Worker        # attribute of `SavedVariable`.
*da0073e9SAndroid Build Coastguard Worker        # See also:
*da0073e9SAndroid Build Coastguard Worker        #  - test_saved_variable_packing_unpacking_saved_original_with_hooks
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def pack(x):
*da0073e9SAndroid Build Coastguard Worker            warnings.warn("pack")
*da0073e9SAndroid Build Coastguard Worker            return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.saved_tensors_hooks(pack, lambda x: x):
*da0073e9SAndroid Build Coastguard Worker            a = torch.ones(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            with warnings.catch_warnings(record=True) as w:
*da0073e9SAndroid Build Coastguard Worker                warnings.simplefilter("always")
*da0073e9SAndroid Build Coastguard Worker                y = a * a
*da0073e9SAndroid Build Coastguard Worker                # should raise two warnings from a being saved twice
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(len(w), 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.saved_tensors_hooks(lambda x: x, lambda x: x):
*da0073e9SAndroid Build Coastguard Worker            a = torch.randn(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            y = a * a
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(a, y.grad_fn._saved_self)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(a, y.grad_fn._saved_other)
*da0073e9SAndroid Build Coastguard Worker            y.sum().backward()
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(2 * a, a.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.saved_tensors_hooks(lambda x: 2 * x, lambda x: x / 2):
*da0073e9SAndroid Build Coastguard Worker            a = torch.randn(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            y = a * a
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(a, y.grad_fn._saved_self)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(a, y.grad_fn._saved_other)
*da0073e9SAndroid Build Coastguard Worker            y.sum().backward()
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(2 * a, a.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.saved_tensors_hooks(lambda x: 2 * x, lambda x: x):
*da0073e9SAndroid Build Coastguard Worker            a = torch.randn(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            y = a * a
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(2 * a, y.grad_fn._saved_self)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(2 * a, y.grad_fn._saved_other)
*da0073e9SAndroid Build Coastguard Worker            y.sum().backward()
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(4 * a, a.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Exited hooks correctly
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = a * a
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a, y.grad_fn._saved_self)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a, y.grad_fn._saved_other)
*da0073e9SAndroid Build Coastguard Worker        y.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(2 * a, a.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_saved_variable_packing_unpacking_did_not_save_original_with_default_hooks(
*da0073e9SAndroid Build Coastguard Worker        self,
*da0073e9SAndroid Build Coastguard Worker    ):
*da0073e9SAndroid Build Coastguard Worker        # See also test_saved_variable_packing_unpacking_did_not_save_original_with_hooks
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.saved_tensors_hooks(lambda x: x, lambda x: x):
*da0073e9SAndroid Build Coastguard Worker            a = torch.randn(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            y = torch.exp(a)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(y, y.grad_fn._saved_result)
*da0073e9SAndroid Build Coastguard Worker            y.sum().backward()
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(a.grad, y)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_setting_default_saved_variable_hooks_twice_should_not_fail(self):
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.saved_tensors_hooks(lambda x: x, lambda x: x):
*da0073e9SAndroid Build Coastguard Worker            with torch.autograd.graph.saved_tensors_hooks(lambda x: x, lambda x: x):
*da0073e9SAndroid Build Coastguard Worker                pass
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_setting_default_saved_variable_hooks_twice_should_use_inner(self):
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.saved_tensors_hooks(lambda x: 3 * x, lambda x: 3 * x):
*da0073e9SAndroid Build Coastguard Worker            b = torch.randn(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            with torch.autograd.graph.saved_tensors_hooks(
*da0073e9SAndroid Build Coastguard Worker                lambda x: 5 * x, lambda x: 5 * x
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                a = torch.randn(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker                y = a * a
*da0073e9SAndroid Build Coastguard Worker            z = b * b
*da0073e9SAndroid Build Coastguard Worker        y.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        z.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(2 * 5 * 5 * a, a.grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(2 * 3 * 3 * b, b.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_disabling_saved_tensor_hooks(self):
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.disable_saved_tensors_hooks("error message"):
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, "error message"):
*da0073e9SAndroid Build Coastguard Worker                with torch.autograd.graph.saved_tensors_hooks(lambda x: x, lambda x: x):
*da0073e9SAndroid Build Coastguard Worker                    pass
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(torch._C._autograd._saved_tensors_hooks_is_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.saved_tensors_hooks(lambda x: x, lambda x: x):
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, "error message"):
*da0073e9SAndroid Build Coastguard Worker                with torch.autograd.graph.disable_saved_tensors_hooks("error message"):
*da0073e9SAndroid Build Coastguard Worker                    pass
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(torch._C._autograd._saved_tensors_hooks_is_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_disabling_saved_tensor_hooks_nested(self):
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.disable_saved_tensors_hooks("outer"):
*da0073e9SAndroid Build Coastguard Worker            with torch.autograd.graph.disable_saved_tensors_hooks("inner"):
*da0073e9SAndroid Build Coastguard Worker                with self.assertRaisesRegex(RuntimeError, "inner"):
*da0073e9SAndroid Build Coastguard Worker                    with torch.autograd.graph.saved_tensors_hooks(
*da0073e9SAndroid Build Coastguard Worker                        lambda x: x, lambda x: x
*da0073e9SAndroid Build Coastguard Worker                    ):
*da0073e9SAndroid Build Coastguard Worker                        pass
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(torch._C._autograd._saved_tensors_hooks_is_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(torch._C._autograd._saved_tensors_hooks_is_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_saved_tensor_hooks_custom_error_propagation(self):
*da0073e9SAndroid Build Coastguard Worker        class CustomError(Exception):
*da0073e9SAndroid Build Coastguard Worker            pass
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class error_on_pack_hook(torch.autograd.graph.saved_tensors_hooks):
*da0073e9SAndroid Build Coastguard Worker            def __init__(self) -> None:
*da0073e9SAndroid Build Coastguard Worker                def pack_hook(x):
*da0073e9SAndroid Build Coastguard Worker                    raise CustomError("pack")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                super().__init__(pack_hook, lambda x: x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class error_on_unpack_hook(torch.autograd.graph.saved_tensors_hooks):
*da0073e9SAndroid Build Coastguard Worker            def __init__(self) -> None:
*da0073e9SAndroid Build Coastguard Worker                def unpack_hook(x):
*da0073e9SAndroid Build Coastguard Worker                    raise CustomError("unpack")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                super().__init__(lambda x: x, unpack_hook)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with error_on_pack_hook():
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(CustomError, "pack"):
*da0073e9SAndroid Build Coastguard Worker                out = torch.sin(a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with error_on_unpack_hook():
*da0073e9SAndroid Build Coastguard Worker            out = torch.sin(a)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(CustomError, "unpack"):
*da0073e9SAndroid Build Coastguard Worker                out.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_saved_tensor_hooks_custom_function_intermediates(self):
*da0073e9SAndroid Build Coastguard Worker        class Func(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                intermediate = x.exp()
*da0073e9SAndroid Build Coastguard Worker                ctx.save_for_backward(
*da0073e9SAndroid Build Coastguard Worker                    intermediate.clone().detach_().requires_grad_(True)
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                return x.exp()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_out):
*da0073e9SAndroid Build Coastguard Worker                (intermediate,) = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                return grad_out * intermediate
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.saved_tensors_hooks(lambda x: x, lambda x: x):
*da0073e9SAndroid Build Coastguard Worker            out = Func.apply(a)
*da0073e9SAndroid Build Coastguard Worker        out.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_unpack_hooks_exec_count(self):
*da0073e9SAndroid Build Coastguard Worker        def f(x, y):
*da0073e9SAndroid Build Coastguard Worker            return x * y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        pack_count = 0
*da0073e9SAndroid Build Coastguard Worker        unpack_count = 0
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def pack_hook(x):
*da0073e9SAndroid Build Coastguard Worker            nonlocal pack_count
*da0073e9SAndroid Build Coastguard Worker            pack_count += 1
*da0073e9SAndroid Build Coastguard Worker            return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # unpack hook shouldn't run during compilation, while we trace the forward
*da0073e9SAndroid Build Coastguard Worker        def unpack_hook(x):
*da0073e9SAndroid Build Coastguard Worker            nonlocal unpack_count
*da0073e9SAndroid Build Coastguard Worker            unpack_count += 1
*da0073e9SAndroid Build Coastguard Worker            return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(4, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.ones(4, requires_grad=False)
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.saved_tensors_hooks(pack_hook, unpack_hook):
*da0073e9SAndroid Build Coastguard Worker            out_test = f(x, y)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(pack_count, 1)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(unpack_count, 0)
*da0073e9SAndroid Build Coastguard Worker            out_test.sum().backward()
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(pack_count, 1)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(unpack_count, 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_saved_tensors_hook_version_counter_not_shared(self):
*da0073e9SAndroid Build Coastguard Worker        class Test(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                ctx.save_for_backward(x)
*da0073e9SAndroid Build Coastguard Worker                return x.sin()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_output):
*da0073e9SAndroid Build Coastguard Worker                (x,) = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                before = a._version
*da0073e9SAndroid Build Coastguard Worker                x.add_(1)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(a._version, before)
*da0073e9SAndroid Build Coastguard Worker                return grad_output
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        a_replacement = a.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def pack_hook(x):
*da0073e9SAndroid Build Coastguard Worker            return a_replacement
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def unpack_hook(x):
*da0073e9SAndroid Build Coastguard Worker            return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.saved_tensors_hooks(pack_hook, unpack_hook):
*da0073e9SAndroid Build Coastguard Worker            b = Test.apply(a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        b.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_save_on_cpu_and_checkpoint(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        b = a.pow(2).pow(2).pow(2).pow(2)
*da0073e9SAndroid Build Coastguard Worker        b.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        b_grad = a.grad.clone()
*da0073e9SAndroid Build Coastguard Worker        a.grad.zero_()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.save_on_cpu():
*da0073e9SAndroid Build Coastguard Worker            h = a.pow(2)
*da0073e9SAndroid Build Coastguard Worker            h = checkpoint(lambda x: x.pow(2).pow(2), h, use_reentrant=False)
*da0073e9SAndroid Build Coastguard Worker            c = h.pow(2)
*da0073e9SAndroid Build Coastguard Worker        c.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        c_grad = a.grad.clone()
*da0073e9SAndroid Build Coastguard Worker        a.grad.zero_()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def f(a):
*da0073e9SAndroid Build Coastguard Worker            h = a.pow(2)
*da0073e9SAndroid Build Coastguard Worker            with torch.autograd.graph.save_on_cpu():
*da0073e9SAndroid Build Coastguard Worker                h = h.pow(2).pow(2)
*da0073e9SAndroid Build Coastguard Worker            return h.pow(2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        d = checkpoint(f, a, use_reentrant=False)
*da0073e9SAndroid Build Coastguard Worker        d.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        d_grad = a.grad.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(b_grad, c_grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(b_grad, d_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_pack_hook_with_inplace_modification_should_fail(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def inc(x):
*da0073e9SAndroid Build Coastguard Worker            x += 1
*da0073e9SAndroid Build Coastguard Worker            return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.saved_tensors_hooks(inc, lambda x: x):
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError,
*da0073e9SAndroid Build Coastguard Worker                "A saved tensor pack hook is modifying its input in place.",
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                y = torch.exp(a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        y = torch.exp(a)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, "A saved tensor pack hook is modifying its input in place."
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            y.grad_fn._raw_saved_result.register_hooks(inc, lambda x: x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_saving_variable_to_disk(self):
*da0073e9SAndroid Build Coastguard Worker        with tempfile.TemporaryDirectory() as tmp_dir:
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def pack(x):
*da0073e9SAndroid Build Coastguard Worker                name = os.path.join(tmp_dir, str(uuid.uuid4()))
*da0073e9SAndroid Build Coastguard Worker                torch.save(x, name)
*da0073e9SAndroid Build Coastguard Worker                return name
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def unpack(name):
*da0073e9SAndroid Build Coastguard Worker                return torch.load(name)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            with torch.autograd.graph.saved_tensors_hooks(pack, unpack):
*da0073e9SAndroid Build Coastguard Worker                a = torch.ones(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker                y = a * a
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(a, y.grad_fn._saved_self)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                y.sum().backward()
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(2 * a, a.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_default_saved_tensors_hooks_double_backward(self):
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.saved_tensors_hooks(lambda x: x, lambda x: x):
*da0073e9SAndroid Build Coastguard Worker            a = torch.randn(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            y = a**3
*da0073e9SAndroid Build Coastguard Worker            s = torch.sum(y)
*da0073e9SAndroid Build Coastguard Worker            (g,) = torch.autograd.grad(s, (a,), create_graph=True)
*da0073e9SAndroid Build Coastguard Worker            g.sum().backward()
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(6 * a, a.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.saved_tensors_hooks(lambda x: 2 * x, lambda x: x):
*da0073e9SAndroid Build Coastguard Worker            a = torch.randn(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            y = a**3
*da0073e9SAndroid Build Coastguard Worker            s = torch.sum(y)
*da0073e9SAndroid Build Coastguard Worker        (g,) = torch.autograd.grad(s, (a,), create_graph=True)
*da0073e9SAndroid Build Coastguard Worker        g.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        # factor 2 because only a is saved once
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(6 * 2 * a, a.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = a**3
*da0073e9SAndroid Build Coastguard Worker        s = torch.sum(y)
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.saved_tensors_hooks(lambda x: 2 * x, lambda x: x):
*da0073e9SAndroid Build Coastguard Worker            (g,) = torch.autograd.grad(s, (a,), create_graph=True)
*da0073e9SAndroid Build Coastguard Worker            g.sum().backward()
*da0073e9SAndroid Build Coastguard Worker            # factor 4 because pow_backward is grad * (exp * self.pow(exp - 1))
*da0073e9SAndroid Build Coastguard Worker            # so grad is saved and self (i.e. a) is saved
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(6 * 4 * a, a.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.saved_tensors_hooks(lambda x: 2 * x, lambda x: x):
*da0073e9SAndroid Build Coastguard Worker            a = torch.randn(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            y = a**3
*da0073e9SAndroid Build Coastguard Worker            s = torch.sum(y)
*da0073e9SAndroid Build Coastguard Worker            (g,) = torch.autograd.grad(s, (a,), create_graph=True)
*da0073e9SAndroid Build Coastguard Worker            g.sum().backward()
*da0073e9SAndroid Build Coastguard Worker            # combining the two above blocks: 2 * 4 = 8
*da0073e9SAndroid Build Coastguard Worker            # note that in that sense, a is saved twice
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(6 * 8 * a, a.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_wrapped_number_saved_tensors_hooks(self):
*da0073e9SAndroid Build Coastguard Worker        def err_hook(x):
*da0073e9SAndroid Build Coastguard Worker            raise RuntimeError("this hook should not be called")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.saved_tensors_hooks(err_hook, err_hook):
*da0073e9SAndroid Build Coastguard Worker            a = torch.randn(5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            out = (a * 3).sum()
*da0073e9SAndroid Build Coastguard Worker            # 3 is saved as a saved tensor because it is a wrapped number, but
*da0073e9SAndroid Build Coastguard Worker            # wrapped numbers should be special cased to not trigger saved variable hooks
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.grad(out, (a,))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_graph_save_on_cpu(self):
*da0073e9SAndroid Build Coastguard Worker        def test(get_input, cuda, pin_memory):
*da0073e9SAndroid Build Coastguard Worker            with torch.autograd.graph.save_on_cpu(pin_memory):
*da0073e9SAndroid Build Coastguard Worker                a = get_input()
*da0073e9SAndroid Build Coastguard Worker                if cuda:
*da0073e9SAndroid Build Coastguard Worker                    a.cuda()
*da0073e9SAndroid Build Coastguard Worker                y = a * a
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(a, y.grad_fn._saved_self)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(a, y.grad_fn._saved_other)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(a.dtype, y.grad_fn._saved_self.dtype)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(a.layout, y.grad_fn._saved_self.layout)
*da0073e9SAndroid Build Coastguard Worker                if y.is_sparse:
*da0073e9SAndroid Build Coastguard Worker                    y = y.to_dense()
*da0073e9SAndroid Build Coastguard Worker                y.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                actual = 2 * a
*da0073e9SAndroid Build Coastguard Worker                expected = a.grad
*da0073e9SAndroid Build Coastguard Worker                if a.is_sparse:
*da0073e9SAndroid Build Coastguard Worker                    actual = actual.coalesce()
*da0073e9SAndroid Build Coastguard Worker                    expected = expected.coalesce()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(actual, expected)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for cuda in [False] + ([True] if torch.cuda.is_available() else []):
*da0073e9SAndroid Build Coastguard Worker            for pin_memory in [True, False]:
*da0073e9SAndroid Build Coastguard Worker                # FloatTensor
*da0073e9SAndroid Build Coastguard Worker                test(lambda: torch.randn(5, requires_grad=True), cuda, pin_memory)
*da0073e9SAndroid Build Coastguard Worker                # DoubleTensor
*da0073e9SAndroid Build Coastguard Worker                test(
*da0073e9SAndroid Build Coastguard Worker                    lambda: torch.randn(5, requires_grad=True, dtype=torch.double),
*da0073e9SAndroid Build Coastguard Worker                    cuda,
*da0073e9SAndroid Build Coastguard Worker                    pin_memory,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                # Sparse tensor
*da0073e9SAndroid Build Coastguard Worker                x = torch.sparse_coo_tensor(
*da0073e9SAndroid Build Coastguard Worker                    torch.tensor([[1, 1]]).long(),
*da0073e9SAndroid Build Coastguard Worker                    torch.tensor([1.0, 1.0]),
*da0073e9SAndroid Build Coastguard Worker                    requires_grad=True,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                test(lambda: x, cuda, pin_memory)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @unittest.skipIf(not TEST_CUDA, "test requires CUDA")
*da0073e9SAndroid Build Coastguard Worker    def test_graph_save_on_cpu_cuda(self):
*da0073e9SAndroid Build Coastguard Worker        def f(x):
*da0073e9SAndroid Build Coastguard Worker            a = x + 1
*da0073e9SAndroid Build Coastguard Worker            return a * a
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # with grad
*da0073e9SAndroid Build Coastguard Worker        a = torch.ones(1, requires_grad=True, device="cuda")
*da0073e9SAndroid Build Coastguard Worker        y = f(a)
*da0073e9SAndroid Build Coastguard Worker        memory_with_grad = torch.cuda.memory_allocated()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        del a
*da0073e9SAndroid Build Coastguard Worker        del y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # without grad
*da0073e9SAndroid Build Coastguard Worker        a = torch.ones(1, requires_grad=True, device="cuda")
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            y = f(a)
*da0073e9SAndroid Build Coastguard Worker        memory_without_grad = torch.cuda.memory_allocated()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertGreater(memory_with_grad, memory_without_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        del a
*da0073e9SAndroid Build Coastguard Worker        del y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # with hooks
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.save_on_cpu():
*da0073e9SAndroid Build Coastguard Worker            a = torch.ones(1, requires_grad=True, device="cuda")
*da0073e9SAndroid Build Coastguard Worker            y = f(a)
*da0073e9SAndroid Build Coastguard Worker            memory_with_hooks = torch.cuda.memory_allocated()
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(memory_with_hooks, memory_without_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @unittest.skipIf(not TEST_CUDA, "test requires CUDA")
*da0073e9SAndroid Build Coastguard Worker    def test_scalar_grad_mixed_device(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(2, 2, device="cuda")
*da0073e9SAndroid Build Coastguard Worker        out = x * y
*da0073e9SAndroid Build Coastguard Worker        out.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_multi_grad_all_hooks(self):
*da0073e9SAndroid Build Coastguard Worker        t1 = torch.rand(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        t2 = torch.rand(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        t3 = torch.rand(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        t4 = torch.rand(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Ensure we properly detect all types of Nodes here
*da0073e9SAndroid Build Coastguard Worker        # C++ Node
*da0073e9SAndroid Build Coastguard Worker        t1 = t1.mul(2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Python custom Function
*da0073e9SAndroid Build Coastguard Worker        class Foo(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, a):
*da0073e9SAndroid Build Coastguard Worker                return a.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                return gO
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        t2 = Foo.apply(t2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # C++ Node
*da0073e9SAndroid Build Coastguard Worker        t3 = torch._C._functions.UndefinedGrad()(t3)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # C++ Custom Op
*da0073e9SAndroid Build Coastguard Worker        cpp_source = """
*da0073e9SAndroid Build Coastguard Workerstruct CustomOpAutogradFunction : public torch::autograd::Function<CustomOpAutogradFunction> {
*da0073e9SAndroid Build Coastguard Worker  static torch::Tensor forward(
*da0073e9SAndroid Build Coastguard Worker      torch::autograd::AutogradContext* ctx,
*da0073e9SAndroid Build Coastguard Worker      const torch::Tensor& x) {
*da0073e9SAndroid Build Coastguard Worker    return x.clone();
*da0073e9SAndroid Build Coastguard Worker  }
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker  static torch::autograd::variable_list backward(
*da0073e9SAndroid Build Coastguard Worker      torch::autograd::AutogradContext *ctx,
*da0073e9SAndroid Build Coastguard Worker      torch::autograd::variable_list grad_output) {
*da0073e9SAndroid Build Coastguard Worker    return grad_output;
*da0073e9SAndroid Build Coastguard Worker  }
*da0073e9SAndroid Build Coastguard Worker};
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workertorch::Tensor custom_op_backed_by_autograd_fn(torch::Tensor x) {
*da0073e9SAndroid Build Coastguard Worker  return CustomOpAutogradFunction::apply(x);
*da0073e9SAndroid Build Coastguard Worker}
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard WorkerTORCH_LIBRARY(test_autograd_cpp_node, m) {
*da0073e9SAndroid Build Coastguard Worker    m.def("custom_op_backed_by_autograd_fn", custom_op_backed_by_autograd_fn);
*da0073e9SAndroid Build Coastguard Worker}
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        module = load_inline(
*da0073e9SAndroid Build Coastguard Worker            name="test_autograd_cpp_node",
*da0073e9SAndroid Build Coastguard Worker            cpp_sources=cpp_source,
*da0073e9SAndroid Build Coastguard Worker            functions="custom_op_backed_by_autograd_fn",
*da0073e9SAndroid Build Coastguard Worker            verbose=True,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        t4 = torch.ops.test_autograd_cpp_node.custom_op_backed_by_autograd_fn(t4)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        res = [None] * 4
*da0073e9SAndroid Build Coastguard Worker        count = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def hook(grads):
*da0073e9SAndroid Build Coastguard Worker            nonlocal res
*da0073e9SAndroid Build Coastguard Worker            count[0] += 1
*da0073e9SAndroid Build Coastguard Worker            res = [g is not None for g in grads]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        handle = torch.autograd.graph.register_multi_grad_hook((t1, t2, t3, t4), hook)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = t2 * t3
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out.sum().backward(inputs=(t2, t3), retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(count[0], 1)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(res, [False, True, True, False])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out.sum().backward(inputs=(t1, t4), retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(count[0], 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out.sum().backward(inputs=(t1, t3), retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(count[0], 2)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(res, [False, False, True, False])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class Func(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                raise RuntimeError("error message")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = Func.apply(t2) * t3
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "error message"):
*da0073e9SAndroid Build Coastguard Worker            out.sum().backward(inputs=(t2, t3), retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(count[0], 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        handle.remove()
*da0073e9SAndroid Build Coastguard Worker        out.sum().backward(inputs=(t1, t3), retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(count[0], 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_multi_grad_any_hooks(self):
*da0073e9SAndroid Build Coastguard Worker        hook_id = 0
*da0073e9SAndroid Build Coastguard Worker        any_hook_handles: List[RemovableHandle] = []
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class MultiOutputModule(nn.Module):
*da0073e9SAndroid Build Coastguard Worker            def __init__(self) -> None:
*da0073e9SAndroid Build Coastguard Worker                super().__init__()
*da0073e9SAndroid Build Coastguard Worker                self.lin = nn.Linear(3, 3)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def forward(self, x: torch.Tensor) -> Tuple[torch.Tensor, torch.Tensor]:
*da0073e9SAndroid Build Coastguard Worker                z = self.lin(x)
*da0073e9SAndroid Build Coastguard Worker                out = torch.sin(z), torch.cos(z)
*da0073e9SAndroid Build Coastguard Worker                nonlocal hook_id
*da0073e9SAndroid Build Coastguard Worker                z.register_hook(partial(hook, hook_id))
*da0073e9SAndroid Build Coastguard Worker                hook_id += 1
*da0073e9SAndroid Build Coastguard Worker                any_hook_handles.append(
*da0073e9SAndroid Build Coastguard Worker                    torch.autograd.graph.register_multi_grad_hook(
*da0073e9SAndroid Build Coastguard Worker                        out, partial(hook, hook_id), mode="any"
*da0073e9SAndroid Build Coastguard Worker                    )
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                hook_id += 1
*da0073e9SAndroid Build Coastguard Worker                return out
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class Model(nn.Module):
*da0073e9SAndroid Build Coastguard Worker            def __init__(self) -> None:
*da0073e9SAndroid Build Coastguard Worker                super().__init__()
*da0073e9SAndroid Build Coastguard Worker                self.mod1 = MultiOutputModule()
*da0073e9SAndroid Build Coastguard Worker                self.mod2 = MultiOutputModule()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def forward(self, x: torch.Tensor) -> torch.Tensor:
*da0073e9SAndroid Build Coastguard Worker                y = self.mod1(x)
*da0073e9SAndroid Build Coastguard Worker                z = y[0] + y[1]
*da0073e9SAndroid Build Coastguard Worker                return self.mod2(z)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        hook_order: List[int] = []
*da0073e9SAndroid Build Coastguard Worker        hook_count = 0
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def hook(hook_id: int, *unused):
*da0073e9SAndroid Build Coastguard Worker            nonlocal hook_count
*da0073e9SAndroid Build Coastguard Worker            nonlocal hook_order
*da0073e9SAndroid Build Coastguard Worker            hook_count += 1
*da0073e9SAndroid Build Coastguard Worker            hook_order.append(hook_id)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Any hooks: IDs 1 and 3; regular hooks: IDs 0 and 2
*da0073e9SAndroid Build Coastguard Worker        model = Model()
*da0073e9SAndroid Build Coastguard Worker        inp = torch.randn((2, 3))
*da0073e9SAndroid Build Coastguard Worker        out = model(inp)
*da0073e9SAndroid Build Coastguard Worker        (out[0] + out[1]).sum().backward()
*da0073e9SAndroid Build Coastguard Worker        # Check that the any-hook runs only once and before the regular hook
*da0073e9SAndroid Build Coastguard Worker        # for each module
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(len(any_hook_handles), 2)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(hook_order, [3, 2, 1, 0])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        hook_id = 0
*da0073e9SAndroid Build Coastguard Worker        hook_order.clear()
*da0073e9SAndroid Build Coastguard Worker        any_hook_handles.clear()
*da0073e9SAndroid Build Coastguard Worker        out = model(inp)
*da0073e9SAndroid Build Coastguard Worker        for handle in any_hook_handles:
*da0073e9SAndroid Build Coastguard Worker            handle.remove()
*da0073e9SAndroid Build Coastguard Worker        (out[0] + out[1]).sum().backward()
*da0073e9SAndroid Build Coastguard Worker        # Check that the any-hook does not run if removed
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(hook_order, [2, 0])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_multi_grad_hooks_invalid_mode(self):
*da0073e9SAndroid Build Coastguard Worker        t1 = torch.rand(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        t2 = torch.rand(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        regex = r"Expects mode to be one of \('all', 'any'\) but got foo"
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(ValueError, regex):
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.graph.register_multi_grad_hook(
*da0073e9SAndroid Build Coastguard Worker                (t1, t2), lambda _: None, mode="foo"
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_pynode_destruction_deadlock(self):
*da0073e9SAndroid Build Coastguard Worker        script = """
*da0073e9SAndroid Build Coastguard Workerimport torch
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass Foo(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker    @staticmethod
*da0073e9SAndroid Build Coastguard Worker    def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker        return x.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @staticmethod
*da0073e9SAndroid Build Coastguard Worker    def forward(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker        return gO.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef get_out():
*da0073e9SAndroid Build Coastguard Worker    inp = torch.rand(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # The python function is first so that it runs
*da0073e9SAndroid Build Coastguard Worker    # last in the backward pass
*da0073e9SAndroid Build Coastguard Worker    right = Foo.apply(inp)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # An op that creates new memory
*da0073e9SAndroid Build Coastguard Worker    left1 = inp.clone()
*da0073e9SAndroid Build Coastguard Worker    # An op that saves its input
*da0073e9SAndroid Build Coastguard Worker    left2 = left1 ** 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # Inplace modify so that the backward for
*da0073e9SAndroid Build Coastguard Worker    # left2 always raises an error
*da0073e9SAndroid Build Coastguard Worker    left1 += 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # An op that takes both side as input.
*da0073e9SAndroid Build Coastguard Worker    # After running, both side's last op will be in
*da0073e9SAndroid Build Coastguard Worker    # the ready queue
*da0073e9SAndroid Build Coastguard Worker    # And the op for left will run first as it was
*da0073e9SAndroid Build Coastguard Worker    # executed last during the forward
*da0073e9SAndroid Build Coastguard Worker    out = left2 + right
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    return out
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker# Nothing should be global variables here as, from what
*da0073e9SAndroid Build Coastguard Worker# I can see, python leaks all the global objects
*da0073e9SAndroid Build Coastguard Workerget_out().sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker# This used to deadlock when the PyNode is being destroyed after
*da0073e9SAndroid Build Coastguard Worker# the error is raised.
*da0073e9SAndroid Build Coastguard Worker"""
*da0073e9SAndroid Build Coastguard Worker        try:
*da0073e9SAndroid Build Coastguard Worker            subprocess.check_output(
*da0073e9SAndroid Build Coastguard Worker                [sys.executable, "-c", script],
*da0073e9SAndroid Build Coastguard Worker                stderr=subprocess.STDOUT,
*da0073e9SAndroid Build Coastguard Worker                # On Windows, opening the subprocess with the default CWD makes `import torch`
*da0073e9SAndroid Build Coastguard Worker                # fail, so just set CWD to this script's directory
*da0073e9SAndroid Build Coastguard Worker                cwd=os.path.dirname(os.path.realpath(__file__)),
*da0073e9SAndroid Build Coastguard Worker                # It is ok to have an extra long timeout here as a timeout means the test failed
*da0073e9SAndroid Build Coastguard Worker                timeout=20,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        except subprocess.TimeoutExpired as e:
*da0073e9SAndroid Build Coastguard Worker            self.fail(
*da0073e9SAndroid Build Coastguard Worker                msg="Example code timed out! See the code sample in the test for details."
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        except subprocess.CalledProcessError as e:
*da0073e9SAndroid Build Coastguard Worker            if e.returncode < 0:
*da0073e9SAndroid Build Coastguard Worker                # Sometimes we segfault instead of deadlocking
*da0073e9SAndroid Build Coastguard Worker                self.fail("Subprocess exited with a fatal signal")
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                err_msg = (
*da0073e9SAndroid Build Coastguard Worker                    "RuntimeError: one of the variables needed for gradient computation"
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(err_msg in e.output.decode("utf-8"))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_view_func_replay(self):
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd._force_original_view_tracking(True):
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def _assert_match_metadata(a, b):
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(a.size(), b.size())
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(a.stride(), b.stride())
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(a.storage_offset(), b.storage_offset())
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(a.device, b.device)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(a.dtype, b.dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def _test_fn(fn, inp, *args, use_unsafe_view_func=False):
*da0073e9SAndroid Build Coastguard Worker                outs = fn(inp, *args)
*da0073e9SAndroid Build Coastguard Worker                # handle functions that return multiple views (e.g. split)
*da0073e9SAndroid Build Coastguard Worker                if isinstance(outs, torch.Tensor):
*da0073e9SAndroid Build Coastguard Worker                    outs = [outs]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                for out in outs:
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(out._is_view())
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(out._base is inp)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    # forward view_func
*da0073e9SAndroid Build Coastguard Worker                    new_inp = inp.clone()
*da0073e9SAndroid Build Coastguard Worker                    _assert_match_metadata(new_inp, inp)
*da0073e9SAndroid Build Coastguard Worker                    if use_unsafe_view_func:
*da0073e9SAndroid Build Coastguard Worker                        new_out = out._view_func_unsafe(new_inp)
*da0073e9SAndroid Build Coastguard Worker                    else:
*da0073e9SAndroid Build Coastguard Worker                        new_out = out._view_func(new_inp)
*da0073e9SAndroid Build Coastguard Worker                    _assert_match_metadata(new_out, out)
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(new_out, out)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    # reverse view_func
*da0073e9SAndroid Build Coastguard Worker                    new_out = out.detach()
*da0073e9SAndroid Build Coastguard Worker                    new_inp = out._rev_view_func_unsafe(new_out)
*da0073e9SAndroid Build Coastguard Worker                    _assert_match_metadata(new_inp, inp)
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(new_inp._is_view())
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(new_inp._base is new_out)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # test individual view ops
*da0073e9SAndroid Build Coastguard Worker            _test_fn(torch.ops.aten.alias.default, torch.rand(2, 2))
*da0073e9SAndroid Build Coastguard Worker            _test_fn(torch.as_strided, torch.rand(2, 2), (4,), (1,))
*da0073e9SAndroid Build Coastguard Worker            _test_fn(torch.chunk, torch.rand(2, 4), 2, -1)
*da0073e9SAndroid Build Coastguard Worker            _test_fn(torch.diagonal, torch.rand(4, 4))
*da0073e9SAndroid Build Coastguard Worker            _test_fn(torch.ops.aten.expand.default, torch.rand(4, 1), (-1, 3))
*da0073e9SAndroid Build Coastguard Worker            _test_fn(torch.narrow, torch.rand(2, 2), 0, 1, 1)
*da0073e9SAndroid Build Coastguard Worker            _test_fn(torch.permute, torch.rand(2, 3, 4), (1, 0, 2))
*da0073e9SAndroid Build Coastguard Worker            _test_fn(torch.select, torch.rand(2, 2), 0, 0)
*da0073e9SAndroid Build Coastguard Worker            _test_fn(torch.ops.aten.slice.Tensor, torch.rand(2, 2), 1, 1, 2)
*da0073e9SAndroid Build Coastguard Worker            _test_fn(torch.split, torch.rand(2, 2), 1)
*da0073e9SAndroid Build Coastguard Worker            _test_fn(torch.split_with_sizes, torch.rand(2, 4), [1, 3], -1)
*da0073e9SAndroid Build Coastguard Worker            _test_fn(torch.squeeze, torch.rand(2, 1, 4))
*da0073e9SAndroid Build Coastguard Worker            _test_fn(torch.squeeze, torch.rand(2, 1, 4), 1)
*da0073e9SAndroid Build Coastguard Worker            _test_fn(torch.squeeze, torch.rand(2, 1, 1, 4), [1, 2])
*da0073e9SAndroid Build Coastguard Worker            _test_fn(torch.t, torch.rand(2, 4))
*da0073e9SAndroid Build Coastguard Worker            _test_fn(torch.transpose, torch.rand(2, 4), 0, 1)
*da0073e9SAndroid Build Coastguard Worker            _test_fn(torch.unbind, torch.rand(1, 5))
*da0073e9SAndroid Build Coastguard Worker            _test_fn(torch.ops.aten.unfold.default, torch.rand(1, 5), 1, 3, 2)
*da0073e9SAndroid Build Coastguard Worker            _test_fn(torch.unsqueeze, torch.rand(2, 4), -2)
*da0073e9SAndroid Build Coastguard Worker            _test_fn(torch.ops.aten.view.default, torch.rand(2, 10), (-1, 5, 2))
*da0073e9SAndroid Build Coastguard Worker            _test_fn(torch.view_as_complex, torch.rand(2, 2))
*da0073e9SAndroid Build Coastguard Worker            _test_fn(torch.view_as_real, torch.rand(2, 2, dtype=torch.cfloat))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # test view chains
*da0073e9SAndroid Build Coastguard Worker            _test_fn(
*da0073e9SAndroid Build Coastguard Worker                lambda x: x.unsqueeze(-1).transpose(-1, -2).squeeze(1),
*da0073e9SAndroid Build Coastguard Worker                torch.randn(2, 4),
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            _test_fn(
*da0073e9SAndroid Build Coastguard Worker                lambda x: x.chunk(2, -1)[0].transpose(0, 1).unsqueeze(-1),
*da0073e9SAndroid Build Coastguard Worker                torch.randn(2, 3, 4),
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            _test_fn(
*da0073e9SAndroid Build Coastguard Worker                lambda x: x.split_with_sizes([1, 3], -1)[0].chunk(2, 0),
*da0073e9SAndroid Build Coastguard Worker                torch.randn(2, 3, 4),
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # chains with missing view_func()s use as_strided() to cover the gaps
*da0073e9SAndroid Build Coastguard Worker            def chain_with_only_parent_view_func(x):
*da0073e9SAndroid Build Coastguard Worker                with torch.autograd._force_original_view_tracking(True):
*da0073e9SAndroid Build Coastguard Worker                    x = x.split_with_sizes([1, 3], -1)[0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                with torch.autograd._force_original_view_tracking(False):
*da0073e9SAndroid Build Coastguard Worker                    x = x.chunk(2, 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            _test_fn(chain_with_only_parent_view_func, torch.randn(2, 3, 4))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def chain_with_only_current_view_func(x):
*da0073e9SAndroid Build Coastguard Worker                with torch.autograd._force_original_view_tracking(False):
*da0073e9SAndroid Build Coastguard Worker                    x = x.split_with_sizes([1, 3], -1)[0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                with torch.autograd._force_original_view_tracking(True):
*da0073e9SAndroid Build Coastguard Worker                    x = x.chunk(2, 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            _test_fn(chain_with_only_current_view_func, torch.randn(2, 3, 4))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # TODO: Move this somewhere else
*da0073e9SAndroid Build Coastguard Worker            # test NT views
*da0073e9SAndroid Build Coastguard Worker            from torch.nested._internal.nested_tensor import (
*da0073e9SAndroid Build Coastguard Worker                nested_view_from_values_offsets,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            values = torch.randn(10, 5)
*da0073e9SAndroid Build Coastguard Worker            offsets = torch.tensor([0, 3, 6, 10])
*da0073e9SAndroid Build Coastguard Worker            _test_fn(nested_view_from_values_offsets, values, offsets)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            nt = nested_view_from_values_offsets(values, offsets).clone().detach()
*da0073e9SAndroid Build Coastguard Worker            _test_fn(
*da0073e9SAndroid Build Coastguard Worker                torch.ops.aten._nested_get_values.default, nt, use_unsafe_view_func=True
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def chain_nt_to_dense_back_and_forth(nt):
*da0073e9SAndroid Build Coastguard Worker                # NJT1 -> dense -> NJT2 -> dense
*da0073e9SAndroid Build Coastguard Worker                offsets2 = nt.offsets().clone().detach()
*da0073e9SAndroid Build Coastguard Worker                return nested_view_from_values_offsets(nt.values(), offsets2).values()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            _test_fn(chain_nt_to_dense_back_and_forth, nt, use_unsafe_view_func=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def chain_dense_to_nt_back_and_forth(values, offsets):
*da0073e9SAndroid Build Coastguard Worker                offsets2 = offsets.clone().detach()
*da0073e9SAndroid Build Coastguard Worker                # dense -> NJT1 -> dense -> NJT2
*da0073e9SAndroid Build Coastguard Worker                return nested_view_from_values_offsets(
*da0073e9SAndroid Build Coastguard Worker                    nested_view_from_values_offsets(values, offsets).values(), offsets2
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            _test_fn(
*da0073e9SAndroid Build Coastguard Worker                chain_dense_to_nt_back_and_forth,
*da0073e9SAndroid Build Coastguard Worker                values,
*da0073e9SAndroid Build Coastguard Worker                offsets,
*da0073e9SAndroid Build Coastguard Worker                use_unsafe_view_func=True,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_view_func_replay_with_modified_state(self):
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd._force_original_view_tracking(True):
*da0073e9SAndroid Build Coastguard Worker            base = torch.randn(3, 4, 5)
*da0073e9SAndroid Build Coastguard Worker            view = base.select(1, 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def symint_visitor_fn(x):
*da0073e9SAndroid Build Coastguard Worker                # modify saved index
*da0073e9SAndroid Build Coastguard Worker                return x + 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # ensure modifying state changes view replay
*da0073e9SAndroid Build Coastguard Worker            new_base = torch.randn_like(base)
*da0073e9SAndroid Build Coastguard Worker            new_view = view._view_func(new_base, symint_visitor_fn=symint_visitor_fn)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(new_view, new_base.select(1, 3))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # ensure saved state reverts back afterwards
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(view._view_func(new_base), new_base.select(1, 2))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # check modifying tensor state. currently, slice_inverse() is the only
*da0073e9SAndroid Build Coastguard Worker            # view that saves a tensor
*da0073e9SAndroid Build Coastguard Worker            base = torch.randn(3, 4, 5)
*da0073e9SAndroid Build Coastguard Worker            sliced = base[:, 2:3, :].detach()
*da0073e9SAndroid Build Coastguard Worker            view = torch.ops.aten.slice_inverse(sliced, base, 1, 2, 3, 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            replacement_shape = (1, 2, 3)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def tensor_visitor_fn(x):
*da0073e9SAndroid Build Coastguard Worker                # return tensor with a smaller shape than the saved one
*da0073e9SAndroid Build Coastguard Worker                return torch.randn(*replacement_shape)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # ensure modifying state changes view replay
*da0073e9SAndroid Build Coastguard Worker            new_sliced = torch.ones_like(base)[:, 2:3, :].detach()
*da0073e9SAndroid Build Coastguard Worker            new_view = view._view_func(new_sliced, tensor_visitor_fn=tensor_visitor_fn)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(new_view.shape, replacement_shape)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker                new_view, new_sliced.as_strided(replacement_shape, (6, 3, 1))
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # ensure saved state reverts back afterwards
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(view._view_func(sliced), base)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_setup_context_when_forward_has_default_args(self):
*da0073e9SAndroid Build Coastguard Worker        class PowFunction(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(x, y=3):
*da0073e9SAndroid Build Coastguard Worker                return torch.pow(x, y)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def setup_context(ctx, inputs, output):
*da0073e9SAndroid Build Coastguard Worker                x, y = inputs
*da0073e9SAndroid Build Coastguard Worker                ctx.save_for_backward(x)
*da0073e9SAndroid Build Coastguard Worker                ctx.y = y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                (x,) = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                y = ctx.y
*da0073e9SAndroid Build Coastguard Worker                return gO * y * torch.pow(x, y - 1), None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class PowFunctionWithClassmethod(Function):
*da0073e9SAndroid Build Coastguard Worker            @classmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(cls, x, y=3):
*da0073e9SAndroid Build Coastguard Worker                return torch.pow(x, y)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @classmethod
*da0073e9SAndroid Build Coastguard Worker            def setup_context(cls, ctx, inputs, output):
*da0073e9SAndroid Build Coastguard Worker                x, y = inputs
*da0073e9SAndroid Build Coastguard Worker                ctx.save_for_backward(x)
*da0073e9SAndroid Build Coastguard Worker                ctx.y = y
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @classmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(cls, ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                (x,) = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                y = ctx.y
*da0073e9SAndroid Build Coastguard Worker                return gO * y * torch.pow(x, y - 1), None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.tensor(2.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        y = torch.tensor(8.0)
*da0073e9SAndroid Build Coastguard Worker        y_expected = torch.tensor(12.0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        y1 = PowFunction.apply(x)
*da0073e9SAndroid Build Coastguard Worker        (y1_expected,) = torch.autograd.grad(y1, x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        y2 = PowFunctionWithClassmethod.apply(x)
*da0073e9SAndroid Build Coastguard Worker        (y2_expected,) = torch.autograd.grad(y2, x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y, y1)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y_expected, y1_expected)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y, y2)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y_expected, y2_expected)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @unittest.skipIf(not TEST_CUDA, "test requires CUDA")
*da0073e9SAndroid Build Coastguard Worker    def test_gradcheck_default_device_placement_context(self):
*da0073e9SAndroid Build Coastguard Worker        # During gradcheck with fast_mode=True, we create a random vector on the CPU device using a CPU generator.
*da0073e9SAndroid Build Coastguard Worker        # This test ensures that this still works when the default device is set to something else by the user.
*da0073e9SAndroid Build Coastguard Worker        with torch.device("cuda"):
*da0073e9SAndroid Build Coastguard Worker            x = torch.randn(3, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def func(inp):
*da0073e9SAndroid Build Coastguard Worker                return inp**2.0
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(gradcheck(func, x, fast_mode=True))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef index_perm_variable(shape, max_indices):
*da0073e9SAndroid Build Coastguard Worker    if not isinstance(shape, tuple):
*da0073e9SAndroid Build Coastguard Worker        shape = (shape,)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    index = torch.randperm(max_indices).narrow(0, 0, reduce(mul, shape)).view(shape)
*da0073e9SAndroid Build Coastguard Worker    return index
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef bernoulli_scalar():
*da0073e9SAndroid Build Coastguard Worker    return torch.tensor(0, dtype=torch.uint8).bernoulli_()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass TestAutogradForwardModeBatchedGrad(TestCase):
*da0073e9SAndroid Build Coastguard Worker    def test_out_of_place_basic(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.rand(4, 4, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = torch.rand(4, 4, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(
*da0073e9SAndroid Build Coastguard Worker            gradcheck(
*da0073e9SAndroid Build Coastguard Worker                torch.sin,
*da0073e9SAndroid Build Coastguard Worker                a,
*da0073e9SAndroid Build Coastguard Worker                check_forward_ad=True,
*da0073e9SAndroid Build Coastguard Worker                check_batched_grad=True,
*da0073e9SAndroid Build Coastguard Worker                check_batched_forward_grad=True,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(
*da0073e9SAndroid Build Coastguard Worker            gradcheck(
*da0073e9SAndroid Build Coastguard Worker                torch.add,
*da0073e9SAndroid Build Coastguard Worker                (a, b),
*da0073e9SAndroid Build Coastguard Worker                check_forward_ad=True,
*da0073e9SAndroid Build Coastguard Worker                check_batched_grad=True,
*da0073e9SAndroid Build Coastguard Worker                check_batched_forward_grad=True,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_out_of_place_not_same_layout(self):
*da0073e9SAndroid Build Coastguard Worker        input = torch.zeros([2, 2]).transpose(0, 1)
*da0073e9SAndroid Build Coastguard Worker        tangent = torch.zeros([2, 2, 2])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def jvp(tangent):
*da0073e9SAndroid Build Coastguard Worker            with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker                x = fwAD.make_dual(input, tangent)
*da0073e9SAndroid Build Coastguard Worker                return fwAD.unpack_dual(x)[1]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x_tangent = torch._vmap_internals._vmap(jvp, 0, 0)(tangent)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNot(x_tangent, tangent)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inplace_on_view_same_layout(self):
*da0073e9SAndroid Build Coastguard Worker        input = torch.zeros([2, 2])
*da0073e9SAndroid Build Coastguard Worker        tangent = torch.zeros([2, 2, 2])
*da0073e9SAndroid Build Coastguard Worker        base = torch.zeros([2, 2])
*da0073e9SAndroid Build Coastguard Worker        view = base.view_as(base)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def jvp(tangent):
*da0073e9SAndroid Build Coastguard Worker            with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker                x = fwAD.make_dual(input, tangent)
*da0073e9SAndroid Build Coastguard Worker                view.copy_(x)
*da0073e9SAndroid Build Coastguard Worker                return (
*da0073e9SAndroid Build Coastguard Worker                    fwAD.unpack_dual(x)[1],
*da0073e9SAndroid Build Coastguard Worker                    fwAD.unpack_dual(view)[1],
*da0073e9SAndroid Build Coastguard Worker                    fwAD.unpack_dual(view._base)[1],
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x_tangent, view_tangent, base_tangent = torch._vmap_internals._vmap(jvp, 0, 0)(
*da0073e9SAndroid Build Coastguard Worker            tangent
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(
*da0073e9SAndroid Build Coastguard Worker            view_tangent._is_view()
*da0073e9SAndroid Build Coastguard Worker        )  # Optimization to share the same tensor!
*da0073e9SAndroid Build Coastguard Worker        self.assertIs(view_tangent, base_tangent)
*da0073e9SAndroid Build Coastguard Worker        self.assertIs(x_tangent, tangent)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inplace_on_view_not_same_layout(self):
*da0073e9SAndroid Build Coastguard Worker        input = torch.zeros([2, 2])
*da0073e9SAndroid Build Coastguard Worker        tangent = torch.zeros([2, 2, 2])
*da0073e9SAndroid Build Coastguard Worker        view = torch.zeros([2, 2]).transpose(0, 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def jvp(tangent):
*da0073e9SAndroid Build Coastguard Worker            with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker                x = fwAD.make_dual(input, tangent)
*da0073e9SAndroid Build Coastguard Worker                view.copy_(x)
*da0073e9SAndroid Build Coastguard Worker                return (
*da0073e9SAndroid Build Coastguard Worker                    fwAD.unpack_dual(x)[1],
*da0073e9SAndroid Build Coastguard Worker                    fwAD.unpack_dual(view)[1],
*da0073e9SAndroid Build Coastguard Worker                    fwAD.unpack_dual(view._base)[1],
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x_tangent, view_tangent, base_tangent = torch._vmap_internals._vmap(jvp, 0, 0)(
*da0073e9SAndroid Build Coastguard Worker            tangent
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertIs(view_tangent._base, base_tangent)
*da0073e9SAndroid Build Coastguard Worker        self.assertIs(x_tangent, tangent)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNot(view_tangent, tangent)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_metadata_check_for_storage_numel_skipped(self):
*da0073e9SAndroid Build Coastguard Worker        # See: test_metadata_check_checks_storage_numel for the reverse of this test
*da0073e9SAndroid Build Coastguard Worker        primal = torch.randn(5)[:4].detach()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(len(primal.storage()), 5)
*da0073e9SAndroid Build Coastguard Worker        tangent = torch.randn(10, 4)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def jvp(tangent):
*da0073e9SAndroid Build Coastguard Worker            with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker                dual = fwAD.make_dual(primal, tangent)
*da0073e9SAndroid Build Coastguard Worker                _, unpacked_tangent = fwAD.unpack_dual(dual)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # No copy is made
*da0073e9SAndroid Build Coastguard Worker                self.assertIs(tangent, unpacked_tangent)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # as_strided raises
*da0073e9SAndroid Build Coastguard Worker                with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                    RuntimeError, "can access memory outside of `tensor`"
*da0073e9SAndroid Build Coastguard Worker                ):
*da0073e9SAndroid Build Coastguard Worker                    dual.as_strided((5,), (1,), 0)
*da0073e9SAndroid Build Coastguard Worker            return unpacked_tangent
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        torch._vmap_internals._vmap(jvp, 0, 0)(tangent)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass TestAutogradForwardMode(TestCase):
*da0073e9SAndroid Build Coastguard Worker    def tearDown(self):
*da0073e9SAndroid Build Coastguard Worker        # Ensure that a failing test won't make others fail
*da0073e9SAndroid Build Coastguard Worker        while fwAD._current_level >= 0:
*da0073e9SAndroid Build Coastguard Worker            fwAD.exit_dual_level()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        super().tearDown()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_forward_level_cleanup(self):
*da0073e9SAndroid Build Coastguard Worker        def get_tensor_and_weak_ref():
*da0073e9SAndroid Build Coastguard Worker            # Create a new Tensor and weak reference
*da0073e9SAndroid Build Coastguard Worker            t = torch.rand(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            return t, torch._C._WeakTensorRef(t)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Sanity check that the helper function works as expected
*da0073e9SAndroid Build Coastguard Worker        t, t_ref = get_tensor_and_weak_ref()
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(t_ref.expired())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        del t
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(t_ref.expired())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Main test code
*da0073e9SAndroid Build Coastguard Worker        foo = torch.rand(2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            tangent, tangent_ref = get_tensor_and_weak_ref()
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(tangent_ref.expired())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            dual = fwAD.make_dual(foo, tangent)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(tangent_ref.expired())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Make sure that the tangent we provided has been re-used as is
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(fwAD.unpack_dual(dual)[1] is tangent)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Make sure that dual is keeping the tangent alive
*da0073e9SAndroid Build Coastguard Worker            del tangent
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(tangent_ref.expired())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Make sure that the dual level does not keep the c++
*da0073e9SAndroid Build Coastguard Worker            # version of the tangent alive
*da0073e9SAndroid Build Coastguard Worker            del dual
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(tangent_ref.expired())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_size_check(self):
*da0073e9SAndroid Build Coastguard Worker        foo = torch.rand(2)
*da0073e9SAndroid Build Coastguard Worker        tangent = torch.rand(3)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError,
*da0073e9SAndroid Build Coastguard Worker                "Trying to set a forward gradient that has a different size",
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                dual = fwAD.make_dual(foo, tangent)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            dual = fwAD.make_dual(foo, tangent[1:])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_metadata_check_checks_storage_numel(self):
*da0073e9SAndroid Build Coastguard Worker        primal = torch.randn(5)[:4].detach()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(len(primal.storage()), 5)
*da0073e9SAndroid Build Coastguard Worker        tangent = torch.randn(4)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            dual = fwAD.make_dual(primal, tangent)
*da0073e9SAndroid Build Coastguard Worker            _, unpacked_tangent = fwAD.unpack_dual(dual)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # # Verify that mutating unpacked tangent does not affect the original tangent
*da0073e9SAndroid Build Coastguard Worker            tangent_clone = tangent.clone()
*da0073e9SAndroid Build Coastguard Worker            unpacked_tangent *= 2
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.allclose(tangent_clone, tangent))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # as_strided runs without error
*da0073e9SAndroid Build Coastguard Worker            dual.as_strided((5,), (1,), 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_metadata_check_checks_ignores_size_zero(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.ones(0).as_strided((0, 1), (1, 1), 0)
*da0073e9SAndroid Build Coastguard Worker        b = torch.ones(0).as_strided((0, 1), (1, 0), 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            dual = fwAD.make_dual(a, b)
*da0073e9SAndroid Build Coastguard Worker            torch.diagonal(dual, offset=0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        input = torch.rand([0, 1], dtype=torch.complex128, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        func = partial(torch.diagonal, offset=0)
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.gradcheck(func, (input,), check_forward_ad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_metadata_check_when_primal_has_conj_bit(self):
*da0073e9SAndroid Build Coastguard Worker        # Make sure the _has_same_storage_numel is a fallthrough, so that
*da0073e9SAndroid Build Coastguard Worker        # conj bit does not materialize. If it materializes it would
*da0073e9SAndroid Build Coastguard Worker        # cause the layout check to fail for views that do not index the
*da0073e9SAndroid Build Coastguard Worker        # the entire storage.
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(2, 2, dtype=torch.cdouble).conj()
*da0073e9SAndroid Build Coastguard Worker        b = torch.rand_like(a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(torch.is_conj(a))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(len(a.storage()), len(b.storage()))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            dual = fwAD.make_dual(a, b)
*da0073e9SAndroid Build Coastguard Worker            dual[1:]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_metadata_check_when_primal_has_neg_bit(self):
*da0073e9SAndroid Build Coastguard Worker        # Make sure the _has_same_storage_numel is a fallthrough, so that
*da0073e9SAndroid Build Coastguard Worker        # conj bit does not materialize. If it materializes it would
*da0073e9SAndroid Build Coastguard Worker        # cause the layout check to fail for views that do not index the
*da0073e9SAndroid Build Coastguard Worker        # the entire storage.
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(2, 2, dtype=torch.cdouble).conj().imag
*da0073e9SAndroid Build Coastguard Worker        b = torch.randn(2, 2, dtype=torch.cdouble).imag
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(torch.is_neg(a))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(len(a.storage()), len(b.storage()))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            dual = fwAD.make_dual(a, b)
*da0073e9SAndroid Build Coastguard Worker            dual[1:]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_metadata_check_check_conj(self):
*da0073e9SAndroid Build Coastguard Worker        keys = {
*da0073e9SAndroid Build Coastguard Worker            "NEITHER": lambda x: x,
*da0073e9SAndroid Build Coastguard Worker            "CONJ": lambda x: x.conj(),
*da0073e9SAndroid Build Coastguard Worker            "NEG": lambda x: x._neg_view(),
*da0073e9SAndroid Build Coastguard Worker        }
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for primal_key, tangent_key in product(keys, keys):
*da0073e9SAndroid Build Coastguard Worker            x = keys[primal_key](torch.randn(2, 3, 4, dtype=torch.cdouble))
*da0073e9SAndroid Build Coastguard Worker            t = keys[tangent_key](torch.randn(2, 3, 4, dtype=torch.cdouble))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            if primal_key == tangent_key:
*da0073e9SAndroid Build Coastguard Worker                with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker                    dual = fwAD.make_dual(x, t)
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(fwAD.unpack_dual(dual).tangent is t)
*da0073e9SAndroid Build Coastguard Worker                    torch.real(dual)
*da0073e9SAndroid Build Coastguard Worker                    torch.imag(dual)
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker                    dual = fwAD.make_dual(x, t)
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(fwAD.unpack_dual(dual).tangent is not t)
*da0073e9SAndroid Build Coastguard Worker                    torch.real(dual)
*da0073e9SAndroid Build Coastguard Worker                    torch.imag(dual)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_metadata_check_ignore_storage_offset_for_zero_numel_tensor(self):
*da0073e9SAndroid Build Coastguard Worker        # See https://github.com/pytorch/pytorch/issues/80507
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor([1.0]).as_strided((0,), (1,), 1)
*da0073e9SAndroid Build Coastguard Worker        b = torch.tensor([1.0]).as_strided((0,), (1,), 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            dual_input = fwAD.make_dual(a, b)
*da0073e9SAndroid Build Coastguard Worker            # Check that no copy is made
*da0073e9SAndroid Build Coastguard Worker            self.assertIs(fwAD.unpack_dual(dual_input).tangent, b)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor([1.0]).as_strided((1,), (2,), 0)
*da0073e9SAndroid Build Coastguard Worker        b = torch.tensor([1.0]).as_strided((1,), (1,), 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            dual_input = fwAD.make_dual(a, b)
*da0073e9SAndroid Build Coastguard Worker            dual_input[1:]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # The following test functions want to ensure all the following behaviors:
*da0073e9SAndroid Build Coastguard Worker    #   - Ensure that default level system in the python binding works
*da0073e9SAndroid Build Coastguard Worker    #   - Ensure that only level 0 exists and nesting is properly disabled
*da0073e9SAndroid Build Coastguard Worker    #   - Ensure that printing works fine
*da0073e9SAndroid Build Coastguard Worker    #   - Ensure that basic packing/unpacking works
*da0073e9SAndroid Build Coastguard Worker    #   - Ensure that advanced packing/unpacking works
*da0073e9SAndroid Build Coastguard Worker    #     - For memory / version counter share
*da0073e9SAndroid Build Coastguard Worker    #     - For backward AD (regular ops)
*da0073e9SAndroid Build Coastguard Worker    #   - Ensure that view + inplace for both modes work fine
*da0073e9SAndroid Build Coastguard Worker    #   - Ensure we do proper cleanup on exit of a level
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_default_level(self):
*da0073e9SAndroid Build Coastguard Worker        foo = torch.rand(2)
*da0073e9SAndroid Build Coastguard Worker        bar = torch.rand(2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            baz = fwAD.make_dual(foo, bar)
*da0073e9SAndroid Build Coastguard Worker            baz_primal, baz_tangent = fwAD.unpack_dual(baz)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(baz_primal, foo)
*da0073e9SAndroid Build Coastguard Worker        # We don't actually need to enforce that these two are the exact same python
*da0073e9SAndroid Build Coastguard Worker        # object, feel free to relax in the future
*da0073e9SAndroid Build Coastguard Worker        self.assertIs(baz_tangent, bar)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        baz_primal, baz_tangent = fwAD.unpack_dual(baz)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(baz_primal, foo)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(baz_tangent, None)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_fwd_grad_enabled(self):
*da0073e9SAndroid Build Coastguard Worker        # Tests some private helper functions to enable/disable fwd grad mode
*da0073e9SAndroid Build Coastguard Worker        enabled = fwAD._is_fwd_grad_enabled()
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(enabled)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        try:
*da0073e9SAndroid Build Coastguard Worker            torch._C._set_fwd_grad_enabled(False)
*da0073e9SAndroid Build Coastguard Worker            enabled = fwAD._is_fwd_grad_enabled()
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(enabled)
*da0073e9SAndroid Build Coastguard Worker        finally:
*da0073e9SAndroid Build Coastguard Worker            torch._C._set_fwd_grad_enabled(True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        enabled = fwAD._is_fwd_grad_enabled()
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(enabled)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_set_fwd_grad_enabled(self):
*da0073e9SAndroid Build Coastguard Worker        # Tests a private helper function
*da0073e9SAndroid Build Coastguard Worker        try:
*da0073e9SAndroid Build Coastguard Worker            torch._C._set_fwd_grad_enabled(False)
*da0073e9SAndroid Build Coastguard Worker            enabled = fwAD._is_fwd_grad_enabled()
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(enabled)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            with fwAD._set_fwd_grad_enabled(True):
*da0073e9SAndroid Build Coastguard Worker                enabled = fwAD._is_fwd_grad_enabled()
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(enabled)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            enabled = fwAD._is_fwd_grad_enabled()
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(enabled)
*da0073e9SAndroid Build Coastguard Worker        finally:
*da0073e9SAndroid Build Coastguard Worker            torch._C._set_fwd_grad_enabled(True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_nested_level(self):
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level() as level:
*da0073e9SAndroid Build Coastguard Worker            # For now only level 0 exists
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(level, 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError, "Nested forward mode AD is not supported at the moment"
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                nest_level = fwAD.enter_dual_level()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_set_fw_grad_having_own_fw_grad_at_same_level(self):
*da0073e9SAndroid Build Coastguard Worker        foo = torch.rand(2)
*da0073e9SAndroid Build Coastguard Worker        bar = torch.rand(2)
*da0073e9SAndroid Build Coastguard Worker        baz = torch.rand(2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            dual = fwAD.make_dual(foo, bar)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError, "has a forward gradient at the same level"
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                fwAD.make_dual(baz, dual)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_codegen_ignores_undefined_outputs(self):
*da0073e9SAndroid Build Coastguard Worker        # This test checks that codegen silently ignores undefined outputs
*da0073e9SAndroid Build Coastguard Worker        # Below, grad_input is specified as False in grad_output_mask, so
*da0073e9SAndroid Build Coastguard Worker        # convolution backward will return a undefined tensor in that position.
*da0073e9SAndroid Build Coastguard Worker        # Note that for this test to work we need to make sure either grad_output
*da0073e9SAndroid Build Coastguard Worker        # or weight to be a dual tensor, so grad_input requires forward grad
*da0073e9SAndroid Build Coastguard Worker        weight = torch.randn(6, 1, 30, 30)
*da0073e9SAndroid Build Coastguard Worker        inp = torch.rand((1, 1, 32, 32))
*da0073e9SAndroid Build Coastguard Worker        out = torch.nn.functional.conv2d(inp, weight)
*da0073e9SAndroid Build Coastguard Worker        grad_out = torch.ones_like(out)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            dual_weight = fwAD.make_dual(weight, torch.ones_like(weight))
*da0073e9SAndroid Build Coastguard Worker            grad_input, _, _ = torch.ops.aten.convolution_backward(
*da0073e9SAndroid Build Coastguard Worker                grad_out,
*da0073e9SAndroid Build Coastguard Worker                inp,
*da0073e9SAndroid Build Coastguard Worker                dual_weight,
*da0073e9SAndroid Build Coastguard Worker                (0,),
*da0073e9SAndroid Build Coastguard Worker                (1, 1),
*da0073e9SAndroid Build Coastguard Worker                (0, 0),
*da0073e9SAndroid Build Coastguard Worker                (1, 1),
*da0073e9SAndroid Build Coastguard Worker                False,
*da0073e9SAndroid Build Coastguard Worker                (0, 0),
*da0073e9SAndroid Build Coastguard Worker                1,
*da0073e9SAndroid Build Coastguard Worker                (False, True, False),
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(grad_input)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_make_dual_inference_tensor_in_inference_mode(self):
*da0073e9SAndroid Build Coastguard Worker        with torch.inference_mode():
*da0073e9SAndroid Build Coastguard Worker            foo = torch.rand(2)
*da0073e9SAndroid Build Coastguard Worker            bar = torch.rand(2)
*da0073e9SAndroid Build Coastguard Worker            foo_copy = foo.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker                dual = fwAD.make_dual(foo, bar)
*da0073e9SAndroid Build Coastguard Worker                self.assertFalse(dual._is_view())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                dual += 1
*da0073e9SAndroid Build Coastguard Worker                self.assertFalse(torch.allclose(foo, foo_copy))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_make_dual_torch_dispatch(self):
*da0073e9SAndroid Build Coastguard Worker        counter = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class MySubclass(torch.Tensor):
*da0073e9SAndroid Build Coastguard Worker            def __new__(cls, data=None):
*da0073e9SAndroid Build Coastguard Worker                return torch.Tensor._make_subclass(cls, data)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @classmethod
*da0073e9SAndroid Build Coastguard Worker            def __torch_dispatch__(cls, func, types, args=(), kwargs=None):
*da0073e9SAndroid Build Coastguard Worker                if func.overloadpacket == torch.ops.aten.alias:
*da0073e9SAndroid Build Coastguard Worker                    counter[0] += 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    # Make sure we can re-enable autograd here
*da0073e9SAndroid Build Coastguard Worker                    with torch.overrides.enable_reentrant_dispatch():
*da0073e9SAndroid Build Coastguard Worker                        foo = torch.rand(1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker                        self.assertIsNotNone(foo.exp().grad_fn)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                with no_dispatch():
*da0073e9SAndroid Build Coastguard Worker                    return func(*args, **kwargs)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0)
*da0073e9SAndroid Build Coastguard Worker        s = MySubclass(a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            # Only the primal has "alias" called on it
*da0073e9SAndroid Build Coastguard Worker            fwAD.make_dual(s, torch.rand_like(s))
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(counter[0], 1)
*da0073e9SAndroid Build Coastguard Worker            fwAD.make_dual(torch.rand_like(s), s)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(counter[0], 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_make_dual_forbid_integral_dtype(self):
*da0073e9SAndroid Build Coastguard Worker        primal_f = torch.ones(2, 2, dtype=torch.float)
*da0073e9SAndroid Build Coastguard Worker        primal_l = torch.ones(2, 2, dtype=torch.long)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        tangent_f = torch.ones(2, 2, dtype=torch.float)
*da0073e9SAndroid Build Coastguard Worker        tangent_l = torch.ones(2, 2, dtype=torch.long)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            # Float Primal and Long Tangent
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                ValueError, "Expected tangent to be floating point or complex"
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                fwAD.make_dual(primal_f, tangent_l)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Long Primal and Long Tangent
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                ValueError, "Expected primal to be floating point or complex"
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                fwAD.make_dual(primal_l, tangent_l)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Long Primal and Float Tangent
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                ValueError, "Expected primal to be floating point or complex"
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                fwAD.make_dual(primal_l, tangent_f)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_print(self):
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level() as level:
*da0073e9SAndroid Build Coastguard Worker            a = torch.rand(3)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse("tangent=" in str(a))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            b = fwAD.make_dual(a, torch.rand(3))
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse("tangent=" in str(a))
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue("tangent=" in str(b))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            b_primal, b_tangent = fwAD.unpack_dual(b)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse("tangent=" in str(b_primal))
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse("tangent=" in str(b_tangent))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_basic_packing_unpacking(self):
*da0073e9SAndroid Build Coastguard Worker        foo = torch.rand(2)
*da0073e9SAndroid Build Coastguard Worker        bar = torch.rand(2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            baz = fwAD.make_dual(foo, bar)
*da0073e9SAndroid Build Coastguard Worker            baz_primal, baz_tangent = fwAD.unpack_dual(baz)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(baz_primal, foo)
*da0073e9SAndroid Build Coastguard Worker            self.assertIs(baz_tangent, bar)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Check unpacked dual is returned as a named tuple
*da0073e9SAndroid Build Coastguard Worker            # NB: Every invocation of unpack_dual returns a new tensor view
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNot(baz_primal, fwAD.unpack_dual(baz).primal)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(baz_primal, fwAD.unpack_dual(baz).primal)
*da0073e9SAndroid Build Coastguard Worker            self.assertIs(baz_tangent, fwAD.unpack_dual(baz).tangent)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Check that packing/unpacking did not change the input
*da0073e9SAndroid Build Coastguard Worker            foo_primal, foo_tangent = fwAD.unpack_dual(foo)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(foo_primal, foo)
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(foo_tangent)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_advanced_packing_unpacking(self):
*da0073e9SAndroid Build Coastguard Worker        foo = torch.rand(2)
*da0073e9SAndroid Build Coastguard Worker        bar = torch.ones(2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Memory and version counter check
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            dual = fwAD.make_dual(foo, bar)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Ensure that they are sharing memory and version counter
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(dual.storage().data_ptr(), foo.storage().data_ptr())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Ensure we properly share the version counter
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(foo._version, dual._version)
*da0073e9SAndroid Build Coastguard Worker            foo.add_(1)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(foo._version, dual._version)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Unpacking should only create aliases as well
*da0073e9SAndroid Build Coastguard Worker            dual_primal, dual_tangent = fwAD.unpack_dual(dual)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(dual_primal.storage().data_ptr(), foo.storage().data_ptr())
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker                dual_tangent.storage().data_ptr(), bar.storage().data_ptr()
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            # And the tangent is actually re-used as-is so it is still the same Tensor
*da0073e9SAndroid Build Coastguard Worker            self.assertIs(dual_tangent, bar)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Ensure we properly share the version counter
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(foo._version, dual_primal._version)
*da0073e9SAndroid Build Coastguard Worker            foo.add_(1)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(foo._version, dual_primal._version)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(bar._version, dual_tangent._version)
*da0073e9SAndroid Build Coastguard Worker            bar.add_(1)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(bar._version, dual_tangent._version)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # backward mode check
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            foo.requires_grad_()
*da0073e9SAndroid Build Coastguard Worker            bar.requires_grad_()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Check that backward gradients properly propagates through packing/unpacking
*da0073e9SAndroid Build Coastguard Worker            dual = fwAD.make_dual(foo, bar)
*da0073e9SAndroid Build Coastguard Worker            p, t = fwAD.unpack_dual(dual)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            gfoo, gbar = torch.autograd.grad(
*da0073e9SAndroid Build Coastguard Worker                p.sum(), (foo, bar), retain_graph=True, allow_unused=True
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(gfoo, torch.ones_like(foo))
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(gbar)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            gfoo, gbar = torch.autograd.grad(
*da0073e9SAndroid Build Coastguard Worker                t.sum(), (foo, bar), retain_graph=True, allow_unused=True
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(gfoo)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(gbar, torch.ones_like(bar))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Check that forward gradients are impacted by detach()
*da0073e9SAndroid Build Coastguard Worker            detached_dual = dual.detach()
*da0073e9SAndroid Build Coastguard Worker            out = detached_dual * 2
*da0073e9SAndroid Build Coastguard Worker            p, t = fwAD.unpack_dual(out)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(p.requires_grad)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(p, foo * 2)
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(t)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Check that forward gradients are not impacted by no_grad
*da0073e9SAndroid Build Coastguard Worker            with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker                out = dual * 3
*da0073e9SAndroid Build Coastguard Worker            p, t = fwAD.unpack_dual(out)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(p.requires_grad)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(t.requires_grad)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(p, foo * 3)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(t, bar * 3)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Check that forward gradients are not impacted by inplace detach
*da0073e9SAndroid Build Coastguard Worker            dual = dual.clone()
*da0073e9SAndroid Build Coastguard Worker            dual.detach_()
*da0073e9SAndroid Build Coastguard Worker            out = dual * 2
*da0073e9SAndroid Build Coastguard Worker            p, t = fwAD.unpack_dual(out)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(p.requires_grad)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(p, foo * 2)
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(t)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_view_inplace_non_differentiable_views(self):
*da0073e9SAndroid Build Coastguard Worker        original_foo = torch.rand(2, dtype=torch.double)
*da0073e9SAndroid Build Coastguard Worker        original_bar = torch.ones(2, dtype=torch.double)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Do clones to be able to compare the values updated inplace
*da0073e9SAndroid Build Coastguard Worker        # with the original content of these Tensors
*da0073e9SAndroid Build Coastguard Worker        foo = original_foo.clone()
*da0073e9SAndroid Build Coastguard Worker        bar = original_bar.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            # Note that in this test, we use "update" to mean computing the right tangent for the dual
*da0073e9SAndroid Build Coastguard Worker            # All the inplace operations here are expected to update the primal value of the Tensors but
*da0073e9SAndroid Build Coastguard Worker            # not always their tangents.
*da0073e9SAndroid Build Coastguard Worker            # Also all mentions of "non differentiable view" here means non forward differentiable view
*da0073e9SAndroid Build Coastguard Worker            # unless specified otherwise.
*da0073e9SAndroid Build Coastguard Worker            # See note [Forward Grad View/inplace] for more details on how these views work.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Check that inplace ops do not update non-differentiable views
*da0073e9SAndroid Build Coastguard Worker            # Non differentiable view
*da0073e9SAndroid Build Coastguard Worker            dual = fwAD.make_dual(foo, bar)
*da0073e9SAndroid Build Coastguard Worker            dual *= 2
*da0073e9SAndroid Build Coastguard Worker            # Check that non differentiable view's tangent was not updated
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(fwAD.unpack_dual(foo)[1])
*da0073e9SAndroid Build Coastguard Worker            # Check that the computed result is correct
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(bar, original_bar * 2)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(fwAD.unpack_dual(dual)[1], original_bar * 2)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(foo, original_foo * 2)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(fwAD.unpack_dual(dual)[0], original_foo * 2)
*da0073e9SAndroid Build Coastguard Worker            # Other non differentiable view
*da0073e9SAndroid Build Coastguard Worker            dual_primal, dual_tangent = fwAD.unpack_dual(dual)
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(fwAD.unpack_dual(dual_primal)[1])
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(fwAD.unpack_dual(dual_tangent)[1])
*da0073e9SAndroid Build Coastguard Worker            dual_primal *= 2
*da0073e9SAndroid Build Coastguard Worker            # Ensure dual's tangent did not change
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(fwAD.unpack_dual(dual)[0], original_foo * 4)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(fwAD.unpack_dual(dual)[1], original_bar * 2)
*da0073e9SAndroid Build Coastguard Worker            dual_tangent *= 2
*da0073e9SAndroid Build Coastguard Worker            # Ensure dual's primal did not change
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(fwAD.unpack_dual(dual)[0], original_foo * 4)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(fwAD.unpack_dual(dual)[1], original_bar * 4)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_view_inplace_differentiable_views(self):
*da0073e9SAndroid Build Coastguard Worker        original_foo = torch.rand(2)
*da0073e9SAndroid Build Coastguard Worker        original_bar = torch.ones(2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Do clones to be able to compare the values updated inplace
*da0073e9SAndroid Build Coastguard Worker        # with the original content of these Tensors
*da0073e9SAndroid Build Coastguard Worker        foo = original_foo.clone()
*da0073e9SAndroid Build Coastguard Worker        bar = original_bar.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            # Check that inplace ops do update differentiable view but stop at non differentiable ones
*da0073e9SAndroid Build Coastguard Worker            # A non differentiable view
*da0073e9SAndroid Build Coastguard Worker            dual = fwAD.make_dual(foo, bar)
*da0073e9SAndroid Build Coastguard Worker            # A differentiable view
*da0073e9SAndroid Build Coastguard Worker            view = dual.narrow(0, 0, 1)
*da0073e9SAndroid Build Coastguard Worker            view *= 2
*da0073e9SAndroid Build Coastguard Worker            # Check that non differentiable view was not updated
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(fwAD.unpack_dual(foo)[1])
*da0073e9SAndroid Build Coastguard Worker            # Check that differentiable view was updated
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(fwAD.unpack_dual(dual)[1], torch.tensor([2.0, 1.0]))
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(fwAD.unpack_dual(view)[1], torch.tensor([2.0]))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Check that we track differentiable view even for Tensors that are not dual
*da0073e9SAndroid Build Coastguard Worker            baz = torch.rand(2)
*da0073e9SAndroid Build Coastguard Worker            baz += dual
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(fwAD.unpack_dual(baz)[1], fwAD.unpack_dual(dual)[1])
*da0073e9SAndroid Build Coastguard Worker            # Updates on view should as well
*da0073e9SAndroid Build Coastguard Worker            baz = torch.rand(2)
*da0073e9SAndroid Build Coastguard Worker            baz[0] = dual[0]
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(fwAD.unpack_dual(baz)[1][0], fwAD.unpack_dual(dual)[1][0])
*da0073e9SAndroid Build Coastguard Worker            # Unused values get a gradient of 0
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(fwAD.unpack_dual(baz)[1][1], 0.0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Check that forward non-differentiable views do prevent gradient update
*da0073e9SAndroid Build Coastguard Worker            baz = torch.rand(2)
*da0073e9SAndroid Build Coastguard Worker            view = baz.detach()
*da0073e9SAndroid Build Coastguard Worker            view += dual
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(fwAD.unpack_dual(baz)[1])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_view_inplace_always_creates_a_view(self):
*da0073e9SAndroid Build Coastguard Worker        # See https://github.com/pytorch/pytorch/issues/67800
*da0073e9SAndroid Build Coastguard Worker        # The codepath may depend on the op. At the time writing, when self is not a dual tensor
*da0073e9SAndroid Build Coastguard Worker        # the resulting forward grad for self for...
*da0073e9SAndroid Build Coastguard Worker        # - add_ has the same layout as self
*da0073e9SAndroid Build Coastguard Worker        # - mul_ has the same layout as other
*da0073e9SAndroid Build Coastguard Worker        # This is kind of fragile because the above depends on how the forward grad expression
*da0073e9SAndroid Build Coastguard Worker        # is written. For add and mul at least, the output inherits the layout of LHS.
*da0073e9SAndroid Build Coastguard Worker        # We want to handle at least these two cases.
*da0073e9SAndroid Build Coastguard Worker        inplace_binary_ops = (  # Add more to this list?
*da0073e9SAndroid Build Coastguard Worker            lambda x, y: x.add_(y),
*da0073e9SAndroid Build Coastguard Worker            lambda x, y: x.mul_(y),
*da0073e9SAndroid Build Coastguard Worker            lambda x, y: x.copy_(y),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for inplace_binary_op in inplace_binary_ops:
*da0073e9SAndroid Build Coastguard Worker            base = torch.randn(2, 2)
*da0073e9SAndroid Build Coastguard Worker            view = base.transpose(0, 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            primal = torch.randn(2, 2)
*da0073e9SAndroid Build Coastguard Worker            tangent = torch.randn(2, 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker                dual = fwAD.make_dual(primal, tangent)
*da0073e9SAndroid Build Coastguard Worker                inplace_binary_op(view, dual)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # Verify that a view relationship is created for both the primal and tangent
*da0073e9SAndroid Build Coastguard Worker                p, t = fwAD.unpack_dual(base)
*da0073e9SAndroid Build Coastguard Worker                p_clone = p.clone()
*da0073e9SAndroid Build Coastguard Worker                t_clone = t.clone()
*da0073e9SAndroid Build Coastguard Worker                view *= 2
*da0073e9SAndroid Build Coastguard Worker                p, t = fwAD.unpack_dual(base)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(torch.allclose(p_clone * 2, p))
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(torch.allclose(t_clone * 2, t))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_grad_cleanup(self):
*da0073e9SAndroid Build Coastguard Worker        foo = torch.rand(2)
*da0073e9SAndroid Build Coastguard Worker        bar = torch.rand(2)
*da0073e9SAndroid Build Coastguard Worker        baz = torch.rand(2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            dual = fwAD.make_dual(foo, bar)
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(fwAD.unpack_dual(foo)[1])
*da0073e9SAndroid Build Coastguard Worker            self.assertIs(fwAD.unpack_dual(dual)[1], bar)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(fwAD.unpack_dual(dual)[1])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(fwAD.unpack_dual(foo)[1])
*da0073e9SAndroid Build Coastguard Worker            new_dual = fwAD.make_dual(foo, baz)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            dual_primal, dual_tangent = fwAD.unpack_dual(dual)
*da0073e9SAndroid Build Coastguard Worker            new_dual_primal, new_dual_tangent = fwAD.unpack_dual(new_dual)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(dual_primal, new_dual_primal)
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(dual_tangent)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(new_dual_tangent, baz)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_detach_view_tracking(self):
*da0073e9SAndroid Build Coastguard Worker        # Default detach is both forward and backward non-differentiable
*da0073e9SAndroid Build Coastguard Worker        foo = torch.rand(2)
*da0073e9SAndroid Build Coastguard Worker        foo_weak = torch._C._WeakTensorRef(foo)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = foo.detach()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        del foo
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(foo_weak.expired())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_out_variant(self):
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            foo = fwAD.make_dual(torch.rand(2), torch.rand(2))
*da0073e9SAndroid Build Coastguard Worker            bar = torch.rand(2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, "out= function"):
*da0073e9SAndroid Build Coastguard Worker                torch.add(bar, bar, out=foo)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, "out= function"):
*da0073e9SAndroid Build Coastguard Worker                torch.add(foo, bar, out=bar)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_non_differentiable(self):
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            foo = fwAD.make_dual(torch.rand(2), torch.rand(2))
*da0073e9SAndroid Build Coastguard Worker            bar = torch.rand(2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # No differentiable outputs, shouldn't error
*da0073e9SAndroid Build Coastguard Worker            eq = foo == bar
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Inplace
*da0073e9SAndroid Build Coastguard Worker            foo.eq_(bar)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_create_new_zeros_with_same_meta(self):
*da0073e9SAndroid Build Coastguard Worker        new_zeroes_fn = torch.ops.aten._new_zeros_with_same_feature_meta
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def check(a, b):
*da0073e9SAndroid Build Coastguard Worker            def assert_same_meta(t, target):
*da0073e9SAndroid Build Coastguard Worker                for num_bdim in range(t.dim()):
*da0073e9SAndroid Build Coastguard Worker                    result = new_zeroes_fn(t, target, self_num_batch_dims=num_bdim)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(result.dim(), target.dim() + num_bdim)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    # Check size/strides match for feature dims only
*da0073e9SAndroid Build Coastguard Worker                    for i in range(num_bdim, result.dim()):
*da0073e9SAndroid Build Coastguard Worker                        self.assertEqual(result.size()[i], target.size()[i - num_bdim])
*da0073e9SAndroid Build Coastguard Worker                        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker                            result.stride()[i], target.stride()[i - num_bdim]
*da0073e9SAndroid Build Coastguard Worker                        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    # Check that we generate strides reasonably
*da0073e9SAndroid Build Coastguard Worker                    if target.is_contiguous():
*da0073e9SAndroid Build Coastguard Worker                        self.assertTrue(result.is_contiguous())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(result.storage_offset(), target.storage_offset())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    prod_of_t_bdims = reduce(operator.mul, t.size()[:num_bdim], 1)
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker                        len(result.storage()), len(target.storage()) * prod_of_t_bdims
*da0073e9SAndroid Build Coastguard Worker                    )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    # TensorOptions is same
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(result.dtype, target.dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            assert_same_meta(a, b)
*da0073e9SAndroid Build Coastguard Worker            assert_same_meta(b, a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(5, dtype=torch.float)
*da0073e9SAndroid Build Coastguard Worker        b = torch.randn(2, 3, 4, dtype=torch.double)
*da0073e9SAndroid Build Coastguard Worker        check(a, b)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # non-contiguous case
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(2, 3, 4).transpose(0, 1).contiguous().transpose(0, 1)
*da0073e9SAndroid Build Coastguard Worker        b = torch.randn(2, 3, 4)
*da0073e9SAndroid Build Coastguard Worker        check(a, b)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(5).narrow(0, 1, 2)
*da0073e9SAndroid Build Coastguard Worker        b = torch.randn(2)
*da0073e9SAndroid Build Coastguard Worker        check(a, b)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # tensor is not a view, but still does not index entirety of storage
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(5).resize_(4)
*da0073e9SAndroid Build Coastguard Worker        b = torch.randn(4)
*da0073e9SAndroid Build Coastguard Worker        check(a, b)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Zero-numel tensors
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(1, 0, 2)
*da0073e9SAndroid Build Coastguard Worker        b = torch.randn(1, 2)
*da0073e9SAndroid Build Coastguard Worker        check(a, b)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Scalar tensor
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0)
*da0073e9SAndroid Build Coastguard Worker        b = torch.randn(1, 2)
*da0073e9SAndroid Build Coastguard Worker        check(a, b)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_backward_graph_destruction(self):
*da0073e9SAndroid Build Coastguard Worker        def fn():
*da0073e9SAndroid Build Coastguard Worker            a = torch.rand(10, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            da = fwAD.make_dual(torch.rand_like(a), a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Create an object with a c++ cycle as:
*da0073e9SAndroid Build Coastguard Worker            # db -> AutogradMeta -> ForwardGrad -> db's grad
*da0073e9SAndroid Build Coastguard Worker            # db's grad -> AutogradMeta -> MulBackward
*da0073e9SAndroid Build Coastguard Worker            # MulBackward -> SavedVariable -> db
*da0073e9SAndroid Build Coastguard Worker            db = da.exp()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            fn()
*da0073e9SAndroid Build Coastguard Worker        # This test make sure that we don't deadlock on exit of this
*da0073e9SAndroid Build Coastguard Worker        # context manager. If you do, there is something wrong with the
*da0073e9SAndroid Build Coastguard Worker        # locking of the forward ad level most likely
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker# Generic device type autograd tests.
*da0073e9SAndroid Build Coastguard Workerclass TestAutogradDeviceType(TestCase):
*da0073e9SAndroid Build Coastguard Worker    def test_min_max_median_backprops_to_all_values(self, device):
*da0073e9SAndroid Build Coastguard Worker        for f in [torch.min, torch.max, torch.median, torch.nanmedian]:
*da0073e9SAndroid Build Coastguard Worker            x1 = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker                [1.0, 0.0, 1.0, 0.0, 1.0, 0.0], device=device, requires_grad=True
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            x2 = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker                [float("nan"), float("nan"), float("nan")], requires_grad=True
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            for x in [x1, x2]:
*da0073e9SAndroid Build Coastguard Worker                y = f(x)
*da0073e9SAndroid Build Coastguard Worker                y.backward()
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(x.grad.sum(), 1.0)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual((x.grad == 1 / 3).sum(), 3)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_scatter_index_reduce_amin_amax_backprops_to_all_values(self, device):
*da0073e9SAndroid Build Coastguard Worker        # tests that gradients are evenly distributed when there are multiple max/min values
*da0073e9SAndroid Build Coastguard Worker        # tested here instead of adding a SampleInput as the backward for this case is non-differentiable for gradgrad
*da0073e9SAndroid Build Coastguard Worker        # as is the case for test_min_max_median_backprops_to_all_values above
*da0073e9SAndroid Build Coastguard Worker        fns = (torch.scatter_reduce, torch.index_reduce)
*da0073e9SAndroid Build Coastguard Worker        reduces = ("amin", "amax")
*da0073e9SAndroid Build Coastguard Worker        for fn, reduction in product(fns, reduces):
*da0073e9SAndroid Build Coastguard Worker            input = torch.randn(
*da0073e9SAndroid Build Coastguard Worker                (2, 3), device=device, dtype=torch.float64, requires_grad=True
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            src = input.clone().detach_().requires_grad_(True)
*da0073e9SAndroid Build Coastguard Worker            idx = torch.arange(2).to(dtype=torch.long, device=device)
*da0073e9SAndroid Build Coastguard Worker            if fn == torch.scatter_reduce:
*da0073e9SAndroid Build Coastguard Worker                idx = idx.unsqueeze(-1).expand((2, 3))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            gradcheck(fn, (input, 0, idx, src, reduction), check_batched_grad=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_scatter_index_reduce_prod_gradgrad_error(self, device):
*da0073e9SAndroid Build Coastguard Worker        # test that double backward raises an error for the case where 2 zeros in src
*da0073e9SAndroid Build Coastguard Worker        # are scattered to the same position in self
*da0073e9SAndroid Build Coastguard Worker        input = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker            [1.0], device=device, dtype=torch.float64, requires_grad=True
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        src = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker            [0.0, 0.0], device=device, dtype=torch.float64, requires_grad=True
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        idx = torch.tensor([0, 0], device=device, dtype=torch.long)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for fn in (torch.scatter_reduce, torch.index_reduce):
*da0073e9SAndroid Build Coastguard Worker            # check that this case passes on gradcheck
*da0073e9SAndroid Build Coastguard Worker            gradcheck(fn, (input, 0, idx, src, "prod"), check_batched_grad=False)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError, "Double backward is unsupported for"
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                gradgradcheck(fn, (input, 0, idx, src, "prod"))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfMps  # the test doesn't work on MPS as double types are not supported
*da0073e9SAndroid Build Coastguard Worker    def test_parameter_resize(self, device):
*da0073e9SAndroid Build Coastguard Worker        asd = torch.nn.Parameter(torch.ones(16, dtype=torch.double, device=device))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for i in range(2):
*da0073e9SAndroid Build Coastguard Worker            with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker                asd.set_(asd[1:])
*da0073e9SAndroid Build Coastguard Worker                asd.grad = None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            m = torch.cat((asd, asd))
*da0073e9SAndroid Build Coastguard Worker            m.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfMps  # the test doesn't work on MPS as double types are not supported
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.double, torch.cdouble)
*da0073e9SAndroid Build Coastguard Worker    def test_sparse_ctor_getter_backward(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        # See NOTE [ Sparse: autograd and API ] on the expected behavior of this test
*da0073e9SAndroid Build Coastguard Worker        def _test(size, sparse_dim, nnz, device):
*da0073e9SAndroid Build Coastguard Worker            v_size = [nnz] + list(size[sparse_dim:])
*da0073e9SAndroid Build Coastguard Worker            i = torch.rand(sparse_dim, nnz)
*da0073e9SAndroid Build Coastguard Worker            i.mul_(torch.tensor(size[:sparse_dim]).unsqueeze(1).to(i))
*da0073e9SAndroid Build Coastguard Worker            i = i.to(torch.long)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            inp = torch.randn(
*da0073e9SAndroid Build Coastguard Worker                v_size, dtype=torch.double, device=device, requires_grad=True
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            other = self.genSparseTensor(
*da0073e9SAndroid Build Coastguard Worker                size, sparse_dim, nnz, is_uncoalesced=True, device=device, dtype=dtype
*da0073e9SAndroid Build Coastguard Worker            )[0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def fn(v):
*da0073e9SAndroid Build Coastguard Worker                x = torch.sparse_coo_tensor(i, v, size, dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker                y = (x + other).coalesce()
*da0073e9SAndroid Build Coastguard Worker                yv = y.values()
*da0073e9SAndroid Build Coastguard Worker                new_v = yv.tanh()
*da0073e9SAndroid Build Coastguard Worker                z = torch.sparse_coo_tensor(y.indices(), new_v, y.size())
*da0073e9SAndroid Build Coastguard Worker                return z.coalesce().values()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            gradcheck(fn, (inp,), check_batched_grad=False)
*da0073e9SAndroid Build Coastguard Worker            # FIXME: make gradgradcheck work.
*da0073e9SAndroid Build Coastguard Worker            # gradgradcheck(fn, (inp,), check_batched_grad=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # assert that _values is non-differentiable
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, "does not have a grad_fn"):
*da0073e9SAndroid Build Coastguard Worker                other.detach().requires_grad_()._values().backward(
*da0073e9SAndroid Build Coastguard Worker                    torch.ones_like(other._values())
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for empty_i, empty_v, empty_nnz in product([True, False], repeat=3):
*da0073e9SAndroid Build Coastguard Worker            sparse_size = [] if empty_i else [2, 1]
*da0073e9SAndroid Build Coastguard Worker            dense_size = [1, 0, 2] if empty_v else [1, 2]
*da0073e9SAndroid Build Coastguard Worker            nnz = 0 if empty_nnz else 5
*da0073e9SAndroid Build Coastguard Worker            _test(sparse_size + dense_size, len(sparse_size), nnz, device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipMeta
*da0073e9SAndroid Build Coastguard Worker    @skipIfMps
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.double, torch.cdouble)
*da0073e9SAndroid Build Coastguard Worker    def test_sparse_backward(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        class FixedGradientFunction(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x, grad_x):
*da0073e9SAndroid Build Coastguard Worker                ctx.save_for_backward(grad_x)
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_x):
*da0073e9SAndroid Build Coastguard Worker                (saved_grad_x,) = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                return saved_grad_x, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        size = torch.Size([6, 3, 2])
*da0073e9SAndroid Build Coastguard Worker        i1 = torch.tensor([[0, 3, 4], [0, 2, 2]], dtype=torch.long)
*da0073e9SAndroid Build Coastguard Worker        v1 = make_tensor([3, 2], dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        sparse_grad1 = torch.sparse_coo_tensor(i1, v1, size, dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        i2 = torch.tensor([[0, 1, 3, 4], [0, 1, 2, 2]], dtype=torch.long)
*da0073e9SAndroid Build Coastguard Worker        v2 = make_tensor([4, 2], dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        sparse_grad2 = torch.sparse_coo_tensor(i2, v2, size, dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        dense_grad = torch.rand(size, device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker        fn = FixedGradientFunction
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # sparse first
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(size, dtype=dtype, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        (
*da0073e9SAndroid Build Coastguard Worker            fn.apply(x, sparse_grad1)
*da0073e9SAndroid Build Coastguard Worker            + fn.apply(x, dense_grad)
*da0073e9SAndroid Build Coastguard Worker            + fn.apply(x, sparse_grad2)
*da0073e9SAndroid Build Coastguard Worker        ).sum().abs().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, dense_grad + sparse_grad1 + sparse_grad2)
*da0073e9SAndroid Build Coastguard Worker        # dense first
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(size, dtype=dtype, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        (
*da0073e9SAndroid Build Coastguard Worker            fn.apply(x, dense_grad)
*da0073e9SAndroid Build Coastguard Worker            + fn.apply(x, sparse_grad1)
*da0073e9SAndroid Build Coastguard Worker            + fn.apply(x, sparse_grad2)
*da0073e9SAndroid Build Coastguard Worker        ).sum().abs().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, dense_grad + sparse_grad1 + sparse_grad2)
*da0073e9SAndroid Build Coastguard Worker        # sparse only
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(size, dtype=dtype, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        (fn.apply(x, sparse_grad1) + fn.apply(x, sparse_grad2)).sum().abs().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, sparse_grad1 + sparse_grad2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfMps
*da0073e9SAndroid Build Coastguard Worker    def test_sparse_mask_autograd(self, device):
*da0073e9SAndroid Build Coastguard Worker        tensor = torch.randn(3, requires_grad=True, device=device)
*da0073e9SAndroid Build Coastguard Worker        mask = torch.ones(3, device=device)
*da0073e9SAndroid Build Coastguard Worker        mask[1] = 0
*da0073e9SAndroid Build Coastguard Worker        mask = mask.to_sparse()
*da0073e9SAndroid Build Coastguard Worker        converted = tensor.sparse_mask(mask).to_dense()
*da0073e9SAndroid Build Coastguard Worker        converted.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(tensor.grad, mask.to_dense())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfMps  # the test doesn't work on MPS as double types are not supported
*da0073e9SAndroid Build Coastguard Worker    def test_pyscalar_conversions(self, device):
*da0073e9SAndroid Build Coastguard Worker        def _test_pyscalar_conversions(t, integral_conv):
*da0073e9SAndroid Build Coastguard Worker            # integral -> integral
*da0073e9SAndroid Build Coastguard Worker            l = t(torch.zeros(1, 1, 1, dtype=torch.long))
*da0073e9SAndroid Build Coastguard Worker            pyscalar = -12345
*da0073e9SAndroid Build Coastguard Worker            l[0] = pyscalar
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(integral_conv(l), pyscalar)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # floating point -> floating point
*da0073e9SAndroid Build Coastguard Worker            f = Variable(t(torch.randn(1, 1, dtype=torch.double)))
*da0073e9SAndroid Build Coastguard Worker            pyscalar = -12345.1
*da0073e9SAndroid Build Coastguard Worker            f[0] = pyscalar
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(float(f), pyscalar)
*da0073e9SAndroid Build Coastguard Worker            f[0] = nan
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(math.isnan(float(f)))
*da0073e9SAndroid Build Coastguard Worker            f[0] = inf
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(float(f), inf)
*da0073e9SAndroid Build Coastguard Worker            f[0] = -inf
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(float(f), -inf)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # integral -> floating point
*da0073e9SAndroid Build Coastguard Worker            # check we can convert something that loses precision
*da0073e9SAndroid Build Coastguard Worker            pyscalar = 1234567890123456789
*da0073e9SAndroid Build Coastguard Worker            self.assertNotEqual(pyscalar, integral_conv(float(pyscalar)))
*da0073e9SAndroid Build Coastguard Worker            l[0] = pyscalar
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(float(l), float(pyscalar))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # floating point -> integral
*da0073e9SAndroid Build Coastguard Worker            f[0] = nan
*da0073e9SAndroid Build Coastguard Worker            self.assertRaises(ValueError, lambda: integral_conv(f[0]))
*da0073e9SAndroid Build Coastguard Worker            f[0] = inf
*da0073e9SAndroid Build Coastguard Worker            self.assertRaises(OverflowError, lambda: integral_conv(f[0]))
*da0073e9SAndroid Build Coastguard Worker            f[0] = -inf
*da0073e9SAndroid Build Coastguard Worker            self.assertRaises(OverflowError, lambda: integral_conv(f[0]))
*da0073e9SAndroid Build Coastguard Worker            f[0] = sys.float_info.max
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(integral_conv(f), sys.float_info.max)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # bool, nonzero
*da0073e9SAndroid Build Coastguard Worker            def test_nonzero(tensor, value, expected):
*da0073e9SAndroid Build Coastguard Worker                tensor[0] = value
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(expected, bool(tensor))
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(expected, True if tensor else False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            test_nonzero(l, 0, False)
*da0073e9SAndroid Build Coastguard Worker            test_nonzero(l, -2, True)
*da0073e9SAndroid Build Coastguard Worker            test_nonzero(f, 0.0, False)
*da0073e9SAndroid Build Coastguard Worker            test_nonzero(f, sys.float_info.min, True)
*da0073e9SAndroid Build Coastguard Worker            test_nonzero(f, nan, bool(nan))
*da0073e9SAndroid Build Coastguard Worker            test_nonzero(f, inf, bool(inf))
*da0073e9SAndroid Build Coastguard Worker            test_nonzero(f, -inf, bool(-inf))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        _test_pyscalar_conversions(lambda x: x.to(device), lambda x: int(x))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfMPS(torch.float32)
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfCUDA(
*da0073e9SAndroid Build Coastguard Worker        torch.half,
*da0073e9SAndroid Build Coastguard Worker        torch.float,
*da0073e9SAndroid Build Coastguard Worker        torch.double,
*da0073e9SAndroid Build Coastguard Worker        torch.int8,
*da0073e9SAndroid Build Coastguard Worker        torch.int16,
*da0073e9SAndroid Build Coastguard Worker        torch.int32,
*da0073e9SAndroid Build Coastguard Worker        torch.int64,
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    @dtypes(
*da0073e9SAndroid Build Coastguard Worker        torch.float, torch.double, torch.int8, torch.int16, torch.int32, torch.int64
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    def test_set_requires_grad_only_for_floats(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        def f1():
*da0073e9SAndroid Build Coastguard Worker            a = torch.ones(1, dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker            a.requires_grad_()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def f2():
*da0073e9SAndroid Build Coastguard Worker            a = torch.ones(1, dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker            a.requires_grad = True
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def f3():
*da0073e9SAndroid Build Coastguard Worker            torch.ones(1, dtype=dtype, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.ones(1, dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        a.requires_grad = False  # should always work
*da0073e9SAndroid Build Coastguard Worker        a.requires_grad_(False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for f in [f1, f2, f3]:
*da0073e9SAndroid Build Coastguard Worker            if dtype.is_floating_point:
*da0073e9SAndroid Build Coastguard Worker                f()
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                    RuntimeError,
*da0073e9SAndroid Build Coastguard Worker                    "floating point",
*da0073e9SAndroid Build Coastguard Worker                    msg=f"dt: {a.dtype} device: {a.device}",
*da0073e9SAndroid Build Coastguard Worker                ):
*da0073e9SAndroid Build Coastguard Worker                    f()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCUDA
*da0073e9SAndroid Build Coastguard Worker    def test_advanced_indexing_backwards_large(self, device):
*da0073e9SAndroid Build Coastguard Worker        # See https://github.com/pytorch/pytorch/issues/22843
*da0073e9SAndroid Build Coastguard Worker        n = 1 << 16
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(n, 1, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        a = x[:, [0]]
*da0073e9SAndroid Build Coastguard Worker        a.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, torch.ones(n, 1, device=device))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_advanced_indexing_backwards_memory_format(self, device):
*da0073e9SAndroid Build Coastguard Worker        # See https://github.com/pytorch/pytorch/issues/36956
*da0073e9SAndroid Build Coastguard Worker        shape = (2, 8, 1, 2)
*da0073e9SAndroid Build Coastguard Worker        i = torch.randint(1, shape, device=device).contiguous(
*da0073e9SAndroid Build Coastguard Worker            memory_format=torch.channels_last
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(shape, requires_grad=True, device=device)
*da0073e9SAndroid Build Coastguard Worker        x[i].sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _test_reentrant_parent_error_on_cpu(self, device):
*da0073e9SAndroid Build Coastguard Worker        t1 = torch.rand([3, 3], requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        t2 = torch.rand([3, 3], device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        t3 = torch.rand([3, 3], device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Parent graph cpu graph.
*da0073e9SAndroid Build Coastguard Worker        t4 = t1 * t1
*da0073e9SAndroid Build Coastguard Worker        t5 = TestAutograd.SimulateBackwardError.apply(t4)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Child gpu graph (much longer than parent graph).
*da0073e9SAndroid Build Coastguard Worker        prev = t2 * t2
*da0073e9SAndroid Build Coastguard Worker        for i in range(10):
*da0073e9SAndroid Build Coastguard Worker            prev = prev * t2
*da0073e9SAndroid Build Coastguard Worker        reentrant_root = prev
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class ReentrantFunc(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, inp):
*da0073e9SAndroid Build Coastguard Worker                return inp.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad):
*da0073e9SAndroid Build Coastguard Worker                # Reentrant backward in child will take much longer.
*da0073e9SAndroid Build Coastguard Worker                reentrant_root.backward()
*da0073e9SAndroid Build Coastguard Worker                return grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Parent gpu graph.
*da0073e9SAndroid Build Coastguard Worker        t6 = ReentrantFunc.apply(t3)
*da0073e9SAndroid Build Coastguard Worker        t7 = t6 * t6
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Parent graph will error out first, while child graph will continue executing.
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(Exception, "Simulate error"):
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.backward([t5.sum(), t7.sum()])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # No grads should be accumulated since child graph will stop execution
*da0073e9SAndroid Build Coastguard Worker        # after parent receives error.
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(t2.grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(t1.grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(t3.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCUDA
*da0073e9SAndroid Build Coastguard Worker    def test_reentrant_parent_error_on_cpu(self, device):
*da0073e9SAndroid Build Coastguard Worker        def _get_cuda_memory_usage():
*da0073e9SAndroid Build Coastguard Worker            # we don't need CUDA synchronize because the statistics are not tracked at
*da0073e9SAndroid Build Coastguard Worker            # actual freeing, but at when marking the block as free.
*da0073e9SAndroid Build Coastguard Worker            num_devices = torch.cuda.device_count()
*da0073e9SAndroid Build Coastguard Worker            gc.collect()
*da0073e9SAndroid Build Coastguard Worker            return tuple(torch.cuda.memory_allocated(i) for i in range(num_devices))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        before = _get_cuda_memory_usage()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Run as separate function so that gc can clean up everything when we
*da0073e9SAndroid Build Coastguard Worker        # check for memory usage.
*da0073e9SAndroid Build Coastguard Worker        self._test_reentrant_parent_error_on_cpu(device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Wait for autograd thread to cleanup failed tasks.
*da0073e9SAndroid Build Coastguard Worker        after = _get_cuda_memory_usage()
*da0073e9SAndroid Build Coastguard Worker        start = time.time()
*da0073e9SAndroid Build Coastguard Worker        while before != after and time.time() - start < 30:
*da0073e9SAndroid Build Coastguard Worker            time.sleep(0.1)
*da0073e9SAndroid Build Coastguard Worker            after = _get_cuda_memory_usage()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(before, after)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfMps  # the test doesn't work on MPS
*da0073e9SAndroid Build Coastguard Worker    # TODO: see if these tests can be ported to OpInfos or moved to where's test suite
*da0073e9SAndroid Build Coastguard Worker    def test_where_functional(self, device):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 5, dtype=torch.double, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(5, 5, dtype=torch.double, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        cond = mask_not_all_zeros((5, 5)).to(device=device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def where(cond, x, y):
*da0073e9SAndroid Build Coastguard Worker            return torch.where(cond, x, y)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        gradcheck(where, [cond, x, y], raise_exception=True)
*da0073e9SAndroid Build Coastguard Worker        gradgradcheck(where, [cond, x, y], [torch.randn(5, 5, device=device)])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 1, 5, dtype=torch.double, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(5, 5, 1, dtype=torch.double, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        gradcheck(where, [cond, x, y], raise_exception=True)
*da0073e9SAndroid Build Coastguard Worker        gradgradcheck(where, [cond, x, y], [torch.randn(5, 5, 5, device=device)])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfMps  # the test doesn't work on MPS
*da0073e9SAndroid Build Coastguard Worker    def test_where_scalar(self, device):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 5, dtype=torch.double, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        scalar = 4.0
*da0073e9SAndroid Build Coastguard Worker        cond = mask_not_all_zeros((5, 5)).to(device=device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def where_scalar_first(cond, x):
*da0073e9SAndroid Build Coastguard Worker            return torch.where(cond, scalar, x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def where_scalar_second(cond, x):
*da0073e9SAndroid Build Coastguard Worker            return torch.where(cond, x, scalar)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        gradcheck(where_scalar_first, (cond, x))
*da0073e9SAndroid Build Coastguard Worker        gradgradcheck(where_scalar_first, (cond, x))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        gradcheck(where_scalar_second, (cond, x))
*da0073e9SAndroid Build Coastguard Worker        gradgradcheck(where_scalar_second, (cond, x))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCUDA
*da0073e9SAndroid Build Coastguard Worker    def test_free_unneeded_tensor(self, device):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(2, 3, 10, 10, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        m = torch.randn(1, 3, 1, 1, device=device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        z = x.sum()
*da0073e9SAndroid Build Coastguard Worker        base_mem = torch.cuda.memory_allocated()
*da0073e9SAndroid Build Coastguard Worker        z = ((x + 2) * m).sum()
*da0073e9SAndroid Build Coastguard Worker        end_mem = torch.cuda.memory_allocated()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # In the end the memory usage should remain equal, because neither of
*da0073e9SAndroid Build Coastguard Worker        # (x + 2) and ((x + 2) * m) should be kept alive for backward, while the
*da0073e9SAndroid Build Coastguard Worker        # previous allocation of z had the same size as the current one.
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(base_mem, end_mem)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCUDA
*da0073e9SAndroid Build Coastguard Worker    def test_pin_memory(self, device):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(2, 2, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x, x.pin_memory())
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNot(x, x.pin_memory())
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(x.pin_memory().requires_grad)
*da0073e9SAndroid Build Coastguard Worker        gradcheck(lambda x: x.pin_memory(), [x])
*da0073e9SAndroid Build Coastguard Worker        gradgradcheck(lambda x: x.pin_memory(), [x])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCUDA
*da0073e9SAndroid Build Coastguard Worker    def test_profiler_emit_nvtx(self, device):
*da0073e9SAndroid Build Coastguard Worker        # This test is not intended to ensure correctness of nvtx ranges.
*da0073e9SAndroid Build Coastguard Worker        # That would require something a great deal more complex (you'd have to create a
*da0073e9SAndroid Build Coastguard Worker        # profile in a subprocess, open it, and parse the sql somehow).
*da0073e9SAndroid Build Coastguard Worker        # This test is merely intended to catch if emit_nvtx breaks on construction.
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor([1, 2, 3], dtype=torch.float32, device=device)
*da0073e9SAndroid Build Coastguard Worker        with torch.cuda.profiler.profile():
*da0073e9SAndroid Build Coastguard Worker            with emit_nvtx():
*da0073e9SAndroid Build Coastguard Worker                a.add(1.0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCUDA
*da0073e9SAndroid Build Coastguard Worker    def test_rnn_backward_to_input_but_not_parameters(self, device):
*da0073e9SAndroid Build Coastguard Worker        # this checks whether it is possible to not require
*da0073e9SAndroid Build Coastguard Worker        # weight parameters, but require inputs, see #7722
*da0073e9SAndroid Build Coastguard Worker        l = torch.nn.LSTM(2, 3).to(device)
*da0073e9SAndroid Build Coastguard Worker        for p in l.parameters():
*da0073e9SAndroid Build Coastguard Worker            p.requires_grad = False
*da0073e9SAndroid Build Coastguard Worker        s = torch.randn(1, 1, 2, requires_grad=True, device=device)
*da0073e9SAndroid Build Coastguard Worker        out, _ = l(s)
*da0073e9SAndroid Build Coastguard Worker        out.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(s.grad is None or s.grad.abs().sum().item() == 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @unittest.skipIf(not torch.profiler.itt.is_available(), "ITT is required")
*da0073e9SAndroid Build Coastguard Worker    def test_profiler_emit_itt(self, device):
*da0073e9SAndroid Build Coastguard Worker        # This test is not intended to ensure correctness of itt ranges.
*da0073e9SAndroid Build Coastguard Worker        # That would require something a great deal more complex (you'd have to create a
*da0073e9SAndroid Build Coastguard Worker        # profile in a subprocess, open it, and parse the sql somehow).
*da0073e9SAndroid Build Coastguard Worker        # This test is merely intended to catch if emit_itt breaks on construction.
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor([1, 2, 3], dtype=torch.float32, device=device)
*da0073e9SAndroid Build Coastguard Worker        with emit_itt():
*da0073e9SAndroid Build Coastguard Worker            a.add(1.0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfMps  # the test doesn't work as randn is not supported with type long
*da0073e9SAndroid Build Coastguard Worker    @deviceCountAtLeast(1)
*da0073e9SAndroid Build Coastguard Worker    def test_grad_assignment(self, devices):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 5, device=devices[0])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Tests that the wrong type raises
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(TypeError, "expected to be a Tensor or None"):
*da0073e9SAndroid Build Coastguard Worker            x.grad = 0
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Tests that the wrong shape raises
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(RuntimeError):
*da0073e9SAndroid Build Coastguard Worker            x.grad = torch.randn(2, 2, device=devices[0])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Tests that the wrong dtype raises
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(RuntimeError):
*da0073e9SAndroid Build Coastguard Worker            x.grad = torch.randn(5, 5, dtype=torch.long, device=devices[0])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Tests that self-assignment raises
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(RuntimeError):
*da0073e9SAndroid Build Coastguard Worker            x.grad = x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Tests device -> cpu grad assignment raises
*da0073e9SAndroid Build Coastguard Worker        if self.device_type != "cpu":
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaises(RuntimeError):
*da0073e9SAndroid Build Coastguard Worker                t_cpu = torch.rand(5, 5)
*da0073e9SAndroid Build Coastguard Worker                t_cpu.grad = torch.randn(5, 5, device=devices[0])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Tests half type on CUDA
*da0073e9SAndroid Build Coastguard Worker        if self.device_type == "cuda":
*da0073e9SAndroid Build Coastguard Worker            x = x.to(dtype=torch.half, device=devices[0])
*da0073e9SAndroid Build Coastguard Worker            x.grad = torch.zeros_like(x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Tests cross-device assignment raises
*da0073e9SAndroid Build Coastguard Worker        if len(devices) > 1:
*da0073e9SAndroid Build Coastguard Worker            x = torch.randn(5, 5, device=devices[0])
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaises(RuntimeError):
*da0073e9SAndroid Build Coastguard Worker                x.grad = torch.randn(5, 5, device=devices[1])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfMPS(torch.float32)
*da0073e9SAndroid Build Coastguard Worker    @deviceCountAtLeast(1)
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.float, torch.double)
*da0073e9SAndroid Build Coastguard Worker    def test_requires_grad_factory(self, devices, dtype):
*da0073e9SAndroid Build Coastguard Worker        fns = [torch.ones_like, torch.randn_like]
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(2, 3, dtype=dtype, device=devices[0])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for fn in fns:
*da0073e9SAndroid Build Coastguard Worker            for requires_grad in [True, False]:
*da0073e9SAndroid Build Coastguard Worker                output = fn(
*da0073e9SAndroid Build Coastguard Worker                    x, dtype=dtype, device=devices[0], requires_grad=requires_grad
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(requires_grad, output.requires_grad)
*da0073e9SAndroid Build Coastguard Worker                self.assertIs(dtype, output.dtype)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(devices[0], str(x.device))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @deviceCountAtLeast(2)
*da0073e9SAndroid Build Coastguard Worker    def test_unused_output_device(self, devices):
*da0073e9SAndroid Build Coastguard Worker        from torch.nn.parallel._functions import Broadcast
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 5, dtype=torch.float, device=devices[0], requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        outputs = Broadcast.apply(list(range(len(devices))), x)
*da0073e9SAndroid Build Coastguard Worker        y = outputs[-1] * 2
*da0073e9SAndroid Build Coastguard Worker        y.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, torch.ones(5, 5) * 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @deviceCountAtLeast(2)
*da0073e9SAndroid Build Coastguard Worker    def test_backward_device(self, devices):
*da0073e9SAndroid Build Coastguard Worker        # check that current device matches the variable's device
*da0073e9SAndroid Build Coastguard Worker        device = [None]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class Identity(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_output):
*da0073e9SAndroid Build Coastguard Worker                device[0] = grad_output.device
*da0073e9SAndroid Build Coastguard Worker                return grad_output.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        v = torch.randn(1, device=devices[1], requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        Identity.apply(v).backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(str(device[0]), devices[1])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @deviceCountAtLeast(2)
*da0073e9SAndroid Build Coastguard Worker    def test_inputbuffer_add_multidevice(self, devices):
*da0073e9SAndroid Build Coastguard Worker        input = torch.randn(1, device=devices[0], requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        output = input.to(device=devices[1]) + input.to(device=devices[1])
*da0073e9SAndroid Build Coastguard Worker        output.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    def test_copy_(self, device):
*da0073e9SAndroid Build Coastguard Worker        # At the time of writing this test, copy_ is not generated from native_functions.yaml
*da0073e9SAndroid Build Coastguard Worker        # there was a bug that bfloat16 was not recognized as floating.
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(10, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        floating_dt = floating_types_and(torch.half, torch.bfloat16)
*da0073e9SAndroid Build Coastguard Worker        for dt in floating_dt:
*da0073e9SAndroid Build Coastguard Worker            y = torch.empty(10, device=device, dtype=dt)
*da0073e9SAndroid Build Coastguard Worker            y.copy_(x)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(y.requires_grad)
*da0073e9SAndroid Build Coastguard Worker            z = x.to(torch.bfloat16)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(z.requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_copy_forward_ad_broadcasting(self, device):
*da0073e9SAndroid Build Coastguard Worker        # copy_ allows the src to have a different shape from self as long as src is
*da0073e9SAndroid Build Coastguard Worker        # broadcastable to self. Make sure forward AD handles this case.
*da0073e9SAndroid Build Coastguard Worker        primal = torch.rand(3, 3, device=device)
*da0073e9SAndroid Build Coastguard Worker        tangent = torch.rand(3, 3, device=device)
*da0073e9SAndroid Build Coastguard Worker        non_dual = torch.rand(1, 3, 3, device=device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            dual = fwAD.make_dual(primal, tangent)
*da0073e9SAndroid Build Coastguard Worker            non_dual.copy_(dual)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_copy_forward_ad_same_layout_copies_grad(self, device):
*da0073e9SAndroid Build Coastguard Worker        primal = torch.tensor([[3.0], [4.0]], device=device)
*da0073e9SAndroid Build Coastguard Worker        tangent = torch.tensor([[5.0], [6.0]], device=device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            x_dual = fwAD.make_dual(primal, tangent)
*da0073e9SAndroid Build Coastguard Worker            non_dual = torch.tensor([[1.0], [2.0]])
*da0073e9SAndroid Build Coastguard Worker            non_dual.copy_(x_dual)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(fwAD.unpack_dual(non_dual).tangent is not tangent)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCUDA
*da0073e9SAndroid Build Coastguard Worker    def test_simple_reentrant_cross_device(self, device):
*da0073e9SAndroid Build Coastguard Worker        class ReentrantFunc(Function):
*da0073e9SAndroid Build Coastguard Worker            _cpu_mode = True
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x * (x + 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad_output):
*da0073e9SAndroid Build Coastguard Worker                with torch.enable_grad():
*da0073e9SAndroid Build Coastguard Worker                    if ReentrantFunc._cpu_mode:
*da0073e9SAndroid Build Coastguard Worker                        new_param = torch.randn(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker                        (new_param**2).sum().backward()
*da0073e9SAndroid Build Coastguard Worker                    else:
*da0073e9SAndroid Build Coastguard Worker                        new_param = torch.randn(2, 2, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker                        (new_param**2).sum().backward()
*da0073e9SAndroid Build Coastguard Worker                return grad_output
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Reentrant starts on GPU thread, finishs on GPU thread
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(2, 2, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out = ReentrantFunc.apply(x)
*da0073e9SAndroid Build Coastguard Worker        out.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Reentrant starts on CPU thread, finishs on GPU thread
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(2, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        # set ReentrantFunc node to GPU to emit tasks to GPU queue
*da0073e9SAndroid Build Coastguard Worker        ReentrantFunc._cpu_mode = False
*da0073e9SAndroid Build Coastguard Worker        out = ReentrantFunc.apply(x)
*da0073e9SAndroid Build Coastguard Worker        out.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Reentrant starts on GPU thread, finishs on CPU thread
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(2, 2, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        # set ReentrantFunc node to CPU to emit tasks to CPU queue
*da0073e9SAndroid Build Coastguard Worker        ReentrantFunc._cpu_mode = True
*da0073e9SAndroid Build Coastguard Worker        out = ReentrantFunc.apply(x)
*da0073e9SAndroid Build Coastguard Worker        out.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCUDA
*da0073e9SAndroid Build Coastguard Worker    def test_cross_device_reentrant_autograd(self, device):
*da0073e9SAndroid Build Coastguard Worker        # Output on gpu so that this task will be associated with the gpu thread
*da0073e9SAndroid Build Coastguard Worker        def fn_on_gpu(inp):
*da0073e9SAndroid Build Coastguard Worker            # Artificially increase the priority of the next op to make sure it runs
*da0073e9SAndroid Build Coastguard Worker            # as soon as we reach it before the ops of branch1.
*da0073e9SAndroid Build Coastguard Worker            dummy = inp * 2 * 2 * 2 * 2
*da0073e9SAndroid Build Coastguard Worker            return inp.to(device=device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def parent_on_cpu(inp):
*da0073e9SAndroid Build Coastguard Worker            # Slow branch of ops on gpu so that the work queue for the gpu thread
*da0073e9SAndroid Build Coastguard Worker            # won't empty too quickly. They also have smaller priorities than the
*da0073e9SAndroid Build Coastguard Worker            # ones created by fn_on_gpu
*da0073e9SAndroid Build Coastguard Worker            branch1 = inp.to(device=device)
*da0073e9SAndroid Build Coastguard Worker            branch1 = branch1 / branch1
*da0073e9SAndroid Build Coastguard Worker            branch1 = branch1 / branch1
*da0073e9SAndroid Build Coastguard Worker            branch1 = branch1 / branch1
*da0073e9SAndroid Build Coastguard Worker            # Perform checkpoint on cpu tensors. So the last op performed in the reentrant
*da0073e9SAndroid Build Coastguard Worker            # autograd is an AccumulateGrad that runs on the cpu thread for the gpu thread.
*da0073e9SAndroid Build Coastguard Worker            # So the cpu thread will notify the gpu thread with an empty NodeTask.
*da0073e9SAndroid Build Coastguard Worker            branch2 = checkpoint(fn_on_gpu, inp, use_reentrant=True)
*da0073e9SAndroid Build Coastguard Worker            out = branch2 + branch1
*da0073e9SAndroid Build Coastguard Worker            return out
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        inp = torch.rand(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out = parent_on_cpu(inp)
*da0073e9SAndroid Build Coastguard Worker        # This will segfault if the empty NodeTask is not handled properly in the
*da0073e9SAndroid Build Coastguard Worker        # gpu thread ReadyQueue
*da0073e9SAndroid Build Coastguard Worker        out.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inplace_on_view_backprop_base(self, device):
*da0073e9SAndroid Build Coastguard Worker        # modify view and back-prop through base
*da0073e9SAndroid Build Coastguard Worker        root = torch.randn(2, 2, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        x = root.clone()
*da0073e9SAndroid Build Coastguard Worker        v1 = x.narrow(0, 0, 1)
*da0073e9SAndroid Build Coastguard Worker        v1.mul_(2)
*da0073e9SAndroid Build Coastguard Worker        x.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(root.grad.tolist(), [[2, 2], [1, 1]])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inplace_on_view_backprop_view_of_view(self, device):
*da0073e9SAndroid Build Coastguard Worker        # modify view and backprop through view-of-view
*da0073e9SAndroid Build Coastguard Worker        root = torch.randn(2, 2, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        x = root.clone()
*da0073e9SAndroid Build Coastguard Worker        v1 = x.narrow(0, 0, 1)
*da0073e9SAndroid Build Coastguard Worker        v2 = x.narrow(0, 0, 1)
*da0073e9SAndroid Build Coastguard Worker        v1.mul_(2)
*da0073e9SAndroid Build Coastguard Worker        v2.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(root.grad.tolist(), [[2, 2], [0, 0]])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inplace_on_view_of_view(self, device):
*da0073e9SAndroid Build Coastguard Worker        # modify view-of-view and backprop through base
*da0073e9SAndroid Build Coastguard Worker        root = torch.randn(2, 2, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        x = root.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        v1 = x.narrow(0, 0, 1)
*da0073e9SAndroid Build Coastguard Worker        v2 = v1.narrow(1, 1, 1)
*da0073e9SAndroid Build Coastguard Worker        v2.mul_(2)
*da0073e9SAndroid Build Coastguard Worker        x.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(root.grad.tolist(), [[1, 2], [1, 1]])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfMps  # the test doesn't work on MPS as double types are not supported
*da0073e9SAndroid Build Coastguard Worker    def test_inplace_on_view_then_no_grad(self, device):
*da0073e9SAndroid Build Coastguard Worker        # Perform an in-place operation on a view of a non-leaf variable.
*da0073e9SAndroid Build Coastguard Worker        a = torch.ones(3, 1, dtype=torch.double, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = a * 2
*da0073e9SAndroid Build Coastguard Worker        c = b.view_as(b)
*da0073e9SAndroid Build Coastguard Worker        c[0][0] = 3
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Force a graph update with grad disabled.
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            c.grad_fn
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        c.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfMps  # the test doesn't work on MPS as double types are not supported
*da0073e9SAndroid Build Coastguard Worker    def test_inplace_on_view_gradcheck(self, device):
*da0073e9SAndroid Build Coastguard Worker        # gradcheck modifications to views
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(4, 4, dtype=torch.double, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = torch.randn(2, 2, dtype=torch.double, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def func(root, b):
*da0073e9SAndroid Build Coastguard Worker            x = root.clone()
*da0073e9SAndroid Build Coastguard Worker            x.narrow(1, 2, 2).narrow(0, 1, 2).mul_(b)
*da0073e9SAndroid Build Coastguard Worker            x.narrow(1, 0, 2).narrow(0, 1, 2).mul_(b)
*da0073e9SAndroid Build Coastguard Worker            return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        gradcheck(func, [a, b], raise_exception=True)
*da0073e9SAndroid Build Coastguard Worker        go = torch.randn(
*da0073e9SAndroid Build Coastguard Worker            a.size(), dtype=torch.double, device=device, requires_grad=True
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        gradgradcheck(func, (a, b), (go,))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inplace_on_view_multiple_outputs(self, device):
*da0073e9SAndroid Build Coastguard Worker        root = torch.arange(9.0, dtype=torch.double).reshape(3, 3).requires_grad_()
*da0073e9SAndroid Build Coastguard Worker        x = root.clone()
*da0073e9SAndroid Build Coastguard Worker        v1 = x.unbind()
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(RuntimeError):
*da0073e9SAndroid Build Coastguard Worker            v1[0].mul_(2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfMps  # the test doesn't work on MPS as double types are not supported
*da0073e9SAndroid Build Coastguard Worker    def test_inplace_on_view_of_multiple_output_view(self, device):
*da0073e9SAndroid Build Coastguard Worker        a = torch.rand(
*da0073e9SAndroid Build Coastguard Worker            10, dtype=torch.double, device=device, requires_grad=True
*da0073e9SAndroid Build Coastguard Worker        ).clone()
*da0073e9SAndroid Build Coastguard Worker        b = a.unbind(0)
*da0073e9SAndroid Build Coastguard Worker        c = b[0].view_as(b[0])
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(RuntimeError):
*da0073e9SAndroid Build Coastguard Worker            c.mul_(2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfMps  # MPS backend doesn't support double types
*da0073e9SAndroid Build Coastguard Worker    def test_inplace_multiple_output_view_of_view(self, device):
*da0073e9SAndroid Build Coastguard Worker        a = torch.rand(
*da0073e9SAndroid Build Coastguard Worker            10, dtype=torch.double, device=device, requires_grad=True
*da0073e9SAndroid Build Coastguard Worker        ).clone()
*da0073e9SAndroid Build Coastguard Worker        b = a.view_as(a)
*da0073e9SAndroid Build Coastguard Worker        c = b.unbind(0)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(RuntimeError):
*da0073e9SAndroid Build Coastguard Worker            c[0].mul_(2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfMps  # MPS backend doesn't support double types
*da0073e9SAndroid Build Coastguard Worker    def test_inplace_on_view_makes_base_require_grad(self, device):
*da0073e9SAndroid Build Coastguard Worker        # in-place modification to view makes base require grad
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(4, 4, dtype=torch.double, device=device, requires_grad=False)
*da0073e9SAndroid Build Coastguard Worker        b = torch.randn(4, 2, dtype=torch.double, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def func(root, b):
*da0073e9SAndroid Build Coastguard Worker            x = root.clone()
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(x.requires_grad)
*da0073e9SAndroid Build Coastguard Worker            x.narrow(1, 2, 2).mul_(b)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(x.requires_grad)
*da0073e9SAndroid Build Coastguard Worker            return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        gradcheck(func, [a, b], raise_exception=True)
*da0073e9SAndroid Build Coastguard Worker        go = torch.randn(
*da0073e9SAndroid Build Coastguard Worker            a.size(), dtype=torch.double, device=device, requires_grad=True
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        gradgradcheck(func, (a, b), (go,))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inplace_on_view_backprop_view(self, device):
*da0073e9SAndroid Build Coastguard Worker        # modify view and backprop through view
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor([2.0, 5.0], device=device, requires_grad=False)
*da0073e9SAndroid Build Coastguard Worker        b = torch.tensor([3.0], device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        res = a.narrow(0, 1, 1).mul_(b)
*da0073e9SAndroid Build Coastguard Worker        res.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(b.grad.tolist(), [5])
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(a.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfMps  # the test doesn't work on MPS as double types are not supported
*da0073e9SAndroid Build Coastguard Worker    def test_inplace_on_view_modify_base(self, device):
*da0073e9SAndroid Build Coastguard Worker        # Test that an in-place operation on a base that forced it to require
*da0073e9SAndroid Build Coastguard Worker        # grad also forces any previous views to require grad and backprop
*da0073e9SAndroid Build Coastguard Worker        # correctly
*da0073e9SAndroid Build Coastguard Worker        r = torch.ones(1, dtype=torch.double, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn(r):
*da0073e9SAndroid Build Coastguard Worker            x = torch.ones(5, dtype=torch.double, device=device)
*da0073e9SAndroid Build Coastguard Worker            v = x.select(0, 1)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(v.requires_grad)
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(v.grad_fn)
*da0073e9SAndroid Build Coastguard Worker            x.add_(r)  # v is now dependent on r due to the in-place op on x
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(v.requires_grad)
*da0073e9SAndroid Build Coastguard Worker            return v
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        gradcheck(fn, [r])
*da0073e9SAndroid Build Coastguard Worker        gradgradcheck(fn, [r])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfMps  # the test doesn't work on MPS as double types are not supported
*da0073e9SAndroid Build Coastguard Worker    def test_inplace_on_view_python(self, device):
*da0073e9SAndroid Build Coastguard Worker        # in-place modifications of Python-autograd created view
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(4, 4, dtype=torch.double, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = torch.randn(2, 2, dtype=torch.double, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class PyAdd(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x, y):
*da0073e9SAndroid Build Coastguard Worker                ctx.mark_dirty(x)
*da0073e9SAndroid Build Coastguard Worker                x.add_(y)
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad):
*da0073e9SAndroid Build Coastguard Worker                return grad, grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def func(root, b):
*da0073e9SAndroid Build Coastguard Worker            x = root.clone()
*da0073e9SAndroid Build Coastguard Worker            PyAdd.apply(x.narrow(1, 2, 2).narrow(0, 1, 2), b)
*da0073e9SAndroid Build Coastguard Worker            PyAdd.apply(x.narrow(1, 0, 2).narrow(0, 1, 2), b)
*da0073e9SAndroid Build Coastguard Worker            return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        gradcheck(func, [a, b], raise_exception=True)
*da0073e9SAndroid Build Coastguard Worker        go = torch.randn(
*da0073e9SAndroid Build Coastguard Worker            a.size(), dtype=torch.double, device=device, requires_grad=True
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        gradgradcheck(func, (a, b), (go,))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inplace_on_view_non_contig(self, device):
*da0073e9SAndroid Build Coastguard Worker        root = torch.ones(2, 3, 2, device=device).select(2, 1).t().requires_grad_(True)
*da0073e9SAndroid Build Coastguard Worker        x = root.clone()
*da0073e9SAndroid Build Coastguard Worker        v1 = x.narrow(0, 0, 1)
*da0073e9SAndroid Build Coastguard Worker        v2 = v1.narrow(1, 1, 1)
*da0073e9SAndroid Build Coastguard Worker        v2.mul_(2)
*da0073e9SAndroid Build Coastguard Worker        x.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(root.grad.tolist(), [[1, 2], [1, 1], [1, 1]])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inplace_on_view_multi_output_unsafe(self, device):
*da0073e9SAndroid Build Coastguard Worker        for f in [
*da0073e9SAndroid Build Coastguard Worker            lambda t: t.unsafe_split(1),
*da0073e9SAndroid Build Coastguard Worker            lambda t: t.unsafe_split_with_sizes((1, 1, 1)),
*da0073e9SAndroid Build Coastguard Worker            lambda t: t.unsafe_chunk(3),
*da0073e9SAndroid Build Coastguard Worker        ]:
*da0073e9SAndroid Build Coastguard Worker            a = torch.randn(3, 3, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            b = a + a
*da0073e9SAndroid Build Coastguard Worker            s1, s2, s3 = f(b)
*da0073e9SAndroid Build Coastguard Worker            s1.mul_(s2)
*da0073e9SAndroid Build Coastguard Worker            s1.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inplace_on_view_multi_output_safe(self, device):
*da0073e9SAndroid Build Coastguard Worker        for f in [
*da0073e9SAndroid Build Coastguard Worker            lambda t: t.split(1),
*da0073e9SAndroid Build Coastguard Worker            lambda t: t.split_with_sizes((1, 1, 1)),
*da0073e9SAndroid Build Coastguard Worker            lambda t: t.chunk(3),
*da0073e9SAndroid Build Coastguard Worker        ]:
*da0073e9SAndroid Build Coastguard Worker            a = torch.randn(3, 3, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            b = a + a
*da0073e9SAndroid Build Coastguard Worker            s1, s2, s3 = f(b)
*da0073e9SAndroid Build Coastguard Worker            error_msg = (
*da0073e9SAndroid Build Coastguard Worker                "This view is the output of a function that returns multiple views."
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, error_msg):
*da0073e9SAndroid Build Coastguard Worker                s1.mul_(s2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inplace_on_view_undefined_grad_output(self, device):
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor([1.0], requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        c = a.clone()
*da0073e9SAndroid Build Coastguard Worker        v = c[:]
*da0073e9SAndroid Build Coastguard Worker        b = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class InplaceFunc(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x, other):
*da0073e9SAndroid Build Coastguard Worker                ctx.mark_dirty(x)
*da0073e9SAndroid Build Coastguard Worker                return x.mul_(2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad):
*da0073e9SAndroid Build Coastguard Worker                return grad * 2, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = InplaceFunc.apply(v, b)
*da0073e9SAndroid Build Coastguard Worker        out.backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNone(b.grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a.grad.item(), 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfMps  # the test doesn't work on MPS as double types are not supported
*da0073e9SAndroid Build Coastguard Worker    def test_mv_grad_stride_0(self, device):
*da0073e9SAndroid Build Coastguard Worker        # Reference: https://github.com/pytorch/pytorch/issues/38315
*da0073e9SAndroid Build Coastguard Worker        mat = torch.randn(2, 2, dtype=torch.double, device=device)
*da0073e9SAndroid Build Coastguard Worker        vec = torch.randn(1, dtype=torch.double, device=device).requires_grad_(True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn(vec):
*da0073e9SAndroid Build Coastguard Worker            # Expand inside the function to make sure the input to
*da0073e9SAndroid Build Coastguard Worker            # gradcheck does not have overlapping memory
*da0073e9SAndroid Build Coastguard Worker            vec = vec.expand(2)
*da0073e9SAndroid Build Coastguard Worker            return (mat @ vec).sum()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        gradcheck(fn, (vec))
*da0073e9SAndroid Build Coastguard Worker        gradgradcheck(fn, (vec))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCUDA
*da0073e9SAndroid Build Coastguard Worker    def test_gradcheck_input_output_different_device(self, device):
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones((1,), dtype=torch.double, device="cuda", requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        gradcheck(lambda x: x.to("cpu"), (x,))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones((1,), dtype=torch.double, device="cpu", requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        gradcheck(lambda x: x.to("cuda"), (x,))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_strided_leaf_grad_layout(self, device):
*da0073e9SAndroid Build Coastguard Worker        # (1) If leaf is non-overlapping and dense, grad's layout should match its leaf.
*da0073e9SAndroid Build Coastguard Worker        for fmt_a in (torch.contiguous_format, torch.channels_last):
*da0073e9SAndroid Build Coastguard Worker            for fmt_b in (torch.contiguous_format, torch.channels_last):
*da0073e9SAndroid Build Coastguard Worker                a = torch.rand((2, 3, 4, 5), device=device).to(memory_format=fmt_a)
*da0073e9SAndroid Build Coastguard Worker                b = torch.rand((2, 3, 4, 5), device=device).to(memory_format=fmt_b)
*da0073e9SAndroid Build Coastguard Worker                a.requires_grad_()
*da0073e9SAndroid Build Coastguard Worker                b.requires_grad_()
*da0073e9SAndroid Build Coastguard Worker                # checks (1) for broadcasted gradients
*da0073e9SAndroid Build Coastguard Worker                a.sum().backward()
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(a.grad.stride(), a.stride())
*da0073e9SAndroid Build Coastguard Worker                b.sum().backward()
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(b.grad.stride(), b.stride())
*da0073e9SAndroid Build Coastguard Worker                # checks (1) for non-broadcasted gradients
*da0073e9SAndroid Build Coastguard Worker                a.grad = None
*da0073e9SAndroid Build Coastguard Worker                b.grad = None
*da0073e9SAndroid Build Coastguard Worker                (a * b).sum().backward()
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(a.grad.stride(), a.stride())
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(b.grad.stride(), b.stride())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # (2) If leaf isn't dense, checks that grads are rowmajor contiguous.
*da0073e9SAndroid Build Coastguard Worker        c = torch.empty_strided((2, 2), (4, 2), device=device).copy_(
*da0073e9SAndroid Build Coastguard Worker            torch.rand((2, 2), device=device)
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        c.requires_grad_()
*da0073e9SAndroid Build Coastguard Worker        d = torch.rand((2, 2), device=device)
*da0073e9SAndroid Build Coastguard Worker        # checks (2) for broadcasted gradients
*da0073e9SAndroid Build Coastguard Worker        c.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(c.grad.stride(), (2, 1))
*da0073e9SAndroid Build Coastguard Worker        # checks (2) for non-broadcasted gradients
*da0073e9SAndroid Build Coastguard Worker        c.grad = None
*da0073e9SAndroid Build Coastguard Worker        (c * d).sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(c.grad.stride(), (2, 1))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfMps
*da0073e9SAndroid Build Coastguard Worker    def test_copy_r_to_c(self, device):
*da0073e9SAndroid Build Coastguard Worker        out_c = torch.empty(3, 2, dtype=torch.cdouble, device=device)
*da0073e9SAndroid Build Coastguard Worker        inp_r = torch.randn(3, 2, dtype=torch.double, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def do_test():
*da0073e9SAndroid Build Coastguard Worker            out_c.copy_(inp_r)
*da0073e9SAndroid Build Coastguard Worker            out_c_inter = out_c.sum()
*da0073e9SAndroid Build Coastguard Worker            out_c_inter.abs().backward()
*da0073e9SAndroid Build Coastguard Worker            with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker                    inp_r.grad, torch.ones_like(inp_r) * torch.sgn(out_c_inter).real
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertNotWarn(do_test)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_to_r_to_c(self, device):
*da0073e9SAndroid Build Coastguard Worker        def do_test():
*da0073e9SAndroid Build Coastguard Worker            inp_r = torch.randn(
*da0073e9SAndroid Build Coastguard Worker                3, 2, dtype=torch.double, device=device, requires_grad=True
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            out = inp_r.to(torch.complex128)
*da0073e9SAndroid Build Coastguard Worker            out_inter = out.sum()
*da0073e9SAndroid Build Coastguard Worker            out_inter.abs().backward()
*da0073e9SAndroid Build Coastguard Worker            with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker                    inp_r.grad, torch.ones_like(inp_r) * torch.sgn(out_inter).real
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertNotWarn(do_test)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_non_differentiable_ops(self, device):
*da0073e9SAndroid Build Coastguard Worker        # Just make sure the op doesn't raise an error
*da0073e9SAndroid Build Coastguard Worker        # and resulting tensor has requires_grad=False.
*da0073e9SAndroid Build Coastguard Worker        x = torch.tensor([[1, 2], [3, 4.0]], requires_grad=True, device=device)
*da0073e9SAndroid Build Coastguard Worker        out = torch.isin(x, torch.tensor([2, 3], device=device))
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(out.requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out = torch.signbit(x)
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(out.requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_warning_in_backward(self, device):
*da0073e9SAndroid Build Coastguard Worker        # Test warning during backward are always propagated as python warnings (gh-50209)
*da0073e9SAndroid Build Coastguard Worker        # NOTE: For device=cuda, warning gets propagated from a worker thread
*da0073e9SAndroid Build Coastguard Worker        a = torch.zeros((), device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = torch._C._nn._test_warn_in_autograd(a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertWarnsRegex(UserWarning, "Warn from backward"):
*da0073e9SAndroid Build Coastguard Worker            b.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_complex_scalar_backward(self, device):
*da0073e9SAndroid Build Coastguard Worker        a = torch.zeros(1, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = a * 0.5j
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        msg = "grad can be implicitly created only for real scalar outputs"
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, msg):
*da0073e9SAndroid Build Coastguard Worker            b.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, msg):
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.grad(b, a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_pow_real_negative_base_complex_exponent(self, device):
*da0073e9SAndroid Build Coastguard Worker        # OpInfo doesn't naturally support input of mixed types, hence this test here.
*da0073e9SAndroid Build Coastguard Worker        base = -torch.ones(2, device=device, dtype=torch.double)
*da0073e9SAndroid Build Coastguard Worker        exponent = torch.randn(
*da0073e9SAndroid Build Coastguard Worker            2, device=device, dtype=torch.cdouble, requires_grad=True
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn(exponent):
*da0073e9SAndroid Build Coastguard Worker            return torch.pow(base, exponent)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.gradcheck(fn, (exponent,))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn(exponent):
*da0073e9SAndroid Build Coastguard Worker            return torch.pow(-1, exponent)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.gradcheck(fn, (exponent,))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_resize_version_bump(self, device):
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand((1,), device=device)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn((3,), device=device)
*da0073e9SAndroid Build Coastguard Worker        x.resize_((1, 2))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x._version, 1)
*da0073e9SAndroid Build Coastguard Worker        x.resize_as_(y)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x._version, 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # In the following cases, `resize` is no-op,
*da0073e9SAndroid Build Coastguard Worker        # so no version bumps.
*da0073e9SAndroid Build Coastguard Worker        x.resize_((3,))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x._version, 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x.resize_as_(y)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x._version, 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass TestAllowMutationOnSaved(TestCase):
*da0073e9SAndroid Build Coastguard Worker    def assertClonedLenEqual(self, ctx, n):
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(len(list(ctx.cloned.items())), n)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def assertTIDMapLenEqual(self, ctx, n):
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(len(list(ctx.tid_to_weakhandle.items())), n)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_basic(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.rand(2, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn(a):
*da0073e9SAndroid Build Coastguard Worker            b = a.clone()
*da0073e9SAndroid Build Coastguard Worker            out = (b**2).sum()
*da0073e9SAndroid Build Coastguard Worker            b.sin_()
*da0073e9SAndroid Build Coastguard Worker            out.sum().backward()
*da0073e9SAndroid Build Coastguard Worker            return a.grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        msg = (
*da0073e9SAndroid Build Coastguard Worker            "variables needed for gradient computation has been modified by an inplace"
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, msg):
*da0073e9SAndroid Build Coastguard Worker            fn(a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.allow_mutation_on_saved_tensors() as ctx:
*da0073e9SAndroid Build Coastguard Worker            da = fn(a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(torch.allclose(a * 2, da))
*da0073e9SAndroid Build Coastguard Worker        self.assertClonedLenEqual(ctx, 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_views(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.rand(2, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn(a):
*da0073e9SAndroid Build Coastguard Worker            b = a.clone()
*da0073e9SAndroid Build Coastguard Worker            c = b.view_as(b)
*da0073e9SAndroid Build Coastguard Worker            out = (b**2).sum()  # How does this work?
*da0073e9SAndroid Build Coastguard Worker            c.sin_()
*da0073e9SAndroid Build Coastguard Worker            out.sum().backward()
*da0073e9SAndroid Build Coastguard Worker            return a.grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        msg = (
*da0073e9SAndroid Build Coastguard Worker            "variables needed for gradient computation has been modified by an inplace"
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, msg):
*da0073e9SAndroid Build Coastguard Worker            fn(a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.allow_mutation_on_saved_tensors() as ctx:
*da0073e9SAndroid Build Coastguard Worker            da = fn(a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertClonedLenEqual(ctx, 0)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(torch.allclose(a * 2, da))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_save_base_and_modify_view(self):
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.allow_mutation_on_saved_tensors() as ctx:
*da0073e9SAndroid Build Coastguard Worker            a = torch.rand(2, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            b = a.clone()
*da0073e9SAndroid Build Coastguard Worker            c = b[:1]
*da0073e9SAndroid Build Coastguard Worker            out = b**2
*da0073e9SAndroid Build Coastguard Worker            # modify the view
*da0073e9SAndroid Build Coastguard Worker            c *= 10
*da0073e9SAndroid Build Coastguard Worker            # self.assertClonedLenEqual(ctx, 1)
*da0073e9SAndroid Build Coastguard Worker            out.sum().backward()
*da0073e9SAndroid Build Coastguard Worker            self.assertClonedLenEqual(ctx, 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertClonedLenEqual(ctx, 0)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(torch.allclose(a * 2, a.grad))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_save_view_modify_base(self):
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.allow_mutation_on_saved_tensors() as ctx:
*da0073e9SAndroid Build Coastguard Worker            a = torch.rand(2, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            b = a.clone()
*da0073e9SAndroid Build Coastguard Worker            c = b[:]
*da0073e9SAndroid Build Coastguard Worker            out = (c**2).sum()
*da0073e9SAndroid Build Coastguard Worker            b *= 2
*da0073e9SAndroid Build Coastguard Worker            out.backward()
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.allclose(a * 2, a.grad))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_double_backward(self):
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.allow_mutation_on_saved_tensors() as ctx:
*da0073e9SAndroid Build Coastguard Worker            a = torch.rand(2, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            b = a.clone()
*da0073e9SAndroid Build Coastguard Worker            out = (b**2).sum()
*da0073e9SAndroid Build Coastguard Worker            b.sin_()
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.grad(out, a, create_graph=True)
*da0073e9SAndroid Build Coastguard Worker            (da,) = torch.autograd.grad(out, a, create_graph=True)
*da0073e9SAndroid Build Coastguard Worker            (d2a,) = torch.autograd.grad(da.sum(), a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(torch.allclose(torch.ones_like(a) * 2, d2a))
*da0073e9SAndroid Build Coastguard Worker        self.assertClonedLenEqual(ctx, 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_saved_but_not_anymore(self):
*da0073e9SAndroid Build Coastguard Worker        # Make sure we don't clone if the tensor was once saved, but
*da0073e9SAndroid Build Coastguard Worker        # by the time we do in-place, it is no longer saved
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.allow_mutation_on_saved_tensors() as ctx:
*da0073e9SAndroid Build Coastguard Worker            a = torch.randn(2, 3, requires_grad=True).clone()
*da0073e9SAndroid Build Coastguard Worker            out = (a**2).sum()
*da0073e9SAndroid Build Coastguard Worker            self.assertTIDMapLenEqual(ctx, 1)
*da0073e9SAndroid Build Coastguard Worker            self.assertClonedLenEqual(ctx, 0)
*da0073e9SAndroid Build Coastguard Worker            out.backward()
*da0073e9SAndroid Build Coastguard Worker            a.sin_()
*da0073e9SAndroid Build Coastguard Worker            self.assertClonedLenEqual(ctx, 0)
*da0073e9SAndroid Build Coastguard Worker            out = (a**2).sum()
*da0073e9SAndroid Build Coastguard Worker            a.sin_()
*da0073e9SAndroid Build Coastguard Worker            self.assertClonedLenEqual(ctx, 1)
*da0073e9SAndroid Build Coastguard Worker            del out
*da0073e9SAndroid Build Coastguard Worker            self.assertClonedLenEqual(ctx, 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_saved_same_tensor_many_times(self):
*da0073e9SAndroid Build Coastguard Worker        # We should only clone once
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.allow_mutation_on_saved_tensors() as ctx:
*da0073e9SAndroid Build Coastguard Worker            a = torch.randn(2, 3, requires_grad=True).clone()
*da0073e9SAndroid Build Coastguard Worker            b = a**2
*da0073e9SAndroid Build Coastguard Worker            c = a**2
*da0073e9SAndroid Build Coastguard Worker            a.sin_()
*da0073e9SAndroid Build Coastguard Worker            self.assertClonedLenEqual(ctx, 1)
*da0073e9SAndroid Build Coastguard Worker            del b, c
*da0073e9SAndroid Build Coastguard Worker            self.assertClonedLenEqual(ctx, 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_saved_same_tensor_different_versions(self):
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.allow_mutation_on_saved_tensors() as ctx:
*da0073e9SAndroid Build Coastguard Worker            a = torch.randn(2, 3, requires_grad=True).clone()
*da0073e9SAndroid Build Coastguard Worker            b = a**2
*da0073e9SAndroid Build Coastguard Worker            a.sin_()
*da0073e9SAndroid Build Coastguard Worker            c = a**2
*da0073e9SAndroid Build Coastguard Worker            a.sin_()
*da0073e9SAndroid Build Coastguard Worker            self.assertClonedLenEqual(ctx, 2)
*da0073e9SAndroid Build Coastguard Worker            del b
*da0073e9SAndroid Build Coastguard Worker            self.assertClonedLenEqual(ctx, 1)
*da0073e9SAndroid Build Coastguard Worker            del c
*da0073e9SAndroid Build Coastguard Worker            self.assertClonedLenEqual(ctx, 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_with_math_views(self):
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.allow_mutation_on_saved_tensors() as ctx:
*da0073e9SAndroid Build Coastguard Worker            a = torch.tensor([1 + 1j], requires_grad=True).clone()
*da0073e9SAndroid Build Coastguard Worker            b = a.conj()
*da0073e9SAndroid Build Coastguard Worker            out = (b**2).sum()
*da0073e9SAndroid Build Coastguard Worker            a.sin_()
*da0073e9SAndroid Build Coastguard Worker            out.abs().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            a = torch.tensor([1 + 1j], requires_grad=True).clone()
*da0073e9SAndroid Build Coastguard Worker            b = a.conj()
*da0073e9SAndroid Build Coastguard Worker            out = (b**2).sum()
*da0073e9SAndroid Build Coastguard Worker            # in this case, it is no longer a view it seems
*da0073e9SAndroid Build Coastguard Worker            b.sin_()
*da0073e9SAndroid Build Coastguard Worker            out.abs().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_with_out_variant(self):
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.allow_mutation_on_saved_tensors() as ctx:
*da0073e9SAndroid Build Coastguard Worker            a = torch.tensor([1.0], requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            b = torch.tensor([1.0])
*da0073e9SAndroid Build Coastguard Worker            c = torch.tensor([2.0])
*da0073e9SAndroid Build Coastguard Worker            out = a * b
*da0073e9SAndroid Build Coastguard Worker            self.assertTIDMapLenEqual(ctx, 1)
*da0073e9SAndroid Build Coastguard Worker            torch.sin(c, out=b)
*da0073e9SAndroid Build Coastguard Worker            self.assertClonedLenEqual(ctx, 1)
*da0073e9SAndroid Build Coastguard Worker            out.backward()
*da0073e9SAndroid Build Coastguard Worker            self.assertClonedLenEqual(ctx, 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_backward_out_of_context(self):
*da0073e9SAndroid Build Coastguard Worker        # Out of context
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.allow_mutation_on_saved_tensors() as ctx:
*da0073e9SAndroid Build Coastguard Worker            a = torch.rand(2, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            out = (a**2).sum()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        msg = "Trying to backward outside of the 'allow_mutation_on_saved_tensors' context"
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(AssertionError, msg):
*da0073e9SAndroid Build Coastguard Worker            out.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Different context
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.allow_mutation_on_saved_tensors() as ctx:
*da0073e9SAndroid Build Coastguard Worker            a = torch.rand(2, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            out = (a**2).sum()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.allow_mutation_on_saved_tensors() as ctx:
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(AssertionError, msg):
*da0073e9SAndroid Build Coastguard Worker                out.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_disallow_nesting(self):
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.allow_mutation_on_saved_tensors() as ctx:
*da0073e9SAndroid Build Coastguard Worker            msg = "allow_mutation_on_saved_tensors contexts cannot be nested"
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, msg):
*da0073e9SAndroid Build Coastguard Worker                with torch.autograd.graph.allow_mutation_on_saved_tensors() as ctx:
*da0073e9SAndroid Build Coastguard Worker                    pass
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass TestAutogradInferenceMode(TestCase):
*da0073e9SAndroid Build Coastguard Worker    def _is_inference_tensor(self, tensor):
*da0073e9SAndroid Build Coastguard Worker        try:
*da0073e9SAndroid Build Coastguard Worker            err_msg = "Inference tensors do not track version counter"
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, err_msg):
*da0073e9SAndroid Build Coastguard Worker                tensor._version
*da0073e9SAndroid Build Coastguard Worker            return True
*da0073e9SAndroid Build Coastguard Worker        except AssertionError as e:
*da0073e9SAndroid Build Coastguard Worker            return False
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inference_mode_context_manager(self):
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(torch.is_inference_mode_enabled())
*da0073e9SAndroid Build Coastguard Worker        with torch.inference_mode():
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.is_inference_mode_enabled())
*da0073e9SAndroid Build Coastguard Worker            with torch.inference_mode(False):
*da0073e9SAndroid Build Coastguard Worker                self.assertFalse(torch.is_inference_mode_enabled())
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.is_inference_mode_enabled())
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(torch.is_inference_mode_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inference_mode_decorator(self):
*da0073e9SAndroid Build Coastguard Worker        def func(x):
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.is_inference_mode_enabled(), mode)
*da0073e9SAndroid Build Coastguard Worker            return x * x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for mode, use_kwarg in product((True, False, None), (True, False)):
*da0073e9SAndroid Build Coastguard Worker            if mode is None:
*da0073e9SAndroid Build Coastguard Worker                if use_kwarg:
*da0073e9SAndroid Build Coastguard Worker                    decorated = torch.inference_mode(mode=func)
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    decorated = torch.inference_mode(func)
*da0073e9SAndroid Build Coastguard Worker                mode = True
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                if use_kwarg:
*da0073e9SAndroid Build Coastguard Worker                    decorated = torch.inference_mode(mode=mode)(func)
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    decorated = torch.inference_mode(mode)(func)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            for requires_grad in (True, False):
*da0073e9SAndroid Build Coastguard Worker                c = torch.ones(1, 2, 3, requires_grad=requires_grad)
*da0073e9SAndroid Build Coastguard Worker                d = decorated(c)
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(not mode or torch.is_inference(d))
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(d.requires_grad, requires_grad and not mode)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inference_mode_tensor_creation(self):
*da0073e9SAndroid Build Coastguard Worker        with torch.inference_mode():
*da0073e9SAndroid Build Coastguard Worker            # new tensors created through constructors are inference tensors
*da0073e9SAndroid Build Coastguard Worker            c = torch.ones(1, 2, 3)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(c.requires_grad)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.is_inference(c))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # requires_grad doesn't change inference tensor behavior in InferenceMode
*da0073e9SAndroid Build Coastguard Worker            tmp = torch.ones(1, 2, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(tmp.requires_grad)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.is_inference(tmp))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            tmp = torch.ones(1, 2, 3).requires_grad_(False)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(tmp.requires_grad)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.is_inference(tmp))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inference_mode_existing_autograd_session(self):
*da0073e9SAndroid Build Coastguard Worker        s = torch.ones(1, 2, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        a = s.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # `a` gets saved outside of inference mode
*da0073e9SAndroid Build Coastguard Worker        out = a * a
*da0073e9SAndroid Build Coastguard Worker        with torch.inference_mode():
*da0073e9SAndroid Build Coastguard Worker            a.add_(2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(torch.is_inference(a))
*da0073e9SAndroid Build Coastguard Worker        # tensors created outside of inference mode aren't
*da0073e9SAndroid Build Coastguard Worker        # inference tensors, so they will still have their
*da0073e9SAndroid Build Coastguard Worker        # version counters tracked
*da0073e9SAndroid Build Coastguard Worker        err_msg = (
*da0073e9SAndroid Build Coastguard Worker            "one of the variables needed for gradient computation has been "
*da0073e9SAndroid Build Coastguard Worker            "modified by an inplace operation"
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, err_msg):
*da0073e9SAndroid Build Coastguard Worker            out.backward(torch.ones_like(out))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inference_mode_inf_tensor_in_inf_mode_functional_op(self):
*da0073e9SAndroid Build Coastguard Worker        def functional_op(x):
*da0073e9SAndroid Build Coastguard Worker            return x * x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.inference_mode():
*da0073e9SAndroid Build Coastguard Worker            for requires_grad in (True, False):
*da0073e9SAndroid Build Coastguard Worker                c = torch.ones(1, 2, 3, requires_grad=requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # performing a non-view operation produces a inference tensor
*da0073e9SAndroid Build Coastguard Worker                # that does not require grad
*da0073e9SAndroid Build Coastguard Worker                func_out = functional_op(c)
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(torch.is_inference(func_out))
*da0073e9SAndroid Build Coastguard Worker                self.assertFalse(func_out.requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inference_mode_inf_tensor_in_inf_mode_inplace_op(self):
*da0073e9SAndroid Build Coastguard Worker        @torch.inference_mode()
*da0073e9SAndroid Build Coastguard Worker        def run_test(fn):
*da0073e9SAndroid Build Coastguard Worker            for requires_grad in (True, False):
*da0073e9SAndroid Build Coastguard Worker                c = torch.ones(1, 2, 3, requires_grad=requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # after performing inplace operation, tensor is still
*da0073e9SAndroid Build Coastguard Worker                # an inference tensor
*da0073e9SAndroid Build Coastguard Worker                fn(c)
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(torch.is_inference(c))
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(c.requires_grad, requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        run_test(lambda x: x.add_(2))
*da0073e9SAndroid Build Coastguard Worker        run_test(lambda x: x.transpose_(0, 1))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # inplace ops with manual kernel for ADInplaceOrView key in VariableTypeManual.cpp
*da0073e9SAndroid Build Coastguard Worker        run_test(lambda x: x.resize_(1, 2))
*da0073e9SAndroid Build Coastguard Worker        run_test(lambda x: x.resize_as_(torch.ones(1, 2)))
*da0073e9SAndroid Build Coastguard Worker        run_test(lambda x: x.copy_(torch.ones(1, 2, 3)))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inference_mode_inf_tensor_in_inf_mode_view_op(self):
*da0073e9SAndroid Build Coastguard Worker        with torch.inference_mode():
*da0073e9SAndroid Build Coastguard Worker            for requires_grad in (True, False):
*da0073e9SAndroid Build Coastguard Worker                c = torch.ones(1, 2, 3, requires_grad=requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # perform view operation produces inference tensor
*da0073e9SAndroid Build Coastguard Worker                # that does not require grad
*da0073e9SAndroid Build Coastguard Worker                view_out = c.view(-1)
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(torch.is_inference(view_out))
*da0073e9SAndroid Build Coastguard Worker                self.assertFalse(view_out.requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inference_mode_inf_tensor_in_normal_mode_functional_op(self):
*da0073e9SAndroid Build Coastguard Worker        def functional_op(x):
*da0073e9SAndroid Build Coastguard Worker            return x * x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for requires_grad in (True, False):
*da0073e9SAndroid Build Coastguard Worker            with torch.inference_mode():
*da0073e9SAndroid Build Coastguard Worker                c = torch.ones(1, 2, 3, requires_grad=requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        func_out = functional_op(c)
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(torch.is_inference(func_out))
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(func_out.requires_grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(func_out.is_leaf)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inference_mode_inf_tensor_in_normal_mode_inplace_op(self):
*da0073e9SAndroid Build Coastguard Worker        def run_test(fn):
*da0073e9SAndroid Build Coastguard Worker            for requires_grad in (False, True):
*da0073e9SAndroid Build Coastguard Worker                with torch.inference_mode():
*da0073e9SAndroid Build Coastguard Worker                    c = torch.ones(1, 2, 3, requires_grad=requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                if requires_grad:
*da0073e9SAndroid Build Coastguard Worker                    # leaf variable that requires grad is being used in an inplace
*da0073e9SAndroid Build Coastguard Worker                    # operation when requires_grad=True
*da0073e9SAndroid Build Coastguard Worker                    pass
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    err_msg = "Inplace update to inference tensor outside InferenceMode"
*da0073e9SAndroid Build Coastguard Worker                    with self.assertRaisesRegex(RuntimeError, err_msg):
*da0073e9SAndroid Build Coastguard Worker                        fn(c)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        run_test(lambda x: x.add_(2))
*da0073e9SAndroid Build Coastguard Worker        run_test(lambda x: x.transpose_(0, 1))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inference_mode_inf_tensor_in_normal_mode_view_op(self):
*da0073e9SAndroid Build Coastguard Worker        for requires_grad in (True, False):
*da0073e9SAndroid Build Coastguard Worker            with torch.inference_mode():
*da0073e9SAndroid Build Coastguard Worker                c = torch.ones(1, 2, 3, requires_grad=requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            out = c.view(-1)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.is_inference(out))
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(out.requires_grad)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(out._is_view())
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(out.is_leaf)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_normal_tensor_inplace_output_in_inference_mode(self):
*da0073e9SAndroid Build Coastguard Worker        def run_test(fn):
*da0073e9SAndroid Build Coastguard Worker            for requires_grad in (True, False):
*da0073e9SAndroid Build Coastguard Worker                s = torch.ones(1, 2, 3, requires_grad=requires_grad)
*da0073e9SAndroid Build Coastguard Worker                a = s.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                with torch.inference_mode():
*da0073e9SAndroid Build Coastguard Worker                    fn(a)
*da0073e9SAndroid Build Coastguard Worker                    self.assertFalse(torch.is_inference(a))
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(a.requires_grad, requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    # inplace -> inplace
*da0073e9SAndroid Build Coastguard Worker                    fn(a)
*da0073e9SAndroid Build Coastguard Worker                    self.assertFalse(torch.is_inference(a))
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(a.requires_grad, requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    # inplace -> inplace -> view
*da0073e9SAndroid Build Coastguard Worker                    view_out = a.view(-1)
*da0073e9SAndroid Build Coastguard Worker                    self.assertFalse(torch.is_inference(view_out))
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(view_out.requires_grad, requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        run_test(lambda x: x.add_(2))
*da0073e9SAndroid Build Coastguard Worker        run_test(lambda x: x.transpose_(0, 1))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_normal_tensor_inplace_output_in_normal_mode(self):
*da0073e9SAndroid Build Coastguard Worker        def run_test(fn):
*da0073e9SAndroid Build Coastguard Worker            for requires_grad in (True, False):
*da0073e9SAndroid Build Coastguard Worker                s = torch.ones(1, 2, 3, requires_grad=requires_grad)
*da0073e9SAndroid Build Coastguard Worker                a = s.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                with torch.inference_mode():
*da0073e9SAndroid Build Coastguard Worker                    fn(a)
*da0073e9SAndroid Build Coastguard Worker                    self.assertFalse(torch.is_inference(a))
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(a.requires_grad, requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                fn(a)
*da0073e9SAndroid Build Coastguard Worker                self.assertFalse(torch.is_inference(a))
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(a.requires_grad, requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # inplace -> inplace
*da0073e9SAndroid Build Coastguard Worker                fn(a)
*da0073e9SAndroid Build Coastguard Worker                self.assertFalse(torch.is_inference(a))
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(a.requires_grad, requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # inplace -> inplace -> view
*da0073e9SAndroid Build Coastguard Worker                view_out = a.view(-1)
*da0073e9SAndroid Build Coastguard Worker                self.assertFalse(torch.is_inference(view_out))
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(view_out.requires_grad, requires_grad)
*da0073e9SAndroid Build Coastguard Worker            run_test(lambda x: x.add_(2))
*da0073e9SAndroid Build Coastguard Worker            run_test(lambda x: x.transpose_(0, 1))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_normal_tensor_view_output_in_inference_mode(self):
*da0073e9SAndroid Build Coastguard Worker        for requires_grad in (True, False):
*da0073e9SAndroid Build Coastguard Worker            s = torch.ones(1, 2, 3, requires_grad=requires_grad)
*da0073e9SAndroid Build Coastguard Worker            a = s.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            with torch.inference_mode():
*da0073e9SAndroid Build Coastguard Worker                out = a.view(-1)
*da0073e9SAndroid Build Coastguard Worker                self.assertFalse(torch.is_inference(out))
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(out.requires_grad, requires_grad)
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(out._is_view())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # view -> view
*da0073e9SAndroid Build Coastguard Worker                tmp = out.view(-1)
*da0073e9SAndroid Build Coastguard Worker                self.assertFalse(torch.is_inference(tmp))
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(tmp.requires_grad, requires_grad)
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(tmp._is_view())
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(tmp.is_leaf)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # view -> view -> inplace
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(torch.is_inference_mode_enabled())
*da0073e9SAndroid Build Coastguard Worker                tmp.add_(2)
*da0073e9SAndroid Build Coastguard Worker                self.assertFalse(torch.is_inference(tmp))
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(tmp.requires_grad, requires_grad)
*da0073e9SAndroid Build Coastguard Worker                # Accessing is_leaf in python tries to update grad_fn and raises:
*da0073e9SAndroid Build Coastguard Worker                # A view was created in inference mode and its base or
*da0073e9SAndroid Build Coastguard Worker                # another view of its base has been modified inplace in normal mode
*da0073e9SAndroid Build Coastguard Worker                # tmp.is_leaf
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(a._version, tmp._version)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_normal_tensor_view_output_in_normal_mode(self):
*da0073e9SAndroid Build Coastguard Worker        def functional_op(x):
*da0073e9SAndroid Build Coastguard Worker            return x * x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for requires_grad in (True, False):
*da0073e9SAndroid Build Coastguard Worker            s = torch.ones(1, 2, 3, requires_grad=requires_grad)
*da0073e9SAndroid Build Coastguard Worker            a = s.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            with torch.inference_mode():
*da0073e9SAndroid Build Coastguard Worker                out = a.view(-1)
*da0073e9SAndroid Build Coastguard Worker                self.assertFalse(torch.is_inference(out))
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(out.requires_grad, requires_grad)
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(out._is_view())
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(out.is_leaf)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            tmp = functional_op(out)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(torch.is_inference(tmp))
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(tmp.requires_grad, requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            if requires_grad:
*da0073e9SAndroid Build Coastguard Worker                err_msg = (
*da0073e9SAndroid Build Coastguard Worker                    "A view was created in inference mode and is being modified inplace"
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                with self.assertRaisesRegex(RuntimeError, err_msg):
*da0073e9SAndroid Build Coastguard Worker                    out.add_(2)
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                out.add_(2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            tmp = out.view(2, 3)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(torch.is_inference(tmp))
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(tmp.requires_grad, requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_mix_inference_and_normal_tensor_functional_op(self):
*da0073e9SAndroid Build Coastguard Worker        for requires_grad in (True, False):
*da0073e9SAndroid Build Coastguard Worker            s = torch.ones(1, 2, 3, requires_grad=requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            with torch.inference_mode():
*da0073e9SAndroid Build Coastguard Worker                c = torch.ones(1, 2, 3, requires_grad=requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # add is safe since it doesn't save any variable for backward
*da0073e9SAndroid Build Coastguard Worker            out = c.add(s)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(torch.is_inference(out))
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(out.requires_grad, requires_grad)
*da0073e9SAndroid Build Coastguard Worker            if requires_grad:
*da0073e9SAndroid Build Coastguard Worker                # leaf inference tensor with requires_grad=True can still have gradient
*da0073e9SAndroid Build Coastguard Worker                out.backward(torch.ones_like(out))
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(c.grad, torch.ones_like(c))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            if requires_grad:
*da0073e9SAndroid Build Coastguard Worker                err_msg = "Inference tensors cannot be saved for backward"
*da0073e9SAndroid Build Coastguard Worker                with self.assertRaisesRegex(RuntimeError, err_msg):
*da0073e9SAndroid Build Coastguard Worker                    c * s
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # TODO: Test this with an autograd.Function when it works
*da0073e9SAndroid Build Coastguard Worker                #       stack stopped capturing a TensorList input
*da0073e9SAndroid Build Coastguard Worker                # # inference tensor in TensorList input
*da0073e9SAndroid Build Coastguard Worker                # inputs = [s, c]
*da0073e9SAndroid Build Coastguard Worker                # with self.assertRaisesRegex(RuntimeError, err_msg):
*da0073e9SAndroid Build Coastguard Worker                #     torch.stack(inputs)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_mix_inference_and_normal_tensor_inplace_op(self):
*da0073e9SAndroid Build Coastguard Worker        for requires_grad in (True, False):
*da0073e9SAndroid Build Coastguard Worker            s = torch.ones(1, 2, 3, requires_grad=requires_grad)
*da0073e9SAndroid Build Coastguard Worker            a = s.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            with torch.inference_mode():
*da0073e9SAndroid Build Coastguard Worker                c = torch.ones(1, 2, 3)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.is_inference(c))
*da0073e9SAndroid Build Coastguard Worker            if requires_grad:
*da0073e9SAndroid Build Coastguard Worker                err_msg = "Inference tensors cannot be saved for backward"
*da0073e9SAndroid Build Coastguard Worker                with self.assertRaisesRegex(RuntimeError, err_msg):
*da0073e9SAndroid Build Coastguard Worker                    a.mul_(c)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # inference tensor in TensorList input
*da0073e9SAndroid Build Coastguard Worker                err_msg = (
*da0073e9SAndroid Build Coastguard Worker                    "out=... arguments don't support automatic differentiation, "
*da0073e9SAndroid Build Coastguard Worker                    "but one of the arguments requires grad"
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                with self.assertRaisesRegex(RuntimeError, err_msg):
*da0073e9SAndroid Build Coastguard Worker                    torch.mul(s, s, out=c)
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                a.mul_(c)
*da0073e9SAndroid Build Coastguard Worker                err_msg = "Inplace update to inference tensor outside InferenceMode is not allowed"
*da0073e9SAndroid Build Coastguard Worker                with self.assertRaisesRegex(RuntimeError, err_msg):
*da0073e9SAndroid Build Coastguard Worker                    torch.mul(s, s, out=c)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_mix_inference_and_normal_tensor_view_op(self):
*da0073e9SAndroid Build Coastguard Worker        for requires_grad in (True, False):
*da0073e9SAndroid Build Coastguard Worker            s = torch.ones(1, 2, 3, requires_grad=requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            with torch.inference_mode():
*da0073e9SAndroid Build Coastguard Worker                c = torch.ones(1, 2, 3)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # view_as is a composite op which calls view with only one
*da0073e9SAndroid Build Coastguard Worker            # tensor argument. So there isn't a mixed inference and normal
*da0073e9SAndroid Build Coastguard Worker            # tensor inputs for view ops
*da0073e9SAndroid Build Coastguard Worker            tmp1 = c.view_as(s)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.is_inference(tmp1))
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(tmp1.requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # this is fine since its equivalent as s.view(c.sizes()) which
*da0073e9SAndroid Build Coastguard Worker            # isn't a mixed input scenario
*da0073e9SAndroid Build Coastguard Worker            tmp2 = s.view_as(c)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(torch.is_inference(tmp2))
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(tmp2.requires_grad, requires_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inference_mode_handle_direct_view_on_rebase(self):
*da0073e9SAndroid Build Coastguard Worker        def run_test(fn):
*da0073e9SAndroid Build Coastguard Worker            for requires_grad in (True, False):
*da0073e9SAndroid Build Coastguard Worker                s = torch.ones(1, 2, 3, requires_grad=requires_grad)
*da0073e9SAndroid Build Coastguard Worker                a = s.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                with torch.inference_mode():
*da0073e9SAndroid Build Coastguard Worker                    view_out = a.view_as(a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                if requires_grad:
*da0073e9SAndroid Build Coastguard Worker                    err_msg = "A view was created in inference mode and is being modified inplace"
*da0073e9SAndroid Build Coastguard Worker                    with self.assertRaisesRegex(RuntimeError, err_msg):
*da0073e9SAndroid Build Coastguard Worker                        fn(view_out)
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    fn(view_out)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        run_test(lambda x: x.add_(2))
*da0073e9SAndroid Build Coastguard Worker        run_test(lambda x: x.transpose_(0, 1))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_inference_mode_handle_indirect_view_on_rebase(self):
*da0073e9SAndroid Build Coastguard Worker        def run_test(fn):
*da0073e9SAndroid Build Coastguard Worker            for requires_grad in (True, False):
*da0073e9SAndroid Build Coastguard Worker                s = torch.ones(1, 2, 3, requires_grad=requires_grad)
*da0073e9SAndroid Build Coastguard Worker                a = s.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                with torch.inference_mode():
*da0073e9SAndroid Build Coastguard Worker                    view_out = a.view(-1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                fn(a)
*da0073e9SAndroid Build Coastguard Worker                if requires_grad:
*da0073e9SAndroid Build Coastguard Worker                    err_msg = "A view was created in inference mode and its base or another view "
*da0073e9SAndroid Build Coastguard Worker                    with self.assertRaisesRegex(RuntimeError, err_msg):
*da0073e9SAndroid Build Coastguard Worker                        view_out.grad_fn
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    view_out.grad_fn
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        run_test(lambda x: x.add_(2))
*da0073e9SAndroid Build Coastguard Worker        run_test(lambda x: x.transpose_(0, 1))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass TestMultithreadAutograd(TestCase):
*da0073e9SAndroid Build Coastguard Worker    def _run_py_multithread_fn(
*da0073e9SAndroid Build Coastguard Worker        self, fn, args=(), num_threads=10, kwargs=None, pass_idx=False
*da0073e9SAndroid Build Coastguard Worker    ):
*da0073e9SAndroid Build Coastguard Worker        class PropagatingThread(threading.Thread):
*da0073e9SAndroid Build Coastguard Worker            """Helper class to propagate exception from child
*da0073e9SAndroid Build Coastguard Worker            thread to main thread on join.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            Reference: https://stackoverflow.com/a/31614591/5602957
*da0073e9SAndroid Build Coastguard Worker            """
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def run(self):
*da0073e9SAndroid Build Coastguard Worker                self.exception = None
*da0073e9SAndroid Build Coastguard Worker                try:
*da0073e9SAndroid Build Coastguard Worker                    self.ret = super().run()
*da0073e9SAndroid Build Coastguard Worker                except Exception as e:
*da0073e9SAndroid Build Coastguard Worker                    self.exception = e
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def join(self, timeout=None):
*da0073e9SAndroid Build Coastguard Worker                super().join(timeout)
*da0073e9SAndroid Build Coastguard Worker                if self.exception:
*da0073e9SAndroid Build Coastguard Worker                    raise self.exception from self.exception
*da0073e9SAndroid Build Coastguard Worker                return self.ret
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        threads = []
*da0073e9SAndroid Build Coastguard Worker        for idx in range(num_threads):
*da0073e9SAndroid Build Coastguard Worker            p = PropagatingThread(target=fn, args=((idx, *args) if pass_idx else args))
*da0073e9SAndroid Build Coastguard Worker            p.start()
*da0073e9SAndroid Build Coastguard Worker            threads.append(p)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for p in threads:
*da0073e9SAndroid Build Coastguard Worker            p.join()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_multithreaded_exception_propagation(self):
*da0073e9SAndroid Build Coastguard Worker        # Test whether exception in child thread
*da0073e9SAndroid Build Coastguard Worker        # are propagated to main thread.
*da0073e9SAndroid Build Coastguard Worker        def fn():
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(AssertionError):
*da0073e9SAndroid Build Coastguard Worker            self._run_py_multithread_fn(fn)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_simple_backward(self):
*da0073e9SAndroid Build Coastguard Worker        # simple multithreaded backward that create threads in the beginning of training
*da0073e9SAndroid Build Coastguard Worker        # and everything else is training separately, i.e. inputs, operations, etc.
*da0073e9SAndroid Build Coastguard Worker        def train_fn():
*da0073e9SAndroid Build Coastguard Worker            x = torch.ones(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            y = (x + 3) * (x + 4) * 0.5
*da0073e9SAndroid Build Coastguard Worker            y.sum().backward()
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(x.grad, x + 3.5)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self._run_py_multithread_fn(train_fn)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_simple_backward_same_input(self):
*da0073e9SAndroid Build Coastguard Worker        # simple multithreaded backward with only shared inputs (i.e. This is common
*da0073e9SAndroid Build Coastguard Worker        # for things like Hogwild multithreaded training with multiple CPU threads)
*da0073e9SAndroid Build Coastguard Worker        def train_fn_backward(x):
*da0073e9SAndroid Build Coastguard Worker            y = (x + 3) * (x + 4) * 0.5
*da0073e9SAndroid Build Coastguard Worker            y.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        self._run_py_multithread_fn(train_fn_backward, (x,))
*da0073e9SAndroid Build Coastguard Worker        # Since we are calling backward from multiple threads
*da0073e9SAndroid Build Coastguard Worker        # and all threads share the same input, when we do backward
*da0073e9SAndroid Build Coastguard Worker        # concurrently, different backwards will all accumulate to
*da0073e9SAndroid Build Coastguard Worker        # the same .grad for each input, and the gradients should
*da0073e9SAndroid Build Coastguard Worker        # be equal to num_threads * gradient
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, 10 * (x + 3.5))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def train_fn_grad(x):
*da0073e9SAndroid Build Coastguard Worker            y = (x + 3) * (x + 4) * 0.5
*da0073e9SAndroid Build Coastguard Worker            grads = torch.autograd.grad(y.sum(), x)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(len(grads), 1)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(grads[0], x + 3.5)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # since we use functional grad() api, gradients will not
*da0073e9SAndroid Build Coastguard Worker        # be accumulate to the same place and should be the same
*da0073e9SAndroid Build Coastguard Worker        self._run_py_multithread_fn(train_fn_grad, (x,))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_multi_grad_all_hooks(self):
*da0073e9SAndroid Build Coastguard Worker        # Multihooks should behave independently per execution of backward
*da0073e9SAndroid Build Coastguard Worker        # Test that the hook fired the number of times we ran backward
*da0073e9SAndroid Build Coastguard Worker        # even if those executions occur concurrently on different threads
*da0073e9SAndroid Build Coastguard Worker        t1 = torch.rand(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        t2 = torch.rand(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        t3 = torch.rand(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        t4 = torch.rand(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        res = None
*da0073e9SAndroid Build Coastguard Worker        count = [0]
*da0073e9SAndroid Build Coastguard Worker        hook_lock = threading.Lock()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def hook(grads):
*da0073e9SAndroid Build Coastguard Worker            nonlocal res
*da0073e9SAndroid Build Coastguard Worker            with hook_lock:
*da0073e9SAndroid Build Coastguard Worker                count[0] += 1
*da0073e9SAndroid Build Coastguard Worker                grad_is_none = [g is not None for g in grads]
*da0073e9SAndroid Build Coastguard Worker                if res is None:
*da0073e9SAndroid Build Coastguard Worker                    res = grad_is_none
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(res, grad_is_none)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.graph.register_multi_grad_hook((t1, t2, t3, t4), hook)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = (t2 * t3).sum()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def backward_retain_graph(out, t2, t3):
*da0073e9SAndroid Build Coastguard Worker            out.backward(inputs=(t2, t3), retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self._run_py_multithread_fn(backward_retain_graph, (out, t2, t3), num_threads=5)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(count[0], 5)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(res, [False, True, True, False])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Leave one hook partially applied
*da0073e9SAndroid Build Coastguard Worker        res = None
*da0073e9SAndroid Build Coastguard Worker        count = [0]
*da0073e9SAndroid Build Coastguard Worker        err_count = [0]
*da0073e9SAndroid Build Coastguard Worker        bw_count = [0]
*da0073e9SAndroid Build Coastguard Worker        bw_count_lock = threading.Lock()
*da0073e9SAndroid Build Coastguard Worker        err_count_lock = threading.Lock()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class Func(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                with bw_count_lock:
*da0073e9SAndroid Build Coastguard Worker                    bw_count[0] += 1
*da0073e9SAndroid Build Coastguard Worker                    if bw_count[0] == 1:
*da0073e9SAndroid Build Coastguard Worker                        raise RuntimeError("error message")
*da0073e9SAndroid Build Coastguard Worker                    else:
*da0073e9SAndroid Build Coastguard Worker                        return gO
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = (Func.apply(t2) * t3).sum()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def backward_retain_graph(out, t2, t3):
*da0073e9SAndroid Build Coastguard Worker            try:
*da0073e9SAndroid Build Coastguard Worker                out.backward(inputs=(t2, t3), retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker            except RuntimeError:
*da0073e9SAndroid Build Coastguard Worker                with err_count_lock:
*da0073e9SAndroid Build Coastguard Worker                    err_count[0] += 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self._run_py_multithread_fn(backward_retain_graph, (out, t2, t3), num_threads=5)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(count[0], 4)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(err_count[0], 1)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(res, [False, True, True, False])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_multi_grad_any_hooks(self):
*da0073e9SAndroid Build Coastguard Worker        # Multihooks should behave independently per execution of backward
*da0073e9SAndroid Build Coastguard Worker        # Test that the hook fired the number of times we ran backward
*da0073e9SAndroid Build Coastguard Worker        # even if those executions occur concurrently on different threads
*da0073e9SAndroid Build Coastguard Worker        t1 = torch.rand(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        t2 = torch.rand(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        t3 = torch.rand(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        t4 = torch.rand(2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        res = None
*da0073e9SAndroid Build Coastguard Worker        count = [0]
*da0073e9SAndroid Build Coastguard Worker        hook_lock = threading.Lock()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def hook(grad):
*da0073e9SAndroid Build Coastguard Worker            nonlocal res
*da0073e9SAndroid Build Coastguard Worker            with hook_lock:
*da0073e9SAndroid Build Coastguard Worker                count[0] += 1
*da0073e9SAndroid Build Coastguard Worker                if res is None:
*da0073e9SAndroid Build Coastguard Worker                    res = "foo"
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(res, "foo")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.graph.register_multi_grad_hook(
*da0073e9SAndroid Build Coastguard Worker            (t1, t2, t3, t4), hook, mode="any"
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = (t2 * t3).sum()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def backward_retain_graph(out, t2, t3):
*da0073e9SAndroid Build Coastguard Worker            out.backward(inputs=(t2, t3), retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self._run_py_multithread_fn(backward_retain_graph, (out, t2, t3), num_threads=5)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(count[0], 5)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(res, "foo")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Raise an error in one thread's backward
*da0073e9SAndroid Build Coastguard Worker        res = None
*da0073e9SAndroid Build Coastguard Worker        count = [0]
*da0073e9SAndroid Build Coastguard Worker        err_count = [0]
*da0073e9SAndroid Build Coastguard Worker        bw_count = [0]
*da0073e9SAndroid Build Coastguard Worker        bw_count_lock = threading.Lock()
*da0073e9SAndroid Build Coastguard Worker        err_count_lock = threading.Lock()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class Func(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                with bw_count_lock:
*da0073e9SAndroid Build Coastguard Worker                    bw_count[0] += 1
*da0073e9SAndroid Build Coastguard Worker                    if bw_count[0] == 1:
*da0073e9SAndroid Build Coastguard Worker                        raise RuntimeError("error message")
*da0073e9SAndroid Build Coastguard Worker                    else:
*da0073e9SAndroid Build Coastguard Worker                        return gO
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = (Func.apply(t2) * t3).sum()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def backward_retain_graph(out, t2, t3):
*da0073e9SAndroid Build Coastguard Worker            try:
*da0073e9SAndroid Build Coastguard Worker                out.backward(inputs=(t2, t3), retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker            except RuntimeError:
*da0073e9SAndroid Build Coastguard Worker                with err_count_lock:
*da0073e9SAndroid Build Coastguard Worker                    err_count[0] += 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self._run_py_multithread_fn(backward_retain_graph, (out, t2, t3), num_threads=5)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Expect all 5 threads to increment count since the hook runs before
*da0073e9SAndroid Build Coastguard Worker        # the custom backward
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(count[0], 5)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(err_count[0], 1)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(res, "foo")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_dataparallel_saved_tensors_hooks(self):
*da0073e9SAndroid Build Coastguard Worker        def pack(x):
*da0073e9SAndroid Build Coastguard Worker            warnings.warn("pack")
*da0073e9SAndroid Build Coastguard Worker            return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        _self = self
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class Model(torch.nn.Module):
*da0073e9SAndroid Build Coastguard Worker            def forward(self, x):
*da0073e9SAndroid Build Coastguard Worker                with warnings.catch_warnings(record=True) as w:
*da0073e9SAndroid Build Coastguard Worker                    y = x * x
*da0073e9SAndroid Build Coastguard Worker                    if torch.cuda.device_count() >= 2:
*da0073e9SAndroid Build Coastguard Worker                        # DataParallel is calling the forward in different threads
*da0073e9SAndroid Build Coastguard Worker                        # without progating TLS, so hooks should not be called here
*da0073e9SAndroid Build Coastguard Worker                        _self.assertEqual(len(w), 0)
*da0073e9SAndroid Build Coastguard Worker                    else:
*da0073e9SAndroid Build Coastguard Worker                        # DataParallel only uses one thread
*da0073e9SAndroid Build Coastguard Worker                        # so hooks should be called here
*da0073e9SAndroid Build Coastguard Worker                        _self.assertGreater(len(w), 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        model = torch.nn.DataParallel(Model())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.graph.saved_tensors_hooks(pack, lambda x: x):
*da0073e9SAndroid Build Coastguard Worker            model(x)
*da0073e9SAndroid Build Coastguard Worker            with warnings.catch_warnings(record=True) as w:
*da0073e9SAndroid Build Coastguard Worker                y = x * x
*da0073e9SAndroid Build Coastguard Worker                # hooks should be called here
*da0073e9SAndroid Build Coastguard Worker                _self.assertGreater(len(w), 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_python_thread_in_middle(self):
*da0073e9SAndroid Build Coastguard Worker        # User might write a network that starts on one CPU thread, then runs its second half
*da0073e9SAndroid Build Coastguard Worker        # concurrently with other threads (either via python threading or fork/join calls),
*da0073e9SAndroid Build Coastguard Worker        # then calls backward()/grad() on BOTH threads, like a Y pattern from input at the
*da0073e9SAndroid Build Coastguard Worker        # bottom to output at the top. This way part of the GraphTask is being shared across
*da0073e9SAndroid Build Coastguard Worker        # different threads and we need to ensure user specify retain_graph=True, otherwise
*da0073e9SAndroid Build Coastguard Worker        # error out with the correct error message
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Case 1: multiple backward with python threads, retain_graph=False
*da0073e9SAndroid Build Coastguard Worker        # should throw error in some threads with no retain_graph.
*da0073e9SAndroid Build Coastguard Worker        success_vs_raises = [0, 0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def train_fn_no_retain_graph(x):
*da0073e9SAndroid Build Coastguard Worker            y = x + x**2
*da0073e9SAndroid Build Coastguard Worker            try:
*da0073e9SAndroid Build Coastguard Worker                y.sum().backward()
*da0073e9SAndroid Build Coastguard Worker                success_vs_raises[0] += 1
*da0073e9SAndroid Build Coastguard Worker            except RuntimeError as error:
*da0073e9SAndroid Build Coastguard Worker                success_vs_raises[1] += 1
*da0073e9SAndroid Build Coastguard Worker                self.assertRegex(str(error), "Specify retain_graph=True")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x_no_retain = torch.ones(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y_no_retain = x_no_retain + x_no_retain**2
*da0073e9SAndroid Build Coastguard Worker        self._run_py_multithread_fn(
*da0073e9SAndroid Build Coastguard Worker            train_fn_no_retain_graph, (y_no_retain,), num_threads=5
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        # at least one thread will be success in this case, all other threads should raise
*da0073e9SAndroid Build Coastguard Worker        # with the error that throw to user to recommend them specify retain_graph=True
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(success_vs_raises[0] >= 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # multiple backward with python threads, no error with retain_graph=True
*da0073e9SAndroid Build Coastguard Worker        def train_fn_retain_graph(x):
*da0073e9SAndroid Build Coastguard Worker            y = x + x**2
*da0073e9SAndroid Build Coastguard Worker            y.sum().backward(retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x_retain = torch.ones(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y_retain = x_retain + x_retain**2
*da0073e9SAndroid Build Coastguard Worker        self._run_py_multithread_fn(train_fn_retain_graph, (y_retain,), num_threads=5)
*da0073e9SAndroid Build Coastguard Worker        # result should equal to num_thread * gradients
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            x_retain.grad,
*da0073e9SAndroid Build Coastguard Worker            5 * (4 * x_retain**3 + 6 * (x_retain**2) + 4 * x_retain + 1),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_fork_join_in_middle(self):
*da0073e9SAndroid Build Coastguard Worker        # multiple backward with jit threads (fork/join primitive)
*da0073e9SAndroid Build Coastguard Worker        # similar to test_python_thread_in_middle, we test with retain_graph=False/True
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Case 1: multiple grad() calls with jit threads, retain_graph=False
*da0073e9SAndroid Build Coastguard Worker        # should throw error in some threads with no retain_graph.
*da0073e9SAndroid Build Coastguard Worker        @torch.jit.script
*da0073e9SAndroid Build Coastguard Worker        def train_fn_jit_no_retain(middle, orig_x):
*da0073e9SAndroid Build Coastguard Worker            y = middle + middle**2
*da0073e9SAndroid Build Coastguard Worker            return torch.autograd.grad([y.sum()], [orig_x])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        @torch.jit.script
*da0073e9SAndroid Build Coastguard Worker        def train_fn_fork_join_calls_no_retain(x):
*da0073e9SAndroid Build Coastguard Worker            y_no_retain = (x + 3) * (x + 4) * 0.5
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            fut = torch.jit._fork(train_fn_jit_no_retain, y_no_retain, x)
*da0073e9SAndroid Build Coastguard Worker            grad_hat = train_fn_jit_no_retain(y_no_retain, x)
*da0073e9SAndroid Build Coastguard Worker            grad = torch.jit._wait(fut)
*da0073e9SAndroid Build Coastguard Worker            return grad, grad_hat
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        try:
*da0073e9SAndroid Build Coastguard Worker            train_fn_fork_join_calls_no_retain(torch.randn(5, 5, requires_grad=True))
*da0073e9SAndroid Build Coastguard Worker        except RuntimeError as error:
*da0073e9SAndroid Build Coastguard Worker            self.assertRegex(str(error), "Specify retain_graph=True")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Case 2: no error with retain_graph=True
*da0073e9SAndroid Build Coastguard Worker        @torch.jit.script
*da0073e9SAndroid Build Coastguard Worker        def train_fn_jit_retain(middle, orig_x):
*da0073e9SAndroid Build Coastguard Worker            y = middle + middle**2
*da0073e9SAndroid Build Coastguard Worker            return torch.autograd.grad([y.sum()], [orig_x], retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        @torch.jit.script
*da0073e9SAndroid Build Coastguard Worker        def train_fn_fork_join_calls_retain(x):
*da0073e9SAndroid Build Coastguard Worker            y_retain = (x + 3) * (x + 4) * 0.5
*da0073e9SAndroid Build Coastguard Worker            fut1 = torch.jit._fork(train_fn_jit_retain, y_retain, x)
*da0073e9SAndroid Build Coastguard Worker            fut2 = torch.jit._fork(train_fn_jit_retain, y_retain, x)
*da0073e9SAndroid Build Coastguard Worker            grad = train_fn_jit_retain(y_retain, x)
*da0073e9SAndroid Build Coastguard Worker            grad1 = torch.jit._wait(fut1)
*da0073e9SAndroid Build Coastguard Worker            grad2 = torch.jit._wait(fut2)
*da0073e9SAndroid Build Coastguard Worker            return grad, grad1, grad2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        grad, grad1, grad2 = train_fn_fork_join_calls_retain(
*da0073e9SAndroid Build Coastguard Worker            torch.randn(5, 5, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(grad, grad1)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(grad, grad2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_preserve_backtrace(self):
*da0073e9SAndroid Build Coastguard Worker        class Foo(torch.autograd.Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, input):
*da0073e9SAndroid Build Coastguard Worker                return input
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, *grad):
*da0073e9SAndroid Build Coastguard Worker                raise ValueError("something")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        t = torch.rand(10, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        try:
*da0073e9SAndroid Build Coastguard Worker            Foo.apply(t).sum().backward()
*da0073e9SAndroid Build Coastguard Worker        except Exception:
*da0073e9SAndroid Build Coastguard Worker            import traceback
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            tb = sys.exc_info()[2]
*da0073e9SAndroid Build Coastguard Worker            tb_str = "\n".join(traceback.format_tb(tb))
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue('raise ValueError("something")' in tb_str)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # TODO(@anjali411): add an OpInfo based test for torch.cat
*da0073e9SAndroid Build Coastguard Worker    # Issue: https://github.com/pytorch/pytorch/issues/51627
*da0073e9SAndroid Build Coastguard Worker    #        https://github.com/pytorch/pytorch/issues/75852
*da0073e9SAndroid Build Coastguard Worker    def test_cat_stack_r_to_c(self):
*da0073e9SAndroid Build Coastguard Worker        inp_c = torch.rand(3, 2, dtype=torch.cdouble, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        inp_r = torch.randn(3, 2, dtype=torch.double, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn(x1, x2):
*da0073e9SAndroid Build Coastguard Worker            return torch.cat((x1, x2), dim=-1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn2(x1, x2):
*da0073e9SAndroid Build Coastguard Worker            return torch.stack((x1, x2), dim=-1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.gradcheck(fn, [inp_r, inp_c], check_forward_ad=True)
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.gradcheck(fn, [inp_c, inp_r], check_forward_ad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.gradcheck(fn2, [inp_r, inp_c], check_forward_ad=True)
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.gradcheck(fn2, [inp_c, inp_r], check_forward_ad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_set_multithreading_enabled_as_context_manager_and_function(self):
*da0073e9SAndroid Build Coastguard Worker        # Test as a context manager
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.set_multithreading_enabled(False):
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(torch.autograd.is_multithreading_enabled())
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(torch.autograd.is_multithreading_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.set_multithreading_enabled(True):
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.autograd.is_multithreading_enabled())
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(torch.autograd.is_multithreading_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.set_multithreading_enabled(False):
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.set_multithreading_enabled(True)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.autograd.is_multithreading_enabled())
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(torch.autograd.is_multithreading_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.set_multithreading_enabled(False)
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(torch.autograd.is_multithreading_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        torch.autograd.set_multithreading_enabled(True)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(torch.autograd.is_multithreading_enabled())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @unittest.skipIf(not TEST_CUDA, "test requires CUDA")
*da0073e9SAndroid Build Coastguard Worker    def test_custom_function_propagates_errors_from_device_thread(self):
*da0073e9SAndroid Build Coastguard Worker        class MyFunc(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                raise RuntimeError("blah")
*da0073e9SAndroid Build Coastguard Worker                return gO
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        t = torch.tensor([1.0, 2.0], requires_grad=True, device=torch.device("cuda"))
*da0073e9SAndroid Build Coastguard Worker        out = MyFunc.apply(t).sum()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "blah"):
*da0073e9SAndroid Build Coastguard Worker            out.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass TestNestedCheckpoint(TestCase):
*da0073e9SAndroid Build Coastguard Worker    @staticmethod
*da0073e9SAndroid Build Coastguard Worker    def grad(fn):
*da0073e9SAndroid Build Coastguard Worker        def wrapper(x):
*da0073e9SAndroid Build Coastguard Worker            with torch.enable_grad():
*da0073e9SAndroid Build Coastguard Worker                out = fn(x)
*da0073e9SAndroid Build Coastguard Worker                (grad_input,) = torch.autograd.grad(out, inputs=(x,), create_graph=True)
*da0073e9SAndroid Build Coastguard Worker            return grad_input
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        return wrapper
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @staticmethod
*da0073e9SAndroid Build Coastguard Worker    def sum(fn):
*da0073e9SAndroid Build Coastguard Worker        def wrapped(x):
*da0073e9SAndroid Build Coastguard Worker            return fn(x).sum()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        return wrapped
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @staticmethod
*da0073e9SAndroid Build Coastguard Worker    def checkpoint(fn):
*da0073e9SAndroid Build Coastguard Worker        def wrapped(*args, **kwargs):
*da0073e9SAndroid Build Coastguard Worker            return torch.utils.checkpoint.checkpoint(
*da0073e9SAndroid Build Coastguard Worker                fn, *args, use_reentrant=False, **kwargs
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        return wrapped
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def get_tests(self, fn):
*da0073e9SAndroid Build Coastguard Worker        grad, c = self.grad, self.checkpoint
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        tests = (
*da0073e9SAndroid Build Coastguard Worker            # function <> tuple of function arbitrarily wrapped in checkpoint in various ways
*da0073e9SAndroid Build Coastguard Worker            (fn, (c(fn), c(c(fn)))),
*da0073e9SAndroid Build Coastguard Worker            (grad(fn), (grad(c(fn)), grad(c(c(fn))))),
*da0073e9SAndroid Build Coastguard Worker            (
*da0073e9SAndroid Build Coastguard Worker                grad(grad(fn)),
*da0073e9SAndroid Build Coastguard Worker                (grad(c(grad(fn))), c(grad(grad(c(fn)))), grad(c(grad(c(fn))))),
*da0073e9SAndroid Build Coastguard Worker            ),
*da0073e9SAndroid Build Coastguard Worker            (
*da0073e9SAndroid Build Coastguard Worker                grad(grad(grad(fn))),
*da0073e9SAndroid Build Coastguard Worker                (grad(c(grad(grad(c(fn))))), grad(c(grad(c(grad(c(fn))))))),
*da0073e9SAndroid Build Coastguard Worker            ),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        return tests
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def check_graph_dies(self, fn):
*da0073e9SAndroid Build Coastguard Worker        def iter_graph(roots):
*da0073e9SAndroid Build Coastguard Worker            if not roots:
*da0073e9SAndroid Build Coastguard Worker                return
*da0073e9SAndroid Build Coastguard Worker            seen = set()
*da0073e9SAndroid Build Coastguard Worker            q = collections.deque()
*da0073e9SAndroid Build Coastguard Worker            for node in roots:
*da0073e9SAndroid Build Coastguard Worker                if node is not None:
*da0073e9SAndroid Build Coastguard Worker                    seen.add(node)
*da0073e9SAndroid Build Coastguard Worker                    q.append(node)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            while q:
*da0073e9SAndroid Build Coastguard Worker                node = q.popleft()
*da0073e9SAndroid Build Coastguard Worker                for fn, _idx in node.next_functions:
*da0073e9SAndroid Build Coastguard Worker                    if fn in seen or fn is None:
*da0073e9SAndroid Build Coastguard Worker                        continue
*da0073e9SAndroid Build Coastguard Worker                    seen.add(fn)
*da0073e9SAndroid Build Coastguard Worker                    q.append(fn)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                yield node
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class Handle:
*da0073e9SAndroid Build Coastguard Worker            __slot__ = ["node_name"]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def __init__(self, node_name):
*da0073e9SAndroid Build Coastguard Worker                self.node_name = node_name
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def scope():
*da0073e9SAndroid Build Coastguard Worker            a = torch.randn((), requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            out = fn(a)
*da0073e9SAndroid Build Coastguard Worker            refs = []
*da0073e9SAndroid Build Coastguard Worker            for node in iter_graph([out.grad_fn]):
*da0073e9SAndroid Build Coastguard Worker                handle = Handle(node.name())
*da0073e9SAndroid Build Coastguard Worker                refs.append(weakref.ref(handle))
*da0073e9SAndroid Build Coastguard Worker                node.metadata["blah"] = handle
*da0073e9SAndroid Build Coastguard Worker            return refs
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        refs = scope()
*da0073e9SAndroid Build Coastguard Worker        node_names = [ref().node_name for ref in refs if ref() is not None]
*da0073e9SAndroid Build Coastguard Worker        if len(node_names) > 0:
*da0073e9SAndroid Build Coastguard Worker            print("Nodes still alive:", node_names)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(len(node_names), 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @parametrize("early_stop", [True, False])
*da0073e9SAndroid Build Coastguard Worker    def test_nested_checkpoint(self, early_stop):
*da0073e9SAndroid Build Coastguard Worker        with torch.utils.checkpoint.set_checkpoint_early_stop(early_stop):
*da0073e9SAndroid Build Coastguard Worker            x = torch.randn((), requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def f(x):
*da0073e9SAndroid Build Coastguard Worker                out = x.sin().exp().sin()
*da0073e9SAndroid Build Coastguard Worker                return out
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def g(x):
*da0073e9SAndroid Build Coastguard Worker                a = x.sin().exp().sin()
*da0073e9SAndroid Build Coastguard Worker                b = x.sin().exp().sin()
*da0073e9SAndroid Build Coastguard Worker                (ga,) = torch.autograd.grad(a, x)
*da0073e9SAndroid Build Coastguard Worker                (gb,) = torch.autograd.grad(b, x)
*da0073e9SAndroid Build Coastguard Worker                return x.sin()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            for fn in (f, g):
*da0073e9SAndroid Build Coastguard Worker                for expected_fn, actual_fns in self.get_tests(fn):
*da0073e9SAndroid Build Coastguard Worker                    expected = expected_fn(x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    for actual_fn in actual_fns:
*da0073e9SAndroid Build Coastguard Worker                        actual = actual_fn(x)
*da0073e9SAndroid Build Coastguard Worker                        self.assertTrue(torch.allclose(expected, actual))
*da0073e9SAndroid Build Coastguard Worker                        self.check_graph_dies(actual_fn)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @parametrize("early_stop", [True, False])
*da0073e9SAndroid Build Coastguard Worker    def test_nested_checkpoint_two_children(self, early_stop):
*da0073e9SAndroid Build Coastguard Worker        with torch.utils.checkpoint.set_checkpoint_early_stop(early_stop):
*da0073e9SAndroid Build Coastguard Worker            grad, sum, c = self.grad, self.sum, self.checkpoint
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def f(x):
*da0073e9SAndroid Build Coastguard Worker                return x.sin().exp().sin()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def g(x):
*da0073e9SAndroid Build Coastguard Worker                return x.cos().sin().exp()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def hc(x):
*da0073e9SAndroid Build Coastguard Worker                return c(g)(c(f)(x))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def h(x):
*da0073e9SAndroid Build Coastguard Worker                return g(f(x))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            a = torch.randn(3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            expected = grad(sum(grad(sum(h))))(a)
*da0073e9SAndroid Build Coastguard Worker            actual = grad(sum(grad(sum(c(hc)))))(a)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.allclose(expected, actual))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            actual = grad(sum(c(grad(sum(c(hc))))))(a)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.allclose(expected, actual))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self.check_graph_dies(grad(c(hc)))
*da0073e9SAndroid Build Coastguard Worker            self.check_graph_dies(grad(sum(grad(sum(c(hc))))))
*da0073e9SAndroid Build Coastguard Worker            self.check_graph_dies(grad(sum(c(grad(sum(c(hc)))))))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @parametrize("early_stop", [True, False])
*da0073e9SAndroid Build Coastguard Worker    def test_nested_checkpoint_non_tensor_inputs_and_outputs(self, early_stop):
*da0073e9SAndroid Build Coastguard Worker        def fn(k, a, b, f):
*da0073e9SAndroid Build Coastguard Worker            return f(k * a * b.exp()), 1, "abcd"
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        k = 3
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(2.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = torch.tensor(3.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def f(x):
*da0073e9SAndroid Build Coastguard Worker            return x.sin()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.utils.checkpoint.set_checkpoint_early_stop(early_stop):
*da0073e9SAndroid Build Coastguard Worker            out, _unused1, _unused2 = checkpoint(fn, k, a, b, f, use_reentrant=False)
*da0073e9SAndroid Build Coastguard Worker        actual_grads = torch.autograd.grad(out, (a, b))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out, _unused1, _unused2 = fn(k, a, b, f)
*da0073e9SAndroid Build Coastguard Worker        expected_grads = torch.autograd.grad(out, (a, b))
*da0073e9SAndroid Build Coastguard Worker        for actual, expected in zip(actual_grads, expected_grads):
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.allclose(actual, expected))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @parametrize("early_stop", [True, False])
*da0073e9SAndroid Build Coastguard Worker    def test_nested_checkpoint_kwargs(self, early_stop):
*da0073e9SAndroid Build Coastguard Worker        def fn(a, blah=None):
*da0073e9SAndroid Build Coastguard Worker            out = a.sin().exp()
*da0073e9SAndroid Build Coastguard Worker            if blah is not None:
*da0073e9SAndroid Build Coastguard Worker                out = out * blah
*da0073e9SAndroid Build Coastguard Worker            return out.sin().exp()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(2.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        b = torch.tensor(3.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.utils.checkpoint.set_checkpoint_early_stop(early_stop):
*da0073e9SAndroid Build Coastguard Worker            out = checkpoint(fn, a, blah=b, use_reentrant=False)
*da0073e9SAndroid Build Coastguard Worker            actual_grads = torch.autograd.grad(out, (a, b))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            out = fn(a, blah=b)
*da0073e9SAndroid Build Coastguard Worker            expected_grads = torch.autograd.grad(out, (a, b))
*da0073e9SAndroid Build Coastguard Worker            for actual, expected in zip(actual_grads, expected_grads):
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(torch.allclose(actual, expected))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @parametrize("early_stop", [True, False])
*da0073e9SAndroid Build Coastguard Worker    def test_nested_checkpoint_same_graph(self, early_stop):
*da0073e9SAndroid Build Coastguard Worker        counter = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def hook(*_unused_args):
*da0073e9SAndroid Build Coastguard Worker            counter[0] += 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn(a):
*da0073e9SAndroid Build Coastguard Worker            return a.sin().cos().sin()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.utils.checkpoint.set_checkpoint_early_stop(early_stop):
*da0073e9SAndroid Build Coastguard Worker            out = checkpoint(fn, a, use_reentrant=False)
*da0073e9SAndroid Build Coastguard Worker        # The hook is registered on the original graph
*da0073e9SAndroid Build Coastguard Worker        out.grad_fn.next_functions[0][0].register_hook(hook)
*da0073e9SAndroid Build Coastguard Worker        # And backward is performed on the original graph
*da0073e9SAndroid Build Coastguard Worker        out.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(counter[0], 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @parametrize("early_stop", [True, False])
*da0073e9SAndroid Build Coastguard Worker    def test_nested_checkpoint_reentrant_backwards(self, early_stop):
*da0073e9SAndroid Build Coastguard Worker        def fn(a):
*da0073e9SAndroid Build Coastguard Worker            x = a.sin().cos()
*da0073e9SAndroid Build Coastguard Worker            out = x.sin()
*da0073e9SAndroid Build Coastguard Worker            return x, out
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def hook(*_unused_args):
*da0073e9SAndroid Build Coastguard Worker            # do backward again, but skip over the part of the graph where
*da0073e9SAndroid Build Coastguard Worker            # the hook was registered
*da0073e9SAndroid Build Coastguard Worker            x.backward(retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        with torch.utils.checkpoint.set_checkpoint_early_stop(early_stop):
*da0073e9SAndroid Build Coastguard Worker            x, out = checkpoint(fn, a, use_reentrant=False)
*da0073e9SAndroid Build Coastguard Worker        out.grad_fn.register_hook(hook)
*da0073e9SAndroid Build Coastguard Worker        out.backward(retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_nested_checkpoint_set_early_stop(self):
*da0073e9SAndroid Build Coastguard Worker        counter = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def clone(x):
*da0073e9SAndroid Build Coastguard Worker            counter[0] += 1
*da0073e9SAndroid Build Coastguard Worker            return x.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn(x):
*da0073e9SAndroid Build Coastguard Worker            # Since clone does not save anything, it is not recomputed iff
*da0073e9SAndroid Build Coastguard Worker            # early stop is enabled.
*da0073e9SAndroid Build Coastguard Worker            return clone(x.sin().cos())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Early stopping is enabled by default
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out = checkpoint(fn, a, use_reentrant=False)
*da0073e9SAndroid Build Coastguard Worker        out.backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(counter[0], 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Try using the context manager to set early stopping to False.
*da0073e9SAndroid Build Coastguard Worker        # Expect early stopping to be disabled for all checkpoints ran under
*da0073e9SAndroid Build Coastguard Worker        # the context manager, even though context manager is no longer active
*da0073e9SAndroid Build Coastguard Worker        # when backward/recomputation is performed.
*da0073e9SAndroid Build Coastguard Worker        counter = [0]
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        with torch.utils.checkpoint.set_checkpoint_early_stop(False):
*da0073e9SAndroid Build Coastguard Worker            out = checkpoint(fn, a, use_reentrant=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out.backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(counter[0], 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_nested_checkpoint_set_early_stop_no_recompution_needed(self):
*da0073e9SAndroid Build Coastguard Worker        # Case 1: We have one tensor saved and its the input
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # We have two different counters here because in this case we actually
*da0073e9SAndroid Build Coastguard Worker        # do call into x.sin() at the python level during recomputation whether
*da0073e9SAndroid Build Coastguard Worker        # or not early stop is enabled. This is because the early stopping
*da0073e9SAndroid Build Coastguard Worker        # only happens at the autograd level (preventing us from reaching the
*da0073e9SAndroid Build Coastguard Worker        # backend).
*da0073e9SAndroid Build Coastguard Worker        python_dispatch_counter = [0]
*da0073e9SAndroid Build Coastguard Worker        counter = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class SinCounterMode(TorchDispatchMode):
*da0073e9SAndroid Build Coastguard Worker            def __init__(self) -> None:
*da0073e9SAndroid Build Coastguard Worker                self.count = 0
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def __torch_dispatch__(self, func, types, args=(), kwargs=None):
*da0073e9SAndroid Build Coastguard Worker                kwargs = {} if kwargs is None else kwargs
*da0073e9SAndroid Build Coastguard Worker                if func is torch.ops.aten.sin.default:
*da0073e9SAndroid Build Coastguard Worker                    self.count += 1
*da0073e9SAndroid Build Coastguard Worker                return func(*args, **kwargs)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn(x):
*da0073e9SAndroid Build Coastguard Worker            counter[0] += 1
*da0073e9SAndroid Build Coastguard Worker            return x.sin()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # With early stopping (enabled by default)
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        with SinCounterMode() as python_dispatch_counter:  # noqa: F811
*da0073e9SAndroid Build Coastguard Worker            out = checkpoint(fn, a, use_reentrant=False)
*da0073e9SAndroid Build Coastguard Worker            out.backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(counter[0], 2)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(python_dispatch_counter.count, 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Without early stopping
*da0073e9SAndroid Build Coastguard Worker        counter = [0]
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        with SinCounterMode() as python_dispatch_counter:
*da0073e9SAndroid Build Coastguard Worker            with torch.utils.checkpoint.set_checkpoint_early_stop(False):
*da0073e9SAndroid Build Coastguard Worker                out = checkpoint(fn, a, use_reentrant=False)
*da0073e9SAndroid Build Coastguard Worker            out.backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(counter[0], 2)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(python_dispatch_counter.count, 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Case 2: Forward saves no tensors
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Since unpack isn't even called, counter is 1 whether or not early stop
*da0073e9SAndroid Build Coastguard Worker        # is enabled!
*da0073e9SAndroid Build Coastguard Worker        counter = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn2(x):
*da0073e9SAndroid Build Coastguard Worker            counter[0] += 1
*da0073e9SAndroid Build Coastguard Worker            return x.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # With early stopping (enabled by default)
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        out = checkpoint(fn2, a, use_reentrant=False)
*da0073e9SAndroid Build Coastguard Worker        out.backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(counter[0], 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Without early stopping
*da0073e9SAndroid Build Coastguard Worker        counter = [0]
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor(1.0, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        with torch.utils.checkpoint.set_checkpoint_early_stop(False):
*da0073e9SAndroid Build Coastguard Worker            out = checkpoint(fn2, a, use_reentrant=False)
*da0073e9SAndroid Build Coastguard Worker        out.backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(counter[0], 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass TestSelectiveActivationCheckpoint(TestCase):
*da0073e9SAndroid Build Coastguard Worker    @unittest.skipIf(not TEST_CUDA, "requires CUDA")
*da0073e9SAndroid Build Coastguard Worker    def test_flops_and_mem(self):
*da0073e9SAndroid Build Coastguard Worker        # From https://github.com/pytorch/pytorch/pull/126320
*da0073e9SAndroid Build Coastguard Worker        def get_act_mem(f):
*da0073e9SAndroid Build Coastguard Worker            out = f()
*da0073e9SAndroid Build Coastguard Worker            out.backward()
*da0073e9SAndroid Build Coastguard Worker            # Why do one forward and backward?
*da0073e9SAndroid Build Coastguard Worker            start_mem = torch.cuda.memory_stats()["requested_bytes.all.current"]
*da0073e9SAndroid Build Coastguard Worker            out = f()
*da0073e9SAndroid Build Coastguard Worker            cur_mem = torch.cuda.memory_stats()["requested_bytes.all.current"]
*da0073e9SAndroid Build Coastguard Worker            act_mem = (cur_mem - start_mem) / (1024 * 1024)
*da0073e9SAndroid Build Coastguard Worker            out.backward()
*da0073e9SAndroid Build Coastguard Worker            return act_mem
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def get_bw_flops(f):
*da0073e9SAndroid Build Coastguard Worker            # Normalized so that a 512 square matmul returns 1
*da0073e9SAndroid Build Coastguard Worker            f().backward()
*da0073e9SAndroid Build Coastguard Worker            out = f()
*da0073e9SAndroid Build Coastguard Worker            # NB: FlopCounterMode is pushed onto the mode stack before CachedMode, so
*da0073e9SAndroid Build Coastguard Worker            # it will be able to observe whether an op is cached or not.
*da0073e9SAndroid Build Coastguard Worker            with FlopCounterMode(display=False) as mode:
*da0073e9SAndroid Build Coastguard Worker                out.backward()
*da0073e9SAndroid Build Coastguard Worker            return mode.get_total_flops() / (512**3 * 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(512, 512, requires_grad=True, device="cuda")
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(512, 512, requires_grad=True, device="cuda")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn(x, y):
*da0073e9SAndroid Build Coastguard Worker            return torch.mm(x.cos(), y).sin().sum()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn_ac(x, y):
*da0073e9SAndroid Build Coastguard Worker            return checkpoint(fn, x, y, use_reentrant=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn_sac(x, y):
*da0073e9SAndroid Build Coastguard Worker            context_fn = functools.partial(
*da0073e9SAndroid Build Coastguard Worker                create_selective_checkpoint_contexts,
*da0073e9SAndroid Build Coastguard Worker                [torch.ops.aten.mm.default],
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            out = checkpoint(fn, x, y, use_reentrant=False, context_fn=context_fn)
*da0073e9SAndroid Build Coastguard Worker            return out
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def policy_fn(ctx, op, *args, **kwargs):
*da0073e9SAndroid Build Coastguard Worker            if op == torch.ops.aten.mm.default:
*da0073e9SAndroid Build Coastguard Worker                return CheckpointPolicy.MUST_SAVE
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                return CheckpointPolicy.PREFER_RECOMPUTE
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn_sac2(x, y):
*da0073e9SAndroid Build Coastguard Worker            context_fn = functools.partial(
*da0073e9SAndroid Build Coastguard Worker                create_selective_checkpoint_contexts,
*da0073e9SAndroid Build Coastguard Worker                policy_fn,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            out = checkpoint(fn, x, y, use_reentrant=False, context_fn=context_fn)
*da0073e9SAndroid Build Coastguard Worker            return out
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def policy_fn_bool(ctx, op, *args, **kwargs):
*da0073e9SAndroid Build Coastguard Worker            return op == torch.ops.aten.mm.default
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn_sac3(x, y):
*da0073e9SAndroid Build Coastguard Worker            context_fn = functools.partial(
*da0073e9SAndroid Build Coastguard Worker                create_selective_checkpoint_contexts,
*da0073e9SAndroid Build Coastguard Worker                policy_fn_bool,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            out = checkpoint(fn, x, y, use_reentrant=False, context_fn=context_fn)
*da0073e9SAndroid Build Coastguard Worker            return out
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        act_mem_noac = get_act_mem(lambda: fn(x, y))
*da0073e9SAndroid Build Coastguard Worker        bw_flops_noac = get_bw_flops(lambda: fn(x, y))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(act_mem_noac, 2.0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(bw_flops_noac, 2.0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        act_mem_ac = get_act_mem(lambda: fn_ac(x, y))
*da0073e9SAndroid Build Coastguard Worker        bw_flops_ac = get_bw_flops(lambda: fn_ac(x, y))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(act_mem_ac, 0.0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(bw_flops_ac, 3.0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        act_mem_sac = get_act_mem(lambda: fn_sac(x, y))
*da0073e9SAndroid Build Coastguard Worker        bw_flops_sac = get_bw_flops(lambda: fn_sac(x, y))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(act_mem_sac, 1.0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(bw_flops_sac, 2.0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        act_mem_sac2 = get_act_mem(lambda: fn_sac2(x, y))
*da0073e9SAndroid Build Coastguard Worker        bw_flops_sac2 = get_bw_flops(lambda: fn_sac2(x, y))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(act_mem_sac2, 1.0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(bw_flops_sac2, 2.0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        act_mem_sac3 = get_act_mem(lambda: fn_sac3(x, y))
*da0073e9SAndroid Build Coastguard Worker        bw_flops_sac3 = get_bw_flops(lambda: fn_sac3(x, y))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(act_mem_sac3, 1.0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(bw_flops_sac3, 2.0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfTorchDynamo("compile tested in test/dynamo/test_activation_checkpointing.py")
*da0073e9SAndroid Build Coastguard Worker    def test_output_already_has_autograd_meta(self):
*da0073e9SAndroid Build Coastguard Worker        # View of tensor of non-differentiable dtype still has AutogradMeta
*da0073e9SAndroid Build Coastguard Worker        def fn(x, y):
*da0073e9SAndroid Build Coastguard Worker            return x.view(-1), y.sin().cos()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.tensor([1, 2, 3], dtype=torch.int64)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        context_fn = functools.partial(
*da0073e9SAndroid Build Coastguard Worker            create_selective_checkpoint_contexts,
*da0073e9SAndroid Build Coastguard Worker            [torch.ops.aten.view.default],
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        out = checkpoint(fn, x, y, use_reentrant=False, context_fn=context_fn)
*da0073e9SAndroid Build Coastguard Worker        out[1].sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfTorchDynamo("compile tested in test/dynamo/test_activation_checkpointing.py")
*da0073e9SAndroid Build Coastguard Worker    def test_subclass_dispatching_sizes(self):
*da0073e9SAndroid Build Coastguard Worker        # Test that we ignore ops that grab metadata like torch.ops.aten.sym_size.default
*da0073e9SAndroid Build Coastguard Worker        # Caching such metadata ops can be problematic when the following are satisfied:
*da0073e9SAndroid Build Coastguard Worker        #
*da0073e9SAndroid Build Coastguard Worker        # 1. size/strides are dispatched upon
*da0073e9SAndroid Build Coastguard Worker        # 2. our policy saves sizes
*da0073e9SAndroid Build Coastguard Worker        ta = torch.randn(6, 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class CustomSizeDynamicShapesTensor(torch.Tensor):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def __new__(cls, inner):
*da0073e9SAndroid Build Coastguard Worker                return torch.Tensor._make_wrapper_subclass(
*da0073e9SAndroid Build Coastguard Worker                    # TODO: right now, _make_wrapper_subclass's dynamic shape interaction is not great.
*da0073e9SAndroid Build Coastguard Worker                    # Calling the overload that has kwargs causes us to go down the first overload path,
*da0073e9SAndroid Build Coastguard Worker                    # which will **always** specialize sizes.
*da0073e9SAndroid Build Coastguard Worker                    # We should probably eventually fix this so that the first overload can just handle dynamic shapes.
*da0073e9SAndroid Build Coastguard Worker                    cls,
*da0073e9SAndroid Build Coastguard Worker                    inner.size(),
*da0073e9SAndroid Build Coastguard Worker                    inner.stride(),
*da0073e9SAndroid Build Coastguard Worker                    None,
*da0073e9SAndroid Build Coastguard Worker                    None,
*da0073e9SAndroid Build Coastguard Worker                    inner.dtype,
*da0073e9SAndroid Build Coastguard Worker                    inner.layout,
*da0073e9SAndroid Build Coastguard Worker                    inner.device,
*da0073e9SAndroid Build Coastguard Worker                    False,
*da0073e9SAndroid Build Coastguard Worker                    inner.requires_grad,
*da0073e9SAndroid Build Coastguard Worker                    "sizes",
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def __init__(self, inner):
*da0073e9SAndroid Build Coastguard Worker                self.inner = inner
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @classmethod
*da0073e9SAndroid Build Coastguard Worker            def __torch_dispatch__(cls, func, types, args, kwargs):
*da0073e9SAndroid Build Coastguard Worker                if kwargs is None:
*da0073e9SAndroid Build Coastguard Worker                    kwargs = {}
*da0073e9SAndroid Build Coastguard Worker                args_inner = torch.utils._pytree.tree_map_only(
*da0073e9SAndroid Build Coastguard Worker                    cls, lambda x: x.inner, args
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                out_inner = func(*args_inner, **kwargs)
*da0073e9SAndroid Build Coastguard Worker                return torch.utils._pytree.tree_map_only(
*da0073e9SAndroid Build Coastguard Worker                    torch.Tensor, lambda x: cls(x), out_inner
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def policy_fn(ctx, op, *args, **kwargs):
*da0073e9SAndroid Build Coastguard Worker            if op is torch.ops.aten.sym_size.default:
*da0073e9SAndroid Build Coastguard Worker                # Silently ignored!
*da0073e9SAndroid Build Coastguard Worker                return CheckpointPolicy.MUST_SAVE
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                return CheckpointPolicy.PREFER_RECOMPUTE
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn(x):
*da0073e9SAndroid Build Coastguard Worker            # We avoid the following case
*da0073e9SAndroid Build Coastguard Worker            #
*da0073e9SAndroid Build Coastguard Worker            # saved     :[4, 3], [], [], [4, 3], [4, 3], [4, 3], [12]
*da0073e9SAndroid Build Coastguard Worker            # forward   :sum   ,sum,mul, mul   , mul   ,view   , view
*da0073e9SAndroid Build Coastguard Worker            # recompute :sum   ,sum,mul, view  , view
*da0073e9SAndroid Build Coastguard Worker            #
*da0073e9SAndroid Build Coastguard Worker            # Views save the shape of their input, so we expect the second
*da0073e9SAndroid Build Coastguard Worker            # view to save 12, but because during AC packing during forward
*da0073e9SAndroid Build Coastguard Worker            # saves the shapes of the input for metadata checks later,
*da0073e9SAndroid Build Coastguard Worker            # we would save the wrong shape during the recompute.
*da0073e9SAndroid Build Coastguard Worker            view_out = (x * x.sum()).view(-1).view(4, 3)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(view_out.grad_fn._saved_self_sym_sizes, [12])
*da0073e9SAndroid Build Coastguard Worker            return view_out.exp()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(4, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        x_wrapper = CustomSizeDynamicShapesTensor(x)
*da0073e9SAndroid Build Coastguard Worker        context_fn = functools.partial(create_selective_checkpoint_contexts, policy_fn)
*da0073e9SAndroid Build Coastguard Worker        out = checkpoint(fn, x_wrapper, use_reentrant=False, context_fn=context_fn)
*da0073e9SAndroid Build Coastguard Worker        out.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_bad_inputs(self):
*da0073e9SAndroid Build Coastguard Worker        bad_op_list1 = [2]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            ValueError, "Expected op in `op_list` to be an OpOverload"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            create_selective_checkpoint_contexts(bad_op_list1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        bad_op_list2 = [torch.ops.aten.sin]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            ValueError, "update the OpOverloadPacket to a specific OpOverload"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            create_selective_checkpoint_contexts(bad_op_list2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(TypeError, "either a function or a list of ops."):
*da0073e9SAndroid Build Coastguard Worker            create_selective_checkpoint_contexts(2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # Dynamo fails for various reasons:
*da0073e9SAndroid Build Coastguard Worker    # - some tests using custom op that does not implement Fake
*da0073e9SAndroid Build Coastguard Worker    # - dynamo is trying to trace into saved variable hooks unpack hook for some reason
*da0073e9SAndroid Build Coastguard Worker    @skipIfTorchDynamo("compile tested in test/dynamo/test_activation_checkpointing.py")
*da0073e9SAndroid Build Coastguard Worker    def test_policy_with_state(self):
*da0073e9SAndroid Build Coastguard Worker        # If I have a stateful callable, state is shared between the original
*da0073e9SAndroid Build Coastguard Worker        # forward and the recompute.
*da0073e9SAndroid Build Coastguard Worker        counters = []
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class Policy:
*da0073e9SAndroid Build Coastguard Worker            def __init__(self) -> None:
*da0073e9SAndroid Build Coastguard Worker                self.counter = [0]
*da0073e9SAndroid Build Coastguard Worker                self.recompute_counter = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def __call__(self, ctx, func, *args, **kwargs):
*da0073e9SAndroid Build Coastguard Worker                counter = self.recompute_counter if ctx.is_recompute else self.counter
*da0073e9SAndroid Build Coastguard Worker                counter[0] += 1
*da0073e9SAndroid Build Coastguard Worker                counters.append(counter[0])
*da0073e9SAndroid Build Coastguard Worker                if counter == 1 and func is torch.ops.aten.mm.default:
*da0073e9SAndroid Build Coastguard Worker                    return CheckpointPolicy.MUST_SAVE
*da0073e9SAndroid Build Coastguard Worker                return CheckpointPolicy.PREFER_RECOMPUTE
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn(x):
*da0073e9SAndroid Build Coastguard Worker            return x.sin().sin().sin()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        context_fn = functools.partial(
*da0073e9SAndroid Build Coastguard Worker            create_selective_checkpoint_contexts,
*da0073e9SAndroid Build Coastguard Worker            Policy(),
*da0073e9SAndroid Build Coastguard Worker            allow_cache_entry_mutation=True,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        out = checkpoint(fn, x, use_reentrant=False, context_fn=context_fn)
*da0073e9SAndroid Build Coastguard Worker        out.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        # 1. counter properly reset to 0 for the recompute
*da0073e9SAndroid Build Coastguard Worker        # 2. due to early-stop we do not recompute the final op
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(counters, [1, 2, 3, 1, 2])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfTorchDynamo("compile tested in test/dynamo/test_activation_checkpointing.py")
*da0073e9SAndroid Build Coastguard Worker    def test_storage_lifetime(self):
*da0073e9SAndroid Build Coastguard Worker        from torch.utils._python_dispatch import _get_current_dispatch_mode
*da0073e9SAndroid Build Coastguard Worker        from torch.utils.checkpoint import (
*da0073e9SAndroid Build Coastguard Worker            _CachedTorchDispatchMode,
*da0073e9SAndroid Build Coastguard Worker            _CachingTorchDispatchMode,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def policy_fn(ctx, op, *args, **kwargs):
*da0073e9SAndroid Build Coastguard Worker            return CheckpointPolicy.MUST_SAVE
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        ref = None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn(x):
*da0073e9SAndroid Build Coastguard Worker            nonlocal ref
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self.assertIsInstance(
*da0073e9SAndroid Build Coastguard Worker                _get_current_dispatch_mode(),
*da0073e9SAndroid Build Coastguard Worker                (_CachingTorchDispatchMode, _CachedTorchDispatchMode),
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            out = x.cos().exp()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            if isinstance(_get_current_dispatch_mode(), _CachingTorchDispatchMode):
*da0073e9SAndroid Build Coastguard Worker                raw_val = (
*da0073e9SAndroid Build Coastguard Worker                    _get_current_dispatch_mode()
*da0073e9SAndroid Build Coastguard Worker                    .storage[torch.ops.aten.exp.default][0]
*da0073e9SAndroid Build Coastguard Worker                    .val
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                # ref should've been detached
*da0073e9SAndroid Build Coastguard Worker                # to avoid graph -> the saved variable hooks -> recompute_context -> storage -> graph
*da0073e9SAndroid Build Coastguard Worker                self.assertFalse(raw_val.requires_grad)
*da0073e9SAndroid Build Coastguard Worker                ref = weakref.ref(raw_val)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Careful for early-stop
*da0073e9SAndroid Build Coastguard Worker            return out.sin()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with disable_gc():
*da0073e9SAndroid Build Coastguard Worker            # Case 1: If graph goes away without backward, make sure there's no reference cycle
*da0073e9SAndroid Build Coastguard Worker            #         keeping storage alive.
*da0073e9SAndroid Build Coastguard Worker            x = torch.randn(3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            context_fn = functools.partial(
*da0073e9SAndroid Build Coastguard Worker                create_selective_checkpoint_contexts, policy_fn
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            out = checkpoint(fn, x, use_reentrant=False, context_fn=context_fn)
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNotNone(ref())
*da0073e9SAndroid Build Coastguard Worker            del out
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(ref())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Case 2: After backward, even if retain_graph=True, the storage should go away
*da0073e9SAndroid Build Coastguard Worker            x = torch.randn(3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            context_fn = functools.partial(
*da0073e9SAndroid Build Coastguard Worker                create_selective_checkpoint_contexts, policy_fn
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            out = checkpoint(fn, x, use_reentrant=False, context_fn=context_fn)
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNotNone(ref())
*da0073e9SAndroid Build Coastguard Worker            out.sum().backward(retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker            # The dispatch mode's storage should still be alive, but the entries should've
*da0073e9SAndroid Build Coastguard Worker            # been cleared.
*da0073e9SAndroid Build Coastguard Worker            self.assertIsNone(ref())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfTorchDynamo("compile tested in test/dynamo/test_activation_checkpointing.py")
*da0073e9SAndroid Build Coastguard Worker    def test_version_counter(self):
*da0073e9SAndroid Build Coastguard Worker        def policy_fn(ctx, op, *args, **kwargs):
*da0073e9SAndroid Build Coastguard Worker            if op == torch.ops.aten.sin.default:
*da0073e9SAndroid Build Coastguard Worker                return CheckpointPolicy.MUST_SAVE
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                return CheckpointPolicy.PREFER_RECOMPUTE
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn(x):
*da0073e9SAndroid Build Coastguard Worker            return x.sin().mul_(2).cos().exp()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        context_fn = functools.partial(create_selective_checkpoint_contexts, policy_fn)
*da0073e9SAndroid Build Coastguard Worker        out = checkpoint(fn, x, use_reentrant=False, context_fn=context_fn)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # 1) Error because the output of sin is saved and mutated by mul_
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "has been mutated"):
*da0073e9SAndroid Build Coastguard Worker            out.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        context_fn = functools.partial(
*da0073e9SAndroid Build Coastguard Worker            create_selective_checkpoint_contexts,
*da0073e9SAndroid Build Coastguard Worker            policy_fn,
*da0073e9SAndroid Build Coastguard Worker            allow_cache_entry_mutation=True,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        out = checkpoint(fn, x, use_reentrant=False, context_fn=context_fn)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # 2) No longer should be an error because of allow_cache_entry_mutation
*da0073e9SAndroid Build Coastguard Worker        out.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfTorchDynamo("compile tested in test/dynamo/test_activation_checkpointing.py")
*da0073e9SAndroid Build Coastguard Worker    def test_function_with_more_than_one_output(self):
*da0073e9SAndroid Build Coastguard Worker        # maybe there is a more systematic way:
*da0073e9SAndroid Build Coastguard Worker        counter = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def policy_fn(ctx, op, *args, **kwargs):
*da0073e9SAndroid Build Coastguard Worker            if op == torch.ops.aten.var_mean.correction:
*da0073e9SAndroid Build Coastguard Worker                counter[0] += 1
*da0073e9SAndroid Build Coastguard Worker                return CheckpointPolicy.MUST_SAVE
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                return CheckpointPolicy.PREFER_RECOMPUTE
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # var_mean has two outputs
*da0073e9SAndroid Build Coastguard Worker        def fn(x):
*da0073e9SAndroid Build Coastguard Worker            a, b = torch.var_mean(x)
*da0073e9SAndroid Build Coastguard Worker            return a * b
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        context_fn = functools.partial(create_selective_checkpoint_contexts, policy_fn)
*da0073e9SAndroid Build Coastguard Worker        out = checkpoint(fn, x, use_reentrant=False, context_fn=context_fn)
*da0073e9SAndroid Build Coastguard Worker        x_grad = torch.autograd.grad(out.sum(), (x,))
*da0073e9SAndroid Build Coastguard Worker        x_grad_ref = torch.autograd.grad(fn(x).sum(), (x,))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x_grad, x_grad_ref)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(counter[0], 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfTorchDynamo("compile tested in test/dynamo/test_activation_checkpointing.py")
*da0073e9SAndroid Build Coastguard Worker    def test_function_with_non_tensor_output(self):
*da0073e9SAndroid Build Coastguard Worker        # When SAC is enabled, the op is not computed a second time
*da0073e9SAndroid Build Coastguard Worker        with torch.library._scoped_library("mylib", "FRAGMENT") as lib:
*da0073e9SAndroid Build Coastguard Worker            counter = [0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @torch.library.custom_op("mylib::sin_with_extra", mutates_args=())
*da0073e9SAndroid Build Coastguard Worker            def sin_with_extra(x: torch.Tensor) -> Tuple[torch.Tensor, int]:
*da0073e9SAndroid Build Coastguard Worker                counter[0] += 1
*da0073e9SAndroid Build Coastguard Worker                return x.sin(), 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def setup_context(ctx, inputs, output) -> torch.Tensor:
*da0073e9SAndroid Build Coastguard Worker                (x,) = inputs
*da0073e9SAndroid Build Coastguard Worker                ctx.save_for_backward(x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, grad, _unused):
*da0073e9SAndroid Build Coastguard Worker                (x,) = ctx.saved_tensors
*da0073e9SAndroid Build Coastguard Worker                return grad * x.cos()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            torch.library.register_autograd(
*da0073e9SAndroid Build Coastguard Worker                "mylib::sin_with_extra", backward, setup_context=setup_context
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            x = torch.randn(3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def fn(x):
*da0073e9SAndroid Build Coastguard Worker                return (torch.ops.mylib.sin_with_extra(x)[0] * x.sin().exp()).sin()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            ops_list = [torch.ops.mylib.sin_with_extra.default]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            x = torch.randn(3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker            context_fn = functools.partial(
*da0073e9SAndroid Build Coastguard Worker                create_selective_checkpoint_contexts, ops_list
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            out = checkpoint(fn, x, use_reentrant=False, context_fn=context_fn)
*da0073e9SAndroid Build Coastguard Worker            x_grad = torch.autograd.grad(out.sum(), (x,))
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(counter[0], 1)
*da0073e9SAndroid Build Coastguard Worker            x_grad_ref = torch.autograd.grad(fn(x).sum(), (x,))
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(x_grad, x_grad_ref)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfTorchDynamo("compile tested in test/dynamo/test_activation_checkpointing.py")
*da0073e9SAndroid Build Coastguard Worker    def test_can_only_trigger_recompute_once(self):
*da0073e9SAndroid Build Coastguard Worker        # We don't support this to avoid adding extra complexity for now.
*da0073e9SAndroid Build Coastguard Worker        # If there's a need, we could probably do some kind of use_count tracking.
*da0073e9SAndroid Build Coastguard Worker        # TODO: have a nice error message here.
*da0073e9SAndroid Build Coastguard Worker        def policy_fn(ctx, op, *args, **kwargs):
*da0073e9SAndroid Build Coastguard Worker            if op == torch.ops.aten.sin.default:
*da0073e9SAndroid Build Coastguard Worker                return CheckpointPolicy.MUST_SAVE
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                return CheckpointPolicy.PREFER_RECOMPUTE
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn(x):
*da0073e9SAndroid Build Coastguard Worker            return x.sin().cos().exp()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        context_fn = functools.partial(create_selective_checkpoint_contexts, policy_fn)
*da0073e9SAndroid Build Coastguard Worker        out = checkpoint(fn, x, use_reentrant=False, context_fn=context_fn)
*da0073e9SAndroid Build Coastguard Worker        out.sum().backward(retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "Trying to backward an extra time"):
*da0073e9SAndroid Build Coastguard Worker            out.sum().backward(retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass TestAutogradMultipleDispatch(TestCase):
*da0073e9SAndroid Build Coastguard Worker    def test_autograd_multiple_dispatch_registrations(self, device):
*da0073e9SAndroid Build Coastguard Worker        t = torch.randn(3, 3, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        # using _test_autograd_multiple_dispatch.fullcoverage which has
*da0073e9SAndroid Build Coastguard Worker        # registrations in derivatives.yaml for Default, AutogradCUDA and NestedTensorAutograd
*da0073e9SAndroid Build Coastguard Worker        out = torch._test_autograd_multiple_dispatch(t)
*da0073e9SAndroid Build Coastguard Worker        grad = torch.randn(3, 3, device=device)
*da0073e9SAndroid Build Coastguard Worker        out.backward(grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if "cuda" not in device:
*da0073e9SAndroid Build Coastguard Worker            # bogus default gradient registered for Autograd is grad + 1
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(t.grad, grad + 1)
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            # bogus gradient registered for AutogradCUDA is grad * 2
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(t.grad, grad * 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # test registered AutogradNestedTensor formula
*da0073e9SAndroid Build Coastguard Worker        a = (
*da0073e9SAndroid Build Coastguard Worker            torch.arange(6, dtype=torch.float, device=device)
*da0073e9SAndroid Build Coastguard Worker            .reshape(2, 3)
*da0073e9SAndroid Build Coastguard Worker            .requires_grad_(True)
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        b = (
*da0073e9SAndroid Build Coastguard Worker            torch.arange(8, dtype=torch.float, device=device)
*da0073e9SAndroid Build Coastguard Worker            .reshape(2, 4)
*da0073e9SAndroid Build Coastguard Worker            .requires_grad_(True)
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        nt = torch.nested.as_nested_tensor([a, b], dtype=torch.float, device=device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        nt_out = torch._test_autograd_multiple_dispatch(nt)
*da0073e9SAndroid Build Coastguard Worker        c = torch.randn(2, 3, device=device)
*da0073e9SAndroid Build Coastguard Worker        d = torch.randn(2, 4, device=device)
*da0073e9SAndroid Build Coastguard Worker        nt_grad = torch.nested.nested_tensor([c, d], dtype=torch.float, device=device)
*da0073e9SAndroid Build Coastguard Worker        nt_out.backward(nt_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # bogus gradient for AutogradNestedTensor is grad * grad
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a.grad, c * c)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(b.grad, d * d)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_autograd_composite_implicit_and_dispatch_registration(self, device):
*da0073e9SAndroid Build Coastguard Worker        t = torch.randn(3, 3, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        # using _test_autograd_multiple_dispatch.ntonly
*da0073e9SAndroid Build Coastguard Worker        # which has registrations in derivatives.yaml for NestedTensorAutograd and otherwise is CompositeImplicit
*da0073e9SAndroid Build Coastguard Worker        out = torch._test_autograd_multiple_dispatch(t, True)
*da0073e9SAndroid Build Coastguard Worker        grad = torch.randn(3, 3, device=device)
*da0073e9SAndroid Build Coastguard Worker        out.backward(grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # t.grad is just out.grad by composite op since _test_autograd_multiple_dispatch is just a clone
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(t.grad, grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # test registered AutogradNestedTensor formula
*da0073e9SAndroid Build Coastguard Worker        a = (
*da0073e9SAndroid Build Coastguard Worker            torch.arange(6, dtype=torch.float, device=device)
*da0073e9SAndroid Build Coastguard Worker            .reshape(2, 3)
*da0073e9SAndroid Build Coastguard Worker            .requires_grad_(True)
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        b = (
*da0073e9SAndroid Build Coastguard Worker            torch.arange(8, dtype=torch.float, device=device)
*da0073e9SAndroid Build Coastguard Worker            .reshape(2, 4)
*da0073e9SAndroid Build Coastguard Worker            .requires_grad_(True)
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        nt = torch.nested.as_nested_tensor([a, b], dtype=torch.float, device=device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        nt_out = torch._test_autograd_multiple_dispatch(nt, True)
*da0073e9SAndroid Build Coastguard Worker        c = torch.randn(2, 3, device=device)
*da0073e9SAndroid Build Coastguard Worker        d = torch.randn(2, 4, device=device)
*da0073e9SAndroid Build Coastguard Worker        nt_grad = torch.nested.nested_tensor([c, d], dtype=torch.float, device=device)
*da0073e9SAndroid Build Coastguard Worker        nt_out.backward(nt_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # bogus gradient for AutogradNestedTensor is grad * grad + grad
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a.grad, c * c + c)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(b.grad, d * d + d)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_foward_mode_AD(self, device):
*da0073e9SAndroid Build Coastguard Worker        # check that forward mode AD is only registered for the Default
*da0073e9SAndroid Build Coastguard Worker        # dispatch for _test_autograd_multiple_dispatch.fullcoverage and not AutogradCUDA
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        primal = torch.randn(3, device=device)
*da0073e9SAndroid Build Coastguard Worker        tangent = torch.randn(3, device=device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with fwAD.dual_level():
*da0073e9SAndroid Build Coastguard Worker            dual_input = fwAD.make_dual(primal, tangent)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            err_msg = r"Trying to use forward AD with .* that does not support it"
*da0073e9SAndroid Build Coastguard Worker            hint_msg = "Running forward AD for an OP that does not implement it should raise a NotImplementedError"
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            if "cuda" in device:
*da0073e9SAndroid Build Coastguard Worker                with self.assertRaisesRegex(NotImplementedError, err_msg, msg=hint_msg):
*da0073e9SAndroid Build Coastguard Worker                    torch._test_autograd_multiple_dispatch(dual_input)
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                torch._test_autograd_multiple_dispatch(dual_input)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_view_copy(self, device):
*da0073e9SAndroid Build Coastguard Worker        # tests that view_copy derivative formulas are also generated per dispatch key
*da0073e9SAndroid Build Coastguard Worker        # from their respective view ops in derivatives.yaml
*da0073e9SAndroid Build Coastguard Worker        t = torch.randn(2, 2, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        t_ref = t.clone().detach().requires_grad_()
*da0073e9SAndroid Build Coastguard Worker        # _test_autograd_multiple_dispatch_view does a .view(-1) on the input
*da0073e9SAndroid Build Coastguard Worker        t_view = torch._test_autograd_multiple_dispatch_view(t_ref)
*da0073e9SAndroid Build Coastguard Worker        t_view_copy = torch._test_autograd_multiple_dispatch_view_copy(t)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        grad = torch.randn(4, device=device)
*da0073e9SAndroid Build Coastguard Worker        t_view_copy.backward(grad)
*da0073e9SAndroid Build Coastguard Worker        t_view.backward(grad.clone())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # forward and backward give the same shape + result
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(t_view_copy, t_view)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(t.grad, t_ref.grad)
*da0073e9SAndroid Build Coastguard Worker        # backward results are per-dispatch-key in derivatives.yaml
*da0073e9SAndroid Build Coastguard Worker        if "cuda" in device:
*da0073e9SAndroid Build Coastguard Worker            # gradient registered to AutogradCUDA is grad.reshape_as(self) + 1
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(t.grad, grad.reshape_as(t) + 1)
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            # Default gradient registered is grad.reshape_as(self)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(t.grad, grad.reshape_as(t))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    def test_per_dispatch_key_input_saving(self, device):
*da0073e9SAndroid Build Coastguard Worker        # Tests that sum.dim_IntList's input is not saved for regular tensors but is saved for nested tensors
*da0073e9SAndroid Build Coastguard Worker        def foo(x):
*da0073e9SAndroid Build Coastguard Worker            # Don't modify the input inplace
*da0073e9SAndroid Build Coastguard Worker            x = x.clone()
*da0073e9SAndroid Build Coastguard Worker            res = x.sum(-1, keepdim=True)
*da0073e9SAndroid Build Coastguard Worker            x.add_(x)
*da0073e9SAndroid Build Coastguard Worker            return res
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        inp = torch.rand(2, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        # sum's input is not saved for regular Tensors
*da0073e9SAndroid Build Coastguard Worker        foo(inp).backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # sum's input is saved for Nested Tensors
*da0073e9SAndroid Build Coastguard Worker        nt = torch.nested.nested_tensor(
*da0073e9SAndroid Build Coastguard Worker            [torch.rand(2), torch.rand(2)], device=device, requires_grad=True
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "modified by an inplace operation"):
*da0073e9SAndroid Build Coastguard Worker            foo(nt).backward(
*da0073e9SAndroid Build Coastguard Worker                torch.nested.nested_tensor(
*da0073e9SAndroid Build Coastguard Worker                    [torch.rand(1), torch.rand(1)], device=device
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCUDA
*da0073e9SAndroid Build Coastguard Worker    def test_backward_single_threaded(self):
*da0073e9SAndroid Build Coastguard Worker        threads_eq = None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class TestFn(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x, self):
*da0073e9SAndroid Build Coastguard Worker                ctx.self = self
*da0073e9SAndroid Build Coastguard Worker                ctx.tid = threading.get_ident()
*da0073e9SAndroid Build Coastguard Worker                return x.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                nonlocal threads_eq
*da0073e9SAndroid Build Coastguard Worker                threads_eq = ctx.tid == threading.get_ident()
*da0073e9SAndroid Build Coastguard Worker                return gO, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        inp = torch.rand(10, device="cuda", requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.set_multithreading_enabled(False):
*da0073e9SAndroid Build Coastguard Worker            TestFn.apply(inp, None).sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(threads_eq)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        TestFn.apply(inp, None).sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(threads_eq)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCUDA
*da0073e9SAndroid Build Coastguard Worker    def test_backward_tls_stash(self):
*da0073e9SAndroid Build Coastguard Worker        local = threading.local()
*da0073e9SAndroid Build Coastguard Worker        local.my_obj = {}
*da0073e9SAndroid Build Coastguard Worker        local.my_obj[10] = 10
*da0073e9SAndroid Build Coastguard Worker        test_self = self
*da0073e9SAndroid Build Coastguard Worker        torch._C._stash_obj_in_tls("my_obj", local.my_obj)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class TestFn(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x, self):
*da0073e9SAndroid Build Coastguard Worker                return x.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                test_self.assertTrue(torch._C._is_key_in_tls("my_obj"))
*da0073e9SAndroid Build Coastguard Worker                test_self.assertTrue(torch._C._get_obj_in_tls("my_obj")[10] == 10)
*da0073e9SAndroid Build Coastguard Worker                torch._C._get_obj_in_tls("my_obj")[10] = 5
*da0073e9SAndroid Build Coastguard Worker                return gO, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        inp = torch.rand(10, device="cuda", requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        TestFn.apply(inp, None).sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(local.my_obj[10], 5)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_is_retain_graph(self):
*da0073e9SAndroid Build Coastguard Worker        retain_graph_set = False
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class TestFn(Function):
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def forward(ctx, x):
*da0073e9SAndroid Build Coastguard Worker                return x.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            @staticmethod
*da0073e9SAndroid Build Coastguard Worker            def backward(ctx, gO):
*da0073e9SAndroid Build Coastguard Worker                nonlocal retain_graph_set
*da0073e9SAndroid Build Coastguard Worker                retain_graph_set = (
*da0073e9SAndroid Build Coastguard Worker                    torch._C._autograd._get_current_graph_task_keep_graph()
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                return gO, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        inp = torch.rand(10, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        out = TestFn.apply(inp)
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(retain_graph_set)
*da0073e9SAndroid Build Coastguard Worker        out.sum().backward(retain_graph=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(retain_graph_set)
*da0073e9SAndroid Build Coastguard Worker        out.sum().backward(retain_graph=False)
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(retain_graph_set)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_set_sequence_nr(self):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn((10,), dtype=torch.float32, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn((10,), dtype=torch.float32, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        z = torch.randn((10,), dtype=torch.float32, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a = x + y
*da0073e9SAndroid Build Coastguard Worker        b = y + z
*da0073e9SAndroid Build Coastguard Worker        c = a + b
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNotNone(a.grad_fn)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNotNone(b.grad_fn)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsNotNone(c.grad_fn)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a.grad_fn._set_sequence_nr(100)
*da0073e9SAndroid Build Coastguard Worker        b.grad_fn._set_sequence_nr(99)
*da0073e9SAndroid Build Coastguard Worker        c.grad_fn._set_sequence_nr(98)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a.grad_fn._sequence_nr(), 100)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(b.grad_fn._sequence_nr(), 99)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(c.grad_fn._sequence_nr(), 98)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def log_grad_order(grad: torch.Tensor, name: str, order):
*da0073e9SAndroid Build Coastguard Worker            order.append(name)
*da0073e9SAndroid Build Coastguard Worker            return grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        order = []
*da0073e9SAndroid Build Coastguard Worker        a.register_hook(partial(log_grad_order, name="a", order=order))
*da0073e9SAndroid Build Coastguard Worker        b.register_hook(partial(log_grad_order, name="b", order=order))
*da0073e9SAndroid Build Coastguard Worker        c.register_hook(partial(log_grad_order, name="c", order=order))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        c.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Expect to see that even though c has the smallest sequence number, it is still the first node to get run in autograd.
*da0073e9SAndroid Build Coastguard Worker        # Also check that although a comes first during the forward, after giving it priority with sequence_nr,
*da0073e9SAndroid Build Coastguard Worker        # its autograd node is run before that of b.
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(order, ["c", "a", "b"])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.grad, torch.ones_like(x))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y.grad, 2 * torch.ones_like(x))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(z.grad, torch.ones_like(x))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker# Import test cases from below autograd/ here. These are found
*da0073e9SAndroid Build Coastguard Worker# implicitly by the loader, so Flake8 thinks they are unused, hence
*da0073e9SAndroid Build Coastguard Worker# the suppressions.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerfrom autograd.test_complex import TestAutogradComplex  # noqa: F401
*da0073e9SAndroid Build Coastguard Workerfrom autograd.test_functional import TestAutogradFunctional  # noqa: F401
*da0073e9SAndroid Build Coastguard Workerfrom autograd.test_logging import TestAutogradLogging  # noqa: F401
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker# e.g., TestAutogradDeviceTypeCPU and TestAutogradDeviceTypeCUDA
*da0073e9SAndroid Build Coastguard Workerinstantiate_device_type_tests(TestAutogradDeviceType, globals(), except_for=None)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerinstantiate_device_type_tests(
*da0073e9SAndroid Build Coastguard Worker    TestAutogradMultipleDispatch, globals(), only_for=("cpu", "cuda")
*da0073e9SAndroid Build Coastguard Worker)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerinstantiate_parametrized_tests(TestAutograd)
*da0073e9SAndroid Build Coastguard Workerinstantiate_parametrized_tests(TestNestedCheckpoint)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerif __name__ == "__main__":
*da0073e9SAndroid Build Coastguard Worker    run_tests()