test/nn/test_embedding.py

*da0073e9SAndroid Build Coastguard Worker# Owner(s): ["module: nn"]
*da0073e9SAndroid Build Coastguard Workerimport itertools
*da0073e9SAndroid Build Coastguard Workerimport random
*da0073e9SAndroid Build Coastguard Workerimport unittest
*da0073e9SAndroid Build Coastguard Workerfrom itertools import product
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerimport torch
*da0073e9SAndroid Build Coastguard Workerimport torch.nn as nn
*da0073e9SAndroid Build Coastguard Workerimport torch.nn.functional as F
*da0073e9SAndroid Build Coastguard Workerfrom torch.testing._internal.common_cuda import TEST_CUDA
*da0073e9SAndroid Build Coastguard Workerfrom torch.testing._internal.common_device_type import (
*da0073e9SAndroid Build Coastguard Worker    dtypes,
*da0073e9SAndroid Build Coastguard Worker    dtypesIfCUDA,
*da0073e9SAndroid Build Coastguard Worker    instantiate_device_type_tests,
*da0073e9SAndroid Build Coastguard Worker    largeTensorTest,
*da0073e9SAndroid Build Coastguard Worker    onlyCUDA,
*da0073e9SAndroid Build Coastguard Worker    onlyNativeDeviceTypes,
*da0073e9SAndroid Build Coastguard Worker    skipCUDAIf,
*da0073e9SAndroid Build Coastguard Worker    skipMeta,
*da0073e9SAndroid Build Coastguard Worker    TEST_WITH_ROCM,
*da0073e9SAndroid Build Coastguard Worker)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerfrom torch.testing._internal.common_nn import NNTestCase
*da0073e9SAndroid Build Coastguard Workerfrom torch.testing._internal.common_utils import (
*da0073e9SAndroid Build Coastguard Worker    _assertGradAndGradgradChecks,
*da0073e9SAndroid Build Coastguard Worker    dtype2prec_DONTUSE,
*da0073e9SAndroid Build Coastguard Worker    instantiate_parametrized_tests,
*da0073e9SAndroid Build Coastguard Worker    IS_JETSON,
*da0073e9SAndroid Build Coastguard Worker    parametrize as parametrize_test,
*da0073e9SAndroid Build Coastguard Worker    run_tests,
*da0073e9SAndroid Build Coastguard Worker    set_default_dtype,
*da0073e9SAndroid Build Coastguard Worker    skipIfTorchDynamo,
*da0073e9SAndroid Build Coastguard Worker)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass TestEmbeddingNN(NNTestCase):
*da0073e9SAndroid Build Coastguard Worker    _do_cuda_memory_leak_check = True
*da0073e9SAndroid Build Coastguard Worker    _do_cuda_non_default_stream = True
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @unittest.skipIf(not TEST_CUDA, "CUDA unavailable")
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_max_norm_unsorted_repeating_indices(self):
*da0073e9SAndroid Build Coastguard Worker        def create_embedding(device):
*da0073e9SAndroid Build Coastguard Worker            # Seed RNG so we get the same Embedding each time
*da0073e9SAndroid Build Coastguard Worker            torch.manual_seed(0)
*da0073e9SAndroid Build Coastguard Worker            return torch.nn.Embedding(
*da0073e9SAndroid Build Coastguard Worker                num_embeddings=20, embedding_dim=64, max_norm=1.0
*da0073e9SAndroid Build Coastguard Worker            ).to(device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        ix = torch.arange(2, device="cpu", dtype=torch.long).repeat(2000)
*da0073e9SAndroid Build Coastguard Worker        out_cpu = create_embedding("cpu")(ix)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        ix = ix.to("cuda")
*da0073e9SAndroid Build Coastguard Worker        out = create_embedding("cuda")(ix)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(out.cpu(), out_cpu)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_sparse_basic(self):
*da0073e9SAndroid Build Coastguard Worker        embedding = nn.Embedding(10, 20, sparse=True)
*da0073e9SAndroid Build Coastguard Worker        input = torch.tensor([[0, 2, 4, 5], [4, 3, 0, 9]], dtype=torch.long)
*da0073e9SAndroid Build Coastguard Worker        embedding(input).sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(embedding.weight.grad.is_sparse)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(embedding.weight.grad.shape, embedding.weight.shape)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_sparse_empty_tensor(self):
*da0073e9SAndroid Build Coastguard Worker        embedding = nn.Embedding(0, 0, sparse=True)
*da0073e9SAndroid Build Coastguard Worker        input = torch.tensor([], dtype=torch.int64)
*da0073e9SAndroid Build Coastguard Worker        embedding(input).sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(embedding.weight.grad.is_sparse)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(embedding.weight.grad.shape, embedding.weight.shape)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        embedding = nn.Embedding(10, 0, sparse=True)
*da0073e9SAndroid Build Coastguard Worker        input = torch.LongTensor([[0, 2, 4, 5], [4, 3, 0, 9]])
*da0073e9SAndroid Build Coastguard Worker        embedding(input).sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(embedding.weight.grad.is_sparse)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(embedding.weight.grad.shape, embedding.weight.shape)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_move_sparse_half_embedding(self):
*da0073e9SAndroid Build Coastguard Worker        embedding = nn.Embedding(10, 3, sparse=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(embedding.weight.device.type, "cpu")
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(embedding.weight.dtype, torch.get_default_dtype())
*da0073e9SAndroid Build Coastguard Worker        embedding.to(torch.float16)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(embedding.weight.dtype, torch.float16)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(embedding.embedding_dim, 3)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(embedding.num_embeddings, 10)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if torch.cuda.is_available():
*da0073e9SAndroid Build Coastguard Worker            embedding.to("cuda")
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(embedding.weight.device.type, "cuda")
*da0073e9SAndroid Build Coastguard Worker            embedding.to("cpu")
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(embedding.weight.device.type, "cpu")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_max_norm(self):
*da0073e9SAndroid Build Coastguard Worker        embedding = nn.Embedding(22, 5, max_norm=1.0)
*da0073e9SAndroid Build Coastguard Worker        input = torch.tensor([2, 8, 8, 6], dtype=torch.long)
*da0073e9SAndroid Build Coastguard Worker        output = embedding(input)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(output[1], output[2])
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(output.data.norm(p=2, dim=1).le(1).all())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @parametrize_test(
*da0073e9SAndroid Build Coastguard Worker        "dtype",
*da0073e9SAndroid Build Coastguard Worker        (
*da0073e9SAndroid Build Coastguard Worker            torch.uint8,
*da0073e9SAndroid Build Coastguard Worker            torch.int8,
*da0073e9SAndroid Build Coastguard Worker            torch.int16,
*da0073e9SAndroid Build Coastguard Worker            torch.int32,
*da0073e9SAndroid Build Coastguard Worker            torch.int64,
*da0073e9SAndroid Build Coastguard Worker            torch.float,
*da0073e9SAndroid Build Coastguard Worker            torch.double,
*da0073e9SAndroid Build Coastguard Worker        ),
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_from_pretrained(self, dtype):
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor([[1.0, 2.0, 3.0], [4.0, 5.0, 6.0]], dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker        embedding = nn.Embedding.from_pretrained(a)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a, embedding.weight.data)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        input = torch.LongTensor([0, 1])
*da0073e9SAndroid Build Coastguard Worker        output = embedding(input)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a, output)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_bag_from_pretrained(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor([[1.0, 2.0, 3.0], [4.0, 5.0, 6.0]])
*da0073e9SAndroid Build Coastguard Worker        embedding = nn.EmbeddingBag.from_pretrained(a)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a, embedding.weight)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        input = torch.tensor([0, 1], dtype=torch.long)
*da0073e9SAndroid Build Coastguard Worker        output = embedding(input, torch.arange(input.size(0)))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a, output)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_from_pretrained_padding_idx(self):
*da0073e9SAndroid Build Coastguard Worker        padding_idx = 2
*da0073e9SAndroid Build Coastguard Worker        padding_vec = torch.ones(3) * 7
*da0073e9SAndroid Build Coastguard Worker        embeddings = torch.rand(4, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            embeddings[padding_idx] = padding_vec
*da0073e9SAndroid Build Coastguard Worker        embedding_nn = nn.Embedding.from_pretrained(embeddings, padding_idx=padding_idx)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(embedding_nn.weight[padding_idx], padding_vec)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_bag_from_pretrained_padding_idx(self):
*da0073e9SAndroid Build Coastguard Worker        padding_idx = 2
*da0073e9SAndroid Build Coastguard Worker        embeddings = torch.rand(4, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        embedding_nn = nn.EmbeddingBag.from_pretrained(
*da0073e9SAndroid Build Coastguard Worker            embeddings, padding_idx=padding_idx
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(embedding_nn.weight, embeddings)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_from_pretrained_options(self):
*da0073e9SAndroid Build Coastguard Worker        with set_default_dtype(torch.double):
*da0073e9SAndroid Build Coastguard Worker            a = torch.tensor([[1.0, 2.0, 3.0], [4.0, 5.0, 6.0]])
*da0073e9SAndroid Build Coastguard Worker            opts = {
*da0073e9SAndroid Build Coastguard Worker                "max_norm": 2.0,
*da0073e9SAndroid Build Coastguard Worker                "norm_type": 0.5,
*da0073e9SAndroid Build Coastguard Worker                "scale_grad_by_freq": False,
*da0073e9SAndroid Build Coastguard Worker                "sparse": True,
*da0073e9SAndroid Build Coastguard Worker            }
*da0073e9SAndroid Build Coastguard Worker            embedding = nn.Embedding.from_pretrained(a, **opts)
*da0073e9SAndroid Build Coastguard Worker            input = torch.LongTensor([0, 1])
*da0073e9SAndroid Build Coastguard Worker            output = embedding(input)
*da0073e9SAndroid Build Coastguard Worker            # test output and that weight matrix was renormalized
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(a, output)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(a.ne(torch.arange(1, 7, dtype=a.dtype).view(2, 3)).all())
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(
*da0073e9SAndroid Build Coastguard Worker                output.data.norm(p=opts["norm_type"], dim=1).le(opts["max_norm"]).all()
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_functional(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor([[1, 3, 2], [0, 2, 1]], dtype=torch.long)
*da0073e9SAndroid Build Coastguard Worker        embeddings = torch.rand(4, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        embed_old = torch.nn.Embedding(4, 3)
*da0073e9SAndroid Build Coastguard Worker        embed_old.weight.data = embeddings.data
*da0073e9SAndroid Build Coastguard Worker        # A silly test for eager, this test is useful for when we run under PYTORCH_TEST_WITH_DYNAMO=1
*da0073e9SAndroid Build Coastguard Worker        # as it ensures that setattr correctly works.
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(embed_old.weight.data, embeddings.data)
*da0073e9SAndroid Build Coastguard Worker        res_old = embed_old(a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        res_F = F.embedding(a, embeddings)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(res_old, res_F)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        embed_old = torch.nn.Embedding(4, 3)
*da0073e9SAndroid Build Coastguard Worker        embed_old = embed_old.from_pretrained(embeddings, padding_idx=2)
*da0073e9SAndroid Build Coastguard Worker        res_old = embed_old(a)
*da0073e9SAndroid Build Coastguard Worker        res_F = F.embedding(a, embeddings, padding_idx=2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(res_old, res_F)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # https://github.com/pytorch/pytorch/issues/130806
*da0073e9SAndroid Build Coastguard Worker    @largeTensorTest("40GB", device="cuda")
*da0073e9SAndroid Build Coastguard Worker    def test_large_tensors(self):
*da0073e9SAndroid Build Coastguard Worker        input = torch.randint(low=0, high=16032, size=[131072], device="cuda")
*da0073e9SAndroid Build Coastguard Worker        w = torch.randn([16032, 16384], device="cuda")
*da0073e9SAndroid Build Coastguard Worker        out = torch.nn.functional.embedding(input, w)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(out.dim(), 2)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(out.numel(), 2147483648)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_bag_functional(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor([[1, 3, 2], [0, 2, 1]], dtype=torch.long)
*da0073e9SAndroid Build Coastguard Worker        embeddings = torch.rand(4, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        embed_old = torch.nn.EmbeddingBag(4, 3)
*da0073e9SAndroid Build Coastguard Worker        embed_old.weight = torch.nn.Parameter(embeddings)
*da0073e9SAndroid Build Coastguard Worker        res_old = embed_old(a)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        res_F = F.embedding_bag(a, embeddings)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(res_old, res_F)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        embed_old = torch.nn.EmbeddingBag(4, 3)
*da0073e9SAndroid Build Coastguard Worker        embed_old = embed_old.from_pretrained(embeddings, padding_idx=2)
*da0073e9SAndroid Build Coastguard Worker        res_old = embed_old(a)
*da0073e9SAndroid Build Coastguard Worker        res_F = F.embedding_bag(a, embeddings, padding_idx=2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(res_old, res_F)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # Make sure that error is thrown if padding_idx is out of bounds
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_bag_padding_idx_error(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor([[1, 3, 2], [0, 2, 1]], dtype=torch.long)
*da0073e9SAndroid Build Coastguard Worker        num_embeddings = 4
*da0073e9SAndroid Build Coastguard Worker        num_features = 3
*da0073e9SAndroid Build Coastguard Worker        embeddings = torch.rand(num_embeddings, num_features, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        functional_err_msg = r"padding_idx must be within the number of embeddings"
*da0073e9SAndroid Build Coastguard Worker        module_err_msg = r"padding_idx must be within num_embeddings"
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for padding_idx in range(-(num_embeddings + 2), (num_embeddings + 2)):
*da0073e9SAndroid Build Coastguard Worker            if (padding_idx < -num_embeddings) or (padding_idx >= num_embeddings):
*da0073e9SAndroid Build Coastguard Worker                with self.assertRaisesRegex(RuntimeError, functional_err_msg):
*da0073e9SAndroid Build Coastguard Worker                    F.embedding_bag(a, embeddings, padding_idx=padding_idx)
*da0073e9SAndroid Build Coastguard Worker                with self.assertRaisesRegex(AssertionError, module_err_msg):
*da0073e9SAndroid Build Coastguard Worker                    torch.nn.EmbeddingBag(
*da0073e9SAndroid Build Coastguard Worker                        num_embeddings, num_features, padding_idx=padding_idx
*da0073e9SAndroid Build Coastguard Worker                    )
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                F.embedding_bag(a, embeddings, padding_idx=padding_idx)
*da0073e9SAndroid Build Coastguard Worker                torch.nn.EmbeddingBag(
*da0073e9SAndroid Build Coastguard Worker                    num_embeddings, num_features, padding_idx=padding_idx
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_embeddingbag_from_pretrained(self):
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor([[1.0, 2.0, 3.0], [4.0, 5.0, 6.0]])
*da0073e9SAndroid Build Coastguard Worker        embeddingbag = nn.EmbeddingBag.from_pretrained(a)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a, embeddingbag.weight.data)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        input = torch.LongTensor([[0, 1]])
*da0073e9SAndroid Build Coastguard Worker        output = embeddingbag(input)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a.mean(0, keepdim=True), output)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_embeddingbag_from_pretrained_options(self):
*da0073e9SAndroid Build Coastguard Worker        with set_default_dtype(torch.double):
*da0073e9SAndroid Build Coastguard Worker            a = torch.tensor([[1.0, 2.0, 3.0], [4.0, 5.0, 6.0]])
*da0073e9SAndroid Build Coastguard Worker            opts = {
*da0073e9SAndroid Build Coastguard Worker                "max_norm": 2.0,
*da0073e9SAndroid Build Coastguard Worker                "norm_type": 0.5,
*da0073e9SAndroid Build Coastguard Worker                "scale_grad_by_freq": False,
*da0073e9SAndroid Build Coastguard Worker                "mode": "max",
*da0073e9SAndroid Build Coastguard Worker                "sparse": False,
*da0073e9SAndroid Build Coastguard Worker            }
*da0073e9SAndroid Build Coastguard Worker            embeddingbag = nn.EmbeddingBag.from_pretrained(a, **opts)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            input = torch.LongTensor([[0, 1]])
*da0073e9SAndroid Build Coastguard Worker            output = embeddingbag(input)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(a.max(0, keepdim=True)[0], output)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(a.ne(torch.arange(1, 7, dtype=a.dtype).view(2, 3)).all())
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(
*da0073e9SAndroid Build Coastguard Worker                a.norm(p=opts["norm_type"], dim=1).le(opts["max_norm"]).all()
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_embeddingbag_include_last_offset(self):
*da0073e9SAndroid Build Coastguard Worker        # Test case from https://github.com/pytorch/pytorch/issues/89677
*da0073e9SAndroid Build Coastguard Worker        embeddingbag = nn.EmbeddingBag(100, 3, include_last_offset=True, padding_idx=61)
*da0073e9SAndroid Build Coastguard Worker        input = torch.tensor([0, 1, 2, 3])
*da0073e9SAndroid Build Coastguard Worker        out = embeddingbag(input, torch.tensor([0, 3, 3]))
*da0073e9SAndroid Build Coastguard Worker        out2 = embeddingbag(input, torch.tensor([0, 3, 4]))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        weight = embeddingbag.weight
*da0073e9SAndroid Build Coastguard Worker        row0 = weight[0:3].mean(0)
*da0073e9SAndroid Build Coastguard Worker        row1 = weight[3]
*da0073e9SAndroid Build Coastguard Worker        ref_out = torch.stack([row0, row1])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(ref_out, out)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(ref_out, out2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass TestEmbeddingNNDeviceType(NNTestCase):
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_dense_grad(self, device):
*da0073e9SAndroid Build Coastguard Worker        with set_default_dtype(torch.double):
*da0073e9SAndroid Build Coastguard Worker            embd = nn.Embedding(20, 20).to(device)
*da0073e9SAndroid Build Coastguard Worker            weight = embd.weight
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def fn_wrapper(device):
*da0073e9SAndroid Build Coastguard Worker                def fn(weight):
*da0073e9SAndroid Build Coastguard Worker                    inp = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker                        [[0, 1, 1, 2], [3, 5, 7, 11]], dtype=torch.long
*da0073e9SAndroid Build Coastguard Worker                    ).to(device)
*da0073e9SAndroid Build Coastguard Worker                    return torch.nn.functional.embedding(inp, weight)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                return fn
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            fn = fn_wrapper(device)
*da0073e9SAndroid Build Coastguard Worker            _assertGradAndGradgradChecks(self, fn, (weight,))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_scalar_weight_error(self, device):
*da0073e9SAndroid Build Coastguard Worker        indices = torch.rand(2, 2, device=device).long()
*da0073e9SAndroid Build Coastguard Worker        weights = [
*da0073e9SAndroid Build Coastguard Worker            torch.tensor(1.0, device=device),
*da0073e9SAndroid Build Coastguard Worker            torch.tensor(1.0, device=device).reshape(1, 1, 1),
*da0073e9SAndroid Build Coastguard Worker        ]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for weight in weights:
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, "'weight' must be 2-D"):
*da0073e9SAndroid Build Coastguard Worker                torch.nn.functional.embedding(indices, weight)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfCUDA(torch.float16, torch.float64)
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.float64)
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_backward(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        embedding = nn.Embedding(10, 3, sparse=True)
*da0073e9SAndroid Build Coastguard Worker        tensor = torch.tensor([[7, 1, 3]])
*da0073e9SAndroid Build Coastguard Worker        ones = torch.tensor(1.0, dtype=dtype).expand(3, 3)
*da0073e9SAndroid Build Coastguard Worker        tensorTwice = tensor.repeat(1, 2)
*da0073e9SAndroid Build Coastguard Worker        onesTwice = torch.cat((ones, ones))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        embedding = embedding.to(dtype=dtype).to(device)
*da0073e9SAndroid Build Coastguard Worker        tensor = tensor.to(device)
*da0073e9SAndroid Build Coastguard Worker        ones = ones.to(device)
*da0073e9SAndroid Build Coastguard Worker        tensorTwice = tensorTwice.to(device)
*da0073e9SAndroid Build Coastguard Worker        onesTwice = onesTwice.to(device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        embedding.zero_grad()
*da0073e9SAndroid Build Coastguard Worker        embedding(tensor[0]).sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(embedding.weight.grad._indices(), tensor)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(embedding.weight.grad._values(), ones)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        embedding.zero_grad()
*da0073e9SAndroid Build Coastguard Worker        embedding(tensor[0]).sum().backward()
*da0073e9SAndroid Build Coastguard Worker        embedding(tensor[0]).sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(embedding.weight.grad._indices(), tensorTwice)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(embedding.weight.grad._values(), onesTwice)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        embedding.zero_grad()
*da0073e9SAndroid Build Coastguard Worker        embedding(tensor[0]).sum().backward()
*da0073e9SAndroid Build Coastguard Worker        tensor[0, 0] = 8
*da0073e9SAndroid Build Coastguard Worker        embedding(tensor[0]).sum().backward()
*da0073e9SAndroid Build Coastguard Worker        tensorTwice[0, 3] = 8
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(embedding.weight.grad._indices(), tensorTwice)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(embedding.weight.grad._values(), onesTwice)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfCUDA(
*da0073e9SAndroid Build Coastguard Worker        *(
*da0073e9SAndroid Build Coastguard Worker            (torch.float, torch.double, torch.bfloat16, torch.half)
*da0073e9SAndroid Build Coastguard Worker            if TEST_WITH_ROCM
*da0073e9SAndroid Build Coastguard Worker            else (torch.float, torch.double, torch.half)
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.float32)
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_max_norm_backward(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        # can't use gradcheck since in place renorm makes analytical gradients different from produced ones
*da0073e9SAndroid Build Coastguard Worker        weight = torch.randn((4, 4), device=device, dtype=dtype) * 2
*da0073e9SAndroid Build Coastguard Worker        weight.requires_grad_()
*da0073e9SAndroid Build Coastguard Worker        inp_list = [0, 1, 2, 2]
*da0073e9SAndroid Build Coastguard Worker        inp = torch.tensor(inp_list, device=device)
*da0073e9SAndroid Build Coastguard Worker        out = nn.functional.embedding(inp, weight, max_norm=1.0).sum()
*da0073e9SAndroid Build Coastguard Worker        out.backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        expected_grad = (
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([[1.0, 1.0, 2.0, 0.0]], device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker            .transpose(0, 1)
*da0073e9SAndroid Build Coastguard Worker            .expand(4, 4)
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(weight.grad, expected_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfCUDA(
*da0073e9SAndroid Build Coastguard Worker        *(
*da0073e9SAndroid Build Coastguard Worker            (torch.float, torch.double, torch.bfloat16, torch.half)
*da0073e9SAndroid Build Coastguard Worker            if TEST_WITH_ROCM
*da0073e9SAndroid Build Coastguard Worker            else (torch.float, torch.double, torch.half)
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.float32)
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_max_norm_fwd_AD(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        if torch.device(device).type == "xla":
*da0073e9SAndroid Build Coastguard Worker            self.skipTest("forward AD doesn't work on xla")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # can't use gradcheck since in place renorm makes analytical gradients different from produced ones
*da0073e9SAndroid Build Coastguard Worker        weight = torch.randn((4, 4), device=device, dtype=dtype) * 2
*da0073e9SAndroid Build Coastguard Worker        tangent = torch.ones((4, 4), device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker        inp = torch.tensor([[0, 1], [2, 2]], device=device)
*da0073e9SAndroid Build Coastguard Worker        with torch.autograd.forward_ad.dual_level():
*da0073e9SAndroid Build Coastguard Worker            dual_weight = torch.autograd.forward_ad.make_dual(weight, tangent)
*da0073e9SAndroid Build Coastguard Worker            out = nn.functional.embedding(inp, dual_weight, max_norm=1.0)
*da0073e9SAndroid Build Coastguard Worker            jvp = torch.autograd.forward_ad.unpack_dual(out).tangent
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        expected_grad = torch.ones((2, 2, 4), device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(jvp, expected_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfCUDA(
*da0073e9SAndroid Build Coastguard Worker        *(
*da0073e9SAndroid Build Coastguard Worker            (torch.float, torch.double, torch.bfloat16, torch.half)
*da0073e9SAndroid Build Coastguard Worker            if TEST_WITH_ROCM
*da0073e9SAndroid Build Coastguard Worker            else (torch.float, torch.double, torch.half)
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.float32)
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_padding_idx(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        embedding = nn.Embedding(10, 20, padding_idx=0).to(device, dtype)
*da0073e9SAndroid Build Coastguard Worker        input = torch.tensor([[0, 2, 4, 5], [4, 3, 0, 9]], dtype=torch.long).to(device)
*da0073e9SAndroid Build Coastguard Worker        output = embedding(input)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(output[0][0].sum(), 0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(output[1][2].sum(), 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        embedding = nn.Embedding(10, 20, padding_idx=0, sparse=True).to(device, dtype)
*da0073e9SAndroid Build Coastguard Worker        input = torch.tensor([[0, 2, 4, 5], [4, 3, 0, 9]], dtype=torch.long).to(device)
*da0073e9SAndroid Build Coastguard Worker        output = embedding(input)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(output[0][0].sum(), 0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(output[1][2].sum(), 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # negative indexing check for padding_idx
*da0073e9SAndroid Build Coastguard Worker        # padding_idx=-2, num_embeddings=10 ==> index 8 padded
*da0073e9SAndroid Build Coastguard Worker        embedding = nn.Embedding(10, 20, padding_idx=-2).to(device, dtype)
*da0073e9SAndroid Build Coastguard Worker        input = torch.tensor([[0, 2, 8, 5], [4, 8, 0, 9]], dtype=torch.long).to(device)
*da0073e9SAndroid Build Coastguard Worker        output = embedding(input)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(output[0][2].sum(), 0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(output[1][1].sum(), 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        embedding = nn.Embedding(10, 20, padding_idx=-2, sparse=True).to(device, dtype)
*da0073e9SAndroid Build Coastguard Worker        input = torch.tensor([[0, 2, 8, 5], [4, 8, 0, 9]], dtype=torch.long).to(device)
*da0073e9SAndroid Build Coastguard Worker        output = embedding(input)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(output[0][2].sum(), 0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(output[1][1].sum(), 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # change padding vector
*da0073e9SAndroid Build Coastguard Worker        padding_vector = torch.ones(20, dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        embedding = nn.Embedding(10, 20, padding_idx=2, sparse=True).to(device, dtype)
*da0073e9SAndroid Build Coastguard Worker        with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker            embedding.weight[2] = padding_vector
*da0073e9SAndroid Build Coastguard Worker        input = torch.tensor([0, 2], dtype=torch.long).to(device)
*da0073e9SAndroid Build Coastguard Worker        output = embedding(input)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(output[1], padding_vector)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # out of bounds check for padding_idx
*da0073e9SAndroid Build Coastguard Worker        self.assertRaises(
*da0073e9SAndroid Build Coastguard Worker            AssertionError,
*da0073e9SAndroid Build Coastguard Worker            nn.Embedding,
*da0073e9SAndroid Build Coastguard Worker            num_embeddings=10,
*da0073e9SAndroid Build Coastguard Worker            embedding_dim=20,
*da0073e9SAndroid Build Coastguard Worker            padding_idx=25,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self.assertRaises(
*da0073e9SAndroid Build Coastguard Worker            AssertionError,
*da0073e9SAndroid Build Coastguard Worker            nn.Embedding,
*da0073e9SAndroid Build Coastguard Worker            num_embeddings=10,
*da0073e9SAndroid Build Coastguard Worker            embedding_dim=20,
*da0073e9SAndroid Build Coastguard Worker            padding_idx=-25,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        padding_idx = 0
*da0073e9SAndroid Build Coastguard Worker        embedding = nn.Embedding(5, 2, padding_idx=padding_idx).to(device, dtype)
*da0073e9SAndroid Build Coastguard Worker        for n in (
*da0073e9SAndroid Build Coastguard Worker            1,
*da0073e9SAndroid Build Coastguard Worker            2,
*da0073e9SAndroid Build Coastguard Worker            1000,
*da0073e9SAndroid Build Coastguard Worker        ):  # Need large N to trigger all the methods we have implemented
*da0073e9SAndroid Build Coastguard Worker            for other_indices in ([], [1, 3], [2]):
*da0073e9SAndroid Build Coastguard Worker                indices = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker                    other_indices + [padding_idx] * n, dtype=torch.long
*da0073e9SAndroid Build Coastguard Worker                ).to(device)
*da0073e9SAndroid Build Coastguard Worker                pre = embedding.weight[padding_idx].clone()
*da0073e9SAndroid Build Coastguard Worker                embedding(indices).sum().backward()
*da0073e9SAndroid Build Coastguard Worker                after = (embedding.weight + embedding.weight.grad)[padding_idx]
*da0073e9SAndroid Build Coastguard Worker                embedding.zero_grad()
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(after, pre)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # test double backward
*da0073e9SAndroid Build Coastguard Worker                emb_sum = embedding(indices).sum()
*da0073e9SAndroid Build Coastguard Worker                emb_grad = torch.autograd.grad(
*da0073e9SAndroid Build Coastguard Worker                    outputs=emb_sum,
*da0073e9SAndroid Build Coastguard Worker                    inputs=list(embedding.parameters()),
*da0073e9SAndroid Build Coastguard Worker                    retain_graph=True,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                scalar = emb_grad[0].sum() + emb_sum
*da0073e9SAndroid Build Coastguard Worker                scalar.backward()
*da0073e9SAndroid Build Coastguard Worker                after = (embedding.weight + embedding.weight.grad)[padding_idx]
*da0073e9SAndroid Build Coastguard Worker                embedding.zero_grad()
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(after, pre)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # Check correctness of torch.nn.functional.embedding_bag forward and
*da0073e9SAndroid Build Coastguard Worker    # backward functions with padding_idx, given a 1D input separated into bags
*da0073e9SAndroid Build Coastguard Worker    # with an offset array. Compare against an equivalent 2D input that uses
*da0073e9SAndroid Build Coastguard Worker    # padding indices to fill in the gaps indicated by the offset array
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfTorchDynamo("see https://github.com/pytorch/pytorch/pull/95621")
*da0073e9SAndroid Build Coastguard Worker    @onlyNativeDeviceTypes
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.float32, torch.float64)
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfCUDA(torch.half, torch.bfloat16)
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_bag_1D_padding_idx(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        num_features = 3
*da0073e9SAndroid Build Coastguard Worker        max_indices_per_bag = 10
*da0073e9SAndroid Build Coastguard Worker        num_bags = 10
*da0073e9SAndroid Build Coastguard Worker        num_words = 100
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def gen_1D_indices_offsets(include_last_offset, allpad):
*da0073e9SAndroid Build Coastguard Worker            indices = []
*da0073e9SAndroid Build Coastguard Worker            offsets = []
*da0073e9SAndroid Build Coastguard Worker            cur_offset = 0
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Make one bag full and one bag empty, for extra coverage
*da0073e9SAndroid Build Coastguard Worker            empty_bag = random.randint(0, num_bags - 1)
*da0073e9SAndroid Build Coastguard Worker            full_bag = empty_bag
*da0073e9SAndroid Build Coastguard Worker            while full_bag == empty_bag:
*da0073e9SAndroid Build Coastguard Worker                full_bag = random.randint(0, num_bags - 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            for bag in range(num_bags):
*da0073e9SAndroid Build Coastguard Worker                offsets.append(cur_offset)
*da0073e9SAndroid Build Coastguard Worker                if bag == full_bag:
*da0073e9SAndroid Build Coastguard Worker                    bag_size = max_indices_per_bag
*da0073e9SAndroid Build Coastguard Worker                elif bag == empty_bag:
*da0073e9SAndroid Build Coastguard Worker                    bag_size = 0
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    bag_size = random.randint(1, max_indices_per_bag - 1)
*da0073e9SAndroid Build Coastguard Worker                indices += [
*da0073e9SAndroid Build Coastguard Worker                    1 if allpad else random.randint(0, num_words - 1)
*da0073e9SAndroid Build Coastguard Worker                    for _ in range(bag_size)
*da0073e9SAndroid Build Coastguard Worker                ]
*da0073e9SAndroid Build Coastguard Worker                cur_offset += bag_size
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # embedding_bag requires first entry of offsets to be 0
*da0073e9SAndroid Build Coastguard Worker            assert offsets[0] == 0
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            indices = torch.tensor(indices, device=device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            if include_last_offset:
*da0073e9SAndroid Build Coastguard Worker                offsets.append(indices.size(0))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            offsets = torch.tensor(offsets, device=device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            return indices, offsets
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Convert a 1-D indices-offsets representation into 2-D. Fill any empty
*da0073e9SAndroid Build Coastguard Worker        # indices with padding_idx
*da0073e9SAndroid Build Coastguard Worker        def gen_2D_indices_from_1D(
*da0073e9SAndroid Build Coastguard Worker            indices_1D, offsets, include_last_offset, padding_idx
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            assert offsets[0] == 0
*da0073e9SAndroid Build Coastguard Worker            if include_last_offset:
*da0073e9SAndroid Build Coastguard Worker                offsets = offsets[:-1]
*da0073e9SAndroid Build Coastguard Worker            indices_2D = torch.empty(
*da0073e9SAndroid Build Coastguard Worker                num_bags, max_indices_per_bag, device=device, dtype=torch.long
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            for bag in range(num_bags):
*da0073e9SAndroid Build Coastguard Worker                # Determine the start and end position of the bag within indices_1D
*da0073e9SAndroid Build Coastguard Worker                start = offsets[bag]
*da0073e9SAndroid Build Coastguard Worker                end = len(indices_1D) if bag + 1 == num_bags else offsets[bag + 1]
*da0073e9SAndroid Build Coastguard Worker                end = min(len(indices_1D), end)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # Pull out the bag's indices from indices_1D, and fill any
*da0073e9SAndroid Build Coastguard Worker                # remaining space with padding indices
*da0073e9SAndroid Build Coastguard Worker                indices_in_bag = []
*da0073e9SAndroid Build Coastguard Worker                for item_pos in range(0, max_indices_per_bag):
*da0073e9SAndroid Build Coastguard Worker                    if (start + item_pos) < end:
*da0073e9SAndroid Build Coastguard Worker                        indices_in_bag.append(indices_1D[start + item_pos])
*da0073e9SAndroid Build Coastguard Worker                    else:
*da0073e9SAndroid Build Coastguard Worker                        indices_in_bag.append(padding_idx)
*da0073e9SAndroid Build Coastguard Worker                indices_2D[bag] = torch.tensor(indices_in_bag, device=device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            return indices_2D
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        test_cases = product(
*da0073e9SAndroid Build Coastguard Worker            ["max", "mean", "sum"], [False, True], [False, True], [False, True]
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for mode, sparse, include_last_offset, allpad in test_cases:
*da0073e9SAndroid Build Coastguard Worker            # Max sparse and bfloat16 are not supported
*da0073e9SAndroid Build Coastguard Worker            if mode == "max":
*da0073e9SAndroid Build Coastguard Worker                if sparse or (dtype == torch.bfloat16):
*da0073e9SAndroid Build Coastguard Worker                    continue
*da0073e9SAndroid Build Coastguard Worker            indices_1D, offsets = gen_1D_indices_offsets(include_last_offset, allpad)
*da0073e9SAndroid Build Coastguard Worker            for padding_idx_1D in list(set(indices_1D.tolist())) + [None]:
*da0073e9SAndroid Build Coastguard Worker                msg = (
*da0073e9SAndroid Build Coastguard Worker                    f"mode: '{mode}', sparse: {sparse}, include_last_offset: {include_last_offset}, "
*da0073e9SAndroid Build Coastguard Worker                    f"padding_idx_1D: {padding_idx_1D}"
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # If 1D input does not use a padding index, we still need one for the 2D input,
*da0073e9SAndroid Build Coastguard Worker                # so we can add one dummy word to the weights to act as the padded word
*da0073e9SAndroid Build Coastguard Worker                padding_idx_2D = (
*da0073e9SAndroid Build Coastguard Worker                    padding_idx_1D if padding_idx_1D is not None else num_words
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                num_words_with_padding = (
*da0073e9SAndroid Build Coastguard Worker                    num_words if padding_idx_1D is not None else num_words + 1
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                indices_2D = gen_2D_indices_from_1D(
*da0073e9SAndroid Build Coastguard Worker                    indices_1D, offsets, include_last_offset, padding_idx_2D
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                weights = torch.randn(
*da0073e9SAndroid Build Coastguard Worker                    num_words_with_padding,
*da0073e9SAndroid Build Coastguard Worker                    num_features,
*da0073e9SAndroid Build Coastguard Worker                    dtype=dtype,
*da0073e9SAndroid Build Coastguard Worker                    device=device,
*da0073e9SAndroid Build Coastguard Worker                    requires_grad=True,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                weights_check = weights.clone().detach().requires_grad_(True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                bag = torch.nn.functional.embedding_bag(
*da0073e9SAndroid Build Coastguard Worker                    indices_1D,
*da0073e9SAndroid Build Coastguard Worker                    weights,
*da0073e9SAndroid Build Coastguard Worker                    offsets,
*da0073e9SAndroid Build Coastguard Worker                    padding_idx=padding_idx_1D,
*da0073e9SAndroid Build Coastguard Worker                    mode=mode,
*da0073e9SAndroid Build Coastguard Worker                    sparse=sparse,
*da0073e9SAndroid Build Coastguard Worker                    include_last_offset=include_last_offset,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                bag_check = torch.nn.functional.embedding_bag(
*da0073e9SAndroid Build Coastguard Worker                    indices_2D,
*da0073e9SAndroid Build Coastguard Worker                    weights_check,
*da0073e9SAndroid Build Coastguard Worker                    padding_idx=padding_idx_2D,
*da0073e9SAndroid Build Coastguard Worker                    mode=mode,
*da0073e9SAndroid Build Coastguard Worker                    sparse=sparse,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(bag, bag_check, msg=msg)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                bag.sum().backward()
*da0073e9SAndroid Build Coastguard Worker                bag_check.sum().backward()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # Sometimes, half dtype gradients mismatch by a greater amount
*da0073e9SAndroid Build Coastguard Worker                # than other dtypes
*da0073e9SAndroid Build Coastguard Worker                if dtype in [torch.half, torch.bfloat16]:
*da0073e9SAndroid Build Coastguard Worker                    atol = 0.01
*da0073e9SAndroid Build Coastguard Worker                    rtol = 0.01
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    atol = None
*da0073e9SAndroid Build Coastguard Worker                    rtol = None
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker                    weights.grad, weights_check.grad, msg=msg, atol=atol, rtol=rtol
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # Check correctness of torch.nn.functional.embedding_bag forward and
*da0073e9SAndroid Build Coastguard Worker    # backward functions with padding_idx, given a 2D indices input. Compare
*da0073e9SAndroid Build Coastguard Worker    # against torch.nn.functional.embedding followed by a reduction.
*da0073e9SAndroid Build Coastguard Worker    @onlyNativeDeviceTypes
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.float32, torch.float64)
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfCUDA(torch.half, torch.bfloat16)
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_bag_2D_padding_idx(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        # Use a Python implementation of embedding_bag with padding_idx support
*da0073e9SAndroid Build Coastguard Worker        # to check torch.nn.functional.embedding_bag correctness
*da0073e9SAndroid Build Coastguard Worker        def embedding_bag_check(indices, weights, mode, sparse, padding_idx):
*da0073e9SAndroid Build Coastguard Worker            assert padding_idx is not None
*da0073e9SAndroid Build Coastguard Worker            embedding = torch.nn.functional.embedding(
*da0073e9SAndroid Build Coastguard Worker                indices, weights, padding_idx=padding_idx, sparse=sparse
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            reduction_dim = indices.dim() - 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            if mode == "sum" or mode == "mean":
*da0073e9SAndroid Build Coastguard Worker                # We must avoid including elements at padding_idx in the
*da0073e9SAndroid Build Coastguard Worker                # sum/mean, so multiply those elements by 0, and multiply
*da0073e9SAndroid Build Coastguard Worker                # all other elements by 1
*da0073e9SAndroid Build Coastguard Worker                per_sample_weights = indices.ne(padding_idx).to(dtype).unsqueeze(-1)
*da0073e9SAndroid Build Coastguard Worker                res = embedding.mul(per_sample_weights).sum(dim=reduction_dim)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                if mode == "mean":
*da0073e9SAndroid Build Coastguard Worker                    weights_sum = per_sample_weights.sum(dim=reduction_dim)
*da0073e9SAndroid Build Coastguard Worker                    res = res.div(weights_sum)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            elif mode == "max":
*da0073e9SAndroid Build Coastguard Worker                # We must avoid allowing elements at padding_idx to be chosen
*da0073e9SAndroid Build Coastguard Worker                # as the max, so set those elements to negative infinity
*da0073e9SAndroid Build Coastguard Worker                res = embedding.masked_fill(
*da0073e9SAndroid Build Coastguard Worker                    indices.unsqueeze(-1) == padding_idx, -float("inf")
*da0073e9SAndroid Build Coastguard Worker                ).amax(dim=reduction_dim)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                raise RuntimeError(f"mode '{mode}' is not available")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # If a row is all padding, set its corresponding result row to 0.
*da0073e9SAndroid Build Coastguard Worker            # This is needed because the above mean and max mode
*da0073e9SAndroid Build Coastguard Worker            # implementations set these elements to nan and -inf, respectively
*da0073e9SAndroid Build Coastguard Worker            if mode in ["mean", "max"]:
*da0073e9SAndroid Build Coastguard Worker                res = res.masked_fill(
*da0073e9SAndroid Build Coastguard Worker                    indices.eq(padding_idx).all(dim=-1).unsqueeze(-1), 0
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            return res
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        num_features = 3
*da0073e9SAndroid Build Coastguard Worker        num_words = 10
*da0073e9SAndroid Build Coastguard Worker        indices_dim1 = 10
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for mode, sparse, allpad, indices_dim0 in product(
*da0073e9SAndroid Build Coastguard Worker            ["max", "mean", "sum"], [False, True], [False, True], [1, 10]
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            # Max sparse and bfloat16 are not supported
*da0073e9SAndroid Build Coastguard Worker            if mode == "max":
*da0073e9SAndroid Build Coastguard Worker                if sparse or (dtype == torch.bfloat16):
*da0073e9SAndroid Build Coastguard Worker                    continue
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            if allpad:
*da0073e9SAndroid Build Coastguard Worker                indices = torch.empty(
*da0073e9SAndroid Build Coastguard Worker                    indices_dim0, indices_dim1, dtype=torch.long, device=device
*da0073e9SAndroid Build Coastguard Worker                ).fill_(1)
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                indices = torch.randint(
*da0073e9SAndroid Build Coastguard Worker                    0, num_words, (indices_dim0, indices_dim1), device=device
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                if indices_dim0 > 1:
*da0073e9SAndroid Build Coastguard Worker                    # Fill one row with duplicate index so we can test with a fully
*da0073e9SAndroid Build Coastguard Worker                    # padded row
*da0073e9SAndroid Build Coastguard Worker                    duplicate_row = random.randint(0, indices_dim0 - 1)
*da0073e9SAndroid Build Coastguard Worker                    indices[duplicate_row] = indices[duplicate_row][0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            for padding_idx in list(set(indices.flatten(0, -1).tolist())):
*da0073e9SAndroid Build Coastguard Worker                weights = torch.randn(
*da0073e9SAndroid Build Coastguard Worker                    num_words,
*da0073e9SAndroid Build Coastguard Worker                    num_features,
*da0073e9SAndroid Build Coastguard Worker                    dtype=dtype,
*da0073e9SAndroid Build Coastguard Worker                    device=device,
*da0073e9SAndroid Build Coastguard Worker                    requires_grad=True,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                weights_check = weights.clone().detach().requires_grad_(True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                msg = (
*da0073e9SAndroid Build Coastguard Worker                    f"mode: '{mode}', sparse: {sparse}, padding_idx: {padding_idx}, "
*da0073e9SAndroid Build Coastguard Worker                    f"allpad: {allpad}, indices.size(): {indices.size()}"
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # Check forward with a Python implementation of padding_idx embedding_bag
*da0073e9SAndroid Build Coastguard Worker                bag_check = embedding_bag_check(
*da0073e9SAndroid Build Coastguard Worker                    indices, weights_check, mode, sparse, padding_idx
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                bag = torch.nn.functional.embedding_bag(
*da0073e9SAndroid Build Coastguard Worker                    indices, weights, padding_idx=padding_idx, mode=mode, sparse=sparse
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(bag, bag_check, msg=msg)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                bag_check.sum().backward()
*da0073e9SAndroid Build Coastguard Worker                grad_check = weights_check.grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                bag.sum().backward()
*da0073e9SAndroid Build Coastguard Worker                grad = weights.grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # Sometimes, half dtype gradients mismatch by a greater amount
*da0073e9SAndroid Build Coastguard Worker                # than other dtypes
*da0073e9SAndroid Build Coastguard Worker                if dtype in [torch.half, torch.bfloat16]:
*da0073e9SAndroid Build Coastguard Worker                    atol = 0.01
*da0073e9SAndroid Build Coastguard Worker                    rtol = 0.01
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    atol = None
*da0073e9SAndroid Build Coastguard Worker                    rtol = None
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(grad, grad_check, msg=msg, atol=atol, rtol=rtol)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCUDA
*da0073e9SAndroid Build Coastguard Worker    @dtypes(
*da0073e9SAndroid Build Coastguard Worker        *(
*da0073e9SAndroid Build Coastguard Worker            (torch.float, torch.double, torch.bfloat16, torch.half)
*da0073e9SAndroid Build Coastguard Worker            if TEST_WITH_ROCM
*da0073e9SAndroid Build Coastguard Worker            else (torch.float, torch.double, torch.half)
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_max_norm_device(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        embedding = nn.Embedding(22, 5, max_norm=1.0).to(device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker        # nn.Embedding only takes LongTensor as input
*da0073e9SAndroid Build Coastguard Worker        input = torch.tensor([2, 8, 8, 6], device=device, dtype=torch.long)
*da0073e9SAndroid Build Coastguard Worker        output = embedding(input)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(output[1], output[2])
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(output.data.norm(p=2, dim=1).le(1).all())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypes(*itertools.product((torch.int, torch.long), (torch.int, torch.long)))
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_bag_empty_input(self, device, dtypes):
*da0073e9SAndroid Build Coastguard Worker        m = 4
*da0073e9SAndroid Build Coastguard Worker        n = 3
*da0073e9SAndroid Build Coastguard Worker        x = torch.tensor([], device=device, dtype=dtypes[0])
*da0073e9SAndroid Build Coastguard Worker        for sparse in [True, False]:
*da0073e9SAndroid Build Coastguard Worker            Embed = torch.nn.EmbeddingBag(m, n, sparse=sparse)
*da0073e9SAndroid Build Coastguard Worker            Embed.to(device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            output = Embed(
*da0073e9SAndroid Build Coastguard Worker                input=x, offsets=torch.tensor([0], device=device, dtype=dtypes[1])
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(output, torch.zeros_like(output))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            output = Embed(
*da0073e9SAndroid Build Coastguard Worker                input=x, offsets=torch.tensor([0, 0], device=device, dtype=dtypes[1])
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(output, torch.zeros_like(output))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipCUDAIf(True, "no out-of-bounds check on CUDA for perf.")
*da0073e9SAndroid Build Coastguard Worker    @dtypes(*itertools.product((torch.float, torch.double), (torch.int, torch.long)))
*da0073e9SAndroid Build Coastguard Worker    @parametrize_test("padding_idx", [None, 0])
*da0073e9SAndroid Build Coastguard Worker    @parametrize_test("mode", ["sum", "mean", "max"])
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_bag_out_of_bounds_idx(self, device, dtypes, padding_idx, mode):
*da0073e9SAndroid Build Coastguard Worker        padding_idx = 0
*da0073e9SAndroid Build Coastguard Worker        w_dtype, idx_dtype = dtypes
*da0073e9SAndroid Build Coastguard Worker        # negative out-of-bound
*da0073e9SAndroid Build Coastguard Worker        idx1 = torch.tensor([[-1, 1]], device=device, dtype=idx_dtype)
*da0073e9SAndroid Build Coastguard Worker        # positive out-of-bound
*da0073e9SAndroid Build Coastguard Worker        idx2 = torch.tensor([[11, 8]], device=device, dtype=idx_dtype)
*da0073e9SAndroid Build Coastguard Worker        weight = torch.randn(10, 2, device=device, dtype=w_dtype)
*da0073e9SAndroid Build Coastguard Worker        if mode == "sum":
*da0073e9SAndroid Build Coastguard Worker            # Only `sum` supports per_sample_weight
*da0073e9SAndroid Build Coastguard Worker            per_sample_weights = (
*da0073e9SAndroid Build Coastguard Worker                None,
*da0073e9SAndroid Build Coastguard Worker                torch.randn_like(idx1, device=device, dtype=w_dtype),
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            per_sample_weights = (None,)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for p_s_weights, idx in itertools.product(per_sample_weights, (idx1, idx2)):
*da0073e9SAndroid Build Coastguard Worker            msg = "Expected idx >= 0 && idx < num_embeddings"
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, msg):
*da0073e9SAndroid Build Coastguard Worker                torch.nn.functional.embedding_bag(
*da0073e9SAndroid Build Coastguard Worker                    idx,
*da0073e9SAndroid Build Coastguard Worker                    weight,
*da0073e9SAndroid Build Coastguard Worker                    per_sample_weights=p_s_weights,
*da0073e9SAndroid Build Coastguard Worker                    padding_idx=padding_idx,
*da0073e9SAndroid Build Coastguard Worker                    mode=mode,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_bag_dimension_errors(self, device):
*da0073e9SAndroid Build Coastguard Worker        funcs = (
*da0073e9SAndroid Build Coastguard Worker            lambda x, y, z: torch.nn.functional.embedding_bag(y, x, z),
*da0073e9SAndroid Build Coastguard Worker            torch.embedding_bag,
*da0073e9SAndroid Build Coastguard Worker            torch._embedding_bag,
*da0073e9SAndroid Build Coastguard Worker            torch._embedding_bag_forward_only,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        for i, f in enumerate(funcs):
*da0073e9SAndroid Build Coastguard Worker            err_type = (ValueError, RuntimeError) if i == 0 else RuntimeError
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            weight = torch.full(
*da0073e9SAndroid Build Coastguard Worker                (
*da0073e9SAndroid Build Coastguard Worker                    2,
*da0073e9SAndroid Build Coastguard Worker                    6,
*da0073e9SAndroid Build Coastguard Worker                ),
*da0073e9SAndroid Build Coastguard Worker                0,
*da0073e9SAndroid Build Coastguard Worker                dtype=torch.float64,
*da0073e9SAndroid Build Coastguard Worker                device=device,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            indices = torch.full(
*da0073e9SAndroid Build Coastguard Worker                (
*da0073e9SAndroid Build Coastguard Worker                    2,
*da0073e9SAndroid Build Coastguard Worker                    0,
*da0073e9SAndroid Build Coastguard Worker                    0,
*da0073e9SAndroid Build Coastguard Worker                    6,
*da0073e9SAndroid Build Coastguard Worker                    6,
*da0073e9SAndroid Build Coastguard Worker                ),
*da0073e9SAndroid Build Coastguard Worker                2,
*da0073e9SAndroid Build Coastguard Worker                dtype=torch.int64,
*da0073e9SAndroid Build Coastguard Worker                device=device,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            offsets = torch.full((2, 0, 0, 6, 6), 0, dtype=torch.int64, device=device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            if i == 0:
*da0073e9SAndroid Build Coastguard Worker                error_msg = "input has to be 1D or 2D Tensor"
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                error_msg = "input has to be a 1D or 2D Tensor"
*da0073e9SAndroid Build Coastguard Worker            torch._dynamo.disable(self.assertRaisesRegex)(
*da0073e9SAndroid Build Coastguard Worker                err_type, error_msg, lambda: f(weight, indices, offsets)
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            weight = torch.full((2, 2), 0, dtype=torch.float64, device=device)
*da0073e9SAndroid Build Coastguard Worker            indices = torch.full((2,), 1, dtype=torch.int64, device=device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            torch._dynamo.disable(self.assertRaisesRegex)(
*da0073e9SAndroid Build Coastguard Worker                err_type,
*da0073e9SAndroid Build Coastguard Worker                "offsets has to be a 1D Tensor",
*da0073e9SAndroid Build Coastguard Worker                lambda: f(weight, indices, offsets),
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            weight = torch.full((2, 2, 2), 0, dtype=torch.float64, device=device)
*da0073e9SAndroid Build Coastguard Worker            indices = torch.full((2,), 2, dtype=torch.int64, device=device)
*da0073e9SAndroid Build Coastguard Worker            offsets = torch.full((2,), 0, dtype=torch.int64, device=device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            torch._dynamo.disable(self.assertRaisesRegex)(
*da0073e9SAndroid Build Coastguard Worker                err_type,
*da0073e9SAndroid Build Coastguard Worker                "weight has to be a 2D Tensor",
*da0073e9SAndroid Build Coastguard Worker                lambda: f(weight, indices, offsets),
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypes(*itertools.product((torch.int, torch.long), (torch.int, torch.long)))
*da0073e9SAndroid Build Coastguard Worker    def test_EmbeddingBag_per_sample_weights_failures(self, device, dtypes):
*da0073e9SAndroid Build Coastguard Worker        # Failure 1: mismatched embeddings / per_sample_weights dtype
*da0073e9SAndroid Build Coastguard Worker        es = nn.EmbeddingBag(5, 2, mode="sum").to(dtype=torch.float, device=device)
*da0073e9SAndroid Build Coastguard Worker        input = torch.tensor([3, 1, 1, 1, 4, 0], dtype=dtypes[0], device=device)
*da0073e9SAndroid Build Coastguard Worker        offsets = torch.tensor([0, 0, 3, 3, 6], dtype=dtypes[1], device=device)
*da0073e9SAndroid Build Coastguard Worker        per_sample_weights = torch.randn_like(input, dtype=torch.double, device=device)
*da0073e9SAndroid Build Coastguard Worker        if device == "cpu":
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, "have the same type as"):
*da0073e9SAndroid Build Coastguard Worker                es(input, offsets, per_sample_weights)
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, "expected scalar type"):
*da0073e9SAndroid Build Coastguard Worker                es(input, offsets, per_sample_weights)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Failure 2.1: input/per_sample_weights have different sizes (1d input)
*da0073e9SAndroid Build Coastguard Worker        input = torch.tensor([3, 1, 1, 1, 4, 0], dtype=dtypes[0], device=device)
*da0073e9SAndroid Build Coastguard Worker        offsets = torch.tensor([0, 0, 3, 3, 6], dtype=dtypes[1], device=device)
*da0073e9SAndroid Build Coastguard Worker        per_sample_weights = torch.randn(5, dtype=torch.float, device=device)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(ValueError, "same shape as the input"):
*da0073e9SAndroid Build Coastguard Worker            es(input, offsets, per_sample_weights)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Failure 2.2: input/per_sample_weights have different sizes (2d input)
*da0073e9SAndroid Build Coastguard Worker        input = torch.randint(5, (7, 3), dtype=dtypes[0], device=device)
*da0073e9SAndroid Build Coastguard Worker        offsets = None
*da0073e9SAndroid Build Coastguard Worker        per_sample_weights = torch.randn(7 * 3, dtype=torch.float, device=device)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(ValueError, "same shape as the input"):
*da0073e9SAndroid Build Coastguard Worker            es(input, offsets, per_sample_weights)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Failure 3: Unsupported per_sample_weights and mode=('max', 'mean')
*da0073e9SAndroid Build Coastguard Worker        for unsupported_mode in ("max", "mean"):
*da0073e9SAndroid Build Coastguard Worker            es = nn.EmbeddingBag(5, 2, mode=unsupported_mode).to(
*da0073e9SAndroid Build Coastguard Worker                dtype=torch.float, device=device
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            input = torch.randint(5, (7, 3), dtype=dtypes[0], device=device)
*da0073e9SAndroid Build Coastguard Worker            offsets = None
*da0073e9SAndroid Build Coastguard Worker            per_sample_weights = torch.randn(7, 3, dtype=torch.float, device=device)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                NotImplementedError, "only supported for mode='sum'"
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                es(input, offsets, per_sample_weights)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _embedding_bag_reference_impl(
*da0073e9SAndroid Build Coastguard Worker        self,
*da0073e9SAndroid Build Coastguard Worker        input,
*da0073e9SAndroid Build Coastguard Worker        weight,
*da0073e9SAndroid Build Coastguard Worker        offsets=None,
*da0073e9SAndroid Build Coastguard Worker        mode="sum",
*da0073e9SAndroid Build Coastguard Worker        per_sample_weights=None,
*da0073e9SAndroid Build Coastguard Worker        include_last_offset=False,
*da0073e9SAndroid Build Coastguard Worker    ):
*da0073e9SAndroid Build Coastguard Worker        assert mode == "sum" or per_sample_weights is None
*da0073e9SAndroid Build Coastguard Worker        assert offsets is not None
*da0073e9SAndroid Build Coastguard Worker        if per_sample_weights is None:
*da0073e9SAndroid Build Coastguard Worker            per_sample_weights = torch.ones(input.size()).to(
*da0073e9SAndroid Build Coastguard Worker                dtype=weight.dtype, device=weight.device
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        assert input.numel() == per_sample_weights.numel()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        bags = []
*da0073e9SAndroid Build Coastguard Worker        long_input = input.to(torch.long)
*da0073e9SAndroid Build Coastguard Worker        embeddings = weight.index_select(0, long_input) * per_sample_weights.unsqueeze(
*da0073e9SAndroid Build Coastguard Worker            1
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        if include_last_offset:
*da0073e9SAndroid Build Coastguard Worker            for index in range(len(offsets) - 1):
*da0073e9SAndroid Build Coastguard Worker                offset = offsets[index]
*da0073e9SAndroid Build Coastguard Worker                next_offset = offsets[index + 1]
*da0073e9SAndroid Build Coastguard Worker                length = next_offset - offset
*da0073e9SAndroid Build Coastguard Worker                if length == 0:
*da0073e9SAndroid Build Coastguard Worker                    bags.append(
*da0073e9SAndroid Build Coastguard Worker                        torch.tensor([0] * weight.size(1)).to(
*da0073e9SAndroid Build Coastguard Worker                            dtype=embeddings.dtype, device=embeddings.device
*da0073e9SAndroid Build Coastguard Worker                        )
*da0073e9SAndroid Build Coastguard Worker                    )
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    if mode == "sum":
*da0073e9SAndroid Build Coastguard Worker                        bags.append(embeddings.narrow(0, offset, length).sum(0))
*da0073e9SAndroid Build Coastguard Worker                    elif mode == "mean":
*da0073e9SAndroid Build Coastguard Worker                        bags.append(
*da0073e9SAndroid Build Coastguard Worker                            embeddings.narrow(0, offset, length).sum(0).div(length)
*da0073e9SAndroid Build Coastguard Worker                        )
*da0073e9SAndroid Build Coastguard Worker                    else:
*da0073e9SAndroid Build Coastguard Worker                        assert mode == "max"
*da0073e9SAndroid Build Coastguard Worker                        bags.append(embeddings.narrow(0, offset, length).max(0)[0])
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            for index, offset in enumerate(offsets):
*da0073e9SAndroid Build Coastguard Worker                if index + 1 < len(offsets):
*da0073e9SAndroid Build Coastguard Worker                    next_offset = offsets[index + 1]
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    next_offset = len(long_input)
*da0073e9SAndroid Build Coastguard Worker                length = next_offset - offset
*da0073e9SAndroid Build Coastguard Worker                if length == 0:
*da0073e9SAndroid Build Coastguard Worker                    bags.append(
*da0073e9SAndroid Build Coastguard Worker                        torch.tensor([0] * weight.size(1)).to(
*da0073e9SAndroid Build Coastguard Worker                            dtype=embeddings.dtype, device=embeddings.device
*da0073e9SAndroid Build Coastguard Worker                        )
*da0073e9SAndroid Build Coastguard Worker                    )
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    if mode == "sum":
*da0073e9SAndroid Build Coastguard Worker                        bags.append(embeddings.narrow(0, offset, length).sum(0))
*da0073e9SAndroid Build Coastguard Worker                    elif mode == "mean":
*da0073e9SAndroid Build Coastguard Worker                        bags.append(
*da0073e9SAndroid Build Coastguard Worker                            embeddings.narrow(0, offset, length).sum(0).div(length)
*da0073e9SAndroid Build Coastguard Worker                        )
*da0073e9SAndroid Build Coastguard Worker                    else:
*da0073e9SAndroid Build Coastguard Worker                        assert mode == "max"
*da0073e9SAndroid Build Coastguard Worker                        bags.append(embeddings.narrow(0, offset, length).max(0)[0])
*da0073e9SAndroid Build Coastguard Worker        return torch.stack(bags)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipMeta
*da0073e9SAndroid Build Coastguard Worker    @dtypes(
*da0073e9SAndroid Build Coastguard Worker        *itertools.product(
*da0073e9SAndroid Build Coastguard Worker            (torch.int, torch.long),
*da0073e9SAndroid Build Coastguard Worker            (torch.int, torch.long),
*da0073e9SAndroid Build Coastguard Worker            (torch.half, torch.bfloat16, torch.float, torch.double),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfCUDA(
*da0073e9SAndroid Build Coastguard Worker        *itertools.product(
*da0073e9SAndroid Build Coastguard Worker            (torch.int, torch.long),
*da0073e9SAndroid Build Coastguard Worker            (torch.int, torch.long),
*da0073e9SAndroid Build Coastguard Worker            (torch.float, torch.double, torch.half),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    def test_EmbeddingBag_empty_per_sample_weights_and_offsets(self, device, dtypes):
*da0073e9SAndroid Build Coastguard Worker        # Test empty input and per sample weight, and backward pass. There was a CUDA
*da0073e9SAndroid Build Coastguard Worker        # invalid configuration bug (more context in #46572)
*da0073e9SAndroid Build Coastguard Worker        def test_per_sample_weights(mode, trainable_scale):
*da0073e9SAndroid Build Coastguard Worker            es = nn.EmbeddingBag(5, 2, mode=mode).to(dtype=dtypes[2], device=device)
*da0073e9SAndroid Build Coastguard Worker            es.weight.data.copy_(
*da0073e9SAndroid Build Coastguard Worker                torch.arange(1, 11, device=device).view_as(es.weight).to(dtypes[2])
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            input = torch.tensor([], device=device, dtype=dtypes[0])
*da0073e9SAndroid Build Coastguard Worker            offsets = torch.tensor([0, 0, 0, 0, 0], device=device, dtype=dtypes[1])
*da0073e9SAndroid Build Coastguard Worker            per_sample_weights = torch.randn_like(
*da0073e9SAndroid Build Coastguard Worker                input, dtype=dtypes[2]
*da0073e9SAndroid Build Coastguard Worker            ).requires_grad_(trainable_scale)
*da0073e9SAndroid Build Coastguard Worker            ref_per_sample_weights = per_sample_weights.detach().requires_grad_(
*da0073e9SAndroid Build Coastguard Worker                trainable_scale
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            reference_weights = es.weight.detach().requires_grad_()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            expected = self._embedding_bag_reference_impl(
*da0073e9SAndroid Build Coastguard Worker                input, reference_weights, offsets, mode, ref_per_sample_weights
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            result = es(input, offsets, per_sample_weights)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker                result, expected, atol=dtype2prec_DONTUSE[dtypes[2]], rtol=0
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            grad = torch.randn_like(expected)
*da0073e9SAndroid Build Coastguard Worker            result.backward(grad)
*da0073e9SAndroid Build Coastguard Worker            # the reference impl doesn't have grad fn for empty input; but the grad should
*da0073e9SAndroid Build Coastguard Worker            # simply be a zero tensor
*da0073e9SAndroid Build Coastguard Worker            ref_weights_grad = torch.zeros_like(es.weight)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker                es.weight.grad,
*da0073e9SAndroid Build Coastguard Worker                ref_weights_grad,
*da0073e9SAndroid Build Coastguard Worker                atol=dtype2prec_DONTUSE[dtypes[2]],
*da0073e9SAndroid Build Coastguard Worker                rtol=0,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            if trainable_scale:
*da0073e9SAndroid Build Coastguard Worker                ref_per_sample_weights_grad = torch.empty_like(per_sample_weights)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker                    per_sample_weights.grad,
*da0073e9SAndroid Build Coastguard Worker                    ref_per_sample_weights_grad,
*da0073e9SAndroid Build Coastguard Worker                    atol=dtype2prec_DONTUSE[dtypes[2]],
*da0073e9SAndroid Build Coastguard Worker                    rtol=0,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        modes = ("sum",)
*da0073e9SAndroid Build Coastguard Worker        trainable_scale = (True, False)
*da0073e9SAndroid Build Coastguard Worker        for mode, trainable in itertools.product(modes, trainable_scale):
*da0073e9SAndroid Build Coastguard Worker            test_per_sample_weights(mode, trainable)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipMeta
*da0073e9SAndroid Build Coastguard Worker    @dtypes(
*da0073e9SAndroid Build Coastguard Worker        *itertools.product(
*da0073e9SAndroid Build Coastguard Worker            (torch.int, torch.long),
*da0073e9SAndroid Build Coastguard Worker            (torch.int, torch.long),
*da0073e9SAndroid Build Coastguard Worker            (torch.float, torch.double, torch.half, torch.bfloat16),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfCUDA(
*da0073e9SAndroid Build Coastguard Worker        *itertools.product(
*da0073e9SAndroid Build Coastguard Worker            (torch.int, torch.long),
*da0073e9SAndroid Build Coastguard Worker            (torch.int, torch.long),
*da0073e9SAndroid Build Coastguard Worker            (torch.float, torch.double, torch.half),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    def test_EmbeddingBag_per_sample_weights_and_offsets(self, device, dtypes):
*da0073e9SAndroid Build Coastguard Worker        def test_per_sample_weights(mode, trainable_scale):
*da0073e9SAndroid Build Coastguard Worker            es = nn.EmbeddingBag(5, 2, mode=mode).to(dtype=dtypes[2], device=device)
*da0073e9SAndroid Build Coastguard Worker            es.weight.data.copy_(
*da0073e9SAndroid Build Coastguard Worker                torch.arange(1, 11, device=device).view_as(es.weight).to(dtypes[2])
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            input = torch.tensor([3, 1, 1, 1, 4, 0], device=device, dtype=dtypes[0])
*da0073e9SAndroid Build Coastguard Worker            offsets = torch.tensor([0, 0, 3, 3, 6], device=device, dtype=dtypes[1])
*da0073e9SAndroid Build Coastguard Worker            per_sample_weights = torch.randn_like(
*da0073e9SAndroid Build Coastguard Worker                input, dtype=dtypes[2]
*da0073e9SAndroid Build Coastguard Worker            ).requires_grad_(trainable_scale)
*da0073e9SAndroid Build Coastguard Worker            ref_per_sample_weights = per_sample_weights.detach().requires_grad_(
*da0073e9SAndroid Build Coastguard Worker                trainable_scale
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            reference_weights = es.weight.detach().requires_grad_()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            expected = self._embedding_bag_reference_impl(
*da0073e9SAndroid Build Coastguard Worker                input, reference_weights, offsets, mode, ref_per_sample_weights
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            result = es(input, offsets, per_sample_weights)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker                result, expected, atol=dtype2prec_DONTUSE[dtypes[2]], rtol=0
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            grad = torch.randn_like(expected).to(dtype=dtypes[2], device=device)
*da0073e9SAndroid Build Coastguard Worker            result.backward(grad)
*da0073e9SAndroid Build Coastguard Worker            expected.backward(grad)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker                es.weight.grad,
*da0073e9SAndroid Build Coastguard Worker                reference_weights.grad,
*da0073e9SAndroid Build Coastguard Worker                atol=dtype2prec_DONTUSE[dtypes[2]],
*da0073e9SAndroid Build Coastguard Worker                rtol=0,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            if trainable_scale:
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker                    per_sample_weights.grad,
*da0073e9SAndroid Build Coastguard Worker                    ref_per_sample_weights.grad,
*da0073e9SAndroid Build Coastguard Worker                    atol=dtype2prec_DONTUSE[dtypes[2]],
*da0073e9SAndroid Build Coastguard Worker                    rtol=0,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        modes = ("sum",)
*da0073e9SAndroid Build Coastguard Worker        trainable_scale = (True, False)
*da0073e9SAndroid Build Coastguard Worker        for mode, trainable in itertools.product(modes, trainable_scale):
*da0073e9SAndroid Build Coastguard Worker            test_per_sample_weights(mode, trainable)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipMeta
*da0073e9SAndroid Build Coastguard Worker    @dtypes(
*da0073e9SAndroid Build Coastguard Worker        *itertools.product(
*da0073e9SAndroid Build Coastguard Worker            (torch.int, torch.long),
*da0073e9SAndroid Build Coastguard Worker            (torch.int, torch.long),
*da0073e9SAndroid Build Coastguard Worker            (torch.float, torch.double, torch.half, torch.bfloat16),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfCUDA(
*da0073e9SAndroid Build Coastguard Worker        *itertools.product(
*da0073e9SAndroid Build Coastguard Worker            (torch.int, torch.long),
*da0073e9SAndroid Build Coastguard Worker            (torch.int, torch.long),
*da0073e9SAndroid Build Coastguard Worker            (torch.float, torch.double, torch.half),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    def test_EmbeddingBag_per_sample_weights_and_new_offsets(self, device, dtypes):
*da0073e9SAndroid Build Coastguard Worker        def test_per_sample_weights_new_offsets(
*da0073e9SAndroid Build Coastguard Worker            mode, trainable_scale, include_last_offset, has_weight=True
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            es = nn.EmbeddingBag(
*da0073e9SAndroid Build Coastguard Worker                5, 2, mode=mode, include_last_offset=include_last_offset
*da0073e9SAndroid Build Coastguard Worker            ).to(dtype=dtypes[2], device=device)
*da0073e9SAndroid Build Coastguard Worker            es.weight.data.copy_(
*da0073e9SAndroid Build Coastguard Worker                torch.arange(1, 11, device=device).view_as(es.weight).to(dtypes[2])
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            input = torch.tensor([3, 1, 1, 1, 4, 0], device=device, dtype=dtypes[0])
*da0073e9SAndroid Build Coastguard Worker            offsets = torch.tensor([0, 0, 3, 3, 6], device=device, dtype=dtypes[1])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            if include_last_offset:
*da0073e9SAndroid Build Coastguard Worker                offsets = torch.cat(
*da0073e9SAndroid Build Coastguard Worker                    (
*da0073e9SAndroid Build Coastguard Worker                        offsets,
*da0073e9SAndroid Build Coastguard Worker                        torch.tensor([input.size(0)], device=device, dtype=dtypes[1]),
*da0073e9SAndroid Build Coastguard Worker                    ),
*da0073e9SAndroid Build Coastguard Worker                    0,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            if has_weight:
*da0073e9SAndroid Build Coastguard Worker                per_sample_weights = torch.randn_like(
*da0073e9SAndroid Build Coastguard Worker                    input, device=device, dtype=dtypes[2]
*da0073e9SAndroid Build Coastguard Worker                ).requires_grad_(trainable_scale)
*da0073e9SAndroid Build Coastguard Worker                ref_per_sample_weights = per_sample_weights.detach().requires_grad_(
*da0073e9SAndroid Build Coastguard Worker                    trainable_scale
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                per_sample_weights = None
*da0073e9SAndroid Build Coastguard Worker                ref_per_sample_weights = None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            reference_weights = es.weight.detach().requires_grad_()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            expected = self._embedding_bag_reference_impl(
*da0073e9SAndroid Build Coastguard Worker                input,
*da0073e9SAndroid Build Coastguard Worker                reference_weights,
*da0073e9SAndroid Build Coastguard Worker                offsets,
*da0073e9SAndroid Build Coastguard Worker                mode,
*da0073e9SAndroid Build Coastguard Worker                ref_per_sample_weights,
*da0073e9SAndroid Build Coastguard Worker                include_last_offset,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            result = es(input, offsets, per_sample_weights)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker                result, expected, atol=dtype2prec_DONTUSE[dtypes[2]], rtol=0
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            grad = torch.randn_like(expected)
*da0073e9SAndroid Build Coastguard Worker            result.backward(grad)
*da0073e9SAndroid Build Coastguard Worker            expected.backward(grad)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker                es.weight.grad,
*da0073e9SAndroid Build Coastguard Worker                reference_weights.grad,
*da0073e9SAndroid Build Coastguard Worker                atol=dtype2prec_DONTUSE[dtypes[2]],
*da0073e9SAndroid Build Coastguard Worker                rtol=0,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            if has_weight and trainable_scale:
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker                    per_sample_weights.grad,
*da0073e9SAndroid Build Coastguard Worker                    ref_per_sample_weights.grad,
*da0073e9SAndroid Build Coastguard Worker                    atol=dtype2prec_DONTUSE[dtypes[2]],
*da0073e9SAndroid Build Coastguard Worker                    rtol=0,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        trainable_scale = (True, False)
*da0073e9SAndroid Build Coastguard Worker        include_last_offset_list = (True, False)
*da0073e9SAndroid Build Coastguard Worker        modes = (("sum", False), ("sum", True), ("max", False), ("mean", False))
*da0073e9SAndroid Build Coastguard Worker        for (mode, has_weight), trainable, include_last_offset in itertools.product(
*da0073e9SAndroid Build Coastguard Worker            modes, trainable_scale, include_last_offset_list
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            test_per_sample_weights_new_offsets(
*da0073e9SAndroid Build Coastguard Worker                mode, trainable, include_last_offset, has_weight
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _test_EmbeddingBag_vs_Embedding(
*da0073e9SAndroid Build Coastguard Worker        self,
*da0073e9SAndroid Build Coastguard Worker        N,
*da0073e9SAndroid Build Coastguard Worker        D,
*da0073e9SAndroid Build Coastguard Worker        B,
*da0073e9SAndroid Build Coastguard Worker        L,
*da0073e9SAndroid Build Coastguard Worker        max_norm=None,
*da0073e9SAndroid Build Coastguard Worker        mode="mean",
*da0073e9SAndroid Build Coastguard Worker        device="cpu",
*da0073e9SAndroid Build Coastguard Worker        wdtype=torch.float,
*da0073e9SAndroid Build Coastguard Worker        dtype=torch.long,
*da0073e9SAndroid Build Coastguard Worker        test_per_sample_weights=False,
*da0073e9SAndroid Build Coastguard Worker        trainable_per_sample_weights=False,
*da0073e9SAndroid Build Coastguard Worker        sparse=False,
*da0073e9SAndroid Build Coastguard Worker        test_backward=True,
*da0073e9SAndroid Build Coastguard Worker        backward_prec=None,
*da0073e9SAndroid Build Coastguard Worker    ):
*da0073e9SAndroid Build Coastguard Worker        es = nn.EmbeddingBag(N, D, mode=mode, sparse=sparse, max_norm=max_norm).to(
*da0073e9SAndroid Build Coastguard Worker            device, wdtype
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        e = nn.Embedding(N, D, max_norm=max_norm).to(device, wdtype)
*da0073e9SAndroid Build Coastguard Worker        e.weight.data.copy_(es.weight)
*da0073e9SAndroid Build Coastguard Worker        input = torch.randint(N, (B, L), device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker        offsets = torch.arange(0, B, device=device, dtype=dtype).mul_(L)
*da0073e9SAndroid Build Coastguard Worker        grad_output = torch.rand(B, D, device=device, dtype=wdtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if test_per_sample_weights:
*da0073e9SAndroid Build Coastguard Worker            # To prevent large gradients, weights should sum to 1 for each bag
*da0073e9SAndroid Build Coastguard Worker            per_sample_weights = torch.randn(B, L, device=device, dtype=wdtype).softmax(
*da0073e9SAndroid Build Coastguard Worker                dim=-1
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            per_sample_weights_reference = per_sample_weights.clone().requires_grad_(
*da0073e9SAndroid Build Coastguard Worker                trainable_per_sample_weights
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            per_sample_weights.requires_grad_(trainable_per_sample_weights)
*da0073e9SAndroid Build Coastguard Worker            output = es(input.view(-1), offsets, per_sample_weights.view(-1))
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            output = es(input.view(-1), offsets)
*da0073e9SAndroid Build Coastguard Worker            per_sample_weights = None
*da0073e9SAndroid Build Coastguard Worker            per_sample_weights_reference = None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if mode == "sum":
*da0073e9SAndroid Build Coastguard Worker            if test_per_sample_weights:
*da0073e9SAndroid Build Coastguard Worker                ref_output = (
*da0073e9SAndroid Build Coastguard Worker                    e(input) * per_sample_weights_reference.unsqueeze(-1)
*da0073e9SAndroid Build Coastguard Worker                ).sum(1)
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                ref_output = e(input).sum(1)
*da0073e9SAndroid Build Coastguard Worker        elif mode == "mean":
*da0073e9SAndroid Build Coastguard Worker            assert not test_per_sample_weights
*da0073e9SAndroid Build Coastguard Worker            ref_output = e(input).mean(1)
*da0073e9SAndroid Build Coastguard Worker        elif mode == "max":
*da0073e9SAndroid Build Coastguard Worker            assert not test_per_sample_weights
*da0073e9SAndroid Build Coastguard Worker            ref_output = e(input).max(1)[0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(output, ref_output, atol=dtype2prec_DONTUSE[wdtype], rtol=0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if not test_backward:
*da0073e9SAndroid Build Coastguard Worker            return
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        output.backward(grad_output)
*da0073e9SAndroid Build Coastguard Worker        ref_output.backward(grad_output)
*da0073e9SAndroid Build Coastguard Worker        es_weight_grad = es.weight.grad
*da0073e9SAndroid Build Coastguard Worker        if sparse:
*da0073e9SAndroid Build Coastguard Worker            es_weight_grad = es.weight.grad.to_dense()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # We have more floating point error here because we are dealing with larger numbers
*da0073e9SAndroid Build Coastguard Worker        if backward_prec is None:
*da0073e9SAndroid Build Coastguard Worker            needed_prec = dtype2prec_DONTUSE[wdtype] * 5
*da0073e9SAndroid Build Coastguard Worker            rtol = 0.02 if wdtype == torch.half else 0
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            needed_prec = backward_prec
*da0073e9SAndroid Build Coastguard Worker            rtol = 0
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(es_weight_grad, e.weight.grad, atol=needed_prec, rtol=rtol)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if test_per_sample_weights and trainable_per_sample_weights:
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker                per_sample_weights.grad,
*da0073e9SAndroid Build Coastguard Worker                per_sample_weights_reference.grad,
*da0073e9SAndroid Build Coastguard Worker                atol=dtype2prec_DONTUSE[wdtype],
*da0073e9SAndroid Build Coastguard Worker                rtol=0,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfCUDA(
*da0073e9SAndroid Build Coastguard Worker        *itertools.product(
*da0073e9SAndroid Build Coastguard Worker            (torch.int, torch.long), (torch.half, torch.float, torch.double)
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    @dtypes(*itertools.product((torch.int, torch.long), (torch.float, torch.double)))
*da0073e9SAndroid Build Coastguard Worker    def test_EmbeddingBag_per_sample_weights_and_no_offsets(self, device, dtypes):
*da0073e9SAndroid Build Coastguard Worker        def run_tests(mode, sparse, trainable_per_sample_weights):
*da0073e9SAndroid Build Coastguard Worker            kwargs = dict(
*da0073e9SAndroid Build Coastguard Worker                test_per_sample_weights=True,
*da0073e9SAndroid Build Coastguard Worker                device=device,
*da0073e9SAndroid Build Coastguard Worker                mode=mode,
*da0073e9SAndroid Build Coastguard Worker                wdtype=dtypes[1],
*da0073e9SAndroid Build Coastguard Worker                dtype=dtypes[0],
*da0073e9SAndroid Build Coastguard Worker                sparse=sparse,
*da0073e9SAndroid Build Coastguard Worker                trainable_per_sample_weights=trainable_per_sample_weights,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Simple case
*da0073e9SAndroid Build Coastguard Worker            self._test_EmbeddingBag_vs_Embedding(2, 3, 5, 7, **kwargs)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # B * L > 1000
*da0073e9SAndroid Build Coastguard Worker            self._test_EmbeddingBag_vs_Embedding(2, 5, 53, 23, **kwargs)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Large num_embedding
*da0073e9SAndroid Build Coastguard Worker            self._test_EmbeddingBag_vs_Embedding(101, 5, 3, 7, **kwargs)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Large embedding_dim
*da0073e9SAndroid Build Coastguard Worker            self._test_EmbeddingBag_vs_Embedding(2, 101, 3, 7, **kwargs)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        modes = ("sum",)
*da0073e9SAndroid Build Coastguard Worker        sparsity = (True, False)
*da0073e9SAndroid Build Coastguard Worker        trainable_scale = (True, False)
*da0073e9SAndroid Build Coastguard Worker        for mode, sparse, trainable_per_sample_weights in itertools.product(
*da0073e9SAndroid Build Coastguard Worker            modes, sparsity, trainable_scale
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            run_tests(mode, sparse, trainable_per_sample_weights)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Test CUDA Dense on half precision
*da0073e9SAndroid Build Coastguard Worker        if device == "cuda":
*da0073e9SAndroid Build Coastguard Worker            modes = ("sum",)
*da0073e9SAndroid Build Coastguard Worker            sparsity = (False,)
*da0073e9SAndroid Build Coastguard Worker            trainable_scale = (True, False)
*da0073e9SAndroid Build Coastguard Worker            for mode, sparse, trainable_per_sample_weights in itertools.product(
*da0073e9SAndroid Build Coastguard Worker                modes, sparsity, trainable_scale
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                run_tests(mode, sparse, trainable_per_sample_weights)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _test_EmbeddingBag(
*da0073e9SAndroid Build Coastguard Worker        self,
*da0073e9SAndroid Build Coastguard Worker        device,
*da0073e9SAndroid Build Coastguard Worker        mode,
*da0073e9SAndroid Build Coastguard Worker        sparse,
*da0073e9SAndroid Build Coastguard Worker        wdtype=torch.double,
*da0073e9SAndroid Build Coastguard Worker        dtype=torch.long,
*da0073e9SAndroid Build Coastguard Worker        odtype=torch.long,
*da0073e9SAndroid Build Coastguard Worker        test_backward=True,
*da0073e9SAndroid Build Coastguard Worker    ):
*da0073e9SAndroid Build Coastguard Worker        # check a known test example
*da0073e9SAndroid Build Coastguard Worker        es = nn.EmbeddingBag(5, 2, mode=mode, sparse=sparse).to(device, wdtype)
*da0073e9SAndroid Build Coastguard Worker        es.weight.data.copy_(
*da0073e9SAndroid Build Coastguard Worker            torch.arange(1, 11, device=device).view_as(es.weight).to(wdtype)
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        input = torch.tensor([3, 1, 1, 1, 4, 0], device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker        offsets = torch.tensor([0, 0, 3, 3, 6], device=device, dtype=odtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        grad_output = torch.tensor([1, 2, 3, 4], device=device, dtype=wdtype).view(2, 2)
*da0073e9SAndroid Build Coastguard Worker        grad_output_with_empty = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker            [99, 99, 1, 2, 99, 99, 3, 4, 99, 99], device=device, dtype=wdtype
*da0073e9SAndroid Build Coastguard Worker        ).view(5, 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if mode == "sum" or mode == "mean":
*da0073e9SAndroid Build Coastguard Worker            denominator = 1 if mode == "sum" else 3
*da0073e9SAndroid Build Coastguard Worker            expected_output = (
*da0073e9SAndroid Build Coastguard Worker                torch.tensor([[13, 16], [13, 16]], device=device, dtype=wdtype)
*da0073e9SAndroid Build Coastguard Worker                / denominator
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            expected_output_with_empty = (
*da0073e9SAndroid Build Coastguard Worker                torch.tensor(
*da0073e9SAndroid Build Coastguard Worker                    [[0, 0], [13, 16], [0, 0], [13, 16], [0, 0]],
*da0073e9SAndroid Build Coastguard Worker                    device=device,
*da0073e9SAndroid Build Coastguard Worker                    dtype=wdtype,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                / denominator
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            expected_grad_weight = (
*da0073e9SAndroid Build Coastguard Worker                torch.tensor(
*da0073e9SAndroid Build Coastguard Worker                    [[3, 4], [5, 8], [0, 0], [1, 2], [3, 4]],
*da0073e9SAndroid Build Coastguard Worker                    device=device,
*da0073e9SAndroid Build Coastguard Worker                    dtype=wdtype,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                / denominator
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        elif mode == "max":
*da0073e9SAndroid Build Coastguard Worker            expected_output = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker                [[7, 8], [9, 10]], device=device, dtype=wdtype
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            expected_output_with_empty = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker                [[0, 0], [7, 8], [0, 0], [9, 10], [0, 0]], device=device, dtype=wdtype
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            expected_grad_weight = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker                [[0, 0], [0, 0], [0, 0], [1, 2], [3, 4]], device=device, dtype=wdtype
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        output = es(input, offsets)
*da0073e9SAndroid Build Coastguard Worker        output.backward(grad_output_with_empty)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        es_weight_grad = es.weight.grad
*da0073e9SAndroid Build Coastguard Worker        if sparse:
*da0073e9SAndroid Build Coastguard Worker            es_weight_grad = es.weight.grad.to_dense()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(output, expected_output_with_empty)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            es_weight_grad,
*da0073e9SAndroid Build Coastguard Worker            expected_grad_weight,
*da0073e9SAndroid Build Coastguard Worker            atol=dtype2prec_DONTUSE[wdtype],
*da0073e9SAndroid Build Coastguard Worker            rtol=0,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # check same example except as 2D (2 x 3)
*da0073e9SAndroid Build Coastguard Worker        input = input.view(2, -1)
*da0073e9SAndroid Build Coastguard Worker        es.zero_grad()
*da0073e9SAndroid Build Coastguard Worker        output = es(input)
*da0073e9SAndroid Build Coastguard Worker        output.backward(grad_output)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        es_weight_grad = es.weight.grad
*da0073e9SAndroid Build Coastguard Worker        if sparse:
*da0073e9SAndroid Build Coastguard Worker            es_weight_grad = es.weight.grad.to_dense()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(output, expected_output)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            es_weight_grad,
*da0073e9SAndroid Build Coastguard Worker            expected_grad_weight,
*da0073e9SAndroid Build Coastguard Worker            atol=dtype2prec_DONTUSE[wdtype],
*da0073e9SAndroid Build Coastguard Worker            rtol=0,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # test all empty bags
*da0073e9SAndroid Build Coastguard Worker        es.zero_grad()
*da0073e9SAndroid Build Coastguard Worker        inputs = torch.tensor([], dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        offsets = torch.tensor([0, 0, 0, 0], dtype=odtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        es(inputs, offsets).sum().backward()
*da0073e9SAndroid Build Coastguard Worker        dense_grad = es.weight.grad
*da0073e9SAndroid Build Coastguard Worker        if dense_grad.is_sparse:
*da0073e9SAndroid Build Coastguard Worker            dense_grad = dense_grad.to_dense()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(dense_grad, torch.zeros_like(es.weight))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # now compare EmbeddingBag vs Embedding + Sum/Mean, for constant bag length
*da0073e9SAndroid Build Coastguard Worker        N, D, B, L = (
*da0073e9SAndroid Build Coastguard Worker            random.randint(1, 100),
*da0073e9SAndroid Build Coastguard Worker            random.randint(1, 100),
*da0073e9SAndroid Build Coastguard Worker            random.randint(1, 50),
*da0073e9SAndroid Build Coastguard Worker            random.randint(1, 50),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        kwargs = dict(
*da0073e9SAndroid Build Coastguard Worker            mode=mode,
*da0073e9SAndroid Build Coastguard Worker            sparse=sparse,
*da0073e9SAndroid Build Coastguard Worker            device=device,
*da0073e9SAndroid Build Coastguard Worker            wdtype=wdtype,
*da0073e9SAndroid Build Coastguard Worker            dtype=dtype,
*da0073e9SAndroid Build Coastguard Worker            test_backward=test_backward,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self._test_EmbeddingBag_vs_Embedding(N, D, B, L, **kwargs)
*da0073e9SAndroid Build Coastguard Worker        for max_norm in (None, 3):
*da0073e9SAndroid Build Coastguard Worker            for p in itertools.product([1, 2], repeat=4):
*da0073e9SAndroid Build Coastguard Worker                self._test_EmbeddingBag_vs_Embedding(*p, max_norm=max_norm, **kwargs)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # check that giving illegal input combos raises error
*da0073e9SAndroid Build Coastguard Worker        es = nn.EmbeddingBag(10, 20, mode=mode, sparse=sparse)
*da0073e9SAndroid Build Coastguard Worker        input = torch.ones(3, 4, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker        offset = torch.arange(0, 3, dtype=odtype)
*da0073e9SAndroid Build Coastguard Worker        torch._dynamo.disable(self.assertRaises)(ValueError, lambda: es(input, offset))
*da0073e9SAndroid Build Coastguard Worker        torch._dynamo.disable(self.assertRaises)(ValueError, lambda: es(input.view(-1)))
*da0073e9SAndroid Build Coastguard Worker        offset[0] = 1
*da0073e9SAndroid Build Coastguard Worker        if self.device_type == "cpu":
*da0073e9SAndroid Build Coastguard Worker            torch._dynamo.disable(self.assertRaises)(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError, lambda: es(input.view(-1), offset)
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            offset[0] = 0
*da0073e9SAndroid Build Coastguard Worker            offset[-1] = 100
*da0073e9SAndroid Build Coastguard Worker            torch._dynamo.disable(self.assertRaises)(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError, lambda: es(input.view(-1), offset)
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipMeta
*da0073e9SAndroid Build Coastguard Worker    @dtypes(
*da0073e9SAndroid Build Coastguard Worker        *itertools.product(
*da0073e9SAndroid Build Coastguard Worker            (torch.int, torch.long),
*da0073e9SAndroid Build Coastguard Worker            (torch.int, torch.long),
*da0073e9SAndroid Build Coastguard Worker            (torch.float, torch.double, torch.half, torch.bfloat16),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfCUDA(
*da0073e9SAndroid Build Coastguard Worker        *itertools.product(
*da0073e9SAndroid Build Coastguard Worker            (torch.int, torch.long),
*da0073e9SAndroid Build Coastguard Worker            (torch.int, torch.long),
*da0073e9SAndroid Build Coastguard Worker            (torch.float, torch.double, torch.half),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_bag_device(self, device, dtypes):
*da0073e9SAndroid Build Coastguard Worker        if IS_JETSON and torch.bfloat16 in dtypes and device == "cpu":
*da0073e9SAndroid Build Coastguard Worker            self.skipTest("bfloat16 not supported with Jetson cpu")
*da0073e9SAndroid Build Coastguard Worker        with set_default_dtype(torch.double):
*da0073e9SAndroid Build Coastguard Worker            self._test_EmbeddingBag(
*da0073e9SAndroid Build Coastguard Worker                device,
*da0073e9SAndroid Build Coastguard Worker                "sum",
*da0073e9SAndroid Build Coastguard Worker                False,
*da0073e9SAndroid Build Coastguard Worker                wdtype=dtypes[2],
*da0073e9SAndroid Build Coastguard Worker                dtype=dtypes[0],
*da0073e9SAndroid Build Coastguard Worker                odtype=dtypes[1],
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            self._test_EmbeddingBag(
*da0073e9SAndroid Build Coastguard Worker                device,
*da0073e9SAndroid Build Coastguard Worker                "mean",
*da0073e9SAndroid Build Coastguard Worker                False,
*da0073e9SAndroid Build Coastguard Worker                wdtype=dtypes[2],
*da0073e9SAndroid Build Coastguard Worker                dtype=dtypes[0],
*da0073e9SAndroid Build Coastguard Worker                odtype=dtypes[1],
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            self._test_EmbeddingBag(
*da0073e9SAndroid Build Coastguard Worker                device,
*da0073e9SAndroid Build Coastguard Worker                "max",
*da0073e9SAndroid Build Coastguard Worker                False,
*da0073e9SAndroid Build Coastguard Worker                wdtype=dtypes[2],
*da0073e9SAndroid Build Coastguard Worker                dtype=dtypes[0],
*da0073e9SAndroid Build Coastguard Worker                odtype=dtypes[1],
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            test_backward = False
*da0073e9SAndroid Build Coastguard Worker            if self.device_type == "cuda":
*da0073e9SAndroid Build Coastguard Worker                # see 'todo' in test_embedding_bag.
*da0073e9SAndroid Build Coastguard Worker                test_backward = dtypes[2] is not torch.float16
*da0073e9SAndroid Build Coastguard Worker            elif self.device_type == "cpu":
*da0073e9SAndroid Build Coastguard Worker                # TODO: figure out why precision on sparse embeddings isn't the
*da0073e9SAndroid Build Coastguard Worker                # same as for dense.
*da0073e9SAndroid Build Coastguard Worker                test_backward = (
*da0073e9SAndroid Build Coastguard Worker                    dtypes[2] is not torch.float and dtypes[2] is not torch.float16
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self._test_EmbeddingBag(
*da0073e9SAndroid Build Coastguard Worker                device,
*da0073e9SAndroid Build Coastguard Worker                "sum",
*da0073e9SAndroid Build Coastguard Worker                True,
*da0073e9SAndroid Build Coastguard Worker                wdtype=dtypes[2],
*da0073e9SAndroid Build Coastguard Worker                dtype=dtypes[0],
*da0073e9SAndroid Build Coastguard Worker                odtype=dtypes[1],
*da0073e9SAndroid Build Coastguard Worker                test_backward=test_backward,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            self._test_EmbeddingBag(
*da0073e9SAndroid Build Coastguard Worker                device,
*da0073e9SAndroid Build Coastguard Worker                "mean",
*da0073e9SAndroid Build Coastguard Worker                True,
*da0073e9SAndroid Build Coastguard Worker                wdtype=dtypes[2],
*da0073e9SAndroid Build Coastguard Worker                dtype=dtypes[0],
*da0073e9SAndroid Build Coastguard Worker                odtype=dtypes[1],
*da0073e9SAndroid Build Coastguard Worker                test_backward=test_backward,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipMeta
*da0073e9SAndroid Build Coastguard Worker    @dtypes(
*da0073e9SAndroid Build Coastguard Worker        *itertools.product(
*da0073e9SAndroid Build Coastguard Worker            (torch.int, torch.long),
*da0073e9SAndroid Build Coastguard Worker            (torch.int, torch.long),
*da0073e9SAndroid Build Coastguard Worker            (torch.float, torch.double, torch.half, torch.bfloat16),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfCUDA(
*da0073e9SAndroid Build Coastguard Worker        *itertools.product(
*da0073e9SAndroid Build Coastguard Worker            (torch.int, torch.long),
*da0073e9SAndroid Build Coastguard Worker            (torch.int, torch.long),
*da0073e9SAndroid Build Coastguard Worker            (torch.float, torch.double, torch.half),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_bag_non_contiguous_weight(self, device, dtypes):
*da0073e9SAndroid Build Coastguard Worker        weight_tensor = torch.randn(3, 4, dtype=dtypes[2], device=device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        weight_tensor_non_contig = weight_tensor[
*da0073e9SAndroid Build Coastguard Worker            :, :3
*da0073e9SAndroid Build Coastguard Worker        ]  # This is non-contiguous strided.
*da0073e9SAndroid Build Coastguard Worker        weight_tensor_contig = (
*da0073e9SAndroid Build Coastguard Worker            weight_tensor_non_contig.clone().contiguous()
*da0073e9SAndroid Build Coastguard Worker        )  # Contig-strided.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        index = torch.tensor([0, 1, 2], dtype=dtypes[0], device=device)
*da0073e9SAndroid Build Coastguard Worker        offsets = torch.tensor([0, 2], dtype=dtypes[1], device=device)
*da0073e9SAndroid Build Coastguard Worker        for mode in ["sum", "mean", "max"]:
*da0073e9SAndroid Build Coastguard Worker            output_non_contig = F.embedding_bag(
*da0073e9SAndroid Build Coastguard Worker                input=index,
*da0073e9SAndroid Build Coastguard Worker                weight=weight_tensor_non_contig,
*da0073e9SAndroid Build Coastguard Worker                offsets=offsets,
*da0073e9SAndroid Build Coastguard Worker                mode=mode,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            output_contig = F.embedding_bag(
*da0073e9SAndroid Build Coastguard Worker                input=index,
*da0073e9SAndroid Build Coastguard Worker                weight=weight_tensor_contig,
*da0073e9SAndroid Build Coastguard Worker                offsets=offsets,
*da0073e9SAndroid Build Coastguard Worker                mode=mode,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(output_non_contig, output_contig)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyNativeDeviceTypes  # currently fails on XLA
*da0073e9SAndroid Build Coastguard Worker    @dtypes(*itertools.product((torch.int, torch.long), (torch.int, torch.long)))
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_bag_bfloat16(self, device, dtypes):
*da0073e9SAndroid Build Coastguard Worker        with set_default_dtype(torch.double):
*da0073e9SAndroid Build Coastguard Worker            self._test_EmbeddingBag(
*da0073e9SAndroid Build Coastguard Worker                device,
*da0073e9SAndroid Build Coastguard Worker                "sum",
*da0073e9SAndroid Build Coastguard Worker                True,
*da0073e9SAndroid Build Coastguard Worker                wdtype=torch.bfloat16,
*da0073e9SAndroid Build Coastguard Worker                dtype=dtypes[0],
*da0073e9SAndroid Build Coastguard Worker                odtype=dtypes[1],
*da0073e9SAndroid Build Coastguard Worker                test_backward=True,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            self._test_EmbeddingBag(
*da0073e9SAndroid Build Coastguard Worker                device,
*da0073e9SAndroid Build Coastguard Worker                "mean",
*da0073e9SAndroid Build Coastguard Worker                True,
*da0073e9SAndroid Build Coastguard Worker                wdtype=torch.bfloat16,
*da0073e9SAndroid Build Coastguard Worker                dtype=dtypes[0],
*da0073e9SAndroid Build Coastguard Worker                odtype=dtypes[1],
*da0073e9SAndroid Build Coastguard Worker                test_backward=True,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyNativeDeviceTypes  # currently fails on XLA
*da0073e9SAndroid Build Coastguard Worker    @dtypes(*itertools.product((torch.int, torch.long), (torch.int, torch.long)))
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_bag_half(self, device, dtypes):
*da0073e9SAndroid Build Coastguard Worker        self._test_EmbeddingBag(
*da0073e9SAndroid Build Coastguard Worker            device,
*da0073e9SAndroid Build Coastguard Worker            "sum",
*da0073e9SAndroid Build Coastguard Worker            True,
*da0073e9SAndroid Build Coastguard Worker            wdtype=torch.float16,
*da0073e9SAndroid Build Coastguard Worker            dtype=dtypes[0],
*da0073e9SAndroid Build Coastguard Worker            odtype=dtypes[1],
*da0073e9SAndroid Build Coastguard Worker            test_backward=True,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerinstantiate_device_type_tests(TestEmbeddingNNDeviceType, globals())
*da0073e9SAndroid Build Coastguard Workerinstantiate_parametrized_tests(TestEmbeddingNN)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerif __name__ == "__main__":
*da0073e9SAndroid Build Coastguard Worker    run_tests()