benchmarks/dynamo/training_loss.py

*da0073e9SAndroid Build Coastguard Workerimport argparse
*da0073e9SAndroid Build Coastguard Workerimport inspect
*da0073e9SAndroid Build Coastguard Workerimport os
*da0073e9SAndroid Build Coastguard Workerimport sys
*da0073e9SAndroid Build Coastguard Workerimport time
*da0073e9SAndroid Build Coastguard Workerfrom datetime import timedelta
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerfrom datasets import load_dataset, load_metric
*da0073e9SAndroid Build Coastguard Workerfrom transformers import AutoModelForSequenceClassification, AutoTokenizer
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerimport torch
*da0073e9SAndroid Build Coastguard Workerimport torch._dynamo
*da0073e9SAndroid Build Coastguard Workerfrom torch.utils.data import DataLoader
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workertorch.backends.cuda.matmul.allow_tf32 = True
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker# You will download around 84G dataset if you run this end to end training/evaluation example.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workeros.environ["TOKENIZERS_PARALLELISM"] = "false"
*da0073e9SAndroid Build Coastguard Workerdevice = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef data_processing(num_samples, batch_size):
*da0073e9SAndroid Build Coastguard Worker    dataset = load_dataset("yelp_review_full")
*da0073e9SAndroid Build Coastguard Worker    tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def tokenize_function(examples):
*da0073e9SAndroid Build Coastguard Worker        return tokenizer(examples["text"], padding="max_length", truncation=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    tokenized_datasets = dataset.map(tokenize_function, batched=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    tokenized_datasets = tokenized_datasets.remove_columns(["text"])
*da0073e9SAndroid Build Coastguard Worker    tokenized_datasets = tokenized_datasets.rename_column("label", "labels")
*da0073e9SAndroid Build Coastguard Worker    tokenized_datasets.set_format("torch")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    small_train_dataset = tokenized_datasets["train"].select(range(num_samples))
*da0073e9SAndroid Build Coastguard Worker    small_eval_dataset = tokenized_datasets["test"].select(range(num_samples))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    train_dataloader = DataLoader(small_train_dataset, batch_size=batch_size)
*da0073e9SAndroid Build Coastguard Worker    eval_dataloader = DataLoader(small_eval_dataset, batch_size=batch_size)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    return train_dataloader, eval_dataloader
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef training_iter_fn(batch, model, optimizer):
*da0073e9SAndroid Build Coastguard Worker    outputs = model(**batch)
*da0073e9SAndroid Build Coastguard Worker    loss = outputs.loss
*da0073e9SAndroid Build Coastguard Worker    loss.backward()
*da0073e9SAndroid Build Coastguard Worker    optimizer.step()
*da0073e9SAndroid Build Coastguard Worker    optimizer.zero_grad()
*da0073e9SAndroid Build Coastguard Worker    return loss
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef model_training_evaluation(
*da0073e9SAndroid Build Coastguard Worker    backend, train_dataloader, eval_dataloader, model, optimizer, num_epochs, evaluation
*da0073e9SAndroid Build Coastguard Worker):
*da0073e9SAndroid Build Coastguard Worker    model.to(device)
*da0073e9SAndroid Build Coastguard Worker    model.train()
*da0073e9SAndroid Build Coastguard Worker    loss_history = []
*da0073e9SAndroid Build Coastguard Worker    if not backend:
*da0073e9SAndroid Build Coastguard Worker        # Run with native Pytorch
*da0073e9SAndroid Build Coastguard Worker        opt_training_iter_fn = training_iter_fn
*da0073e9SAndroid Build Coastguard Worker    else:
*da0073e9SAndroid Build Coastguard Worker        # Support backends: eager, aot_eager, aot_nvfuser and inductor
*da0073e9SAndroid Build Coastguard Worker        opt_training_iter_fn = torch._dynamo.optimize(backend)(training_iter_fn)
*da0073e9SAndroid Build Coastguard Worker    for epoch in range(num_epochs):
*da0073e9SAndroid Build Coastguard Worker        running_loss = 0.0
*da0073e9SAndroid Build Coastguard Worker        for i, batch in enumerate(train_dataloader, 0):
*da0073e9SAndroid Build Coastguard Worker            batch = {k: v.to(device) for k, v in batch.items()}
*da0073e9SAndroid Build Coastguard Worker            loss = opt_training_iter_fn(batch, model, optimizer)
*da0073e9SAndroid Build Coastguard Worker            running_loss += loss.item()
*da0073e9SAndroid Build Coastguard Worker            if i % 100 == 99:
*da0073e9SAndroid Build Coastguard Worker                loss_history.append(running_loss / 100)
*da0073e9SAndroid Build Coastguard Worker                running_loss = 0.0
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    if evaluation:
*da0073e9SAndroid Build Coastguard Worker        metric = load_metric("accuracy")
*da0073e9SAndroid Build Coastguard Worker        model.eval()
*da0073e9SAndroid Build Coastguard Worker        if not backend:
*da0073e9SAndroid Build Coastguard Worker            opt_model = model
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            opt_model = torch._dynamo.optimize(backend)(model)
*da0073e9SAndroid Build Coastguard Worker        for batch in eval_dataloader:
*da0073e9SAndroid Build Coastguard Worker            batch = {k: v.to(device) for k, v in batch.items()}
*da0073e9SAndroid Build Coastguard Worker            with torch.no_grad():
*da0073e9SAndroid Build Coastguard Worker                outputs = opt_model(**batch)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            logits = outputs.logits
*da0073e9SAndroid Build Coastguard Worker            predictions = torch.argmax(logits, dim=-1)
*da0073e9SAndroid Build Coastguard Worker            metric.add_batch(predictions=predictions, references=batch["labels"])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        return loss_history, metric.compute()
*da0073e9SAndroid Build Coastguard Worker    else:
*da0073e9SAndroid Build Coastguard Worker        return loss_history, None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef check_loss(ref_loss, res_loss):
*da0073e9SAndroid Build Coastguard Worker    assert len(ref_loss) == len(res_loss)
*da0073e9SAndroid Build Coastguard Worker    length = len(ref_loss)
*da0073e9SAndroid Build Coastguard Worker    x = min(length, 10)
*da0073e9SAndroid Build Coastguard Worker    return sum(res_loss[-x:]) / 10 <= sum(ref_loss[-x:]) / 10 + 0.1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef parse_args():
*da0073e9SAndroid Build Coastguard Worker    parser = argparse.ArgumentParser(
*da0073e9SAndroid Build Coastguard Worker        description="TorchDynamo end to end training/evaluation benchmark"
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    parser.add_argument(
*da0073e9SAndroid Build Coastguard Worker        "--epochs", type=int, default=10, help="number of epochs to train (default: 10)"
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    parser.add_argument(
*da0073e9SAndroid Build Coastguard Worker        "--num-samples",
*da0073e9SAndroid Build Coastguard Worker        type=int,
*da0073e9SAndroid Build Coastguard Worker        default=1000,
*da0073e9SAndroid Build Coastguard Worker        help="number of samples to train/eval (default: 1000)",
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    parser.add_argument(
*da0073e9SAndroid Build Coastguard Worker        "--batch-size",
*da0073e9SAndroid Build Coastguard Worker        type=int,
*da0073e9SAndroid Build Coastguard Worker        default=8,
*da0073e9SAndroid Build Coastguard Worker        help="input batch size for training (default: 8)",
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    parser.add_argument(
*da0073e9SAndroid Build Coastguard Worker        "--lr", type=float, default=5e-5, help="learning rate (default: 5e-5)"
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    parser.add_argument(
*da0073e9SAndroid Build Coastguard Worker        "--backend",
*da0073e9SAndroid Build Coastguard Worker        choices=torch._dynamo.list_backends(exclude_tags=None),
*da0073e9SAndroid Build Coastguard Worker        default="inductor",
*da0073e9SAndroid Build Coastguard Worker        help="train/evaluate model with a given backend (default: inductor)",
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    parser.add_argument(
*da0073e9SAndroid Build Coastguard Worker        "--optimizer",
*da0073e9SAndroid Build Coastguard Worker        default="Adam",
*da0073e9SAndroid Build Coastguard Worker        help="train model using a given optimizer (default: Adam)",
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    parser.add_argument(
*da0073e9SAndroid Build Coastguard Worker        "--evaluation",
*da0073e9SAndroid Build Coastguard Worker        action="store_true",
*da0073e9SAndroid Build Coastguard Worker        help="running evaluation after model training",
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    args = parser.parse_args()
*da0073e9SAndroid Build Coastguard Worker    return args
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef main():
*da0073e9SAndroid Build Coastguard Worker    args = parse_args()
*da0073e9SAndroid Build Coastguard Worker    train_dataloader, eval_dataloader = data_processing(
*da0073e9SAndroid Build Coastguard Worker        args.num_samples, args.batch_size
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    model = AutoModelForSequenceClassification.from_pretrained(
*da0073e9SAndroid Build Coastguard Worker        "bert-base-cased", num_labels=5
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    optimizer_cls = getattr(sys.modules["torch.optim"], args.optimizer)
*da0073e9SAndroid Build Coastguard Worker    if "capturable" in inspect.signature(optimizer_cls).parameters.keys():
*da0073e9SAndroid Build Coastguard Worker        optimizer = optimizer_cls(model.parameters(), lr=args.lr, capturable=True)
*da0073e9SAndroid Build Coastguard Worker    else:
*da0073e9SAndroid Build Coastguard Worker        optimizer = optimizer_cls(model.parameters(), lr=args.lr)
*da0073e9SAndroid Build Coastguard Worker    native_start = time.time()
*da0073e9SAndroid Build Coastguard Worker    ref_loss, accuracy = model_training_evaluation(
*da0073e9SAndroid Build Coastguard Worker        None,
*da0073e9SAndroid Build Coastguard Worker        train_dataloader,
*da0073e9SAndroid Build Coastguard Worker        eval_dataloader,
*da0073e9SAndroid Build Coastguard Worker        model,
*da0073e9SAndroid Build Coastguard Worker        optimizer,
*da0073e9SAndroid Build Coastguard Worker        args.epochs,
*da0073e9SAndroid Build Coastguard Worker        args.evaluation,
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    native_end = time.time()
*da0073e9SAndroid Build Coastguard Worker    res_loss, accuracy = model_training_evaluation(
*da0073e9SAndroid Build Coastguard Worker        args.backend,
*da0073e9SAndroid Build Coastguard Worker        train_dataloader,
*da0073e9SAndroid Build Coastguard Worker        eval_dataloader,
*da0073e9SAndroid Build Coastguard Worker        model,
*da0073e9SAndroid Build Coastguard Worker        optimizer,
*da0073e9SAndroid Build Coastguard Worker        args.epochs,
*da0073e9SAndroid Build Coastguard Worker        args.evaluation,
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    dynamo_end = time.time()
*da0073e9SAndroid Build Coastguard Worker    if check_loss(ref_loss, res_loss):
*da0073e9SAndroid Build Coastguard Worker        print(
*da0073e9SAndroid Build Coastguard Worker            "[PASSED] TorchDynamo end to end training loss is less than or equal to native PyTorch"
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker    else:
*da0073e9SAndroid Build Coastguard Worker        print(
*da0073e9SAndroid Build Coastguard Worker            "[FAILED] TorchDynamo end to end training loss is greater than native Pytorch"
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker    if args.evaluation:
*da0073e9SAndroid Build Coastguard Worker        print(f"Model accuracy: {accuracy}")
*da0073e9SAndroid Build Coastguard Worker    native_elapsed = native_end - native_start
*da0073e9SAndroid Build Coastguard Worker    dynamo_elapsed = dynamo_end - native_end
*da0073e9SAndroid Build Coastguard Worker    print(
*da0073e9SAndroid Build Coastguard Worker        f"Train model on {args.epochs} epochs with backend {args.backend} and optimizer {args.optimizer}:"
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    print(f"PyTorch spent {timedelta(seconds=native_elapsed/args.epochs)} per epoch")
*da0073e9SAndroid Build Coastguard Worker    print(
*da0073e9SAndroid Build Coastguard Worker        f"TorchDynamo spent {timedelta(seconds=dynamo_elapsed/args.epochs)} per epoch"
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerif __name__ == "__main__":
*da0073e9SAndroid Build Coastguard Worker    main()