toolchain-utils/crosperf/results_cache.py

*760c253cSXin Li# -*- coding: utf-8 -*-
*760c253cSXin Li# Copyright 2013 The ChromiumOS Authors
*760c253cSXin Li# Use of this source code is governed by a BSD-style license that can be
*760c253cSXin Li# found in the LICENSE file.
*760c253cSXin Li
*760c253cSXin Li"""Module to deal with result cache."""
*760c253cSXin Li
*760c253cSXin Li
*760c253cSXin Liimport collections
*760c253cSXin Liimport glob
*760c253cSXin Liimport hashlib
*760c253cSXin Liimport heapq
*760c253cSXin Liimport json
*760c253cSXin Liimport os
*760c253cSXin Liimport pickle
*760c253cSXin Liimport re
*760c253cSXin Liimport tempfile
*760c253cSXin Li
*760c253cSXin Lifrom cros_utils import command_executer
*760c253cSXin Lifrom cros_utils import misc
*760c253cSXin Lifrom image_checksummer import ImageChecksummer
*760c253cSXin Liimport results_report
*760c253cSXin Liimport test_flag
*760c253cSXin Li
*760c253cSXin Li
*760c253cSXin LiSCRATCH_DIR = os.path.expanduser("~/cros_scratch")
*760c253cSXin LiRESULTS_FILE = "results.pickle"
*760c253cSXin LiMACHINE_FILE = "machine.txt"
*760c253cSXin LiAUTOTEST_TARBALL = "autotest.tbz2"
*760c253cSXin LiRESULTS_TARBALL = "results.tbz2"
*760c253cSXin LiPERF_RESULTS_FILE = "perf-results.txt"
*760c253cSXin LiCACHE_KEYS_FILE = "cache_keys.txt"
*760c253cSXin Li
*760c253cSXin Li
*760c253cSXin Liclass PidVerificationError(Exception):
*760c253cSXin Li    """Error of perf PID verification in per-process mode."""
*760c253cSXin Li
*760c253cSXin Li
*760c253cSXin Liclass PerfDataReadError(Exception):
*760c253cSXin Li    """Error of reading a perf.data header."""
*760c253cSXin Li
*760c253cSXin Li
*760c253cSXin Liclass Result(object):
*760c253cSXin Li    """Class for holding the results of a single test run.
*760c253cSXin Li
*760c253cSXin Li    This class manages what exactly is stored inside the cache without knowing
*760c253cSXin Li    what the key of the cache is. For runs with perf, it stores perf.data,
*760c253cSXin Li    perf.report, etc. The key generation is handled by the ResultsCache class.
*760c253cSXin Li    """
*760c253cSXin Li
*760c253cSXin Li    def __init__(self, logger, label, log_level, machine, cmd_exec=None):
*760c253cSXin Li        self.chromeos_root = label.chromeos_root
*760c253cSXin Li        self._logger = logger
*760c253cSXin Li        self.ce = cmd_exec or command_executer.GetCommandExecuter(
*760c253cSXin Li            self._logger, log_level=log_level
*760c253cSXin Li        )
*760c253cSXin Li        self.temp_dir = None
*760c253cSXin Li        self.label = label
*760c253cSXin Li        self.results_dir = None
*760c253cSXin Li        self.log_level = log_level
*760c253cSXin Li        self.machine = machine
*760c253cSXin Li        self.perf_data_files = []
*760c253cSXin Li        self.perf_report_files = []
*760c253cSXin Li        self.results_file = []
*760c253cSXin Li        self.turbostat_log_file = ""
*760c253cSXin Li        self.cpustats_log_file = ""
*760c253cSXin Li        self.cpuinfo_file = ""
*760c253cSXin Li        self.top_log_file = ""
*760c253cSXin Li        self.wait_time_log_file = ""
*760c253cSXin Li        self.chrome_version = ""
*760c253cSXin Li        self.err = None
*760c253cSXin Li        self.chroot_results_dir = ""
*760c253cSXin Li        self.test_name = ""
*760c253cSXin Li        self.keyvals = None
*760c253cSXin Li        self.board = None
*760c253cSXin Li        self.suite = None
*760c253cSXin Li        self.cwp_dso = ""
*760c253cSXin Li        self.retval = None
*760c253cSXin Li        self.out = None
*760c253cSXin Li        self.top_cmds = []
*760c253cSXin Li
*760c253cSXin Li    def GetTopCmds(self):
*760c253cSXin Li        """Get the list of top commands consuming CPU on the machine."""
*760c253cSXin Li        return self.top_cmds
*760c253cSXin Li
*760c253cSXin Li    def FormatStringTopCommands(self):
*760c253cSXin Li        """Get formatted string of top commands.
*760c253cSXin Li
*760c253cSXin Li        Get the formatted string with top commands consuming CPU on DUT machine.
*760c253cSXin Li        Number of "non-chrome" processes in the list is limited to 5.
*760c253cSXin Li        """
*760c253cSXin Li        format_list = [
*760c253cSXin Li            "Top commands with highest CPU usage:",
*760c253cSXin Li            # Header.
*760c253cSXin Li            "%20s %9s %6s   %s" % ("COMMAND", "AVG CPU%", "COUNT", "HIGHEST 5"),
*760c253cSXin Li            "-" * 50,
*760c253cSXin Li        ]
*760c253cSXin Li        if self.top_cmds:
*760c253cSXin Li            # After switching to top processes we have to expand the list since there
*760c253cSXin Li            # will be a lot of 'chrome' processes (up to 10, sometimes more) in the
*760c253cSXin Li            # top.
*760c253cSXin Li            # Let's limit the list size by the number of non-chrome processes.
*760c253cSXin Li            limit_of_non_chrome_procs = 5
*760c253cSXin Li            num_of_non_chrome_procs = 0
*760c253cSXin Li            for topcmd in self.top_cmds:
*760c253cSXin Li                print_line = "%20s %9.2f %6s   %s" % (
*760c253cSXin Li                    topcmd["cmd"],
*760c253cSXin Li                    topcmd["cpu_use_avg"],
*760c253cSXin Li                    topcmd["count"],
*760c253cSXin Li                    topcmd["top5_cpu_use"],
*760c253cSXin Li                )
*760c253cSXin Li                format_list.append(print_line)
*760c253cSXin Li                if not topcmd["cmd"].startswith("chrome"):
*760c253cSXin Li                    num_of_non_chrome_procs += 1
*760c253cSXin Li                    if num_of_non_chrome_procs >= limit_of_non_chrome_procs:
*760c253cSXin Li                        break
*760c253cSXin Li        else:
*760c253cSXin Li            format_list.append("[NO DATA FROM THE TOP LOG]")
*760c253cSXin Li        format_list.append("-" * 50)
*760c253cSXin Li        return "\n".join(format_list)
*760c253cSXin Li
*760c253cSXin Li    def CopyFilesTo(self, dest_dir, files_to_copy):
*760c253cSXin Li        file_index = 0
*760c253cSXin Li        for file_to_copy in files_to_copy:
*760c253cSXin Li            if not os.path.isdir(dest_dir):
*760c253cSXin Li                command = "mkdir -p %s" % dest_dir
*760c253cSXin Li                self.ce.RunCommand(command)
*760c253cSXin Li            dest_file = os.path.join(
*760c253cSXin Li                dest_dir,
*760c253cSXin Li                ("%s.%s" % (os.path.basename(file_to_copy), file_index)),
*760c253cSXin Li            )
*760c253cSXin Li            ret = self.ce.CopyFiles(file_to_copy, dest_file, recursive=False)
*760c253cSXin Li            if ret:
*760c253cSXin Li                raise IOError("Could not copy results file: %s" % file_to_copy)
*760c253cSXin Li            file_index += 1
*760c253cSXin Li
*760c253cSXin Li    def CopyResultsTo(self, dest_dir):
*760c253cSXin Li        self.CopyFilesTo(dest_dir, self.results_file)
*760c253cSXin Li        self.CopyFilesTo(dest_dir, self.perf_data_files)
*760c253cSXin Li        self.CopyFilesTo(dest_dir, self.perf_report_files)
*760c253cSXin Li        extra_files = []
*760c253cSXin Li        if self.top_log_file:
*760c253cSXin Li            extra_files.append(self.top_log_file)
*760c253cSXin Li        if self.cpuinfo_file:
*760c253cSXin Li            extra_files.append(self.cpuinfo_file)
*760c253cSXin Li        if extra_files:
*760c253cSXin Li            self.CopyFilesTo(dest_dir, extra_files)
*760c253cSXin Li        if self.results_file or self.perf_data_files or self.perf_report_files:
*760c253cSXin Li            self._logger.LogOutput("Results files stored in %s." % dest_dir)
*760c253cSXin Li
*760c253cSXin Li    def CompressResultsTo(self, dest_dir):
*760c253cSXin Li        tarball = os.path.join(self.results_dir, RESULTS_TARBALL)
*760c253cSXin Li        # Test_that runs hold all output under TEST_NAME_HASHTAG/results/,
*760c253cSXin Li        # while tast runs hold output under TEST_NAME/.
*760c253cSXin Li        # Both ensure to be unique.
*760c253cSXin Li        result_dir_name = self.test_name if self.suite == "tast" else "results"
*760c253cSXin Li        results_dir = self.FindFilesInResultsDir(
*760c253cSXin Li            "-name %s" % result_dir_name
*760c253cSXin Li        ).split("\n")[0]
*760c253cSXin Li
*760c253cSXin Li        if not results_dir:
*760c253cSXin Li            self._logger.LogOutput(
*760c253cSXin Li                "WARNING: No results dir matching %r found" % result_dir_name
*760c253cSXin Li            )
*760c253cSXin Li            return
*760c253cSXin Li
*760c253cSXin Li        self.CreateTarball(results_dir, tarball)
*760c253cSXin Li        self.CopyFilesTo(dest_dir, [tarball])
*760c253cSXin Li        if results_dir:
*760c253cSXin Li            self._logger.LogOutput(
*760c253cSXin Li                "Results files compressed into %s." % dest_dir
*760c253cSXin Li            )
*760c253cSXin Li
*760c253cSXin Li    def GetNewKeyvals(self, keyvals_dict):
*760c253cSXin Li        # Initialize 'units' dictionary.
*760c253cSXin Li        units_dict = {}
*760c253cSXin Li        for k in keyvals_dict:
*760c253cSXin Li            units_dict[k] = ""
*760c253cSXin Li        results_files = self.GetDataMeasurementsFiles()
*760c253cSXin Li        for f in results_files:
*760c253cSXin Li            # Make sure we can find the results file
*760c253cSXin Li            if os.path.exists(f):
*760c253cSXin Li                data_filename = f
*760c253cSXin Li            else:
*760c253cSXin Li                # Otherwise get the base filename and create the correct
*760c253cSXin Li                # path for it.
*760c253cSXin Li                _, f_base = misc.GetRoot(f)
*760c253cSXin Li                data_filename = misc.GetOutsideChrootPath(
*760c253cSXin Li                    self.chromeos_root,
*760c253cSXin Li                    os.path.join("/tmp", self.temp_dir, f_base),
*760c253cSXin Li                )
*760c253cSXin Li            if data_filename.find(".json") > 0:
*760c253cSXin Li                raw_dict = dict()
*760c253cSXin Li                if os.path.exists(data_filename):
*760c253cSXin Li                    with open(
*760c253cSXin Li                        data_filename, "r", encoding="utf-8"
*760c253cSXin Li                    ) as data_file:
*760c253cSXin Li                        raw_dict = json.load(data_file)
*760c253cSXin Li
*760c253cSXin Li                if "charts" in raw_dict:
*760c253cSXin Li                    raw_dict = raw_dict["charts"]
*760c253cSXin Li                for k1 in raw_dict:
*760c253cSXin Li                    field_dict = raw_dict[k1]
*760c253cSXin Li                    for k2 in field_dict:
*760c253cSXin Li                        result_dict = field_dict[k2]
*760c253cSXin Li                        key = k1 + "__" + k2
*760c253cSXin Li                        if "value" in result_dict:
*760c253cSXin Li                            keyvals_dict[key] = result_dict["value"]
*760c253cSXin Li                        elif "values" in result_dict:
*760c253cSXin Li                            values = result_dict["values"]
*760c253cSXin Li                            if (
*760c253cSXin Li                                "type" in result_dict
*760c253cSXin Li                                and result_dict["type"]
*760c253cSXin Li                                == "list_of_scalar_values"
*760c253cSXin Li                                and values
*760c253cSXin Li                                and values != "null"
*760c253cSXin Li                            ):
*760c253cSXin Li                                keyvals_dict[key] = sum(values) / float(
*760c253cSXin Li                                    len(values)
*760c253cSXin Li                                )
*760c253cSXin Li                            else:
*760c253cSXin Li                                keyvals_dict[key] = values
*760c253cSXin Li                        units_dict[key] = result_dict["units"]
*760c253cSXin Li            else:
*760c253cSXin Li                if os.path.exists(data_filename):
*760c253cSXin Li                    with open(
*760c253cSXin Li                        data_filename, "r", encoding="utf-8"
*760c253cSXin Li                    ) as data_file:
*760c253cSXin Li                        lines = data_file.readlines()
*760c253cSXin Li                        for line in lines:
*760c253cSXin Li                            tmp_dict = json.loads(line)
*760c253cSXin Li                            graph_name = tmp_dict["graph"]
*760c253cSXin Li                            graph_str = (
*760c253cSXin Li                                (graph_name + "__") if graph_name else ""
*760c253cSXin Li                            )
*760c253cSXin Li                            key = graph_str + tmp_dict["description"]
*760c253cSXin Li                            keyvals_dict[key] = tmp_dict["value"]
*760c253cSXin Li                            units_dict[key] = tmp_dict["units"]
*760c253cSXin Li
*760c253cSXin Li        return keyvals_dict, units_dict
*760c253cSXin Li
*760c253cSXin Li    def AppendTelemetryUnits(self, keyvals_dict, units_dict):
*760c253cSXin Li        """keyvals_dict is the dict of key-value used to generate Crosperf reports.
*760c253cSXin Li
*760c253cSXin Li        units_dict is a dictionary of the units for the return values in
*760c253cSXin Li        keyvals_dict.  We need to associate the units with the return values,
*760c253cSXin Li        for Telemetry tests, so that we can include the units in the reports.
*760c253cSXin Li        This function takes each value in keyvals_dict, finds the corresponding
*760c253cSXin Li        unit in the units_dict, and replaces the old value with a list of the
*760c253cSXin Li        old value and the units.  This later gets properly parsed in the
*760c253cSXin Li        ResultOrganizer class, for generating the reports.
*760c253cSXin Li        """
*760c253cSXin Li
*760c253cSXin Li        results_dict = {}
*760c253cSXin Li        for k in keyvals_dict:
*760c253cSXin Li            # We don't want these lines in our reports; they add no useful data.
*760c253cSXin Li            if not k or k == "telemetry_Crosperf":
*760c253cSXin Li                continue
*760c253cSXin Li            val = keyvals_dict[k]
*760c253cSXin Li            units = units_dict[k]
*760c253cSXin Li            new_val = [val, units]
*760c253cSXin Li            results_dict[k] = new_val
*760c253cSXin Li        return results_dict
*760c253cSXin Li
*760c253cSXin Li    def GetKeyvals(self):
*760c253cSXin Li        results_in_chroot = misc.GetOutsideChrootPath(
*760c253cSXin Li            self.chromeos_root, "/tmp"
*760c253cSXin Li        )
*760c253cSXin Li        if not self.temp_dir:
*760c253cSXin Li            self.temp_dir = tempfile.mkdtemp(dir=results_in_chroot)
*760c253cSXin Li            command = f"cp -r {self.results_dir}/* {self.temp_dir}"
*760c253cSXin Li            self.ce.RunCommand(command, print_to_console=False)
*760c253cSXin Li
*760c253cSXin Li        tmp_dir_in_chroot = misc.GetInsideChrootPath(
*760c253cSXin Li            self.chromeos_root, self.temp_dir
*760c253cSXin Li        )
*760c253cSXin Li        command = "./generate_test_report --no-color --csv %s" % (
*760c253cSXin Li            tmp_dir_in_chroot
*760c253cSXin Li        )
*760c253cSXin Li        _, out, _ = self.ce.ChrootRunCommandWOutput(
*760c253cSXin Li            self.chromeos_root, command, print_to_console=False
*760c253cSXin Li        )
*760c253cSXin Li        keyvals_dict = {}
*760c253cSXin Li        for line in out.splitlines():
*760c253cSXin Li            tokens = re.split("=|,", line)
*760c253cSXin Li            key = tokens[-2]
*760c253cSXin Li            if key.startswith(tmp_dir_in_chroot):
*760c253cSXin Li                key = key[len(tmp_dir_in_chroot) + 1 :]
*760c253cSXin Li            value = tokens[-1]
*760c253cSXin Li            keyvals_dict[key] = value
*760c253cSXin Li
*760c253cSXin Li        # Check to see if there is a perf_measurements file and get the
*760c253cSXin Li        # data from it if so.
*760c253cSXin Li        keyvals_dict, units_dict = self.GetNewKeyvals(keyvals_dict)
*760c253cSXin Li        if self.suite == "telemetry_Crosperf":
*760c253cSXin Li            # For telemtry_Crosperf results, append the units to the return
*760c253cSXin Li            # results, for use in generating the reports.
*760c253cSXin Li            keyvals_dict = self.AppendTelemetryUnits(keyvals_dict, units_dict)
*760c253cSXin Li        return keyvals_dict
*760c253cSXin Li
*760c253cSXin Li    def GetSamples(self):
*760c253cSXin Li        actual_samples = 0
*760c253cSXin Li        for perf_data_file in self.perf_data_files:
*760c253cSXin Li            chroot_perf_data_file = misc.GetInsideChrootPath(
*760c253cSXin Li                self.chromeos_root, perf_data_file
*760c253cSXin Li            )
*760c253cSXin Li            perf_path = misc.GetOutsideChrootPath(
*760c253cSXin Li                self.chromeos_root, "/usr/bin/perf"
*760c253cSXin Li            )
*760c253cSXin Li            perf_file = "/usr/sbin/perf"
*760c253cSXin Li            if os.path.exists(perf_path):
*760c253cSXin Li                perf_file = "/usr/bin/perf"
*760c253cSXin Li
*760c253cSXin Li            # For each perf.data, we want to collect sample count for specific DSO.
*760c253cSXin Li            # We specify exact match for known DSO type, and every sample for `all`.
*760c253cSXin Li            exact_match = ""
*760c253cSXin Li            if self.cwp_dso == "all":
*760c253cSXin Li                exact_match = ""
*760c253cSXin Li            elif self.cwp_dso == "chrome":
*760c253cSXin Li                exact_match = "chrome"
*760c253cSXin Li            elif self.cwp_dso == "kallsyms":
*760c253cSXin Li                exact_match = "[kernel.kallsyms]"
*760c253cSXin Li            else:
*760c253cSXin Li                # This will need to be updated once there are more DSO types supported,
*760c253cSXin Li                # if user want an exact match for the field they want.
*760c253cSXin Li                exact_match = self.cwp_dso
*760c253cSXin Li
*760c253cSXin Li            command = (
*760c253cSXin Li                f"{perf_file} report -n -s dso -i "
*760c253cSXin Li                f"{chroot_perf_data_file} 2> /dev/null"
*760c253cSXin Li            )
*760c253cSXin Li            _, result, _ = self.ce.ChrootRunCommandWOutput(
*760c253cSXin Li                self.chromeos_root, command
*760c253cSXin Li            )
*760c253cSXin Li            # Accumulate the sample count for all matched fields.
*760c253cSXin Li            # Each line looks like this:
*760c253cSXin Li            #     45.42%        237210  chrome
*760c253cSXin Li            # And we want the second number which is the sample count.
*760c253cSXin Li            samples = 0
*760c253cSXin Li            try:
*760c253cSXin Li                for line in result.split("\n"):
*760c253cSXin Li                    attr = line.split()
*760c253cSXin Li                    if len(attr) == 3 and "%" in attr[0]:
*760c253cSXin Li                        if exact_match and exact_match != attr[2]:
*760c253cSXin Li                            continue
*760c253cSXin Li                        samples += int(attr[1])
*760c253cSXin Li            except:
*760c253cSXin Li                raise RuntimeError("Cannot parse perf dso result")
*760c253cSXin Li
*760c253cSXin Li            actual_samples += samples
*760c253cSXin Li
*760c253cSXin Li            # Remove idle cycles from the accumulated sample count.
*760c253cSXin Li            perf_report_file = f"{perf_data_file}.report"
*760c253cSXin Li            if not os.path.exists(perf_report_file):
*760c253cSXin Li                raise RuntimeError(
*760c253cSXin Li                    f"Missing perf report file: {perf_report_file}"
*760c253cSXin Li                )
*760c253cSXin Li
*760c253cSXin Li            idle_functions = {
*760c253cSXin Li                "[kernel.kallsyms]": (
*760c253cSXin Li                    "intel_idle",
*760c253cSXin Li                    "arch_cpu_idle",
*760c253cSXin Li                    "intel_idle",
*760c253cSXin Li                    "cpu_startup_entry",
*760c253cSXin Li                    "default_idle",
*760c253cSXin Li                    "cpu_idle_loop",
*760c253cSXin Li                    "do_idle",
*760c253cSXin Li                    "cpuidle_enter_state",
*760c253cSXin Li                ),
*760c253cSXin Li            }
*760c253cSXin Li            idle_samples = 0
*760c253cSXin Li
*760c253cSXin Li            with open(perf_report_file, encoding="utf-8") as f:
*760c253cSXin Li                try:
*760c253cSXin Li                    for line in f:
*760c253cSXin Li                        line = line.strip()
*760c253cSXin Li                        if not line or line[0] == "#":
*760c253cSXin Li                            continue
*760c253cSXin Li                        # Each line has the following fields,
*760c253cSXin Li                        # pylint: disable=line-too-long
*760c253cSXin Li                        # Overhead       Samples  Command          Shared Object         Symbol
*760c253cSXin Li                        # pylint: disable=line-too-long
*760c253cSXin Li                        # 1.48%          60       swapper          [kernel.kallsyms]     [k] intel_idle
*760c253cSXin Li                        # pylint: disable=line-too-long
*760c253cSXin Li                        # 0.00%          1        shill            libshill-net.so       [.] std::__1::vector<unsigned char, std::__1::allocator<unsigned char> >::vector<unsigned char const*>
*760c253cSXin Li                        _, samples, _, dso, _, function = line.split(None, 5)
*760c253cSXin Li
*760c253cSXin Li                        if (
*760c253cSXin Li                            dso in idle_functions
*760c253cSXin Li                            and function in idle_functions[dso]
*760c253cSXin Li                        ):
*760c253cSXin Li                            if self.log_level != "verbose":
*760c253cSXin Li                                self._logger.LogOutput(
*760c253cSXin Li                                    "Removing %s samples from %s in %s"
*760c253cSXin Li                                    % (samples, function, dso)
*760c253cSXin Li                                )
*760c253cSXin Li                            idle_samples += int(samples)
*760c253cSXin Li                except:
*760c253cSXin Li                    raise RuntimeError("Cannot parse perf report")
*760c253cSXin Li            actual_samples -= idle_samples
*760c253cSXin Li        return [actual_samples, "samples"]
*760c253cSXin Li
*760c253cSXin Li    def GetResultsDir(self):
*760c253cSXin Li        if self.suite == "tast":
*760c253cSXin Li            mo = re.search(r"Writing results to (\S+)", self.out)
*760c253cSXin Li        else:
*760c253cSXin Li            mo = re.search(r"Results placed in (\S+)", self.out)
*760c253cSXin Li        if mo:
*760c253cSXin Li            result = mo.group(1)
*760c253cSXin Li            return result
*760c253cSXin Li        raise RuntimeError("Could not find results directory.")
*760c253cSXin Li
*760c253cSXin Li    def FindFilesInResultsDir(self, find_args):
*760c253cSXin Li        if not self.results_dir:
*760c253cSXin Li            return ""
*760c253cSXin Li
*760c253cSXin Li        command = "find %s %s" % (self.results_dir, find_args)
*760c253cSXin Li        ret, out, _ = self.ce.RunCommandWOutput(command, print_to_console=False)
*760c253cSXin Li        if ret:
*760c253cSXin Li            raise RuntimeError("Could not run find command!")
*760c253cSXin Li        return out
*760c253cSXin Li
*760c253cSXin Li    def GetResultsFile(self):
*760c253cSXin Li        if self.suite == "telemetry_Crosperf":
*760c253cSXin Li            return self.FindFilesInResultsDir(
*760c253cSXin Li                "-name histograms.json"
*760c253cSXin Li            ).splitlines()
*760c253cSXin Li        return self.FindFilesInResultsDir(
*760c253cSXin Li            "-name results-chart.json"
*760c253cSXin Li        ).splitlines()
*760c253cSXin Li
*760c253cSXin Li    def GetPerfDataFiles(self):
*760c253cSXin Li        return self.FindFilesInResultsDir("-name perf.data").splitlines()
*760c253cSXin Li
*760c253cSXin Li    def GetPerfReportFiles(self):
*760c253cSXin Li        return self.FindFilesInResultsDir("-name perf.data.report").splitlines()
*760c253cSXin Li
*760c253cSXin Li    def GetDataMeasurementsFiles(self):
*760c253cSXin Li        result = self.FindFilesInResultsDir(
*760c253cSXin Li            "-name perf_measurements"
*760c253cSXin Li        ).splitlines()
*760c253cSXin Li        if not result:
*760c253cSXin Li            if self.suite == "telemetry_Crosperf":
*760c253cSXin Li                result = self.FindFilesInResultsDir(
*760c253cSXin Li                    "-name histograms.json"
*760c253cSXin Li                ).splitlines()
*760c253cSXin Li            else:
*760c253cSXin Li                result = self.FindFilesInResultsDir(
*760c253cSXin Li                    "-name results-chart.json"
*760c253cSXin Li                ).splitlines()
*760c253cSXin Li        return result
*760c253cSXin Li
*760c253cSXin Li    def GetTurbostatFile(self):
*760c253cSXin Li        """Get turbostat log path string."""
*760c253cSXin Li        return self.FindFilesInResultsDir("-name turbostat.log").split("\n")[0]
*760c253cSXin Li
*760c253cSXin Li    def GetCpustatsFile(self):
*760c253cSXin Li        """Get cpustats log path string."""
*760c253cSXin Li        return self.FindFilesInResultsDir("-name cpustats.log").split("\n")[0]
*760c253cSXin Li
*760c253cSXin Li    def GetCpuinfoFile(self):
*760c253cSXin Li        """Get cpustats log path string."""
*760c253cSXin Li        return self.FindFilesInResultsDir("-name cpuinfo.log").split("\n")[0]
*760c253cSXin Li
*760c253cSXin Li    def GetTopFile(self):
*760c253cSXin Li        """Get cpustats log path string."""
*760c253cSXin Li        return self.FindFilesInResultsDir("-name top.log").split("\n")[0]
*760c253cSXin Li
*760c253cSXin Li    def GetWaitTimeFile(self):
*760c253cSXin Li        """Get wait time log path string."""
*760c253cSXin Li        return self.FindFilesInResultsDir("-name wait_time.log").split("\n")[0]
*760c253cSXin Li
*760c253cSXin Li    def _CheckDebugPath(self, option, path):
*760c253cSXin Li        out_chroot_path = misc.GetOutsideChrootPath(self.chromeos_root, path)
*760c253cSXin Li        if os.path.exists(out_chroot_path):
*760c253cSXin Li            if option == "kallsyms":
*760c253cSXin Li                path = os.path.join(path, "System.map-*")
*760c253cSXin Li            return "--" + option + " " + path
*760c253cSXin Li        else:
*760c253cSXin Li            print(
*760c253cSXin Li                "** WARNING **: --%s option not applied, %s does not exist"
*760c253cSXin Li                % (option, out_chroot_path)
*760c253cSXin Li            )
*760c253cSXin Li            return ""
*760c253cSXin Li
*760c253cSXin Li    def GeneratePerfReportFiles(self):
*760c253cSXin Li        perf_report_files = []
*760c253cSXin Li        for perf_data_file in self.perf_data_files:
*760c253cSXin Li            # Generate a perf.report and store it side-by-side with the perf.data
*760c253cSXin Li            # file.
*760c253cSXin Li            chroot_perf_data_file = misc.GetInsideChrootPath(
*760c253cSXin Li                self.chromeos_root, perf_data_file
*760c253cSXin Li            )
*760c253cSXin Li            perf_report_file = "%s.report" % perf_data_file
*760c253cSXin Li            if os.path.exists(perf_report_file):
*760c253cSXin Li                raise RuntimeError(
*760c253cSXin Li                    "Perf report file already exists: %s" % perf_report_file
*760c253cSXin Li                )
*760c253cSXin Li            chroot_perf_report_file = misc.GetInsideChrootPath(
*760c253cSXin Li                self.chromeos_root, perf_report_file
*760c253cSXin Li            )
*760c253cSXin Li            perf_path = misc.GetOutsideChrootPath(
*760c253cSXin Li                self.chromeos_root, "/usr/bin/perf"
*760c253cSXin Li            )
*760c253cSXin Li
*760c253cSXin Li            perf_file = "/usr/sbin/perf"
*760c253cSXin Li            if os.path.exists(perf_path):
*760c253cSXin Li                perf_file = "/usr/bin/perf"
*760c253cSXin Li
*760c253cSXin Li            debug_path = self.label.debug_path
*760c253cSXin Li
*760c253cSXin Li            if debug_path:
*760c253cSXin Li                symfs = "--symfs " + debug_path
*760c253cSXin Li                vmlinux = "--vmlinux " + os.path.join(
*760c253cSXin Li                    debug_path, "usr", "lib", "debug", "boot", "vmlinux"
*760c253cSXin Li                )
*760c253cSXin Li                kallsyms = ""
*760c253cSXin Li                print(
*760c253cSXin Li                    "** WARNING **: --kallsyms option not applied, no System.map-* "
*760c253cSXin Li                    "for downloaded image."
*760c253cSXin Li                )
*760c253cSXin Li            else:
*760c253cSXin Li                if self.label.image_type != "local":
*760c253cSXin Li                    print(
*760c253cSXin Li                        "** WARNING **: Using local debug info in /build, this may "
*760c253cSXin Li                        "not match the downloaded image."
*760c253cSXin Li                    )
*760c253cSXin Li                build_path = os.path.join("/build", self.board)
*760c253cSXin Li                symfs = self._CheckDebugPath("symfs", build_path)
*760c253cSXin Li                vmlinux_path = os.path.join(
*760c253cSXin Li                    build_path, "usr/lib/debug/boot/vmlinux"
*760c253cSXin Li                )
*760c253cSXin Li                vmlinux = self._CheckDebugPath("vmlinux", vmlinux_path)
*760c253cSXin Li                kallsyms_path = os.path.join(build_path, "boot")
*760c253cSXin Li                kallsyms = self._CheckDebugPath("kallsyms", kallsyms_path)
*760c253cSXin Li
*760c253cSXin Li            command = "%s report -n %s %s %s -i %s --stdio > %s" % (
*760c253cSXin Li                perf_file,
*760c253cSXin Li                symfs,
*760c253cSXin Li                vmlinux,
*760c253cSXin Li                kallsyms,
*760c253cSXin Li                chroot_perf_data_file,
*760c253cSXin Li                chroot_perf_report_file,
*760c253cSXin Li            )
*760c253cSXin Li            if self.log_level != "verbose":
*760c253cSXin Li                self._logger.LogOutput(
*760c253cSXin Li                    "Generating perf report...\nCMD: %s" % command
*760c253cSXin Li                )
*760c253cSXin Li            exit_code = self.ce.ChrootRunCommand(self.chromeos_root, command)
*760c253cSXin Li            if exit_code == 0:
*760c253cSXin Li                if self.log_level != "verbose":
*760c253cSXin Li                    self._logger.LogOutput(
*760c253cSXin Li                        "Perf report generated successfully."
*760c253cSXin Li                    )
*760c253cSXin Li            else:
*760c253cSXin Li                raise RuntimeError(
*760c253cSXin Li                    "Perf report not generated correctly. CMD: %s" % command
*760c253cSXin Li                )
*760c253cSXin Li
*760c253cSXin Li            # Add a keyval to the dictionary for the events captured.
*760c253cSXin Li            perf_report_files.append(
*760c253cSXin Li                misc.GetOutsideChrootPath(
*760c253cSXin Li                    self.chromeos_root, chroot_perf_report_file
*760c253cSXin Li                )
*760c253cSXin Li            )
*760c253cSXin Li        return perf_report_files
*760c253cSXin Li
*760c253cSXin Li    def GatherPerfResults(self):
*760c253cSXin Li        report_id = 0
*760c253cSXin Li        for perf_report_file in self.perf_report_files:
*760c253cSXin Li            with open(perf_report_file, "r", encoding="utf-8") as f:
*760c253cSXin Li                report_contents = f.read()
*760c253cSXin Li                for group in re.findall(
*760c253cSXin Li                    r"Events: (\S+) (\S+)", report_contents
*760c253cSXin Li                ):
*760c253cSXin Li                    num_events = group[0]
*760c253cSXin Li                    event_name = group[1]
*760c253cSXin Li                    key = "perf_%s_%s" % (report_id, event_name)
*760c253cSXin Li                    value = str(misc.UnitToNumber(num_events))
*760c253cSXin Li                    self.keyvals[key] = value
*760c253cSXin Li
*760c253cSXin Li    def PopulateFromRun(self, out, err, retval, test, suite, cwp_dso):
*760c253cSXin Li        self.board = self.label.board
*760c253cSXin Li        self.out = out
*760c253cSXin Li        self.err = err
*760c253cSXin Li        self.retval = retval
*760c253cSXin Li        self.test_name = test
*760c253cSXin Li        self.suite = suite
*760c253cSXin Li        self.cwp_dso = cwp_dso
*760c253cSXin Li        self.chroot_results_dir = self.GetResultsDir()
*760c253cSXin Li        self.results_dir = misc.GetOutsideChrootPath(
*760c253cSXin Li            self.chromeos_root, self.chroot_results_dir
*760c253cSXin Li        )
*760c253cSXin Li        self.results_file = self.GetResultsFile()
*760c253cSXin Li        self.perf_data_files = self.GetPerfDataFiles()
*760c253cSXin Li        # Include all perf.report data in table.
*760c253cSXin Li        self.perf_report_files = self.GeneratePerfReportFiles()
*760c253cSXin Li        self.turbostat_log_file = self.GetTurbostatFile()
*760c253cSXin Li        self.cpustats_log_file = self.GetCpustatsFile()
*760c253cSXin Li        self.cpuinfo_file = self.GetCpuinfoFile()
*760c253cSXin Li        self.top_log_file = self.GetTopFile()
*760c253cSXin Li        self.wait_time_log_file = self.GetWaitTimeFile()
*760c253cSXin Li        # TODO(asharif): Do something similar with perf stat.
*760c253cSXin Li
*760c253cSXin Li        # Grab keyvals from the directory.
*760c253cSXin Li        self.ProcessResults()
*760c253cSXin Li
*760c253cSXin Li    def ProcessChartResults(self):
*760c253cSXin Li        # Open and parse the json results file generated by telemetry/test_that.
*760c253cSXin Li        if not self.results_file:
*760c253cSXin Li            raise IOError("No results file found.")
*760c253cSXin Li        filename = self.results_file[0]
*760c253cSXin Li        if not filename.endswith(".json"):
*760c253cSXin Li            raise IOError(
*760c253cSXin Li                "Attempt to call json on non-json file: %s" % filename
*760c253cSXin Li            )
*760c253cSXin Li        if not os.path.exists(filename):
*760c253cSXin Li            raise IOError("%s does not exist" % filename)
*760c253cSXin Li
*760c253cSXin Li        keyvals = {}
*760c253cSXin Li        with open(filename, "r", encoding="utf-8") as f:
*760c253cSXin Li            raw_dict = json.load(f)
*760c253cSXin Li            if "charts" in raw_dict:
*760c253cSXin Li                raw_dict = raw_dict["charts"]
*760c253cSXin Li            for k, field_dict in raw_dict.items():
*760c253cSXin Li                for item in field_dict:
*760c253cSXin Li                    keyname = k + "__" + item
*760c253cSXin Li                    value_dict = field_dict[item]
*760c253cSXin Li                    if "value" in value_dict:
*760c253cSXin Li                        result = value_dict["value"]
*760c253cSXin Li                    elif "values" in value_dict:
*760c253cSXin Li                        values = value_dict["values"]
*760c253cSXin Li                        if not values:
*760c253cSXin Li                            continue
*760c253cSXin Li                        if (
*760c253cSXin Li                            "type" in value_dict
*760c253cSXin Li                            and value_dict["type"] == "list_of_scalar_values"
*760c253cSXin Li                            and values != "null"
*760c253cSXin Li                        ):
*760c253cSXin Li                            result = sum(values) / float(len(values))
*760c253cSXin Li                        else:
*760c253cSXin Li                            result = values
*760c253cSXin Li                    else:
*760c253cSXin Li                        continue
*760c253cSXin Li                    units = value_dict["units"]
*760c253cSXin Li                    new_value = [result, units]
*760c253cSXin Li                    keyvals[keyname] = new_value
*760c253cSXin Li        return keyvals
*760c253cSXin Li
*760c253cSXin Li    def ProcessTurbostatResults(self):
*760c253cSXin Li        """Given turbostat_log_file non-null parse cpu stats from file.
*760c253cSXin Li
*760c253cSXin Li        Returns:
*760c253cSXin Li          Dictionary of 'cpufreq', 'cputemp' where each
*760c253cSXin Li          includes dictionary 'all': [list_of_values]
*760c253cSXin Li
*760c253cSXin Li        Example of the output of turbostat_log.
*760c253cSXin Li        ----------------------
*760c253cSXin Li        CPU     Avg_MHz Busy%   Bzy_MHz TSC_MHz IRQ     CoreTmp
*760c253cSXin Li        -       329     12.13   2723    2393    10975   77
*760c253cSXin Li        0       336     12.41   2715    2393    6328    77
*760c253cSXin Li        2       323     11.86   2731    2393    4647    69
*760c253cSXin Li        CPU     Avg_MHz Busy%   Bzy_MHz TSC_MHz IRQ     CoreTmp
*760c253cSXin Li        -       1940    67.46   2884    2393    39920   83
*760c253cSXin Li        0       1827    63.70   2877    2393    21184   83
*760c253cSXin Li        """
*760c253cSXin Li        cpustats = {}
*760c253cSXin Li        read_data = ""
*760c253cSXin Li        with open(self.turbostat_log_file, encoding="utf-8") as f:
*760c253cSXin Li            read_data = f.readlines()
*760c253cSXin Li
*760c253cSXin Li        if not read_data:
*760c253cSXin Li            self._logger.LogOutput("WARNING: Turbostat output file is empty.")
*760c253cSXin Li            return {}
*760c253cSXin Li
*760c253cSXin Li        # First line always contains the header.
*760c253cSXin Li        stats = read_data[0].split()
*760c253cSXin Li
*760c253cSXin Li        # Mandatory parameters.
*760c253cSXin Li        if "CPU" not in stats:
*760c253cSXin Li            self._logger.LogOutput(
*760c253cSXin Li                "WARNING: Missing data for CPU# in Turbostat output."
*760c253cSXin Li            )
*760c253cSXin Li            return {}
*760c253cSXin Li        if "Bzy_MHz" not in stats:
*760c253cSXin Li            self._logger.LogOutput(
*760c253cSXin Li                "WARNING: Missing data for Bzy_MHz in Turbostat output."
*760c253cSXin Li            )
*760c253cSXin Li            return {}
*760c253cSXin Li        cpu_index = stats.index("CPU")
*760c253cSXin Li        cpufreq_index = stats.index("Bzy_MHz")
*760c253cSXin Li        cpufreq = cpustats.setdefault("cpufreq", {"all": []})
*760c253cSXin Li
*760c253cSXin Li        # Optional parameters.
*760c253cSXin Li        cputemp_index = -1
*760c253cSXin Li        if "CoreTmp" in stats:
*760c253cSXin Li            cputemp_index = stats.index("CoreTmp")
*760c253cSXin Li            cputemp = cpustats.setdefault("cputemp", {"all": []})
*760c253cSXin Li
*760c253cSXin Li        # Parse data starting from the second line ignoring repeating headers.
*760c253cSXin Li        for st in read_data[1:]:
*760c253cSXin Li            # Data represented by int or float separated by spaces.
*760c253cSXin Li            numbers = st.split()
*760c253cSXin Li            if not all(
*760c253cSXin Li                word.replace(".", "", 1).isdigit() for word in numbers[1:]
*760c253cSXin Li            ):
*760c253cSXin Li                # Skip the line if data mismatch.
*760c253cSXin Li                continue
*760c253cSXin Li            if numbers[cpu_index] != "-":
*760c253cSXin Li                # Ignore Core-specific statistics which starts with Core number.
*760c253cSXin Li                # Combined statistics for all core has "-" CPU identifier.
*760c253cSXin Li                continue
*760c253cSXin Li
*760c253cSXin Li            cpufreq["all"].append(int(numbers[cpufreq_index]))
*760c253cSXin Li            if cputemp_index != -1:
*760c253cSXin Li                cputemp["all"].append(int(numbers[cputemp_index]))
*760c253cSXin Li        return cpustats
*760c253cSXin Li
*760c253cSXin Li    def ProcessTopResults(self):
*760c253cSXin Li        """Given self.top_log_file process top log data.
*760c253cSXin Li
*760c253cSXin Li        Returns:
*760c253cSXin Li          List of dictionaries with the following keyvals:
*760c253cSXin Li           'cmd': command name (string),
*760c253cSXin Li           'cpu_use_avg': average cpu usage (float),
*760c253cSXin Li           'count': number of occurrences (int),
*760c253cSXin Li           'top5_cpu_use': up to 5 highest cpu usages (descending list of floats)
*760c253cSXin Li
*760c253cSXin Li        Example of the top log:
*760c253cSXin Li          PID USER      PR  NI    VIRT    RES    SHR S  %CPU  %MEM     TIME+ COMMAND
*760c253cSXin Li         4102 chronos   12  -8 3454472 238300 118188 R  41.8   6.1   0:08.37 chrome
*760c253cSXin Li          375 root       0 -20       0      0      0 S   5.9   0.0   0:00.17 kworker
*760c253cSXin Li          617 syslog    20   0   25332   8372   7888 S   5.9   0.2   0:00.77 systemd
*760c253cSXin Li
*760c253cSXin Li          PID USER      PR  NI    VIRT    RES    SHR S  %CPU  %MEM     TIME+ COMMAND
*760c253cSXin Li         5745 chronos   20   0 5438580 139328  67988 R 122.8   3.6   0:04.26 chrome
*760c253cSXin Li          912 root     -51   0       0      0      0 S   2.0   0.0   0:01.04 irq/cro
*760c253cSXin Li          121 root      20   0       0      0      0 S   1.0   0.0   0:00.45 spi5
*760c253cSXin Li        """
*760c253cSXin Li        all_data = ""
*760c253cSXin Li        with open(self.top_log_file, encoding="utf-8") as f:
*760c253cSXin Li            all_data = f.read()
*760c253cSXin Li
*760c253cSXin Li        if not all_data:
*760c253cSXin Li            self._logger.LogOutput("WARNING: Top log file is empty.")
*760c253cSXin Li            return []
*760c253cSXin Li
*760c253cSXin Li        top_line_regex = re.compile(
*760c253cSXin Li            r"""
*760c253cSXin Li        ^\s*(?P<pid>\d+)\s+         # Group 1: PID
*760c253cSXin Li        \S+\s+\S+\s+-?\d+\s+        # Ignore: user, prio, nice
*760c253cSXin Li        \d+\s+\d+\s+\d+\s+          # Ignore: virt/res/shared mem
*760c253cSXin Li        \S+\s+                      # Ignore: state
*760c253cSXin Li        (?P<cpu_use>\d+\.\d+)\s+    # Group 2: CPU usage
*760c253cSXin Li        \d+\.\d+\s+\d+:\d+\.\d+\s+  # Ignore: mem usage, time
*760c253cSXin Li        (?P<cmd>\S+)$               # Group 3: command
*760c253cSXin Li        """,
*760c253cSXin Li            re.VERBOSE,
*760c253cSXin Li        )
*760c253cSXin Li        # Page represents top log data per one measurement within time interval
*760c253cSXin Li        # 'top_interval'.
*760c253cSXin Li        # Pages separated by empty line.
*760c253cSXin Li        pages = all_data.split("\n\n")
*760c253cSXin Li        # Snapshots are structured representation of the pages.
*760c253cSXin Li        snapshots = []
*760c253cSXin Li        for page in pages:
*760c253cSXin Li            if not page:
*760c253cSXin Li                continue
*760c253cSXin Li
*760c253cSXin Li            # Snapshot list will contain all processes (command duplicates are
*760c253cSXin Li            # allowed).
*760c253cSXin Li            snapshot = []
*760c253cSXin Li            for line in page.splitlines():
*760c253cSXin Li                match = top_line_regex.match(line)
*760c253cSXin Li                if match:
*760c253cSXin Li                    # Top line is valid, collect data.
*760c253cSXin Li                    process = {
*760c253cSXin Li                        # NOTE: One command may be represented by multiple processes.
*760c253cSXin Li                        "cmd": match.group("cmd"),
*760c253cSXin Li                        "pid": match.group("pid"),
*760c253cSXin Li                        "cpu_use": float(match.group("cpu_use")),
*760c253cSXin Li                    }
*760c253cSXin Li
*760c253cSXin Li                    # Filter out processes with 0 CPU usage and top command.
*760c253cSXin Li                    if process["cpu_use"] > 0 and process["cmd"] != "top":
*760c253cSXin Li                        snapshot.append(process)
*760c253cSXin Li
*760c253cSXin Li            # If page contained meaningful data add snapshot to the list.
*760c253cSXin Li            if snapshot:
*760c253cSXin Li                snapshots.append(snapshot)
*760c253cSXin Li
*760c253cSXin Li        # Define threshold of CPU usage when Chrome is busy, i.e. benchmark is
*760c253cSXin Li        # running.
*760c253cSXin Li        # Ideally it should be 100% but it will be hardly reachable with 1 core.
*760c253cSXin Li        # Statistics on DUT with 2-6 cores shows that chrome load of 100%, 95% and
*760c253cSXin Li        # 90% equally occurs in 72-74% of all top log snapshots.
*760c253cSXin Li        # Further decreasing of load threshold leads to a shifting percent of
*760c253cSXin Li        # "high load" snapshots which might include snapshots when benchmark is
*760c253cSXin Li        # not running.
*760c253cSXin Li        # On 1-core DUT 90% chrome cpu load occurs in 55%, 95% in 33% and 100% in 2%
*760c253cSXin Li        # of snapshots accordingly.
*760c253cSXin Li        # Threshold of "high load" is reduced to 70% (from 90) when we switched to
*760c253cSXin Li        # topstats per process. From experiment data the rest 20% are distributed
*760c253cSXin Li        # among other chrome processes.
*760c253cSXin Li        CHROME_HIGH_CPU_LOAD = 70
*760c253cSXin Li        # Number of snapshots where chrome is heavily used.
*760c253cSXin Li        high_load_snapshots = 0
*760c253cSXin Li        # Total CPU use per process in ALL active snapshots.
*760c253cSXin Li        cmd_total_cpu_use = collections.defaultdict(float)
*760c253cSXin Li        # Top CPU usages per command.
*760c253cSXin Li        cmd_top5_cpu_use = collections.defaultdict(list)
*760c253cSXin Li        # List of Top Commands to be returned.
*760c253cSXin Li        topcmds = []
*760c253cSXin Li
*760c253cSXin Li        for snapshot_processes in snapshots:
*760c253cSXin Li            # CPU usage per command, per PID in one snapshot.
*760c253cSXin Li            cmd_cpu_use_per_snapshot = collections.defaultdict(dict)
*760c253cSXin Li            for process in snapshot_processes:
*760c253cSXin Li                cmd = process["cmd"]
*760c253cSXin Li                cpu_use = process["cpu_use"]
*760c253cSXin Li                pid = process["pid"]
*760c253cSXin Li                cmd_cpu_use_per_snapshot[cmd][pid] = cpu_use
*760c253cSXin Li
*760c253cSXin Li            # Chrome processes, pid: cpu_usage.
*760c253cSXin Li            chrome_processes = cmd_cpu_use_per_snapshot.get("chrome", {})
*760c253cSXin Li            chrome_cpu_use_list = chrome_processes.values()
*760c253cSXin Li
*760c253cSXin Li            if (
*760c253cSXin Li                chrome_cpu_use_list
*760c253cSXin Li                and max(chrome_cpu_use_list) > CHROME_HIGH_CPU_LOAD
*760c253cSXin Li            ):
*760c253cSXin Li                # CPU usage of any of the "chrome" processes exceeds "High load"
*760c253cSXin Li                # threshold which means DUT is busy running a benchmark.
*760c253cSXin Li                high_load_snapshots += 1
*760c253cSXin Li                for cmd, cpu_use_per_pid in cmd_cpu_use_per_snapshot.items():
*760c253cSXin Li                    for pid, cpu_use in cpu_use_per_pid.items():
*760c253cSXin Li                        # Append PID to the name of the command.
*760c253cSXin Li                        cmd_with_pid = cmd + "-" + pid
*760c253cSXin Li                        cmd_total_cpu_use[cmd_with_pid] += cpu_use
*760c253cSXin Li
*760c253cSXin Li                        # Add cpu_use into command top cpu usages, sorted in descending
*760c253cSXin Li                        # order.
*760c253cSXin Li                        heapq.heappush(
*760c253cSXin Li                            cmd_top5_cpu_use[cmd_with_pid], round(cpu_use, 1)
*760c253cSXin Li                        )
*760c253cSXin Li
*760c253cSXin Li        for consumer, usage in sorted(
*760c253cSXin Li            cmd_total_cpu_use.items(), key=lambda x: x[1], reverse=True
*760c253cSXin Li        ):
*760c253cSXin Li            # Iterate through commands by descending order of total CPU usage.
*760c253cSXin Li            topcmd = {
*760c253cSXin Li                "cmd": consumer,
*760c253cSXin Li                "cpu_use_avg": usage / high_load_snapshots,
*760c253cSXin Li                "count": len(cmd_top5_cpu_use[consumer]),
*760c253cSXin Li                "top5_cpu_use": heapq.nlargest(5, cmd_top5_cpu_use[consumer]),
*760c253cSXin Li            }
*760c253cSXin Li            topcmds.append(topcmd)
*760c253cSXin Li
*760c253cSXin Li        return topcmds
*760c253cSXin Li
*760c253cSXin Li    def ProcessCpustatsResults(self):
*760c253cSXin Li        """Given cpustats_log_file non-null parse cpu data from file.
*760c253cSXin Li
*760c253cSXin Li        Returns:
*760c253cSXin Li          Dictionary of 'cpufreq', 'cputemp' where each
*760c253cSXin Li          includes dictionary of parameter: [list_of_values]
*760c253cSXin Li
*760c253cSXin Li        Example of cpustats.log output.
*760c253cSXin Li        ----------------------
*760c253cSXin Li        /sys/devices/system/cpu/cpu0/cpufreq/cpuinfo_cur_freq 1512000
*760c253cSXin Li        /sys/devices/system/cpu/cpu2/cpufreq/cpuinfo_cur_freq 2016000
*760c253cSXin Li        little-cpu 41234
*760c253cSXin Li        big-cpu 51234
*760c253cSXin Li
*760c253cSXin Li        If cores share the same policy their frequencies may always match
*760c253cSXin Li        on some devices.
*760c253cSXin Li        To make report concise we should eliminate redundancy in the output.
*760c253cSXin Li        Function removes cpuN data if it duplicates data from other cores.
*760c253cSXin Li        """
*760c253cSXin Li
*760c253cSXin Li        cpustats = {}
*760c253cSXin Li        read_data = ""
*760c253cSXin Li        with open(self.cpustats_log_file, encoding="utf-8") as f:
*760c253cSXin Li            read_data = f.readlines()
*760c253cSXin Li
*760c253cSXin Li        if not read_data:
*760c253cSXin Li            self._logger.LogOutput("WARNING: Cpustats output file is empty.")
*760c253cSXin Li            return {}
*760c253cSXin Li
*760c253cSXin Li        cpufreq_regex = re.compile(r"^[/\S]+/(cpu\d+)/[/\S]+\s+(\d+)$")
*760c253cSXin Li        cputemp_regex = re.compile(r"^([^/\s]+)\s+(\d+)$")
*760c253cSXin Li
*760c253cSXin Li        for st in read_data:
*760c253cSXin Li            match = cpufreq_regex.match(st)
*760c253cSXin Li            if match:
*760c253cSXin Li                cpu = match.group(1)
*760c253cSXin Li                # CPU frequency comes in kHz.
*760c253cSXin Li                freq_khz = int(match.group(2))
*760c253cSXin Li                freq_mhz = freq_khz / 1000
*760c253cSXin Li                # cpufreq represents a dictionary with CPU frequency-related
*760c253cSXin Li                # data from cpustats.log.
*760c253cSXin Li                cpufreq = cpustats.setdefault("cpufreq", {})
*760c253cSXin Li                cpu_n_freq = cpufreq.setdefault(cpu, [])
*760c253cSXin Li                cpu_n_freq.append(freq_mhz)
*760c253cSXin Li            else:
*760c253cSXin Li                match = cputemp_regex.match(st)
*760c253cSXin Li                if match:
*760c253cSXin Li                    therm_type = match.group(1)
*760c253cSXin Li                    # The value is int, uCelsius unit.
*760c253cSXin Li                    temp_uc = float(match.group(2))
*760c253cSXin Li                    # Round to XX.X float.
*760c253cSXin Li                    temp_c = round(temp_uc / 1000, 1)
*760c253cSXin Li                    # cputemp represents a dictionary with temperature measurements
*760c253cSXin Li                    # from cpustats.log.
*760c253cSXin Li                    cputemp = cpustats.setdefault("cputemp", {})
*760c253cSXin Li                    therm_type = cputemp.setdefault(therm_type, [])
*760c253cSXin Li                    therm_type.append(temp_c)
*760c253cSXin Li
*760c253cSXin Li        # Remove duplicate statistics from cpustats.
*760c253cSXin Li        pruned_stats = {}
*760c253cSXin Li        for cpukey, cpuparam in cpustats.items():
*760c253cSXin Li            # Copy 'cpufreq' and 'cputemp'.
*760c253cSXin Li            pruned_params = pruned_stats.setdefault(cpukey, {})
*760c253cSXin Li            for paramkey, paramvalue in sorted(cpuparam.items()):
*760c253cSXin Li                # paramvalue is list of all measured data.
*760c253cSXin Li                if paramvalue not in pruned_params.values():
*760c253cSXin Li                    pruned_params[paramkey] = paramvalue
*760c253cSXin Li
*760c253cSXin Li        return pruned_stats
*760c253cSXin Li
*760c253cSXin Li    def ProcessHistogramsResults(self):
*760c253cSXin Li        # Open and parse the json results file generated by telemetry/test_that.
*760c253cSXin Li        if not self.results_file:
*760c253cSXin Li            raise IOError("No results file found.")
*760c253cSXin Li        filename = self.results_file[0]
*760c253cSXin Li        if not filename.endswith(".json"):
*760c253cSXin Li            raise IOError(
*760c253cSXin Li                "Attempt to call json on non-json file: %s" % filename
*760c253cSXin Li            )
*760c253cSXin Li        if not os.path.exists(filename):
*760c253cSXin Li            raise IOError("%s does not exist" % filename)
*760c253cSXin Li
*760c253cSXin Li        keyvals = {}
*760c253cSXin Li        with open(filename, encoding="utf-8") as f:
*760c253cSXin Li            histograms = json.load(f)
*760c253cSXin Li            value_map = {}
*760c253cSXin Li            # Gets generic set values.
*760c253cSXin Li            for obj in histograms:
*760c253cSXin Li                if "type" in obj and obj["type"] == "GenericSet":
*760c253cSXin Li                    value_map[obj["guid"]] = obj["values"]
*760c253cSXin Li
*760c253cSXin Li            for obj in histograms:
*760c253cSXin Li                if "name" not in obj or "sampleValues" not in obj:
*760c253cSXin Li                    continue
*760c253cSXin Li                metric_name = obj["name"]
*760c253cSXin Li                vals = obj["sampleValues"]
*760c253cSXin Li                if isinstance(vals, list):
*760c253cSXin Li                    # Remove None elements from the list
*760c253cSXin Li                    vals = [val for val in vals if val is not None]
*760c253cSXin Li                    if vals:
*760c253cSXin Li                        result = float(sum(vals)) / len(vals)
*760c253cSXin Li                    else:
*760c253cSXin Li                        result = 0
*760c253cSXin Li                else:
*760c253cSXin Li                    result = vals
*760c253cSXin Li                unit = obj["unit"]
*760c253cSXin Li                diagnostics = obj["diagnostics"]
*760c253cSXin Li                # for summaries of benchmarks
*760c253cSXin Li                key = metric_name
*760c253cSXin Li                if key not in keyvals:
*760c253cSXin Li                    keyvals[key] = [[result], unit]
*760c253cSXin Li                else:
*760c253cSXin Li                    keyvals[key][0].append(result)
*760c253cSXin Li                # TODO: do we need summaries of stories?
*760c253cSXin Li                # for summaries of story tags
*760c253cSXin Li                if "storyTags" in diagnostics:
*760c253cSXin Li                    guid = diagnostics["storyTags"]
*760c253cSXin Li                    if guid not in value_map:
*760c253cSXin Li                        raise RuntimeError(
*760c253cSXin Li                            "Unrecognized storyTags in %s " % (obj)
*760c253cSXin Li                        )
*760c253cSXin Li                    for story_tag in value_map[guid]:
*760c253cSXin Li                        key = metric_name + "__" + story_tag
*760c253cSXin Li                        if key not in keyvals:
*760c253cSXin Li                            keyvals[key] = [[result], unit]
*760c253cSXin Li                        else:
*760c253cSXin Li                            keyvals[key][0].append(result)
*760c253cSXin Li        # calculate summary
*760c253cSXin Li        for key in keyvals:
*760c253cSXin Li            vals = keyvals[key][0]
*760c253cSXin Li            unit = keyvals[key][1]
*760c253cSXin Li            result = float(sum(vals)) / len(vals)
*760c253cSXin Li            keyvals[key] = [result, unit]
*760c253cSXin Li        return keyvals
*760c253cSXin Li
*760c253cSXin Li    def ReadPidFromPerfData(self):
*760c253cSXin Li        """Read PIDs from perf.data files.
*760c253cSXin Li
*760c253cSXin Li        Extract PID from perf.data if "perf record" was running per process,
*760c253cSXin Li        i.e. with "-p <PID>" and no "-a".
*760c253cSXin Li
*760c253cSXin Li        Returns:
*760c253cSXin Li          pids: list of PIDs.
*760c253cSXin Li
*760c253cSXin Li        Raises:
*760c253cSXin Li          PerfDataReadError when perf.data header reading fails.
*760c253cSXin Li        """
*760c253cSXin Li        cmd = ["/usr/bin/perf", "report", "--header-only", "-i"]
*760c253cSXin Li        pids = []
*760c253cSXin Li
*760c253cSXin Li        for perf_data_path in self.perf_data_files:
*760c253cSXin Li            perf_data_path_in_chroot = misc.GetInsideChrootPath(
*760c253cSXin Li                self.chromeos_root, perf_data_path
*760c253cSXin Li            )
*760c253cSXin Li            path_str = " ".join(cmd + [perf_data_path_in_chroot])
*760c253cSXin Li            status, output, _ = self.ce.ChrootRunCommandWOutput(
*760c253cSXin Li                self.chromeos_root, path_str
*760c253cSXin Li            )
*760c253cSXin Li            if status:
*760c253cSXin Li                # Error of reading a perf.data profile is fatal.
*760c253cSXin Li                raise PerfDataReadError(
*760c253cSXin Li                    f"Failed to read perf.data profile: {path_str}"
*760c253cSXin Li                )
*760c253cSXin Li
*760c253cSXin Li            # Pattern to search a line with "perf record" command line:
*760c253cSXin Li            # # cmdline : /usr/bin/perf record -e instructions -p 123"
*760c253cSXin Li            cmdline_regex = re.compile(
*760c253cSXin Li                r"^\#\scmdline\s:\s+(?P<cmd>.*perf\s+record\s+.*)$"
*760c253cSXin Li            )
*760c253cSXin Li            # Pattern to search PID in a command line.
*760c253cSXin Li            pid_regex = re.compile(r"^.*\s-p\s(?P<pid>\d+)\s*.*$")
*760c253cSXin Li            for line in output.splitlines():
*760c253cSXin Li                cmd_match = cmdline_regex.match(line)
*760c253cSXin Li                if cmd_match:
*760c253cSXin Li                    # Found a perf command line.
*760c253cSXin Li                    cmdline = cmd_match.group("cmd")
*760c253cSXin Li                    # '-a' is a system-wide mode argument.
*760c253cSXin Li                    if "-a" not in cmdline.split():
*760c253cSXin Li                        # It can be that perf was attached to PID and was still running in
*760c253cSXin Li                        # system-wide mode.
*760c253cSXin Li                        # We filter out this case here since it's not per-process.
*760c253cSXin Li                        pid_match = pid_regex.match(cmdline)
*760c253cSXin Li                        if pid_match:
*760c253cSXin Li                            pids.append(pid_match.group("pid"))
*760c253cSXin Li                    # Stop the search and move to the next perf.data file.
*760c253cSXin Li                    break
*760c253cSXin Li            else:
*760c253cSXin Li                # cmdline wasn't found in the header. It's a fatal error.
*760c253cSXin Li                raise PerfDataReadError(
*760c253cSXin Li                    f"Perf command line is not found in {path_str}"
*760c253cSXin Li                )
*760c253cSXin Li        return pids
*760c253cSXin Li
*760c253cSXin Li    def VerifyPerfDataPID(self):
*760c253cSXin Li        """Verify PIDs in per-process perf.data profiles.
*760c253cSXin Li
*760c253cSXin Li        Check that at list one top process is profiled if perf was running in
*760c253cSXin Li        per-process mode.
*760c253cSXin Li
*760c253cSXin Li        Raises:
*760c253cSXin Li          PidVerificationError if PID verification of per-process perf.data profiles
*760c253cSXin Li          fail.
*760c253cSXin Li        """
*760c253cSXin Li        perf_data_pids = self.ReadPidFromPerfData()
*760c253cSXin Li        if not perf_data_pids:
*760c253cSXin Li            # In system-wide mode there are no PIDs.
*760c253cSXin Li            self._logger.LogOutput("System-wide perf mode. Skip verification.")
*760c253cSXin Li            return
*760c253cSXin Li
*760c253cSXin Li        # PIDs will be present only in per-process profiles.
*760c253cSXin Li        # In this case we need to verify that profiles are collected on the
*760c253cSXin Li        # hottest processes.
*760c253cSXin Li        top_processes = [top_cmd["cmd"] for top_cmd in self.top_cmds]
*760c253cSXin Li        # top_process structure: <cmd>-<pid>
*760c253cSXin Li        top_pids = [top_process.split("-")[-1] for top_process in top_processes]
*760c253cSXin Li        for top_pid in top_pids:
*760c253cSXin Li            if top_pid in perf_data_pids:
*760c253cSXin Li                self._logger.LogOutput(
*760c253cSXin Li                    "PID verification passed! "
*760c253cSXin Li                    f"Top process {top_pid} is profiled."
*760c253cSXin Li                )
*760c253cSXin Li                return
*760c253cSXin Li        raise PidVerificationError(
*760c253cSXin Li            f"top processes {top_processes} are missing in perf.data traces with"
*760c253cSXin Li            f" PID: {perf_data_pids}."
*760c253cSXin Li        )
*760c253cSXin Li
*760c253cSXin Li    def ProcessResults(self, use_cache=False):
*760c253cSXin Li        # Note that this function doesn't know anything about whether there is a
*760c253cSXin Li        # cache hit or miss. It should process results agnostic of the cache hit
*760c253cSXin Li        # state.
*760c253cSXin Li        if (
*760c253cSXin Li            self.results_file
*760c253cSXin Li            and self.suite == "telemetry_Crosperf"
*760c253cSXin Li            and "histograms.json" in self.results_file[0]
*760c253cSXin Li        ):
*760c253cSXin Li            self.keyvals = self.ProcessHistogramsResults()
*760c253cSXin Li        elif (
*760c253cSXin Li            self.results_file
*760c253cSXin Li            and self.suite != "telemetry_Crosperf"
*760c253cSXin Li            and "results-chart.json" in self.results_file[0]
*760c253cSXin Li        ):
*760c253cSXin Li            self.keyvals = self.ProcessChartResults()
*760c253cSXin Li        else:
*760c253cSXin Li            if not use_cache:
*760c253cSXin Li                print(
*760c253cSXin Li                    "\n ** WARNING **: Had to use deprecated output-method to "
*760c253cSXin Li                    "collect results.\n"
*760c253cSXin Li                )
*760c253cSXin Li            self.keyvals = self.GetKeyvals()
*760c253cSXin Li        self.keyvals["retval"] = self.retval
*760c253cSXin Li        # If we are in CWP approximation mode, we want to collect DSO samples
*760c253cSXin Li        # for each perf.data file
*760c253cSXin Li        if self.cwp_dso and self.retval == 0:
*760c253cSXin Li            self.keyvals["samples"] = self.GetSamples()
*760c253cSXin Li            # If the samples count collected from perf file is 0, we will treat
*760c253cSXin Li            # it as a failed run.
*760c253cSXin Li            if self.keyvals["samples"][0] == 0:
*760c253cSXin Li                del self.keyvals["samples"]
*760c253cSXin Li                self.keyvals["retval"] = 1
*760c253cSXin Li        # Generate report from all perf.data files.
*760c253cSXin Li        # Now parse all perf report files and include them in keyvals.
*760c253cSXin Li        self.GatherPerfResults()
*760c253cSXin Li
*760c253cSXin Li        cpustats = {}
*760c253cSXin Li        # Turbostat output has higher priority of processing.
*760c253cSXin Li        if self.turbostat_log_file:
*760c253cSXin Li            cpustats = self.ProcessTurbostatResults()
*760c253cSXin Li        # Process cpustats output only if turbostat has no data.
*760c253cSXin Li        if not cpustats and self.cpustats_log_file:
*760c253cSXin Li            cpustats = self.ProcessCpustatsResults()
*760c253cSXin Li        if self.top_log_file:
*760c253cSXin Li            self.top_cmds = self.ProcessTopResults()
*760c253cSXin Li        # Verify that PID in non system-wide perf.data and top_cmds are matching.
*760c253cSXin Li        if self.perf_data_files and self.top_cmds:
*760c253cSXin Li            self.VerifyPerfDataPID()
*760c253cSXin Li        if self.wait_time_log_file:
*760c253cSXin Li            with open(self.wait_time_log_file, encoding="utf-8") as f:
*760c253cSXin Li                wait_time = f.readline().strip()
*760c253cSXin Li                try:
*760c253cSXin Li                    wait_time = float(wait_time)
*760c253cSXin Li                except ValueError:
*760c253cSXin Li                    raise ValueError("Wait time in log file is not a number.")
*760c253cSXin Li            # This is for accumulating wait time for telemtry_Crosperf runs only,
*760c253cSXin Li            # for test_that runs, please refer to suite_runner.
*760c253cSXin Li            self.machine.AddCooldownWaitTime(wait_time)
*760c253cSXin Li
*760c253cSXin Li        for param_key, param in cpustats.items():
*760c253cSXin Li            for param_type, param_values in param.items():
*760c253cSXin Li                val_avg = sum(param_values) / len(param_values)
*760c253cSXin Li                val_min = min(param_values)
*760c253cSXin Li                val_max = max(param_values)
*760c253cSXin Li                # Average data is always included.
*760c253cSXin Li                self.keyvals["_".join([param_key, param_type, "avg"])] = val_avg
*760c253cSXin Li                # Insert min/max results only if they deviate
*760c253cSXin Li                # from average.
*760c253cSXin Li                if val_min != val_avg:
*760c253cSXin Li                    self.keyvals[
*760c253cSXin Li                        "_".join([param_key, param_type, "min"])
*760c253cSXin Li                    ] = val_min
*760c253cSXin Li                if val_max != val_avg:
*760c253cSXin Li                    self.keyvals[
*760c253cSXin Li                        "_".join([param_key, param_type, "max"])
*760c253cSXin Li                    ] = val_max
*760c253cSXin Li
*760c253cSXin Li    def GetChromeVersionFromCache(self, cache_dir):
*760c253cSXin Li        # Read chrome_version from keys file, if present.
*760c253cSXin Li        chrome_version = ""
*760c253cSXin Li        keys_file = os.path.join(cache_dir, CACHE_KEYS_FILE)
*760c253cSXin Li        if os.path.exists(keys_file):
*760c253cSXin Li            with open(keys_file, "r", encoding="utf-8") as f:
*760c253cSXin Li                lines = f.readlines()
*760c253cSXin Li                for l in lines:
*760c253cSXin Li                    if l.startswith("Google Chrome "):
*760c253cSXin Li                        chrome_version = l
*760c253cSXin Li                        if chrome_version.endswith("\n"):
*760c253cSXin Li                            chrome_version = chrome_version[:-1]
*760c253cSXin Li                        break
*760c253cSXin Li        return chrome_version
*760c253cSXin Li
*760c253cSXin Li    def PopulateFromCacheDir(self, cache_dir, test, suite, cwp_dso):
*760c253cSXin Li        self.test_name = test
*760c253cSXin Li        self.suite = suite
*760c253cSXin Li        self.cwp_dso = cwp_dso
*760c253cSXin Li        # Read in everything from the cache directory.
*760c253cSXin Li        with open(os.path.join(cache_dir, RESULTS_FILE), "rb") as f:
*760c253cSXin Li            self.out = pickle.load(f)
*760c253cSXin Li            self.err = pickle.load(f)
*760c253cSXin Li            self.retval = pickle.load(f)
*760c253cSXin Li
*760c253cSXin Li        # Untar the tarball to a temporary directory
*760c253cSXin Li        self.temp_dir = tempfile.mkdtemp(
*760c253cSXin Li            dir=misc.GetOutsideChrootPath(self.chromeos_root, "/tmp")
*760c253cSXin Li        )
*760c253cSXin Li
*760c253cSXin Li        command = "cd %s && tar xf %s" % (
*760c253cSXin Li            self.temp_dir,
*760c253cSXin Li            os.path.join(cache_dir, AUTOTEST_TARBALL),
*760c253cSXin Li        )
*760c253cSXin Li        ret = self.ce.RunCommand(command, print_to_console=False)
*760c253cSXin Li        if ret:
*760c253cSXin Li            raise RuntimeError("Could not untar cached tarball")
*760c253cSXin Li        self.results_dir = self.temp_dir
*760c253cSXin Li        self.results_file = self.GetDataMeasurementsFiles()
*760c253cSXin Li        self.perf_data_files = self.GetPerfDataFiles()
*760c253cSXin Li        self.perf_report_files = self.GetPerfReportFiles()
*760c253cSXin Li        self.chrome_version = self.GetChromeVersionFromCache(cache_dir)
*760c253cSXin Li        self.ProcessResults(use_cache=True)
*760c253cSXin Li
*760c253cSXin Li    def CleanUp(self, rm_chroot_tmp):
*760c253cSXin Li        if (
*760c253cSXin Li            rm_chroot_tmp
*760c253cSXin Li            and self.results_dir
*760c253cSXin Li            and self.results_dir != self.temp_dir
*760c253cSXin Li        ):
*760c253cSXin Li            dirname, basename = misc.GetRoot(self.results_dir)
*760c253cSXin Li            if basename.find("test_that_results_") != -1:
*760c253cSXin Li                command = "rm -rf %s" % self.results_dir
*760c253cSXin Li            else:
*760c253cSXin Li                command = "rm -rf %s" % dirname
*760c253cSXin Li            self.ce.RunCommand(command)
*760c253cSXin Li        if self.temp_dir:
*760c253cSXin Li            command = "rm -rf %s" % self.temp_dir
*760c253cSXin Li            self.ce.RunCommand(command)
*760c253cSXin Li
*760c253cSXin Li    def CreateTarball(self, results_dir, tarball):
*760c253cSXin Li        if not results_dir.strip():
*760c253cSXin Li            raise ValueError(
*760c253cSXin Li                "Refusing to `tar` an empty results_dir: %r" % results_dir
*760c253cSXin Li            )
*760c253cSXin Li
*760c253cSXin Li        ret = self.ce.RunCommand(
*760c253cSXin Li            "cd %s && "
*760c253cSXin Li            "tar "
*760c253cSXin Li            "--exclude=var/spool "
*760c253cSXin Li            "--exclude=var/log "
*760c253cSXin Li            "-cjf %s ." % (results_dir, tarball)
*760c253cSXin Li        )
*760c253cSXin Li        if ret:
*760c253cSXin Li            raise RuntimeError("Couldn't compress test output directory.")
*760c253cSXin Li
*760c253cSXin Li    def StoreToCacheDir(self, cache_dir, machine_manager, key_list):
*760c253cSXin Li        # Create the dir if it doesn't exist.
*760c253cSXin Li        temp_dir = tempfile.mkdtemp()
*760c253cSXin Li
*760c253cSXin Li        # Store to the temp directory.
*760c253cSXin Li        with open(os.path.join(temp_dir, RESULTS_FILE), "wb") as f:
*760c253cSXin Li            pickle.dump(self.out, f)
*760c253cSXin Li            pickle.dump(self.err, f)
*760c253cSXin Li            pickle.dump(self.retval, f)
*760c253cSXin Li
*760c253cSXin Li        if not test_flag.GetTestMode():
*760c253cSXin Li            with open(
*760c253cSXin Li                os.path.join(temp_dir, CACHE_KEYS_FILE), "w", encoding="utf-8"
*760c253cSXin Li            ) as f:
*760c253cSXin Li                f.write("%s\n" % self.label.name)
*760c253cSXin Li                f.write("%s\n" % self.label.chrome_version)
*760c253cSXin Li                f.write("%s\n" % self.machine.checksum_string)
*760c253cSXin Li                for k in key_list:
*760c253cSXin Li                    f.write(k)
*760c253cSXin Li                    f.write("\n")
*760c253cSXin Li
*760c253cSXin Li        if self.results_dir:
*760c253cSXin Li            tarball = os.path.join(temp_dir, AUTOTEST_TARBALL)
*760c253cSXin Li            self.CreateTarball(self.results_dir, tarball)
*760c253cSXin Li
*760c253cSXin Li        # Store machine info.
*760c253cSXin Li        # TODO(asharif): Make machine_manager a singleton, and don't pass it into
*760c253cSXin Li        # this function.
*760c253cSXin Li        with open(
*760c253cSXin Li            os.path.join(temp_dir, MACHINE_FILE), "w", encoding="utf-8"
*760c253cSXin Li        ) as f:
*760c253cSXin Li            f.write(machine_manager.machine_checksum_string[self.label.name])
*760c253cSXin Li
*760c253cSXin Li        if os.path.exists(cache_dir):
*760c253cSXin Li            command = f"rm -rf {cache_dir}"
*760c253cSXin Li            self.ce.RunCommand(command)
*760c253cSXin Li
*760c253cSXin Li        parent_dir = os.path.dirname(cache_dir)
*760c253cSXin Li        command = f"mkdir -p {parent_dir} && "
*760c253cSXin Li        command += f"chmod g+x {temp_dir} && "
*760c253cSXin Li        command += f"mv {temp_dir} {cache_dir}"
*760c253cSXin Li        ret = self.ce.RunCommand(command)
*760c253cSXin Li        if ret:
*760c253cSXin Li            command = f"rm -rf {temp_dir}"
*760c253cSXin Li            self.ce.RunCommand(command)
*760c253cSXin Li            raise RuntimeError(
*760c253cSXin Li                "Could not move dir %s to dir %s" % (temp_dir, cache_dir)
*760c253cSXin Li            )
*760c253cSXin Li
*760c253cSXin Li    @classmethod
*760c253cSXin Li    def CreateFromRun(
*760c253cSXin Li        cls,
*760c253cSXin Li        logger,
*760c253cSXin Li        log_level,
*760c253cSXin Li        label,
*760c253cSXin Li        machine,
*760c253cSXin Li        out,
*760c253cSXin Li        err,
*760c253cSXin Li        retval,
*760c253cSXin Li        test,
*760c253cSXin Li        suite="telemetry_Crosperf",
*760c253cSXin Li        cwp_dso="",
*760c253cSXin Li    ):
*760c253cSXin Li        if suite == "telemetry":
*760c253cSXin Li            result = TelemetryResult(logger, label, log_level, machine)
*760c253cSXin Li        else:
*760c253cSXin Li            result = cls(logger, label, log_level, machine)
*760c253cSXin Li        result.PopulateFromRun(out, err, retval, test, suite, cwp_dso)
*760c253cSXin Li        return result
*760c253cSXin Li
*760c253cSXin Li    @classmethod
*760c253cSXin Li    def CreateFromCacheHit(
*760c253cSXin Li        cls,
*760c253cSXin Li        logger,
*760c253cSXin Li        log_level,
*760c253cSXin Li        label,
*760c253cSXin Li        machine,
*760c253cSXin Li        cache_dir,
*760c253cSXin Li        test,
*760c253cSXin Li        suite="telemetry_Crosperf",
*760c253cSXin Li        cwp_dso="",
*760c253cSXin Li    ):
*760c253cSXin Li        if suite == "telemetry":
*760c253cSXin Li            result = TelemetryResult(logger, label, log_level, machine)
*760c253cSXin Li        else:
*760c253cSXin Li            result = cls(logger, label, log_level, machine)
*760c253cSXin Li        try:
*760c253cSXin Li            result.PopulateFromCacheDir(cache_dir, test, suite, cwp_dso)
*760c253cSXin Li
*760c253cSXin Li        except RuntimeError as e:
*760c253cSXin Li            logger.LogError("Exception while using cache: %s" % e)
*760c253cSXin Li            return None
*760c253cSXin Li        return result
*760c253cSXin Li
*760c253cSXin Li
*760c253cSXin Liclass TelemetryResult(Result):
*760c253cSXin Li    """Class to hold the results of a single Telemetry run."""
*760c253cSXin Li
*760c253cSXin Li    def PopulateFromRun(self, out, err, retval, test, suite, cwp_dso):
*760c253cSXin Li        self.out = out
*760c253cSXin Li        self.err = err
*760c253cSXin Li        self.retval = retval
*760c253cSXin Li
*760c253cSXin Li        self.ProcessResults()
*760c253cSXin Li
*760c253cSXin Li    # pylint: disable=arguments-differ
*760c253cSXin Li    def ProcessResults(self):
*760c253cSXin Li        # The output is:
*760c253cSXin Li        # url,average_commit_time (ms),...
*760c253cSXin Li        # www.google.com,33.4,21.2,...
*760c253cSXin Li        # We need to convert to this format:
*760c253cSXin Li        # {"www.google.com:average_commit_time (ms)": "33.4",
*760c253cSXin Li        #  "www.google.com:...": "21.2"}
*760c253cSXin Li        # Added note:  Occasionally the output comes back
*760c253cSXin Li        # with "JSON.stringify(window.automation.GetResults())" on
*760c253cSXin Li        # the first line, and then the rest of the output as
*760c253cSXin Li        # described above.
*760c253cSXin Li
*760c253cSXin Li        lines = self.out.splitlines()
*760c253cSXin Li        self.keyvals = {}
*760c253cSXin Li
*760c253cSXin Li        if lines:
*760c253cSXin Li            if lines[0].startswith("JSON.stringify"):
*760c253cSXin Li                lines = lines[1:]
*760c253cSXin Li
*760c253cSXin Li        if not lines:
*760c253cSXin Li            return
*760c253cSXin Li        labels = lines[0].split(",")
*760c253cSXin Li        for line in lines[1:]:
*760c253cSXin Li            fields = line.split(",")
*760c253cSXin Li            if len(fields) != len(labels):
*760c253cSXin Li                continue
*760c253cSXin Li            for i in range(1, len(labels)):
*760c253cSXin Li                key = "%s %s" % (fields[0], labels[i])
*760c253cSXin Li                value = fields[i]
*760c253cSXin Li                self.keyvals[key] = value
*760c253cSXin Li        self.keyvals["retval"] = self.retval
*760c253cSXin Li
*760c253cSXin Li    def PopulateFromCacheDir(self, cache_dir, test, suite, cwp_dso):
*760c253cSXin Li        self.test_name = test
*760c253cSXin Li        self.suite = suite
*760c253cSXin Li        self.cwp_dso = cwp_dso
*760c253cSXin Li        with open(os.path.join(cache_dir, RESULTS_FILE), "rb") as f:
*760c253cSXin Li            self.out = pickle.load(f)
*760c253cSXin Li            self.err = pickle.load(f)
*760c253cSXin Li            self.retval = pickle.load(f)
*760c253cSXin Li
*760c253cSXin Li        self.chrome_version = super(
*760c253cSXin Li            TelemetryResult, self
*760c253cSXin Li        ).GetChromeVersionFromCache(cache_dir)
*760c253cSXin Li        self.ProcessResults()
*760c253cSXin Li
*760c253cSXin Li
*760c253cSXin Liclass CacheConditions(object):
*760c253cSXin Li    """Various Cache condition values, for export."""
*760c253cSXin Li
*760c253cSXin Li    # Cache hit only if the result file exists.
*760c253cSXin Li    CACHE_FILE_EXISTS = 0
*760c253cSXin Li
*760c253cSXin Li    # Cache hit if the checksum of cpuinfo and totalmem of
*760c253cSXin Li    # the cached result and the new run match.
*760c253cSXin Li    MACHINES_MATCH = 1
*760c253cSXin Li
*760c253cSXin Li    # Cache hit if the image checksum of the cached result and the new run match.
*760c253cSXin Li    CHECKSUMS_MATCH = 2
*760c253cSXin Li
*760c253cSXin Li    # Cache hit only if the cached result was successful
*760c253cSXin Li    RUN_SUCCEEDED = 3
*760c253cSXin Li
*760c253cSXin Li    # Never a cache hit.
*760c253cSXin Li    FALSE = 4
*760c253cSXin Li
*760c253cSXin Li    # Cache hit if the image path matches the cached image path.
*760c253cSXin Li    IMAGE_PATH_MATCH = 5
*760c253cSXin Li
*760c253cSXin Li    # Cache hit if the uuid of hard disk mataches the cached one
*760c253cSXin Li
*760c253cSXin Li    SAME_MACHINE_MATCH = 6
*760c253cSXin Li
*760c253cSXin Li
*760c253cSXin Liclass ResultsCache(object):
*760c253cSXin Li    """Class to handle the cache for storing/retrieving test run results.
*760c253cSXin Li
*760c253cSXin Li    This class manages the key of the cached runs without worrying about what
*760c253cSXin Li    is exactly stored (value). The value generation is handled by the Results
*760c253cSXin Li    class.
*760c253cSXin Li    """
*760c253cSXin Li
*760c253cSXin Li    CACHE_VERSION = 6
*760c253cSXin Li
*760c253cSXin Li    def __init__(self):
*760c253cSXin Li        # Proper initialization happens in the Init function below.
*760c253cSXin Li        self.chromeos_image = None
*760c253cSXin Li        self.chromeos_root = None
*760c253cSXin Li        self.test_name = None
*760c253cSXin Li        self.iteration = None
*760c253cSXin Li        self.test_args = None
*760c253cSXin Li        self.profiler_args = None
*760c253cSXin Li        self.board = None
*760c253cSXin Li        self.cache_conditions = None
*760c253cSXin Li        self.machine_manager = None
*760c253cSXin Li        self.machine = None
*760c253cSXin Li        self._logger = None
*760c253cSXin Li        self.ce = None
*760c253cSXin Li        self.label = None
*760c253cSXin Li        self.share_cache = None
*760c253cSXin Li        self.suite = None
*760c253cSXin Li        self.log_level = None
*760c253cSXin Li        self.show_all = None
*760c253cSXin Li        self.run_local = None
*760c253cSXin Li        self.cwp_dso = None
*760c253cSXin Li
*760c253cSXin Li    def Init(
*760c253cSXin Li        self,
*760c253cSXin Li        chromeos_image,
*760c253cSXin Li        chromeos_root,
*760c253cSXin Li        test_name,
*760c253cSXin Li        iteration,
*760c253cSXin Li        test_args,
*760c253cSXin Li        profiler_args,
*760c253cSXin Li        machine_manager,
*760c253cSXin Li        machine,
*760c253cSXin Li        board,
*760c253cSXin Li        cache_conditions,
*760c253cSXin Li        logger_to_use,
*760c253cSXin Li        log_level,
*760c253cSXin Li        label,
*760c253cSXin Li        share_cache,
*760c253cSXin Li        suite,
*760c253cSXin Li        show_all_results,
*760c253cSXin Li        run_local,
*760c253cSXin Li        cwp_dso,
*760c253cSXin Li    ):
*760c253cSXin Li        self.chromeos_image = chromeos_image
*760c253cSXin Li        self.chromeos_root = chromeos_root
*760c253cSXin Li        self.test_name = test_name
*760c253cSXin Li        self.iteration = iteration
*760c253cSXin Li        self.test_args = test_args
*760c253cSXin Li        self.profiler_args = profiler_args
*760c253cSXin Li        self.board = board
*760c253cSXin Li        self.cache_conditions = cache_conditions
*760c253cSXin Li        self.machine_manager = machine_manager
*760c253cSXin Li        self.machine = machine
*760c253cSXin Li        self._logger = logger_to_use
*760c253cSXin Li        self.ce = command_executer.GetCommandExecuter(
*760c253cSXin Li            self._logger, log_level=log_level
*760c253cSXin Li        )
*760c253cSXin Li        self.label = label
*760c253cSXin Li        self.share_cache = share_cache
*760c253cSXin Li        self.suite = suite
*760c253cSXin Li        self.log_level = log_level
*760c253cSXin Li        self.show_all = show_all_results
*760c253cSXin Li        self.run_local = run_local
*760c253cSXin Li        self.cwp_dso = cwp_dso
*760c253cSXin Li
*760c253cSXin Li    def GetCacheDirForRead(self):
*760c253cSXin Li        matching_dirs = []
*760c253cSXin Li        for glob_path in self.FormCacheDir(self.GetCacheKeyList(True)):
*760c253cSXin Li            matching_dirs += glob.glob(glob_path)
*760c253cSXin Li
*760c253cSXin Li        if matching_dirs:
*760c253cSXin Li            # Cache file found.
*760c253cSXin Li            return matching_dirs[0]
*760c253cSXin Li        return None
*760c253cSXin Li
*760c253cSXin Li    def GetCacheDirForWrite(self, get_keylist=False):
*760c253cSXin Li        cache_path = self.FormCacheDir(self.GetCacheKeyList(False))[0]
*760c253cSXin Li        if get_keylist:
*760c253cSXin Li            args_str = "%s_%s_%s" % (
*760c253cSXin Li                self.test_args,
*760c253cSXin Li                self.profiler_args,
*760c253cSXin Li                self.run_local,
*760c253cSXin Li            )
*760c253cSXin Li            version, image = results_report.ParseChromeosImage(
*760c253cSXin Li                self.label.chromeos_image
*760c253cSXin Li            )
*760c253cSXin Li            keylist = [
*760c253cSXin Li                version,
*760c253cSXin Li                image,
*760c253cSXin Li                self.label.board,
*760c253cSXin Li                self.machine.name,
*760c253cSXin Li                self.test_name,
*760c253cSXin Li                str(self.iteration),
*760c253cSXin Li                args_str,
*760c253cSXin Li            ]
*760c253cSXin Li            return cache_path, keylist
*760c253cSXin Li        return cache_path
*760c253cSXin Li
*760c253cSXin Li    def FormCacheDir(self, list_of_strings):
*760c253cSXin Li        cache_key = " ".join(list_of_strings)
*760c253cSXin Li        cache_dir = misc.GetFilenameFromString(cache_key)
*760c253cSXin Li        if self.label.cache_dir:
*760c253cSXin Li            cache_home = os.path.abspath(
*760c253cSXin Li                os.path.expanduser(self.label.cache_dir)
*760c253cSXin Li            )
*760c253cSXin Li            cache_path = [os.path.join(cache_home, cache_dir)]
*760c253cSXin Li        else:
*760c253cSXin Li            cache_path = [os.path.join(SCRATCH_DIR, cache_dir)]
*760c253cSXin Li
*760c253cSXin Li        if self.share_cache:
*760c253cSXin Li            for path in [x.strip() for x in self.share_cache.split(",")]:
*760c253cSXin Li                if os.path.exists(path):
*760c253cSXin Li                    cache_path.append(os.path.join(path, cache_dir))
*760c253cSXin Li                else:
*760c253cSXin Li                    self._logger.LogFatal(
*760c253cSXin Li                        "Unable to find shared cache: %s" % path
*760c253cSXin Li                    )
*760c253cSXin Li
*760c253cSXin Li        return cache_path
*760c253cSXin Li
*760c253cSXin Li    def GetCacheKeyList(self, read):
*760c253cSXin Li        if read and CacheConditions.MACHINES_MATCH not in self.cache_conditions:
*760c253cSXin Li            machine_checksum = "*"
*760c253cSXin Li        else:
*760c253cSXin Li            machine_checksum = self.machine_manager.machine_checksum[
*760c253cSXin Li                self.label.name
*760c253cSXin Li            ]
*760c253cSXin Li        if (
*760c253cSXin Li            read
*760c253cSXin Li            and CacheConditions.CHECKSUMS_MATCH not in self.cache_conditions
*760c253cSXin Li        ):
*760c253cSXin Li            checksum = "*"
*760c253cSXin Li        elif self.label.image_type == "trybot":
*760c253cSXin Li            checksum = hashlib.md5(
*760c253cSXin Li                self.label.chromeos_image.encode("utf-8")
*760c253cSXin Li            ).hexdigest()
*760c253cSXin Li        elif self.label.image_type == "official":
*760c253cSXin Li            checksum = "*"
*760c253cSXin Li        else:
*760c253cSXin Li            checksum = ImageChecksummer().Checksum(self.label, self.log_level)
*760c253cSXin Li
*760c253cSXin Li        if (
*760c253cSXin Li            read
*760c253cSXin Li            and CacheConditions.IMAGE_PATH_MATCH not in self.cache_conditions
*760c253cSXin Li        ):
*760c253cSXin Li            image_path_checksum = "*"
*760c253cSXin Li        else:
*760c253cSXin Li            image_path_checksum = hashlib.md5(
*760c253cSXin Li                self.chromeos_image.encode("utf-8")
*760c253cSXin Li            ).hexdigest()
*760c253cSXin Li
*760c253cSXin Li        machine_id_checksum = ""
*760c253cSXin Li        if (
*760c253cSXin Li            read
*760c253cSXin Li            and CacheConditions.SAME_MACHINE_MATCH not in self.cache_conditions
*760c253cSXin Li        ):
*760c253cSXin Li            machine_id_checksum = "*"
*760c253cSXin Li        else:
*760c253cSXin Li            if self.machine and self.machine.name in self.label.remote:
*760c253cSXin Li                machine_id_checksum = self.machine.machine_id_checksum
*760c253cSXin Li            else:
*760c253cSXin Li                for machine in self.machine_manager.GetMachines(self.label):
*760c253cSXin Li                    if machine.name == self.label.remote[0]:
*760c253cSXin Li                        machine_id_checksum = machine.machine_id_checksum
*760c253cSXin Li                        break
*760c253cSXin Li
*760c253cSXin Li        temp_test_args = "%s %s %s" % (
*760c253cSXin Li            self.test_args,
*760c253cSXin Li            self.profiler_args,
*760c253cSXin Li            self.run_local,
*760c253cSXin Li        )
*760c253cSXin Li        test_args_checksum = hashlib.md5(
*760c253cSXin Li            temp_test_args.encode("utf-8")
*760c253cSXin Li        ).hexdigest()
*760c253cSXin Li        return (
*760c253cSXin Li            image_path_checksum,
*760c253cSXin Li            self.test_name,
*760c253cSXin Li            str(self.iteration),
*760c253cSXin Li            test_args_checksum,
*760c253cSXin Li            checksum,
*760c253cSXin Li            machine_checksum,
*760c253cSXin Li            machine_id_checksum,
*760c253cSXin Li            str(self.CACHE_VERSION),
*760c253cSXin Li        )
*760c253cSXin Li
*760c253cSXin Li    def ReadResult(self):
*760c253cSXin Li        if CacheConditions.FALSE in self.cache_conditions:
*760c253cSXin Li            cache_dir = self.GetCacheDirForWrite()
*760c253cSXin Li            command = "rm -rf %s" % (cache_dir,)
*760c253cSXin Li            self.ce.RunCommand(command)
*760c253cSXin Li            return None
*760c253cSXin Li        cache_dir = self.GetCacheDirForRead()
*760c253cSXin Li
*760c253cSXin Li        if not cache_dir:
*760c253cSXin Li            return None
*760c253cSXin Li
*760c253cSXin Li        if not os.path.isdir(cache_dir):
*760c253cSXin Li            return None
*760c253cSXin Li
*760c253cSXin Li        if self.log_level == "verbose":
*760c253cSXin Li            self._logger.LogOutput(
*760c253cSXin Li                "Trying to read from cache dir: %s" % cache_dir
*760c253cSXin Li            )
*760c253cSXin Li        result = Result.CreateFromCacheHit(
*760c253cSXin Li            self._logger,
*760c253cSXin Li            self.log_level,
*760c253cSXin Li            self.label,
*760c253cSXin Li            self.machine,
*760c253cSXin Li            cache_dir,
*760c253cSXin Li            self.test_name,
*760c253cSXin Li            self.suite,
*760c253cSXin Li            self.cwp_dso,
*760c253cSXin Li        )
*760c253cSXin Li        if not result:
*760c253cSXin Li            return None
*760c253cSXin Li
*760c253cSXin Li        if (
*760c253cSXin Li            result.retval == 0
*760c253cSXin Li            or CacheConditions.RUN_SUCCEEDED not in self.cache_conditions
*760c253cSXin Li        ):
*760c253cSXin Li            return result
*760c253cSXin Li
*760c253cSXin Li        return None
*760c253cSXin Li
*760c253cSXin Li    def StoreResult(self, result):
*760c253cSXin Li        cache_dir, keylist = self.GetCacheDirForWrite(get_keylist=True)
*760c253cSXin Li        result.StoreToCacheDir(cache_dir, self.machine_manager, keylist)
*760c253cSXin Li
*760c253cSXin Li
*760c253cSXin Liclass MockResultsCache(ResultsCache):
*760c253cSXin Li    """Class for mock testing, corresponding to ResultsCache class."""
*760c253cSXin Li
*760c253cSXin Li    # FIXME: pylint complains about this mock init method, we should probably
*760c253cSXin Li    # replace all Mock classes in Crosperf with simple Mock.mock().
*760c253cSXin Li    # pylint: disable=arguments-differ
*760c253cSXin Li    def Init(self, *args):
*760c253cSXin Li        pass
*760c253cSXin Li
*760c253cSXin Li    def ReadResult(self):
*760c253cSXin Li        return None
*760c253cSXin Li
*760c253cSXin Li    def StoreResult(self, result):
*760c253cSXin Li        pass
*760c253cSXin Li
*760c253cSXin Li
*760c253cSXin Liclass MockResult(Result):
*760c253cSXin Li    """Class for mock testing, corresponding to Result class."""
*760c253cSXin Li
*760c253cSXin Li    def PopulateFromRun(self, out, err, retval, test, suite, cwp_dso):
*760c253cSXin Li        self.out = out
*760c253cSXin Li        self.err = err
*760c253cSXin Li        self.retval = retval