scripts/top-down/top_down.py

*effccb7dSTang Haojinfrom multiprocessing import Process, Manager
*effccb7dSTang Haojinimport threading
*effccb7dSTang Haojinimport os.path as osp
*effccb7dSTang Haojinimport os
*effccb7dSTang Haojinimport resource
*effccb7dSTang Haojinimport json
*effccb7dSTang Haojinimport argparse
*effccb7dSTang Haojinimport psutil
*effccb7dSTang Haojinimport numpy as np
*effccb7dSTang Haojinimport pandas as pd
*effccb7dSTang Haojinimport utils as u
*effccb7dSTang Haojinimport configs as cf
*effccb7dSTang Haojinfrom draw import draw
eb163ef0SHaojin Tang
eb163ef0SHaojin Tang
*effccb7dSTang Haojindef batch():
*effccb7dSTang Haojin    paths = u.glob_stats(cf.stats_dir, fname='simulator_err.txt')
*effccb7dSTang Haojin
*effccb7dSTang Haojin    manager = Manager()
*effccb7dSTang Haojin    all_bmk_dict = manager.dict()
*effccb7dSTang Haojin
*effccb7dSTang Haojin    semaphore = threading.Semaphore(psutil.cpu_count())
*effccb7dSTang Haojin
*effccb7dSTang Haojin    # for workload, path in paths:
*effccb7dSTang Haojin    def extract_and_post_process(gloabl_dict, workload, path):
*effccb7dSTang Haojin        with semaphore:
*effccb7dSTang Haojin            flag_file = osp.join(osp.dirname(path), 'simulator_out.txt')
*effccb7dSTang Haojin            with open(flag_file, encoding='utf-8') as f:
*effccb7dSTang Haojin                contents = f.read()
*effccb7dSTang Haojin                if 'EXCEEDING CYCLE/INSTR LIMIT' not in contents and 'HIT GOOD TRAP' not in contents:
*effccb7dSTang Haojin                    print('Skip unfinished job:', workload)
*effccb7dSTang Haojin                    return
*effccb7dSTang Haojin
*effccb7dSTang Haojin            print('Process finished job:', workload)
*effccb7dSTang Haojin
*effccb7dSTang Haojin            d = u.xs_get_stats(path, cf.targets)
*effccb7dSTang Haojin            if len(d):
*effccb7dSTang Haojin
*effccb7dSTang Haojin                # add bmk and point after topdown processing
*effccb7dSTang Haojin                segments = workload.split('_')
*effccb7dSTang Haojin                if len(segments):
*effccb7dSTang Haojin                    d['point'] = segments[-1]
*effccb7dSTang Haojin                    d['workload'] = '_'.join(segments[:-1])
*effccb7dSTang Haojin                    d['bmk'] = segments[0]
*effccb7dSTang Haojin
*effccb7dSTang Haojin            gloabl_dict[workload] = d
*effccb7dSTang Haojin        return
*effccb7dSTang Haojin
*effccb7dSTang Haojin    jobs = [Process(target=extract_and_post_process, args=(
*effccb7dSTang Haojin        all_bmk_dict, workload, path)) for workload, path in paths]
*effccb7dSTang Haojin    _ = [p.start() for p in jobs]
*effccb7dSTang Haojin    _ = [p.join() for p in jobs]
*effccb7dSTang Haojin
*effccb7dSTang Haojin    df = pd.DataFrame.from_dict(all_bmk_dict, orient='index')
*effccb7dSTang Haojin    df = df.sort_index()
*effccb7dSTang Haojin    df = df.reindex(sorted(df.columns), axis=1)
*effccb7dSTang Haojin
*effccb7dSTang Haojin    df = df.fillna(0)
*effccb7dSTang Haojin
*effccb7dSTang Haojin    df.to_csv(cf.CSV_PATH, index=True)
*effccb7dSTang Haojin
*effccb7dSTang Haojin
*effccb7dSTang Haojindef proc_input(wl_df: pd.DataFrame, js: dict, workload: str):
*effccb7dSTang Haojin    # we implement the weighted metrics computation with the following formula:
*effccb7dSTang Haojin    # weight = vec_weight matmul matrix_perf
*effccb7dSTang Haojin    # (N, 1) = (1, W) matmul (W, N)
*effccb7dSTang Haojin    # To make sure the matrix_perf is in the same order as the vec_weight,
*effccb7dSTang Haojin    # we sort the matrix_perf by point
*effccb7dSTang Haojin    assert isinstance(wl_df['point'][0], np.int64)
*effccb7dSTang Haojin    wl_df = wl_df.sort_values(by=['point'])
*effccb7dSTang Haojin    # We also sort the vec_weight by point
*effccb7dSTang Haojin    wl_js = dict(js[workload])
*effccb7dSTang Haojin    wl_df['cpi'] = 1.0 / wl_df['ipc']
*effccb7dSTang Haojin    vec_weight = pd.DataFrame.from_dict(wl_js['points'], orient='index')
*effccb7dSTang Haojin
*effccb7dSTang Haojin    # convert string index into int64
*effccb7dSTang Haojin    vec_weight.index = vec_weight.index.astype(np.int64)
*effccb7dSTang Haojin    # select only existing points
*effccb7dSTang Haojin    vec_weight = vec_weight.loc[wl_df['point']]
*effccb7dSTang Haojin    # make their sum equals 1.0
*effccb7dSTang Haojin    vec_weight.columns = ['weight']
*effccb7dSTang Haojin
*effccb7dSTang Haojin    vec_weight['weight'] = vec_weight['weight'].astype(np.float64)
*effccb7dSTang Haojin    coverage = np.sum(vec_weight.values)
*effccb7dSTang Haojin    vec_weight = vec_weight / coverage
*effccb7dSTang Haojin
*effccb7dSTang Haojin    # Drop these auxiliary fields
*effccb7dSTang Haojin    to_drop = {'bmk', 'point', 'workload', 'ipc'}
*effccb7dSTang Haojin    to_drop = to_drop.intersection(set(wl_df.columns.to_list()))
*effccb7dSTang Haojin    wl_df = wl_df.drop(to_drop, axis=1)
*effccb7dSTang Haojin
*effccb7dSTang Haojin    weight_metrics = np.matmul(vec_weight.values.reshape(1, -1), wl_df.values)
*effccb7dSTang Haojin    weight_metrics_df = pd.DataFrame(weight_metrics, columns=wl_df.columns)
*effccb7dSTang Haojin    # We have to process coverage here to avoid apply weight on top of weight
*effccb7dSTang Haojin    weight_metrics_df['coverage'] = coverage
*effccb7dSTang Haojin    return weight_metrics_df.values, weight_metrics_df.columns
*effccb7dSTang Haojin
*effccb7dSTang Haojin
*effccb7dSTang Haojindef proc_bmk(bmk_df: pd.DataFrame, js: dict):
*effccb7dSTang Haojin    # Similar to per-input proc, we view the instruction count as the weight
*effccb7dSTang Haojin    # and compute weighted metrics with matrix multiplication
*effccb7dSTang Haojin    workloads = bmk_df['workload'].unique()
*effccb7dSTang Haojin    metric_list = []
*effccb7dSTang Haojin    for wl in workloads:
*effccb7dSTang Haojin        metrics, cols = proc_input(bmk_df[bmk_df['workload'] == wl], js, wl)
*effccb7dSTang Haojin        metric_list.append(metrics)
*effccb7dSTang Haojin    metrics = np.concatenate(metric_list, axis=0)
*effccb7dSTang Haojin    metrics = pd.DataFrame(metrics, columns=cols)
*effccb7dSTang Haojin
*effccb7dSTang Haojin    input_dict = {}
*effccb7dSTang Haojin    for workload in workloads:
*effccb7dSTang Haojin        if workload.startswith(workload):
*effccb7dSTang Haojin            input_dict[workload] = int(js[workload]['insts'])
*effccb7dSTang Haojin    input_insts = pd.DataFrame.from_dict(
*effccb7dSTang Haojin        input_dict, orient='index', columns=['insts'])
*effccb7dSTang Haojin    # make their sum equals 1.0
*effccb7dSTang Haojin    vec_weight = input_insts / np.sum(input_insts.values)
*effccb7dSTang Haojin    weight_metric = np.matmul(vec_weight.values.reshape(1, -1), metrics.values)
*effccb7dSTang Haojin    return weight_metric, metrics.columns
*effccb7dSTang Haojin
*effccb7dSTang Haojin
*effccb7dSTang Haojindef compute_weighted_metrics():
*effccb7dSTang Haojin    df = pd.read_csv(cf.CSV_PATH, index_col=0)
*effccb7dSTang Haojin    bmks = df['bmk'].unique()
*effccb7dSTang Haojin    with open(cf.JSON_FILE, 'r', encoding='utf-8') as f:
*effccb7dSTang Haojin        js = json.load(f)
*effccb7dSTang Haojin    weighted = {}
*effccb7dSTang Haojin    for bmk in bmks:
*effccb7dSTang Haojin        if bmk not in cf.spec_bmks['06']['int'] and cf.INT_ONLY:
*effccb7dSTang Haojin            continue
*effccb7dSTang Haojin        if bmk not in cf.spec_bmks['06']['float'] and cf.FP_ONLY:
*effccb7dSTang Haojin            continue
*effccb7dSTang Haojin        df_bmk = df[df['bmk'] == bmk]
*effccb7dSTang Haojin        workloads = df_bmk['workload'].unique()
*effccb7dSTang Haojin        n_wl = len(workloads)
*effccb7dSTang Haojin        if n_wl == 1:
*effccb7dSTang Haojin            metrics, cols = proc_input(df_bmk, js, workloads[0])
eb163ef0SHaojin Tang        else:
*effccb7dSTang Haojin            metrics, cols = proc_bmk(df_bmk, js)
*effccb7dSTang Haojin        weighted[bmk] = metrics[0]
*effccb7dSTang Haojin    weighted_df = pd.DataFrame.from_dict(
*effccb7dSTang Haojin        weighted, orient='index', columns=cols)
*effccb7dSTang Haojin    if 'cpi' in weighted_df.columns:
*effccb7dSTang Haojin        weighted_df = weighted_df.sort_values(by='cpi', ascending=False)
*effccb7dSTang Haojin    else:
*effccb7dSTang Haojin        weighted_df = weighted_df.sort_index()
*effccb7dSTang Haojin    weighted_df.to_csv(cf.OUT_CSV)
eb163ef0SHaojin Tang
eb163ef0SHaojin Tang
*effccb7dSTang Haojinif __name__ == '__main__':
*effccb7dSTang Haojin    parser = argparse.ArgumentParser(usage='generate top-down results')
*effccb7dSTang Haojin    parser.add_argument('-s', '--stat-dir', action='store', required=True,
*effccb7dSTang Haojin                        help='stat output directory')
*effccb7dSTang Haojin    parser.add_argument('-j', '--json', action='store', required=True,
*effccb7dSTang Haojin                        help='specify json file', default='resources/spec06_rv64gcb_o2_20m.json')
*effccb7dSTang Haojin    opt = parser.parse_args()
*effccb7dSTang Haojin    cf.stats_dir = opt.stat_dir
*effccb7dSTang Haojin    cf.JSON_FILE = opt.json
*effccb7dSTang Haojin    if not osp.exists('results'):
*effccb7dSTang Haojin        os.makedirs('results')
*effccb7dSTang Haojin    if resource.getrlimit(resource.RLIMIT_NOFILE)[0] <= 8192:
*effccb7dSTang Haojin        resource.setrlimit(resource.RLIMIT_NOFILE, (8192, 8192))
eb163ef0SHaojin Tang
*effccb7dSTang Haojin    batch()
*effccb7dSTang Haojin    compute_weighted_metrics()
*effccb7dSTang Haojin    draw()