scripts/top-down/top_down.py

effccb7dSTang Haojinfrom multiprocessing import Process, Manager
effccb7dSTang Haojinimport threading
effccb7dSTang Haojinimport os.path as osp
effccb7dSTang Haojinimport os
effccb7dSTang Haojinimport resource
effccb7dSTang Haojinimport json
effccb7dSTang Haojinimport argparse
effccb7dSTang Haojinimport psutil
effccb7dSTang Haojinimport numpy as np
effccb7dSTang Haojinimport pandas as pd
effccb7dSTang Haojinimport utils as u
effccb7dSTang Haojinimport configs as cf
effccb7dSTang Haojinfrom draw import draw
eb163ef0SHaojin Tang
eb163ef0SHaojin Tang
effccb7dSTang Haojindef batch():
effccb7dSTang Haojin    paths = u.glob_stats(cf.stats_dir, fname='simulator_err.txt')
effccb7dSTang Haojin
effccb7dSTang Haojin    manager = Manager()
effccb7dSTang Haojin    all_bmk_dict = manager.dict()
effccb7dSTang Haojin
effccb7dSTang Haojin    semaphore = threading.Semaphore(psutil.cpu_count())
effccb7dSTang Haojin
effccb7dSTang Haojin    # for workload, path in paths:
effccb7dSTang Haojin    def extract_and_post_process(gloabl_dict, workload, path):
effccb7dSTang Haojin        with semaphore:
effccb7dSTang Haojin            flag_file = osp.join(osp.dirname(path), 'simulator_out.txt')
effccb7dSTang Haojin            with open(flag_file, encoding='utf-8') as f:
effccb7dSTang Haojin                contents = f.read()
effccb7dSTang Haojin                if 'EXCEEDING CYCLE/INSTR LIMIT' not in contents and 'HIT GOOD TRAP' not in contents:
effccb7dSTang Haojin                    print('Skip unfinished job:', workload)
effccb7dSTang Haojin                    return
effccb7dSTang Haojin
effccb7dSTang Haojin            print('Process finished job:', workload)
effccb7dSTang Haojin
effccb7dSTang Haojin            d = u.xs_get_stats(path, cf.targets)
effccb7dSTang Haojin            if len(d):
effccb7dSTang Haojin
effccb7dSTang Haojin                # add bmk and point after topdown processing
effccb7dSTang Haojin                segments = workload.split('_')
effccb7dSTang Haojin                if len(segments):
effccb7dSTang Haojin                    d['point'] = segments[-1]
effccb7dSTang Haojin                    d['workload'] = '_'.join(segments[:-1])
effccb7dSTang Haojin                    d['bmk'] = segments[0]
effccb7dSTang Haojin
effccb7dSTang Haojin            gloabl_dict[workload] = d
effccb7dSTang Haojin        return
effccb7dSTang Haojin
effccb7dSTang Haojin    jobs = [Process(target=extract_and_post_process, args=(
effccb7dSTang Haojin        all_bmk_dict, workload, path)) for workload, path in paths]
effccb7dSTang Haojin    _ = [p.start() for p in jobs]
effccb7dSTang Haojin    _ = [p.join() for p in jobs]
effccb7dSTang Haojin
effccb7dSTang Haojin    df = pd.DataFrame.from_dict(all_bmk_dict, orient='index')
effccb7dSTang Haojin    df = df.sort_index()
effccb7dSTang Haojin    df = df.reindex(sorted(df.columns), axis=1)
effccb7dSTang Haojin
effccb7dSTang Haojin    df = df.fillna(0)
effccb7dSTang Haojin
effccb7dSTang Haojin    df.to_csv(cf.CSV_PATH, index=True)
effccb7dSTang Haojin
effccb7dSTang Haojin
effccb7dSTang Haojindef proc_input(wl_df: pd.DataFrame, js: dict, workload: str):
effccb7dSTang Haojin    # we implement the weighted metrics computation with the following formula:
effccb7dSTang Haojin    # weight = vec_weight matmul matrix_perf
effccb7dSTang Haojin    # (N, 1) = (1, W) matmul (W, N)
effccb7dSTang Haojin    # To make sure the matrix_perf is in the same order as the vec_weight,
effccb7dSTang Haojin    # we sort the matrix_perf by point
*f2421014SYanqin Li    assert isinstance(wl_df.iloc[0]['point'], np.int64)
effccb7dSTang Haojin    wl_df = wl_df.sort_values(by=['point'])
effccb7dSTang Haojin    # We also sort the vec_weight by point
effccb7dSTang Haojin    wl_js = dict(js[workload])
effccb7dSTang Haojin    wl_df['cpi'] = 1.0 / wl_df['ipc']
effccb7dSTang Haojin    vec_weight = pd.DataFrame.from_dict(wl_js['points'], orient='index')
effccb7dSTang Haojin
effccb7dSTang Haojin    # convert string index into int64
effccb7dSTang Haojin    vec_weight.index = vec_weight.index.astype(np.int64)
effccb7dSTang Haojin    # select only existing points
effccb7dSTang Haojin    vec_weight = vec_weight.loc[wl_df['point']]
effccb7dSTang Haojin    # make their sum equals 1.0
effccb7dSTang Haojin    vec_weight.columns = ['weight']
effccb7dSTang Haojin
effccb7dSTang Haojin    vec_weight['weight'] = vec_weight['weight'].astype(np.float64)
effccb7dSTang Haojin    coverage = np.sum(vec_weight.values)
effccb7dSTang Haojin    vec_weight = vec_weight / coverage
effccb7dSTang Haojin
effccb7dSTang Haojin    # Drop these auxiliary fields
effccb7dSTang Haojin    to_drop = {'bmk', 'point', 'workload', 'ipc'}
effccb7dSTang Haojin    to_drop = to_drop.intersection(set(wl_df.columns.to_list()))
effccb7dSTang Haojin    wl_df = wl_df.drop(to_drop, axis=1)
effccb7dSTang Haojin
effccb7dSTang Haojin    weight_metrics = np.matmul(vec_weight.values.reshape(1, -1), wl_df.values)
effccb7dSTang Haojin    weight_metrics_df = pd.DataFrame(weight_metrics, columns=wl_df.columns)
effccb7dSTang Haojin    # We have to process coverage here to avoid apply weight on top of weight
effccb7dSTang Haojin    weight_metrics_df['coverage'] = coverage
effccb7dSTang Haojin    return weight_metrics_df.values, weight_metrics_df.columns
effccb7dSTang Haojin
effccb7dSTang Haojin
effccb7dSTang Haojindef proc_bmk(bmk_df: pd.DataFrame, js: dict):
effccb7dSTang Haojin    # Similar to per-input proc, we view the instruction count as the weight
effccb7dSTang Haojin    # and compute weighted metrics with matrix multiplication
effccb7dSTang Haojin    workloads = bmk_df['workload'].unique()
effccb7dSTang Haojin    metric_list = []
effccb7dSTang Haojin    for wl in workloads:
effccb7dSTang Haojin        metrics, cols = proc_input(bmk_df[bmk_df['workload'] == wl], js, wl)
effccb7dSTang Haojin        metric_list.append(metrics)
effccb7dSTang Haojin    metrics = np.concatenate(metric_list, axis=0)
effccb7dSTang Haojin    metrics = pd.DataFrame(metrics, columns=cols)
effccb7dSTang Haojin
effccb7dSTang Haojin    input_dict = {}
effccb7dSTang Haojin    for workload in workloads:
effccb7dSTang Haojin        if workload.startswith(workload):
effccb7dSTang Haojin            input_dict[workload] = int(js[workload]['insts'])
effccb7dSTang Haojin    input_insts = pd.DataFrame.from_dict(
effccb7dSTang Haojin        input_dict, orient='index', columns=['insts'])
effccb7dSTang Haojin    # make their sum equals 1.0
effccb7dSTang Haojin    vec_weight = input_insts / np.sum(input_insts.values)
effccb7dSTang Haojin    weight_metric = np.matmul(vec_weight.values.reshape(1, -1), metrics.values)
effccb7dSTang Haojin    return weight_metric, metrics.columns
effccb7dSTang Haojin
effccb7dSTang Haojin
effccb7dSTang Haojindef compute_weighted_metrics():
effccb7dSTang Haojin    df = pd.read_csv(cf.CSV_PATH, index_col=0)
effccb7dSTang Haojin    bmks = df['bmk'].unique()
effccb7dSTang Haojin    with open(cf.JSON_FILE, 'r', encoding='utf-8') as f:
effccb7dSTang Haojin        js = json.load(f)
effccb7dSTang Haojin    weighted = {}
effccb7dSTang Haojin    for bmk in bmks:
effccb7dSTang Haojin        if bmk not in cf.spec_bmks['06']['int'] and cf.INT_ONLY:
effccb7dSTang Haojin            continue
effccb7dSTang Haojin        if bmk not in cf.spec_bmks['06']['float'] and cf.FP_ONLY:
effccb7dSTang Haojin            continue
effccb7dSTang Haojin        df_bmk = df[df['bmk'] == bmk]
effccb7dSTang Haojin        workloads = df_bmk['workload'].unique()
effccb7dSTang Haojin        n_wl = len(workloads)
effccb7dSTang Haojin        if n_wl == 1:
effccb7dSTang Haojin            metrics, cols = proc_input(df_bmk, js, workloads[0])
eb163ef0SHaojin Tang        else:
effccb7dSTang Haojin            metrics, cols = proc_bmk(df_bmk, js)
effccb7dSTang Haojin        weighted[bmk] = metrics[0]
effccb7dSTang Haojin    weighted_df = pd.DataFrame.from_dict(
effccb7dSTang Haojin        weighted, orient='index', columns=cols)
effccb7dSTang Haojin    if 'cpi' in weighted_df.columns:
effccb7dSTang Haojin        weighted_df = weighted_df.sort_values(by='cpi', ascending=False)
effccb7dSTang Haojin    else:
effccb7dSTang Haojin        weighted_df = weighted_df.sort_index()
effccb7dSTang Haojin    weighted_df.to_csv(cf.OUT_CSV)
eb163ef0SHaojin Tang
eb163ef0SHaojin Tang
effccb7dSTang Haojinif __name__ == '__main__':
effccb7dSTang Haojin    parser = argparse.ArgumentParser(usage='generate top-down results')
effccb7dSTang Haojin    parser.add_argument('-s', '--stat-dir', action='store', required=True,
effccb7dSTang Haojin                        help='stat output directory')
effccb7dSTang Haojin    parser.add_argument('-j', '--json', action='store', required=True,
effccb7dSTang Haojin                        help='specify json file', default='resources/spec06_rv64gcb_o2_20m.json')
effccb7dSTang Haojin    opt = parser.parse_args()
effccb7dSTang Haojin    cf.stats_dir = opt.stat_dir
effccb7dSTang Haojin    cf.JSON_FILE = opt.json
effccb7dSTang Haojin    if not osp.exists('results'):
effccb7dSTang Haojin        os.makedirs('results')
effccb7dSTang Haojin    if resource.getrlimit(resource.RLIMIT_NOFILE)[0] <= 8192:
effccb7dSTang Haojin        resource.setrlimit(resource.RLIMIT_NOFILE, (8192, 8192))
eb163ef0SHaojin Tang
effccb7dSTang Haojin    batch()
effccb7dSTang Haojin    compute_weighted_metrics()
effccb7dSTang Haojin    draw()