instrument-classification/leaderboard.py

import glob
import numpy as np
import pandas as pd


class LeaderBoard():
    def __init__(self, models_dir):
        self.models_dir = models_dir

        def load_df(file_name):
            model_id = file_name.split('/')[4]
            df = pd.read_csv(file_name)
            df.rename(columns={'Unnamed: 0': 'split'}, inplace=True)
            df['model_id'] = model_id
            if 'auc' not in df.columns:
                df['auc'] = np.nan
            df = df[['model_id', 'split', 'loss', 'error', 'auc']]
            return df

        files = sorted(glob.glob(self.models_dir + '/*/evaluation/final_metrics.csv'))
        df = pd.concat([load_df(f) for f in files])

        df_valid = df[df['split'] == 'valid'][:]
        df_valid.set_index('model_id', inplace=True)

        df_valid['rank_error'] = df_valid['error'].rank().astype(int)
        df_valid['rank_auc'] = df_valid['auc'].fillna(0).rank(ascending=False).astype(int)

        self.df_valid = df_valid

    def best_model(self):
        return self.df_valid['auc'].argmax()

    def print_report(self):
        print('Ranking on the validation split metrics.\n')
        print('Lowest error:')
        print(self.df_valid['error'].sort_values(ascending=True)[:5])

        print('\nHighest AUC:')
        print(self.df_valid['auc'].sort_values(ascending=False)[:5])

        print('\nRank of the last few models by error/AUC, total:', len(self.df_valid))
        print(self.df_valid[['rank_error', 'rank_auc', 'error', 'auc']].iloc[-5:])

        print('\nBest model (by AUC):', self.best_model())

if __name__ == '__main__':
    leader_board = LeaderBoard('data/working/single-notes-2000/models')
    leader_board.print_report()