deeppavlov · voorhs · Oct 1, 2024 · Sep 30, 2024 · Sep 30, 2024 · Oct 1, 2024
diff --git a/autointent/context/context.py b/autointent/context/context.py
@@ -1,5 +1,5 @@
 from .data_handler import DataHandler
-from .optimization_logs import OptimizationLogs
+from .optimization_info import OptimizationInfo
 from .vector_index import VectorIndex
 
 
@@ -25,7 +25,7 @@ def __init__(
             regex_sampling,
             seed,
         )
-        self.optimization_logs = OptimizationLogs()
+        self.optimization_info = OptimizationInfo()
         self.vector_index = VectorIndex(db_dir, device, self.data_handler.multilabel, self.data_handler.n_classes)
 
         self.device = device
@@ -34,5 +34,5 @@ def __init__(
         self.seed = seed
 
     def get_best_collection(self):
-        model_name = self.optimization_logs.get_best_embedder()
+        model_name = self.optimization_info.get_best_embedder()
         return self.vector_index.get_collection(model_name)
diff --git a/autointent/context/optimization_info/__init__.py b/autointent/context/optimization_info/__init__.py
@@ -0,0 +1,2 @@
+from .data_models import RetrieverArtifact, ScorerArtifact
+from .optimization_info import OptimizationInfo
diff --git a/autointent/context/optimization_info/data_models.py b/autointent/context/optimization_info/data_models.py
@@ -0,0 +1,91 @@
+from typing import Any
+
+import numpy as np
+from numpy.typing import NDArray
+from pydantic import BaseModel, ConfigDict, Field
+
+
+class Artifact(BaseModel):
+    ...
+
+
+class RegexpArtifact(Artifact):
+    ...
+
+
+class RetrieverArtifact(Artifact):
+    """
+    Name of the embedding model chosen after retrieval optimization
+    """
+    embedder_name: str
+
+
+class ScorerArtifact(Artifact):
+    """
+    Outputs from best scorer, numpy arrays of shape (n_samples, n_classes)
+    """
+    model_config = ConfigDict(arbitrary_types_allowed=True)
+    test_scores: NDArray[np.float64] | None = Field(None, description="Scorer outputs for test utterances")
+    oos_scores: NDArray[np.float64] | None = Field(None, description="Scorer outputs for out-of-scope utterances")
+
+
+class PredictorArtifact(Artifact):
+    """
+    Outputs from best predictor, numpy array of shape (n_samples,) or
+    (n_samples, n_classes) depending on classification mode (multi-class or multi-label)
+    """
+    model_config = ConfigDict(arbitrary_types_allowed=True)
+    labels: NDArray[np.float64]
+
+
+class Artifacts(BaseModel):
+    """
+    Modules hyperparams and outputs. The best ones are transmitted between nodes of the pipeline
+    """
+    model_config = ConfigDict(arbitrary_types_allowed=True)
+
+    regexp: list[RegexpArtifact] = []
+    retrieval: list[RetrieverArtifact] = []
+    scoring: list[ScorerArtifact] = []
+    prediction: list[PredictorArtifact] = []
+
+    def __getitem__(self, node_type: str) -> list:
+        return getattr(self, node_type)
+
+
+class Trial(BaseModel):
+    """
+    Detailed representation of one optimization trial
+    """
+    module_type: str
+    module_params: dict[str, Any]
+    metric_name: str
+    metric_value: float
+
+class Trials(BaseModel):
+    """
+    Detailed representation of optimization results
+    """
+    regexp: list[Trial] = []
+    retrieval: list[Trial] = []
+    scoring: list[Trial] = []
+    prediction: list[Trial] = []
+
+    def __getitem__(self, node_type: str) -> list[Trial]:
+        return getattr(self, node_type)
+
+
+class TrialsIds(BaseModel):
+    """
+    Detailed representation of optimization results
+    """
+    regexp: int | None = None
+    retrieval: int | None = None
+    scoring: int | None = None
+    prediction: int | None = None
+
+    def __getitem__(self, node_type: str) -> list[Trial]:
+        return getattr(self, node_type)
+
+    def __setitem__(self, node_type: str, idx: int) -> None:
+        setattr(self, node_type, idx)
diff --git a/autointent/context/optimization_info/logger.py b/autointent/context/optimization_info/logger.py
@@ -0,0 +1,25 @@
+import logging
+from pprint import pformat
+
+
+def get_logger() -> logging.Logger:
+    logger = logging.getLogger(__name__)
+
+    formatter = PPrintFormatter()
+    ch = logging.StreamHandler()
+    ch.setFormatter(formatter)
+    logger.addHandler(ch)
+
+    return logger
+
+
+class PPrintFormatter(logging.Formatter):
+    def __init__(self):
+        super().__init__(fmt="{asctime} - {name} - {levelname} - {message}", style="{")
+
+    def format(self, record):
+        if isinstance(record.msg, dict):
+            format_msg = "module scoring results:\n"
+            dct_to_str = pformat(record.msg)
+            record.msg = format_msg + dct_to_str
+        return super().format(record)
diff --git a/autointent/context/optimization_info/optimization_info.py b/autointent/context/optimization_info/optimization_info.py
@@ -0,0 +1,80 @@
+import numpy as np
+
+from .data_models import Artifact, Artifacts, NDArray, RetrieverArtifact, ScorerArtifact, Trial, Trials, TrialsIds
+from .logger import get_logger
+
+
+class OptimizationInfo:
+    """TODO continous IO with file system (to be able to restore the state of optimization)"""
+
+    def __init__(self):
+        self._logger = get_logger()
+
+        self.artifacts = Artifacts()
+        self.trials = Trials()
+        self._trials_best_ids = TrialsIds()
+
+    def log_module_optimization(
+        self,
+        node_type: str,
+        module_type: str,
+        module_params: dict,
+        metric_value: float,
+        metric_name: str,
+        artifact: Artifact,
+    ):
+        """
+        Purposes:
+        - save optimization results in a text form (hyperparameters and corresponding metrics)
+        - update best assets
+        """
+
+        # save trial
+        trial = Trial(
+            module_type=module_type,
+            metric_name=metric_name,
+            metric_value=metric_value,
+            module_params=module_params,
+        )
+        self.trials[node_type].append(trial)
+        self._logger.info(trial.model_dump())
+
+        # save artifact
+        self.artifacts[node_type].append(artifact)
+
+    def _get_metrics_values(self, node_type: str) -> list[float]:
+        return [trial.metric_value for trial in self.trials[node_type]]
+
+    def _get_best_trial_idx(self, node_type: str) -> int:
+        res = self._trials_best_ids[node_type]
+        if res is not None:
+            return res
+        res = np.argmax(self._get_metrics_values(node_type))
+        self._trials_best_ids[node_type] = res
+        return res
+
+    def _get_best_artifact(self, node_type: str) -> Artifact:
+        i_best = self._get_best_trial_idx(node_type)
+        return self.artifacts[node_type][i_best]
+
+    def get_best_embedder(self) -> str:
+        best_retriever_artifact: RetrieverArtifact = self._get_best_artifact(node_type="retrieval")
+        return best_retriever_artifact.embedder_name
+
+    def get_best_test_scores(self) -> NDArray[np.float64]:
+        best_scorer_artifact: ScorerArtifact = self._get_best_artifact(node_type="scoring")
+        return best_scorer_artifact.test_scores
+
+    def get_best_oos_scores(self) -> NDArray[np.float64]:
+        best_scorer_artifact: ScorerArtifact = self._get_best_artifact(node_type="scoring")
+        return best_scorer_artifact.oos_scores
+
+    def dump(self):
+        node_wise_metrics = {
+            node_type: self._get_metrics_values(node_type)
+            for node_type in ["regexp", "retrieval", "scoring", "prediction"]
+        }
+        return {
+            "metrics": node_wise_metrics,
+            "configs": self.trials.model_dump(),
+        }
diff --git a/autointent/context/optimization_logs.py b/autointent/context/optimization_logs.py
diff --git a/autointent/modules/prediction/base.py b/autointent/modules/prediction/base.py
@@ -30,9 +30,9 @@ def clear_cache(self):
 
 def get_prediction_evaluation_data(context: Context):
     labels = context.data_handler.labels_test
-    scores = context.optimization_logs.get_best_test_scores()
+    scores = context.optimization_info.get_best_test_scores()
 
-    oos_scores = context.optimization_logs.get_best_oos_scores()
+    oos_scores = context.optimization_info.get_best_oos_scores()
     if oos_scores is not None:
         oos_labels = [[0] * context.n_classes] * len(oos_scores) if context.multilabel else [-1] * len(oos_scores)
         labels = np.concatenate([labels, oos_labels])

diff --git a/autointent/modules/prediction/tunable.py b/autointent/modules/prediction/tunable.py
@@ -5,7 +5,7 @@
 from optuna.trial import Trial
 from sklearn.metrics import f1_score
 
-from .base import Context, PredictionModule
+from .base import Context, PredictionModule, get_prediction_evaluation_data
 from .threshold import multiclass_predict, multilabel_predict
 
 
@@ -24,9 +24,10 @@ def fit(self, context: Context):
             )
 
         thresh_optimizer = ThreshOptimizer(n_classes=context.n_classes, multilabel=context.multilabel)
+        labels, scores = get_prediction_evaluation_data(context)
         thresh_optimizer.fit(
-            probas=context.optimization_logs.get_best_test_scores(),
-            labels=context.data_handler.labels_test,
+            probas=scores,
+            labels=labels,
             seed=context.seed,
             tags=self.tags,
         )

diff --git a/autointent/modules/retrieval/vectordb.py b/autointent/modules/retrieval/vectordb.py
@@ -4,6 +4,7 @@
 from chromadb import Collection
 
 from autointent.context import Context
+from autointent.context.optimization_info import RetrieverArtifact
 from autointent.metrics import RetrievalMetricFn
 
 from .base import RetrievalModule
@@ -26,8 +27,8 @@ def score(self, context: Context, metric_fn: RetrievalMetricFn) -> tuple[float,
         )
         return metric_fn(context.data_handler.labels_test, labels_pred)
 
-    def get_assets(self):
-        return self.model_name
+    def get_assets(self) -> RetrieverArtifact:
+        return RetrieverArtifact(embedder_name=self.model_name)
 
     def clear_cache(self):
         model = self.collection._embedding_function._model  # noqa: SLF001

diff --git a/autointent/modules/scoring/base.py b/autointent/modules/scoring/base.py
@@ -2,6 +2,7 @@
 
 import numpy as np
 
+from autointent.context.optimization_info import ScorerArtifact
 from autointent.metrics import ScoringMetricFn
 from autointent.modules.base import Context, Module
 
@@ -21,8 +22,8 @@ def score(self, context: Context, metric_fn: ScoringMetricFn) -> tuple[float, np
             self._oos_scores = self.predict(context.data_handler.oos_utterances)
         return res
 
-    def get_assets(self):
-        return {"test_scores": self._test_scores, "oos_scores": self._oos_scores}
+    def get_assets(self) -> ScorerArtifact:
+        return ScorerArtifact(test_scores=self._test_scores, oos_scores=self._oos_scores)
 
     @abstractmethod
     def predict(self, utterances: list[str]):

diff --git a/autointent/nodes/base.py b/autointent/nodes/base.py
@@ -45,7 +45,7 @@ def fit(self, context: Context):
                 metric_value = module.score(context, self.metrics_available[self.metric_name])
 
                 assets = module.get_assets()
-                context.optimization_logs.log_module_optimization(
+                context.optimization_info.log_module_optimization(
                     self.node_type,
                     module_type,
                     module_kwargs,