Model: Fix logprobs unwrapping

Take a log of the token probs since they're already normalized which reflects the proper value. Also, don't error out if a token prob doesn't exist in the dict and return None instead from zip. Signed-off-by: kingbri <[email protected]>
theroyallab · Feb 9, 2024 · 43bba52 · 43bba52
1 parent c7428f0
commit 43bba52
Showing 1 changed file with 5 additions and 2 deletions.
diff --git a/backends/exllamav2/model.py b/backends/exllamav2/model.py
@@ -1,5 +1,6 @@
 """The model container class for ExLlamaV2 models."""
 import gc
+from itertools import zip_longest
 import pathlib
 import time
 
@@ -486,9 +487,11 @@ def get_logprobs(self, logits: torch.Tensor, max_logprobs: int):
         )
         top_values = top_values[0].tolist()
 
-        return dict(zip(top_tokens, top_values, strict=True))
+        return dict(zip_longest(top_tokens, top_values))
 
     def get_token_probs(self, token_ids: torch.tensor, token_probs: torch.Tensor):
+        normalized_probs = torch.log(token_probs)
+
         tokens = list(
             map(
                 lambda index: self.tokenizer.extended_id_to_piece.get(
@@ -498,7 +501,7 @@ def get_token_probs(self, token_ids: torch.tensor, token_probs: torch.Tensor):
             )
         )
 
-        return dict(zip(tokens, token_probs[0].tolist(), strict=True))
+        return dict(zip_longest(tokens, normalized_probs[0].tolist()))
 
     def generate(self, prompt: str, **kwargs):
         """Generate a response to a prompt"""