Как бенчмарк закрытой модели, у которой нету метода loglikelihood? #11

chorus12 · 2024-02-08T19:25:57Z

Добрый день.
Хотим поскорить закрытые модели - шаблон для Anthropic не работает(нет метода loglikelihood и токенизатора).
В самом фреймворке, который вы используете, есть метод генерации для закрытых моделей generate_until (no logprobs). Это как-то надо прикручивать к текущему коду оценки MERA?

artemorloff · 2024-02-09T13:30:09Z

Добрый день!
В данный момент скоринг моделей из Anthropic невозможен на нашем бенчмарке. Также OpenAI ChatCompletions невозможны, так как данные модели не возвращают логиты для поданных в них токенов (#10 и #5 ). Часть задач бенчмарка требует логиты для поданных в модель токенов (не для токенов генерации), что не позволяет скорить некоторые модели, доступные по API.
Скоринг моделей от OpenAI, которые возвращают логиты (например, davinci-002), вы можете осуществить в ветке openai_completions.
Мы работаем над усовершенствованием системы скоринга и будем рады вашим идеям и pull requests!

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Как бенчмарк закрытой модели, у которой нету метода loglikelihood? #11

Как бенчмарк закрытой модели, у которой нету метода loglikelihood? #11

chorus12 commented Feb 8, 2024

artemorloff commented Feb 9, 2024 •

edited

Loading

Как бенчмарк закрытой модели, у которой нету метода loglikelihood? #11

Как бенчмарк закрытой модели, у которой нету метода loglikelihood? #11

Comments

chorus12 commented Feb 8, 2024

artemorloff commented Feb 9, 2024 • edited Loading

artemorloff commented Feb 9, 2024 •

edited

Loading