Can refinement be used with any ASR? #406

entrider · 2024-10-13T16:22:25Z

entrider
Oct 13, 2024

Can .refine() be used in this example?

result = stable_whisper.transcribe_any(inference, './demo.wav', vad=True)
print(result.to_srt_vtt(word_level=False))

P.S. I use Whisper API.

Answered by jianfch

Oct 14, 2024

If the Whisper API does not return any tokens, you can manually add them to the result.

from stable_whisper.whisper_compatibility import get_tokenizer

result = stable_whisper.transcribe_any(inference, './demo.wav', vad=True)
model = stable_whisper.load_model('base')
tokenizer = get_tokenizer(model=model)
for word in result.all_words():
    word.tokens = tokenizer.encode(word.word)
model.refine('./demo.wav', result)

Note: the result must have word timestamps to begin with.

View full answer

jianfch · 2024-10-13T22:24:10Z

jianfch
Oct 13, 2024
Maintainer

Refinement is only supported on models loaded by stable_whisper.load_model().
But you can use it to refine results from stable_whisper.transcribe_any().

2 replies

entrider Oct 14, 2024
Author

What's wrong?

result = stable_whisper.transcribe_any(inference, './demo.wav', vad=True)
model = stable_whisper.load_model('base')
model.refine('./demo.wav', result)

NotImplementedError: The are missing tokens in the result. Refinement currently only supports results produced by ``transcribe()`` on vanilla Whisper models.

jianfch Oct 14, 2024
Maintainer

If the Whisper API does not return any tokens, you can manually add them to the result.

from stable_whisper.whisper_compatibility import get_tokenizer

result = stable_whisper.transcribe_any(inference, './demo.wav', vad=True)
model = stable_whisper.load_model('base')
tokenizer = get_tokenizer(model=model)
for word in result.all_words():
    word.tokens = tokenizer.encode(word.word)
model.refine('./demo.wav', result)

Note: the result must have word timestamps to begin with.

Answer selected by entrider

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Can refinement be used with any ASR? #406

{{title}}

Replies: 1 comment 2 replies

{{title}}

{{title}}

{{title}}

Select a reply

Can refinement be used with any ASR? #406

entrider Oct 13, 2024

Replies: 1 comment · 2 replies

jianfch Oct 13, 2024 Maintainer

entrider Oct 14, 2024 Author

jianfch Oct 14, 2024 Maintainer

entrider
Oct 13, 2024

Replies: 1 comment 2 replies

jianfch
Oct 13, 2024
Maintainer

entrider Oct 14, 2024
Author

jianfch Oct 14, 2024
Maintainer