Generate answer from embedding vectors #1897

leewoosub · 2025-01-16T04:46:37Z

Hi, I'm not familiar with llama-cpp-python (actually not familiar with cpp) but I have to use gguf model for my project.

I want to generate answer from pre-computed embedding vecotrs(torch.Tensor) with size (1, n_tokens, 4096), not from query text.
(Just like inputs_embeds argument of generate() function of transformers model)

Is this feature already implemented? If not, please anyone help me where should I begin.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Generate answer from embedding vectors #1897

Generate answer from embedding vectors #1897

leewoosub commented Jan 16, 2025

Generate answer from embedding vectors #1897

Generate answer from embedding vectors #1897

Comments

leewoosub commented Jan 16, 2025