`ssm` models have been deprecated in favor of `mamba` models #2739

mokeddembillel · 2024-11-10T22:30:38Z

System Info

System Specifications

+-----------------------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=========================================================================================|
| No running processes found |
+-----------------------------------------------------------------------------------------+

Reproducing Steps and Traceback

~/Desktop/Code/text-generation-inference/server$ SAFETENSORS_FAST_GPU=1 python text_generation_server/cli.py serve state-spaces/mamba-130m
2024-11-10 22:26:52.790 | INFO | text_generation_server.utils.import_utils::80 - Detected system cuda
/home/ubuntu/Desktop/Code/text-generation-inference/server/text_generation_server/utils/sgmv.py:18: UserWarning: Could not import SGMV kernel from Punica, falling back to loop.
warnings.warn("Could not import SGMV kernel from Punica, falling back to loop.")
Using prefix caching = True
Using Attention = flashinfer
Could not import Flash Attention enabled models: /opt/conda/envs/tgi/lib/python3.11/site-packages/moe_kernels/_moe_kernels_ops.cpython-311-x86_64-linux-gnu.so: undefined symbol: _ZNK3c105Error4whatEv
Error when initializing model
Traceback (most recent call last):
File "/home/ubuntu/Desktop/Code/text-generation-inference/server/text_generation_server/cli.py", line 373, in
app()
File "/opt/conda/envs/tgi/lib/python3.11/site-packages/typer/main.py", line 311, in call
return get_command(self)(*args, **kwargs)
File "/opt/conda/envs/tgi/lib/python3.11/site-packages/click/core.py", line 1157, in call
return self.main(*args, **kwargs)
File "/opt/conda/envs/tgi/lib/python3.11/site-packages/typer/core.py", line 778, in main
return _main(
File "/opt/conda/envs/tgi/lib/python3.11/site-packages/typer/core.py", line 216, in _main
rv = self.invoke(ctx)
File "/opt/conda/envs/tgi/lib/python3.11/site-packages/click/core.py", line 1688, in invoke
return _process_result(sub_ctx.command.invoke(sub_ctx))
File "/opt/conda/envs/tgi/lib/python3.11/site-packages/click/core.py", line 1434, in invoke
return ctx.invoke(self.callback, **ctx.params)
File "/opt/conda/envs/tgi/lib/python3.11/site-packages/click/core.py", line 783, in invoke
return __callback(*args, **kwargs)
File "/opt/conda/envs/tgi/lib/python3.11/site-packages/typer/main.py", line 683, in wrapper
return callback(**use_params) # type: ignore
File "/home/ubuntu/Desktop/Code/text-generation-inference/server/text_generation_server/cli.py", line 116, in serve
server.serve(
File "/home/ubuntu/Desktop/Code/text-generation-inference/server/text_generation_server/server.py", line 315, in serve
asyncio.run(
File "/opt/conda/envs/tgi/lib/python3.11/asyncio/runners.py", line 190, in run
return runner.run(main)
File "/opt/conda/envs/tgi/lib/python3.11/asyncio/runners.py", line 118, in run
return self._loop.run_until_complete(task)
File "/opt/conda/envs/tgi/lib/python3.11/asyncio/base_events.py", line 641, in run_until_complete
self.run_forever()
File "/opt/conda/envs/tgi/lib/python3.11/asyncio/base_events.py", line 608, in run_forever
self._run_once()
File "/opt/conda/envs/tgi/lib/python3.11/asyncio/base_events.py", line 1936, in _run_once
handle._run()
File "/opt/conda/envs/tgi/lib/python3.11/asyncio/events.py", line 84, in _run
self._context.run(self._callback, *self._args)

File "/home/ubuntu/Desktop/Code/text-generation-inference/server/text_generation_server/server.py", line 268, in serve_inner
model = get_model_with_lora_adapters(
File "/home/ubuntu/Desktop/Code/text-generation-inference/server/text_generation_server/models/init.py", line 1358, in get_model_with_lora_adapters
model = get_model(
File "/home/ubuntu/Desktop/Code/text-generation-inference/server/text_generation_server/models/init.py", line 631, in get_model
raise RuntimeError(
RuntimeError: ssm models have been deprecated in favor of mamba models, which follow standard HF formats. Check out a list here: https://huggingface.co/models?search=mamba%20-hf

Information

Docker
The CLI directly

Tasks

An officially supported command
My own modifications

Reproduction

SAFETENSORS_FAST_GPU=1 python text_generation_server/cli.py serve state-spaces/mamba-130m

Expected behavior

Web server started

The text was updated successfully, but these errors were encountered:

mokeddembillel · 2024-11-10T22:31:02Z

Solved the issue. Will submit a pull request.

mokeddembillel linked a pull request Nov 10, 2024 that will close this issue

Fix: Change model_type from ssm to mamba #2740

Open

5 tasks

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

`ssm` models have been deprecated in favor of `mamba` models #2739

`ssm` models have been deprecated in favor of `mamba` models #2739

mokeddembillel commented Nov 10, 2024

mokeddembillel commented Nov 10, 2024

ssm models have been deprecated in favor of mamba models #2739

ssm models have been deprecated in favor of mamba models #2739

Comments

mokeddembillel commented Nov 10, 2024

System Info

System Specifications

Reproducing Steps and Traceback

Information

Tasks

Reproduction

Expected behavior

mokeddembillel commented Nov 10, 2024

`ssm` models have been deprecated in favor of `mamba` models #2739

`ssm` models have been deprecated in favor of `mamba` models #2739