robert-mcdermott · November 2, 2025 03:24
diff --git a/vllm-docker-spark.sh b/vllm-docker-spark.sh
 docker run -it --gpus all --ipc=host --ulimit memlock=-1 --ulimit stack=67108864 \
 -p 8900:8000 \
 -v ~/.cache/huggingface:/root/.cache/huggingface \
 nvcr.io/nvidia/vllm:25.09-py3 \
 vllm serve "Qwen/Qwen3-1.7B"
	docker run -it --gpus all --ipc=host --ulimit memlock=-1 --ulimit stack=67108864 \
	-p 8900:8000 \
	-v ~/.cache/huggingface:/root/.cache/huggingface \
	nvcr.io/nvidia/vllm:25.09-py3 \
	vllm serve "Qwen/Qwen3-1.7B"
No results found