fuzboxz · October 11, 2025 09:59
diff --git a/A Local LLM Stack.md b/A Local LLM Stack.md
diff --git a/Caddyfile b/Caddyfile
 # Replace localhost with hostname
 localhost:3000 {
    reverse_proxy open-webui:8080
    tls internal
 }
diff --git a/docker-compose.yaml b/docker-compose.yaml
 name: llmstack
 x-logging:
  default: &default
    driver: "json-file"
    options:
      max-size: "10m"
      max-file: "3"

 services:
  # LLM Runtime
  ollama:
    container_name: ${COMPOSE_PROJECT_NAME}-ollama
    image: ollama/ollama:latest
    runtime: nvidia
    environment:
      - NVIDIA_VISIBLE_DEVICES=all
      - NVIDIA_DRIVER_CAPABILITIES=compute,utility
      - CUDA_VISIBLE_DEVICES=0
      - LOG_LEVEL=debug
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              capabilities: [gpu]
              count: all
    # --- CHANGED: Using local bind mount for model data ---
    volumes:
      - ./ollama_data:/root/.ollama
    networks:
      - llm_network
    labels:
      - "com.centurylinklabs.watchtower.enable=true"
    logging: *default
    restart: unless-stopped

  # Open Web UI
  open-webui:
    image: ghcr.io/open-webui/open-webui:cuda
    container_name: ${COMPOSE_PROJECT_NAME}-open-webui
    # --- CHANGED: Using local bind mount for Open WebUI data ---
    volumes:
      - ./openwebui_data:/app/backend/data
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: all
              capabilities: [gpu]
    networks:
      - llm_network
    environment:
      - 'OLLAMA_BASE_URL=http://ollama:11434'
    depends_on:
      - ollama
    labels:
      - "com.centurylinklabs.watchtower.enable=true"
    logging: *default
    restart: unless-stopped

  # Reverse proxy
  caddy:
    container_name: ${COMPOSE_PROJECT_NAME}-caddy
    image: caddy:2.9-alpine
    ports:
      - "3000:3000"
    volumes:
      - ./Caddyfile:/etc/caddy/Caddyfile
      - ./caddy_data:/data
      - ./caddy_config:/config
    networks:
      - llm_network
    depends_on:
      - open-webui
    labels:
      - "com.centurylinklabs.watchtower.enable=true"
    logging: *default
    restart: unless-stopped

  # Auto update
  watchtower:
    container_name: ${COMPOSE_PROJECT_NAME}-watchtower
    image: containrrr/watchtower
    volumes:
      - /var/run/docker.sock:/var/run/docker.sock
    command: >
      --cleanup=true
      --label-enable
      --interval=300
    networks:
      - llm_network
    labels:
      - "com.centurylinklabs.watchtower.enable=true"
    logging: *default
    restart: unless-stopped

 networks:
  llm_network:
    driver: bridge
	# Replace localhost with hostname
	localhost:3000 {
	reverse_proxy open-webui:8080
	tls internal
	}
	name: llmstack
	x-logging:
	default: &default
	driver: "json-file"
	options:
	max-size: "10m"
	max-file: "3"

	services:
	# LLM Runtime
	ollama:
	container_name: ${COMPOSE_PROJECT_NAME}-ollama
	image: ollama/ollama:latest
	runtime: nvidia
	environment:
	- NVIDIA_VISIBLE_DEVICES=all
	- NVIDIA_DRIVER_CAPABILITIES=compute,utility
	- CUDA_VISIBLE_DEVICES=0
	- LOG_LEVEL=debug
	deploy:
	resources:
	reservations:
	devices:
	- driver: nvidia
	capabilities: [gpu]
	count: all
	# --- CHANGED: Using local bind mount for model data ---
	volumes:
	- ./ollama_data:/root/.ollama
	networks:
	- llm_network
	labels:
	- "com.centurylinklabs.watchtower.enable=true"
	logging: *default
	restart: unless-stopped

	# Open Web UI
	open-webui:
	image: ghcr.io/open-webui/open-webui:cuda
	container_name: ${COMPOSE_PROJECT_NAME}-open-webui
	# --- CHANGED: Using local bind mount for Open WebUI data ---
	volumes:
	- ./openwebui_data:/app/backend/data
	deploy:
	resources:
	reservations:
	devices:
	- driver: nvidia
	count: all
	capabilities: [gpu]
	networks:
	- llm_network
	environment:
	- 'OLLAMA_BASE_URL=http://ollama:11434'
	depends_on:
	- ollama
	labels:
	- "com.centurylinklabs.watchtower.enable=true"
	logging: *default
	restart: unless-stopped

	# Reverse proxy
	caddy:
	container_name: ${COMPOSE_PROJECT_NAME}-caddy
	image: caddy:2.9-alpine
	ports:
	- "3000:3000"
	volumes:
	- ./Caddyfile:/etc/caddy/Caddyfile
	- ./caddy_data:/data
	- ./caddy_config:/config
	networks:
	- llm_network
	depends_on:
	- open-webui
	labels:
	- "com.centurylinklabs.watchtower.enable=true"
	logging: *default
	restart: unless-stopped

	# Auto update
	watchtower:
	container_name: ${COMPOSE_PROJECT_NAME}-watchtower
	image: containrrr/watchtower
	volumes:
	- /var/run/docker.sock:/var/run/docker.sock
	command: >
	--cleanup=true
	--label-enable
	--interval=300
	networks:
	- llm_network
	labels:
	- "com.centurylinklabs.watchtower.enable=true"
	logging: *default
	restart: unless-stopped

	networks:
	llm_network:
	driver: bridge