4090 审核系统 v3.0 · 部署依赖离线镜像站

国内直连 · HTTPS · 支持断点续传(Range)。所有 4090/CPU/构建机统一从此拉取，无需访问外网原始仓库。

常用拉取范式

# ① 拉一个模型目录(HuggingFace 布局, vLLM 可直接挂载)
bash <(curl -fsSL https://file.liaoms.net/scripts/pull_model.sh) qwen3-8b-instruct /var/lib/model-cache

# ② 导入容器镜像
curl -fL -O https://file.liaoms.net/images/vllm_vllm-openai_v0.11.0.tar.zst
zstd -d vllm_vllm-openai_v0.11.0.tar.zst -c | sudo ctr -n k8s.io image import -   # 或 docker load

# ③ 离线 Helm
curl -fL -O https://file.liaoms.net/charts/redis-20.6.0.tgz && helm install redis ./redis-20.6.0.tgz -n redis

# ④ 离线 pip
pip install --no-index --find-links https://file.liaoms.net/pip/ -r requirements.txt

模型清单(对应 /models/)

目录	Hub ID	引擎	量化
qwen3guard	Qwen/Qwen3Guard-Gen-8B	vLLM	BF16
qwen3-8b-instruct	Qwen/Qwen3-8B	vLLM	BF16
qwen3-vl-8b-instruct	Qwen/Qwen3-VL-8B-Instruct	vLLM	BF16
qwen3-14b-instruct-awq	Qwen/Qwen3-14B-AWQ	vLLM	AWQ INT4
qwen3-asr-1.7b	Qwen/Qwen3-ASR-1.7B	Triton	BF16
triton/*	nudenet · paddleocr · rtdetr · sed · ecapa_tdnn	Triton	ONNX/原始权重

版本基线源自 06_服务器部署手册附录 C；镜像 tag 全部钉死。