4090 审核系统 v3.0 · 部署依赖离线镜像站

国内直连 · HTTPS · 支持断点续传(Range)。所有 4090/CPU/构建机统一从此拉取,无需访问外网原始仓库。

目录

models/ 大模型权重 images/ 容器镜像 charts/ Helm 包 installers/ 系统安装件 pip/ Python 仓 scripts/ 拉取脚本

完整清单: DEPENDENCIES.md

常用拉取范式

# ① 拉一个模型目录(HuggingFace 布局, vLLM 可直接挂载)
bash <(curl -fsSL https://file.liaoms.net/scripts/pull_model.sh) qwen3-8b-instruct /var/lib/model-cache

# ② 导入容器镜像
curl -fL -O https://file.liaoms.net/images/vllm_vllm-openai_v0.11.0.tar.zst
zstd -d vllm_vllm-openai_v0.11.0.tar.zst -c | sudo ctr -n k8s.io image import -   # 或 docker load

# ③ 离线 Helm
curl -fL -O https://file.liaoms.net/charts/redis-20.6.0.tgz && helm install redis ./redis-20.6.0.tgz -n redis

# ④ 离线 pip
pip install --no-index --find-links https://file.liaoms.net/pip/ -r requirements.txt

模型清单(对应 /models/)

目录Hub ID引擎量化
qwen3guardQwen/Qwen3Guard-Gen-8BvLLMBF16
qwen3-8b-instructQwen/Qwen3-8BvLLMBF16
qwen3-vl-8b-instructQwen/Qwen3-VL-8B-InstructvLLMBF16
qwen3-14b-instruct-awqQwen/Qwen3-14B-AWQvLLMAWQ INT4
qwen3-asr-1.7bQwen/Qwen3-ASR-1.7BTritonBF16
triton/*nudenet · paddleocr · rtdetr · sed · ecapa_tdnnTritonONNX/原始权重

版本基线源自 06_服务器部署手册 附录 C;镜像 tag 全部钉死。