国内直连 · HTTPS · 支持断点续传(Range)。所有 4090/CPU/构建机统一从此拉取,无需访问外网原始仓库。
完整清单: DEPENDENCIES.md
# ① 拉一个模型目录(HuggingFace 布局, vLLM 可直接挂载) bash <(curl -fsSL https://file.liaoms.net/scripts/pull_model.sh) qwen3-8b-instruct /var/lib/model-cache # ② 导入容器镜像 curl -fL -O https://file.liaoms.net/images/vllm_vllm-openai_v0.11.0.tar.zst zstd -d vllm_vllm-openai_v0.11.0.tar.zst -c | sudo ctr -n k8s.io image import - # 或 docker load # ③ 离线 Helm curl -fL -O https://file.liaoms.net/charts/redis-20.6.0.tgz && helm install redis ./redis-20.6.0.tgz -n redis # ④ 离线 pip pip install --no-index --find-links https://file.liaoms.net/pip/ -r requirements.txt
| 目录 | Hub ID | 引擎 | 量化 |
|---|---|---|---|
| qwen3guard | Qwen/Qwen3Guard-Gen-8B | vLLM | BF16 |
| qwen3-8b-instruct | Qwen/Qwen3-8B | vLLM | BF16 |
| qwen3-vl-8b-instruct | Qwen/Qwen3-VL-8B-Instruct | vLLM | BF16 |
| qwen3-14b-instruct-awq | Qwen/Qwen3-14B-AWQ | vLLM | AWQ INT4 |
| qwen3-asr-1.7b | Qwen/Qwen3-ASR-1.7B | Triton | BF16 |
| triton/* | nudenet · paddleocr · rtdetr · sed · ecapa_tdnn | Triton | ONNX/原始权重 |
版本基线源自 06_服务器部署手册 附录 C;镜像 tag 全部钉死。