Tags

5 个页面

Qwen

同一块 GPU，推理速度翻倍：Gemma 4 MTP 和 Qwen 3.6 MTP 同时来了

同一块 GPU，推理速度翻倍：Gemma 4 MTP 和 Qwen 3.6 MTP 同时来了

开源小模型的临界点：Qwen 3.5 用 9B 参数打败了 120B 的对手

开源小模型的临界点：Qwen 3.5 用 9B 参数打败了 120B 的对手

在cloudflare部署hugging face的免费api，可对接oneapi/newapi，免费使用Qwen2.5 72B等模型

在cloudflare部署hugging face的免费api，可对接oneapi/newapi，免费使用Qwen2.5 72B等模型

实现本地 RAG 服务：整合 Open WebUI、Ollama 和 Qwen2.5

实现本地 RAG 服务：整合 Open WebUI、Ollama 和 Qwen2.5

手把手教你构建一个本地化的，免费的，企业级的，AI大模型知识库问答系统

手把手教你构建一个本地化的，免费的，企业级的，AI大模型知识库问答系统