Tags
5 个页面
Qwen
同一块 GPU,推理速度翻倍:Gemma 4 MTP 和 Qwen 3.6 MTP 同时来了
开源小模型的临界点:Qwen 3.5 用 9B 参数打败了 120B 的对手
在cloudflare部署hugging face的免费api,可对接oneapi/newapi,免费使用Qwen2.5 72B等模型
实现本地 RAG 服务:整合 Open WebUI、Ollama 和 Qwen2.5
手把手教你构建一个 本地化的,免费的,企业级的,AI大模型知识库问答系统