GoForum🌐 V2EX

qwen 本地大模型的问题

workbest · 2026-04-02 12:04 · 0 次点赞 · 2 条回复

我的机器是 M1 Pro ,32G 内存,部署本地模型主要是两个需求:

  1. 翻译
  2. 总结并做简单的分析提取内容

我一开始使用的是 qwen3.5-9b 和 qwen3.5-4b 的模型,测试的时候,可以用,但是在实际跑起来的时候,发现 qwen 会无限思考,经常 10 分钟都没有任何响应;后来换成了 qwen3-4b 的模型,效果比较好,很少出现无限思考的问题

2 条回复
lagrange7 · 2026-04-02 12:44
#1

是不是启动的时候设定不思考,会好一些?

xiaoz · 2026-04-02 12:49
#2

你直接调用参数里面设置下禁止思考呗。

添加回复
你还需要 登录 后发表回复

登录后可发帖和回复

登录 注册
主题信息
作者: workbest
发布: 2026-04-02
点赞: 0
回复: 0