这里推荐一个本地微调大模型的框架。
ZO2,一个仅用18G显存就能全参微调175B大模型的框架(当然也支持微调小一些的模型)。
更新:现在ZO2支持Qwen3啦,全参微调32B的版本只需要6GB显存。
Code: ***s://github***/liangyuwang/zo2 Paper: ***s://arxiv.org/abs/2503.12668。
{dede:pagebreak/}
你和你老婆是怎么认识的?
二氧化碳人工合成淀粉技术现在怎么没动静了?
为什么国外网站总喜欢弹出cookie访问权限弹窗,国内网站却没有,这么做有什么意义?
买到烂尾楼到底该有多绝望?
为什么说PostgreSQL前途无量?
你最喜欢哪门编程语言?为什么?
5 月 28 日 DeepSeek R1 模型完成小版本试升级并开源,具体有哪些提升?使用体验如何?
为什么我看了凡人修仙传后再看其它修仙***都感觉看不下去?
颈椎病可以恢复吗?
F-35作战半径1100公里,以色列距离伊朗首都德黑兰1600公里。以色列F-35是如何轰炸伊朗的?
杨幂论文一年间 AI 率从 0 飙至 91%,为什么会这样?AI 查重到底有没有统一标准?
慈禧为什么要反对戊戌变法?
Caddy 和 Nginx 比有哪些优点和缺点?
为什么中国主机带宽比美国贵5倍(原来错误的10000倍),比如阿里云?
微软暂停专用 Xbox 掌机开发,转而优化 Windows 11 的掌机游戏体验,这背后原因有哪些?
网传厦门某国企研发部门要求每日考察后端 400 行,前端 1000 行代码量,如属实,这个考核合理吗?