ktransformers+unsloth混合框架搭载deepseek r1 671b-Q1 Q2 Q3 Q4多版本测速

作者: 变玩boy-DR天意

作者简介: 变形金刚玩家,任粉,《电子游戏软件》、《掌机迷》前文编“天意”。

描述: 测试平台: AMD EPYC 9654 96核 DDR5 4800MHZ 64GB*12 4090 24GB 涡轮*1 技嘉 MZ33-AR0 金士顿SNV2S4000G M.2  win server 2022 wsl2 ubuntu24.04 SMT关,NPS=1 kt0.2.3+unsloth联合(卸载flash infer,采用triton支持长上下文) wsl2 网络模式为nat,映射端口实现局域网调用api 32K上下文 4096 一次性最大生成tokens数

ktransformers+unsloth混合框架搭载deepseek r1 671b-Q1 Q2 Q3 Q4多版本测速

推荐视频

每秒10.8Tonkens,本地DeepSeek 671b q4

每秒10.8Tonkens,本地DeepSeek 671b q4

上传者: 爱跳绳的乃龙

KTransformers 团队直播答疑回放

KTransformers 团队直播答疑回放

上传者: KTransformers小助手

ktransformers搭建

ktransformers搭建

上传者: 秋天的s菠菜