iFlow CLI 模型编码能力评测

iFlowCLI 目前支持 MiniMax-M2、GLM-4.6、Qwen3-Coder-plus、DeepSeek-3.2、kimi-k2-thinking 等模型，以下对其编码能力进行评测。

结论

目前 iFlowCLI 建议选择 GLM-4.6。

值得注意的是，本文的结论均是在 iFlowCLI 中使用时的结论，如果在另外的框架中使用会有不同的结果,因为框架与模型会有一定的适配度。

GLM-4.6：所提出的功能都会去实现，不会遗漏；交付的代码仅有少量报错（300 行代码报错1行，import 包没引）
MiniMax-M2：所提出的功能都会去实现，不会遗漏；但是交付的代码报错较多，比如 import 包没引，方法参数类型不匹配，上下文消耗较多
Qwen3-Coder-plus：所提出的功能都会去实现，不会遗漏；但是交付的代码报错较多，比如引用了不存在的变量
kimi-k2-thinking：所提出的功能都会去实现，不会遗漏；但是交付的代码有少量报错，比如会引用没有创建的方法，部分逻辑出错，最崩溃的是速度太慢了，生成 300 行的代码需要 10 几分钟

说明1：import 包没引错误，属于基础错误

正确：

java

import java.util.List;
import java.util.ArrayList;

public void hello(){
    List<String> xList = new ArrayList<>();
}

模型犯错：

java

public void hello(){
    List<String> xList = new ArrayList<>(); // 模型没引包，直接使用
}

说明2：方法参数类型不匹配，给定a方法：

java

public void a(String x) {
    List<String> xList = new ArrayList<>();
}

正确：

java

public String b() {
    return "hi";
}

public void c() {
    a(b()); // 方法参数类型匹配
}

模型犯错：

java

public List<String> b() {
    return Lists.newArrayList("hi");
}

public void c() {
    a(b()); // 方法参数类型匹配
}