标签:豆包评测

硅星人Eval Eps.5|豆包专业版实测:做题家风格,办公有余,生产不足

在编码方面,模型在常规算法和基础修复中表现稳定,但代码缺乏函数拆分与结构分层,且默认输入理想化,缺少对异常数据的防御逻辑。面对系统级问题,模型无法...