混合生图压测报告

run = mixed-load-2026-06-21T15-03-23-911Z
端点模式 = mixed-load · model = gpt-image-2 · 并发 = 500 · 时长 = 120s · 超时 = 600s
完成请求
724
成功
705
失败
19
成功率
97.4%
429
0
生成图片
705
图/分钟
90.29
总运行
468s

这次压测是怎么做的

这是一次混合并发压力测试,目的是看在大量用户同时请求时,出图服务还能不能稳定、快速地把图生成出来。

怎么施压:我们同时开了 500 条请求通道,每条通道都不停地发请求——发出一张、等它出图、马上再发下一张,持续不断地施压 120 秒。这样可以始终保持约 500 个请求“在路上”,模拟真实高峰期的并发压力。

测了哪两类活:每个请求会随机挑一种来做,贴近真实混合使用:

文生图:给一句文字描述,让服务直接画一张图(本次 341 次)
换装图生图:上传模特图和一件衣服,让服务把衣服“穿”到模特身上(本次 383 次)

每张图还会随机换“清晰度档位”:低、中、高三档轮流随机使用,这样能分别看出不同画质对成功率和耗时的影响(见下方“按 quality 区分”)。

怎么算成功:必须真正拿到图片才算成功;超过 600 秒还没出图、或服务报错,都算失败。

本次结果速览:累计发出 724 个请求,成功 705 个,平均每分钟出图约 90.29 张。测试线路:默认线路。由于出图本身较慢,最后一批请求要等它画完,所以总耗时(约 468 秒)会比 120 秒的施压时间长,这是正常现象。

按 quality 区分

quality请求数成功失败成功率生成图片429p50p90p95p99
low 260 254 6 97.7% 254 0 116493 159958 167034 188320
medium 235 234 1 99.6% 234 0 149050 193594 202999 217815
high 229 217 12 94.8% 217 0 246884 316791 328709 361863

按 size × quality 区分

每格为「请求数 · 成功率」,含行/列合计。
size\qualitylowmediumhigh合计
1K 1024x102491 97%77 100%74 93%242 97%
2K 2048x204885 99%78 99%78 95%241 98%
4K 3840x216084 98%80 100%77 96%241 98%
合计260 98%235 100%229 95%724 97%

按场景区分

场景请求数成功失败成功率生成图片429p50p90p95p99
文生图 341 324 17 95.0% 324 0 155986 284935 308187 360524
换装图生图 383 381 2 99.5% 381 0 156175 275482 310474 333736

请求明细

筛选 quality: · 筛选 size: ·
#场景qualitysizeformat状态码结果延迟(ms)错误