混合生图压测报告

run = mixed-load-2026-06-21T15-11-40-763Z
端点模式 = mixed-load · model = gpt-image-2 · 并发 = 150 · 时长 = 60s · 超时 = 600s
完成请求
171
成功
166
失败
5
成功率
97.1%
429
0
生成图片
166
图/分钟
33.2
总运行
300s

这次压测是怎么做的

这是一次混合并发压力测试,目的是看在大量用户同时请求时,出图服务还能不能稳定、快速地把图生成出来。

怎么施压:我们同时开了 150 条请求通道,每条通道都不停地发请求——发出一张、等它出图、马上再发下一张,持续不断地施压 60 秒。这样可以始终保持约 150 个请求“在路上”,模拟真实高峰期的并发压力。

测了哪两类活:每个请求会随机挑一种来做,贴近真实混合使用:

文生图:给一句文字描述,让服务直接画一张图(本次 76 次)
换装图生图:上传模特图和一件衣服,让服务把衣服“穿”到模特身上(本次 95 次)

每张图还会随机换“清晰度档位”:低、中、高三档轮流随机使用,这样能分别看出不同画质对成功率和耗时的影响(见下方“按 quality 区分”)。

怎么算成功:必须真正拿到图片才算成功;超过 600 秒还没出图、或服务报错,都算失败。

本次结果速览:累计发出 171 个请求,成功 166 个,平均每分钟出图约 33.2 张。测试线路:默认线路。由于出图本身较慢,最后一批请求要等它画完,所以总耗时(约 300 秒)会比 60 秒的施压时间长,这是正常现象。

按 quality 区分

quality请求数成功失败成功率生成图片429p50p90p95p99
low 59 58 1 98.3% 58 0 63982 85618 89984 114718
medium 58 58 0 100.0% 58 0 91399 130865 151215 151600
high 54 50 4 92.6% 50 0 205307 282091 299858 299954

按 size × quality 区分

每格为「请求数 · 成功率」,含行/列合计。
size\qualitylowmediumhigh合计
1K 1024x102421 95%17 100%19 89%57 95%
2K 2048x204815 100%21 100%21 90%57 96%
4K 3840x216023 100%20 100%14 100%57 100%
合计59 98%58 100%54 93%171 97%

按场景区分

场景请求数成功失败成功率生成图片429p50p90p95p99
文生图 76 74 2 97.4% 74 0 77081 199611 213502 299874
换装图生图 95 92 3 96.8% 92 0 111261 222340 282091 299954

请求明细

筛选 quality: · 筛选 size: ·
#场景qualitysizeformat状态码结果延迟(ms)错误