OpenAI发布GPT-image-1模型，探索图像生成与API开发的创意应用

凌晨1点30分，OpenAI正式推出了全新的图像生成模型GPT-image-1，并通过API向全球开发者开放使用权限。这款模型与ChatGPT版本存在显著差异，支持多种高级功能定制，例如生成图像的敏感度控制、效率优化、背景调整、输出格式选择、渲染质量以及压缩质量等。此外，它还支持近期备受关注的吉卜力风格模式。目前，Adobe、Figma、HeyGen和Wix等知名企业已将该模型集成到其产品中。

值得注意的是，新模型的API使用了全新的身份验证机制。如果用户无法通过验证，可以借助微软Azure云服务进行体验。更多详细信息可参考官方文档：[https：//platform.openai.com/docs/guides/image-generation?image-generation-model=GPT-image-1](https：//platform.openai.com/docs/guides/image-generation?image-generation-model=GPT-image-1)

GPT-image-1的实际应用案例
目前，许多知名企业已经开始在实际业务中应用GPT-image-1模型。例如：
– 多媒体巨头Adobe将其整合到Firefly和Express应用中，为用户提供多样化的图片风格。
– 云设计平台Figma通过简单的提示即可生成和编辑图像，帮助设计师快速获取灵感并完成视觉迭代。
– AI视频平台HeyGen利用GPT-image-1增强头像创建功能，特别是改进了平台内的头像编辑能力。
– 云开发平台Wix借助GPT-image-1，帮助用户快速将创意转化为现实。
– 图像设计平台Photoroom正在使用GPT-image-1，为在线卖家提供即时生成高质量视觉效果的服务，包括生活场景和模特照片。

高级定制功能
GPT-image-1的API支持丰富的高级定制选项。例如：
– 开发者可以通过设置N参数一次性生成多张图像，而无需多次调用API。
– 支持多张图像作为提示词进行合成，例如将四张单图合成为一张完整的礼品图像。
– 提供类似Photoshop中的蒙版功能，允许开发者对图像进行局部编辑。
– 更改图片透明度只需将background参数设置为transparent，但仅支持png和webp格式输出。
– 开发者还可以通过API调整图像尺寸（1024×1024、1024×1536或自动）、渲染质量（low、medium、high）以及JPEG和WebP格式的压缩级别（0-100%）。

这些功能赋予了用户极高的自由度，能够轻松实现复杂创意。在定价方面，文本输入每100万token收费5美元，图像输入每100万token收费510美元，图像输出每100万token收费40美元。具体到实际使用中，低质量1024×1024图像生成成本约为每张0.02美元，中等质量图像约为每张0.07美元，高质量图像约为每张0.19美元。

OpenAI首席执行官兼联合创始人Sam Altman对该模型给予了高度评价，称其与ChatGPT版本存在显著差异。网友们也纷纷表示，此次API发布对开发者意义重大，尤其是在图像编辑领域，开启了众多前所未有的创意应用场景。

网友热议
许多人认为，GPT-image-1的推出可能会取代DALL-E系列模型。图像生成功能的集成进一步拓宽了API用户的创意可能性，期待看到更多开发者将其应用于实际场景。这一创新不仅令人瞩目，而且提供了更深层次的控制能力，特别是在特定应用场景下，自定义审核敏感度和平衡质量与速度的功能可能带来行业变革。

本文来源：