OpenAI发布GPT-image-1模型,探索图像生成与API开发的创意应用

凌晨1点30分,OpenAI正式推出了全新的图像生成模型GPT-image-1,并通过API向全球开发者开放使用权限。这款模型与ChatGPT版本存在显著差异,支持多种高级功能定制,例如生成图像的敏感度控制、效率优化、背景调整、输出格式选择、渲染质量以及压缩质量等。此外,它还支持近期备受关注的吉卜力风格模式。目前,Adobe、Figma、HeyGen和Wix等知名企业已将该模型集成到其产品中。

值得注意的是,新模型的API使用了全新的身份验证机制。如果用户无法通过验证,可以借助微软Azure云服务进行体验。更多详细信息可参考官方文档:[https://platform.openai.com/docs/guides/image-generation?image-generation-model=GPT-image-1](https://platform.openai.com/docs/guides/image-generation?image-generation-model=GPT-image-1)

GPT-image-1的实际应用案例
目前,许多知名企业已经开始在实际业务中应用GPT-image-1模型。例如:
– 多媒体巨头Adobe将其整合到Firefly和Express应用中,为用户提供多样化的图片风格。
– 云设计平台Figma通过简单的提示即可生成和编辑图像,帮助设计师快速获取灵感并完成视觉迭代。
– AI视频平台HeyGen利用GPT-image-1增强头像创建功能,特别是改进了平台内的头像编辑能力。
– 云开发平台Wix借助GPT-image-1,帮助用户快速将创意转化为现实。
– 图像设计平台Photoroom正在使用GPT-image-1,为在线卖家提供即时生成高质量视觉效果的服务,包括生活场景和模特照片。

高级定制功能
GPT-image-1的API支持丰富的高级定制选项。例如:
– 开发者可以通过设置N参数一次性生成多张图像,而无需多次调用API。
– 支持多张图像作为提示词进行合成,例如将四张单图合成为一张完整的礼品图像。
– 提供类似Photoshop中的蒙版功能,允许开发者对图像进行局部编辑。
– 更改图片透明度只需将background参数设置为transparent,但仅支持png和webp格式输出。
– 开发者还可以通过API调整图像尺寸(1024×1024、1024×1536或自动)、渲染质量(low、medium、high)以及JPEG和WebP格式的压缩级别(0-100%)。

这些功能赋予了用户极高的自由度,能够轻松实现复杂创意。在定价方面,文本输入每100万token收费5美元,图像输入每100万token收费510美元,图像输出每100万token收费40美元。具体到实际使用中,低质量1024×1024图像生成成本约为每张0.02美元,中等质量图像约为每张0.07美元,高质量图像约为每张0.19美元。

OpenAI首席执行官兼联合创始人Sam Altman对该模型给予了高度评价,称其与ChatGPT版本存在显著差异。网友们也纷纷表示,此次API发布对开发者意义重大,尤其是在图像编辑领域,开启了众多前所未有的创意应用场景。

网友热议
许多人认为,GPT-image-1的推出可能会取代DALL-E系列模型。图像生成功能的集成进一步拓宽了API用户的创意可能性,期待看到更多开发者将其应用于实际场景。这一创新不仅令人瞩目,而且提供了更深层次的控制能力,特别是在特定应用场景下,自定义审核敏感度和平衡质量与速度的功能可能带来行业变革。

本文来源: ​ AIGC开放社区公众号【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...