脚下瞬闪指令，玩出新花样！

随着OpenAI的图像生成技术完成重大升级，新的挑战也随之出现。

OpenAI的CEO萨姆・奥尔特曼（Sam Altman）表示，ChatGPT的文生图应用需求过于旺盛，导致我们的GPU承载压力过大，甚至“不堪重负”。为了提高效率，我们暂时对图像生成功能进行速率限制。这意味着OpenAI将对图像生成功能实施临时限速，降低单位时间内的请求处理量，以缓解GPU的压力，并优先保障文本生成、对话等核心功能的稳定性。这可能会暂时放缓图像生成技术的优化步伐。

据OpenAI消息，当地时间3月25日，OpenAI正式推出了GPT-4o图像生成功能。该功能一经推出，便因其便利性和创意性迅速火爆，互联网上涌现出大量以个人照片、知名梗图为基础的“吉卜力”卡通风格图片。

据OpenAI介绍，GPT-4o图像生成功能具备四大核心优势：精准的文本渲染能力、严格的指令遵循能力、深度的知识调用能力以及强大的创意拓展能力。在实际测试中，GPT-4o表现出了令人印象深刻的能力。在生成带有特定文字的图片时，它精准地还原了内容，并在短时间内完成。在应对复杂指令时，它也能保持高遵循度并呈现出令人惊叹的细节精准度。

尽管存在一些对中文理解能力的不足，但在实用性测试中，GPT-4o的表现依然出色。无论是生成餐厅菜单还是科学示意图，它都能满足用户需求并呈现出令人满意的效果。GPT-4o的推出标志着“创作自由的新高点”，为用户释放更多视觉创意潜能提供了强大工具。

作为AI领域的领军企业，OpenAI背后依托的GPU储备自然是业内顶尖。根据技术咨询公司Omdia的分析，微软作为OpenAI的主要投资者，购买了大量英伟达的Hopper芯片，是其竞争对手Meta的两倍，这使得微软成为英伟达GPU的最大买家。OpenAI的大模型正是利用微软的Azure云基础设施进行训练的。