脚下瞬闪指令,玩出新花样!

随着OpenAI的图像生成技术完成重大升级,新的挑战也随之出现。

OpenAI的CEO萨姆・奥尔特曼(Sam Altman)表示,ChatGPT的文生图应用需求过于旺盛,导致我们的GPU承载压力过大,甚至“不堪重负”。为了提高效率,我们暂时对图像生成功能进行速率限制。这意味着OpenAI将对图像生成功能实施临时限速,降低单位时间内的请求处理量,以缓解GPU的压力,并优先保障文本生成、对话等核心功能的稳定性。这可能会暂时放缓图像生成技术的优化步伐。

据OpenAI消息,当地时间3月25日,OpenAI正式推出了GPT-4o图像生成功能。该功能一经推出,便因其便利性和创意性迅速火爆,互联网上涌现出大量以个人照片、知名梗图为基础的“吉卜力”卡通风格图片。

据OpenAI介绍,GPT-4o图像生成功能具备四大核心优势:精准的文本渲染能力、严格的指令遵循能力、深度的知识调用能力以及强大的创意拓展能力。在实际测试中,GPT-4o表现出了令人印象深刻的能力。在生成带有特定文字的图片时,它精准地还原了内容,并在短时间内完成。在应对复杂指令时,它也能保持高遵循度并呈现出令人惊叹的细节精准度。

尽管存在一些对中文理解能力的不足,但在实用性测试中,GPT-4o的表现依然出色。无论是生成餐厅菜单还是科学示意图,它都能满足用户需求并呈现出令人满意的效果。GPT-4o的推出标志着“创作自由的新高点”,为用户释放更多视觉创意潜能提供了强大工具。

作为AI领域的领军企业,OpenAI背后依托的GPU储备自然是业内顶尖。根据技术咨询公司Omdia的分析,微软作为OpenAI的主要投资者,购买了大量英伟达的Hopper芯片,是其竞争对手Meta的两倍,这使得微软成为英伟达GPU的最大买家。OpenAI的大模型正是利用微软的Azure云基础设施进行训练的。