📣 OpenAI发布旗舰AI模型GPT-4o,将免费提供给所有用户
5月13日太平洋时间10时(北京时间5月14日1时),OpenAI 在“春季升级”发布会上正式推出最新旗舰AI模型GPT-4o,可以实时进行音频、视觉和文本推理。
GPT-4o 文本和图像输入今天(5月13日)开始在 API 和 ChatGPT 中推出,并且向所有用户免费开放 ,语音和视频模式将在未来几周内推出。
GPT-4o (“o”代表“omni”)是朝着更自然的人机交互迈出的一步——它接受文本、音频和图像的任何组合作为输入,并生成文本、音频和图像的任何组合输出。它可以在232毫秒内响应音频输入,平均为320毫秒,这与人类在对话中的响应时间(在新窗口中打开)相似。它在英语和代码文本上的表现与 GPT-4 Turbo 相当,在非英语语言文本上的表现有显著改善,同时在 API 上也更快、更便宜 50%。与现有模型相比,GPT-4o 在视觉和音频理解方面尤其出色。
暂无评论...