ChatGPT升级！多模态功能即将上线

张小虎

发布于 2023-09-27 14:00

据澎湃新闻消息，ChatGPT 于近日进行了一次重要更新，不管是 GPT-4 还是 GPT-3.5 模型，现在都可以基于图像进行分析和对话了。

ChatGPT 中的新图像识别功能允许用户使用 GPT-3.5 或 GPT-4 模型上传一张或多张图像配合进行对话。

OpenAI 在其宣传博客文章中声称该功能可用于各种日常应用：从通过拍摄冰箱和食品储藏室的照片来让 AI 决定晚餐吃什么，到排除烧烤炉无法启动的原因。OpenAI 还表示，你可以使用设备的触摸屏圈出他们希望 ChatGPT 关注的图像部分。

OpenAI 还表示，ChatGPT 的移动端 App 还将添加语音合成选项，与现有的语音识别功能配合使用时，我们就能与人工智能助手进行完全直接的口头对话。

与此同时，在音频方面，ChatGPT 新的语音合成功能据说由 OpenAI 所称的「新文本到语音模型」驱动，尽管文本到语音问题已经解决了很长时间。该公司表示，该功能推出后，用户可以在应用设置中选择语音对话，然后从「Juniper」、「Sky」、「Cove」、「Ember」和「Breeze」等五种不同的合成声音中进行选择。OpenAI 表示，这些声音都是与专业配音演员合作制作的。

今年 3 月，OpenAI 上线 GPT-4 ，展示了 AI 模型的多模态功能，能够明显感觉到的是 GPT-4 对文本和图像强大的处理能力，但有个问题，这种功能普通用户都无法使用。

截图源自4A广告网

也就是说，此次更新，对于广告营销人员来说也是一件便利事。在继承了强大的图文能力后，增加“基于图像进行分析和对话”后，整体的创意过程也会更加具体和有趣。

ChatGPTGPT-4ChatGPT升级ChatGPT多模态功能

声明

1、该内容为作者独立观点，不代表4A广告网观点或立场，文章为作者本人上传，版权归原作者所有，未经允许不得转载。
2、如对本稿件有异议或投诉，请联系：info@4Anet.com