ChatGPT升级!多模态功能即将上线
张小虎
发布于 2023-09-27 14:00
28727
据澎湃新闻消息,ChatGPT 于近日进行了一次重要更新,不管是 GPT-4 还是 GPT-3.5 模型,现在都可以基于图像进行分析和对话了。
ChatGPT 中的新图像识别功能允许用户使用 GPT-3.5 或 GPT-4 模型上传一张或多张图像配合进行对话。
OpenAI 在其宣传博客文章中声称该功能可用于各种日常应用:从通过拍摄冰箱和食品储藏室的照片来让 AI 决定晚餐吃什么,到排除烧烤炉无法启动的原因。OpenAI 还表示,你可以使用设备的触摸屏圈出他们希望 ChatGPT 关注的图像部分。
OpenAI 还表示,ChatGPT 的移动端 App 还将添加语音合成选项,与现有的语音识别功能配合使用时,我们就能与人工智能助手进行完全直接的口头对话。
与此同时,在音频方面,ChatGPT 新的语音合成功能据说由 OpenAI 所称的「新文本到语音模型」驱动,尽管文本到语音问题已经解决了很长时间。该公司表示,该功能推出后,用户可以在应用设置中选择语音对话,然后从「Juniper」、「Sky」、「Cove」、「Ember」和「Breeze」等五种不同的合成声音中进行选择。OpenAI 表示,这些声音都是与专业配音演员合作制作的。
今年 3 月,OpenAI 上线 GPT-4 ,展示了 AI 模型的多模态功能,能够明显感觉到的是 GPT-4 对文本和图像强大的处理能力,但有个问题,这种功能普通用户都无法使用。
截图源自4A广告网
也就是说,此次更新,对于广告营销人员来说也是一件便利事。在继承了强大的图文能力后,增加“基于图像进行分析和对话”后,整体的创意过程也会更加具体和有趣。
ChatGPTGPT-4ChatGPT升级ChatGPT多模态功能
声明
1、该内容为作者独立观点,不代表4A广告网观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、如对本稿件有异议或投诉,请联系:info@4Anet.com
2、如对本稿件有异议或投诉,请联系:info@4Anet.com
张小虎
4A圈资深广告狂,喜欢研究创意,爱聊广告的所有八卦