Ailiaili
▼分类导航▲

注意:GPT-4.0又升级了!重磅升级多模态:图片交互对话功能上线!且支持上下文连续对话!

Ailiaili610639个月前
公众号:Ailiaili | AI软件网
Ai项目交流群,Ai账号交易充值,Ai软件分享,Ai网站导航,Ai工具大全等
复制公众号

这项图片识别功能得益于多模态的GPT-4技术,它们的语言理解能力应用到各种图片上,如照片、屏幕截图和包含文本与图片的文件。

向GPT展示一个图片。无论是为了解决烧烤架不启动的问题,还是为了规划一顿饭的食材,或是为工作相关数据分析一张复杂的图表,都可以轻松处理!

能想象得出吗?你用手机拍摄餐桌上美味的菜品,回家后将菜品照片输入GPT后,这个AI程序就能根据图片内容,能给你自动生成健康的食谱和制作方法。系统还可以提供制作这顿饭的逐步说明。真的吗?答案是肯定的。

这些新增功能让GPT更加融入日常生活。比如你在哈尔滨雪乡旅行中拍摄一个图片,与GPT即时讨论这景色的特点,并且以小红书的风格写一篇文章。

带给用户的另一个惊喜是,家长可以拍摄孩子的数学问题照片,然后寻求如何向孩子解释如何解决这个问题的建议。用户甚至可以标记图像的特定区域(例如用圆圈),以获取更具体的信息或关于该元素的帮助!

甚至你在外面吃饭还可以让他为你写出一个菜品及餐厅的点评。

如果你是一个短剧编辑,你甚至上传一张精美的摄影照片或者用MJ画一张有创意的海报,让他为你写出一个短剧剧本,可能只需要2分钟就可以完成创作。

如果你是一个农场主,假如你的棉花有了病虫害,你甚至可以拍照给GPT,让他为你的棉花诊断,甚至开出救治方案。

如果你看上了宜家家居里的装修风格或者家具布置,马上拍下来,让GPT马上就可以告诉你装修风格和家具布置。

这个全新功能给人们的生活带来了巨大的便利。首先,通过图片和语音命令交互,用户能够更加直观地表达自己的需求。无需费力编写文字描述,用户只需拍照或者说出需要的指令,就能够得到准确的回答或者完成任务。这对于那些不擅长键盘输入或者有特殊需求的人们来说,无疑是一种解放和便捷。

与其他GPT功能一样,视觉功能旨在协助日常生活,而最佳的协助方式是能够看到人们所看到的。这个功能对于那些无法阅读或听写的人们来说,尤其有着重要的意义。通过图片和语音命令交互,他们能够直接与GPT进行交流,获取所需信息。这为他们提供了与世界互动的新途径,帮助他们更好地融入社会。相信这个功能更能为一个为盲人和视力受损的人提供更多的帮助。


本文转载自互联网,若有侵权,请联系我们。本站尊重原创,转载文章仅为传递更多信息之目的。

本文链接:https://ailiaili.cc/post/221.html

【公众号 | 微信群】
\"二维码\"

公众号:AI软件网

【 Ai推荐榜 】
【 Ai常用工具 】
【 Ai最新收录 】
【 Ai知识 】
【 Ai资讯 】