注意:GPT-4.0又升级了!重磅升级多模态:图片交互对话功能上线!且支持上下文连续对话!
Ai项目交流群,Ai账号交易充值,Ai软件分享,Ai网站导航,Ai工具大全等
复制公众号
这项图片识别功能得益于多模态的GPT-4技术,它们的语言理解能力应用到各种图片上,如照片、屏幕截图和包含文本与图片的文件。
向GPT展示一个图片。无论是为了解决烧烤架不启动的问题,还是为了规划一顿饭的食材,或是为工作相关数据分析一张复杂的图表,都可以轻松处理!
能想象得出吗?你用手机拍摄餐桌上美味的菜品,回家后将菜品照片输入GPT后,这个AI程序就能根据图片内容,能给你自动生成健康的食谱和制作方法。系统还可以提供制作这顿饭的逐步说明。真的吗?答案是肯定的。
这些新增功能让GPT更加融入日常生活。比如你在哈尔滨雪乡旅行中拍摄一个图片,与GPT即时讨论这景色的特点,并且以小红书的风格写一篇文章。
带给用户的另一个惊喜是,家长可以拍摄孩子的数学问题照片,然后寻求如何向孩子解释如何解决这个问题的建议。用户甚至可以标记图像的特定区域(例如用圆圈),以获取更具体的信息或关于该元素的帮助!
甚至你在外面吃饭还可以让他为你写出一个菜品及餐厅的点评。
如果你是一个短剧编辑,你甚至上传一张精美的摄影照片或者用MJ画一张有创意的海报,让他为你写出一个短剧剧本,可能只需要2分钟就可以完成创作。
如果你看上了宜家家居里的装修风格或者家具布置,马上拍下来,让GPT马上就可以告诉你装修风格和家具布置。
这个全新功能给人们的生活带来了巨大的便利。首先,通过图片和语音命令交互,用户能够更加直观地表达自己的需求。无需费力编写文字描述,用户只需拍照或者说出需要的指令,就能够得到准确的回答或者完成任务。这对于那些不擅长键盘输入或者有特殊需求的人们来说,无疑是一种解放和便捷。
与其他GPT功能一样,视觉功能旨在协助日常生活,而最佳的协助方式是能够看到人们所看到的。这个功能对于那些无法阅读或听写的人们来说,尤其有着重要的意义。通过图片和语音命令交互,他们能够直接与GPT进行交流,获取所需信息。这为他们提供了与世界互动的新途径,帮助他们更好地融入社会。相信这个功能更能为一个为盲人和视力受损的人提供更多的帮助。