ChatGPT图像识别能力解锁和深度分析

ChatGPT爱玩1个月前57

来源:老罗不说

作者:罗予晨

编辑:好困

【新智元导读】其实,ChatGPT是可以识别图片的!你只需要输入图片网址,并确保图片能不受限制地被OpenAI的服务器读取到。

因为ChatGPT网页上没有上传图片按钮,所以一般人都不知道它能识别图片。但是其实它是可以识别图片的,你需要输入图片网址,确保图片不需要登录或者其他限制条件就能被美国服务器读取到。

目前看它读取Wiki、CNN图片都没有问题。

那么它能识别出什么内容?

普通新闻图片

ChatGPT没有识别出具体的装备型号,但是描述了一个非常贴近的场景氛围。对构图的视角有较强的理解力。

人物图片

马克龙这张,没有识别出人脸,也没有识别出画面的文字。但是可以基本描述出画面内容,虽然有一些错误。重点是它对场景的猜测,和接近人的感觉,比如它说马克龙像是很有礼貌的人。

上面两张是识别精度一般的,这里还有画面特征比较强,识别精度较高的。

特定历史图片

这幅越战美军搜查敌人的照片。被ChatGPT详细的描述了细节,这幅图的场景,人物和细节的信息量,会比上面的两张更大(ChatGPT看起来没有对特定的物体和人脸做针对性的优化),所以描述非常生动,虽然有少许错误。而且对人的工作态度这样抽象的信息也有理解。

值得注意的是这里提到警察。这图片来自Wiki越战词条。如果ChatGPT是通过读取连接的文字信息来获取图片信息的,那么就不会认为那些执行任务的人是警察。因此可以认为它的结论完全来自于图片信息。

全球著名图片

这是一幅名画,这个时候ChatGPT是能完整的识别人物和事件的。同时仍然有很多抽象的描述,比如动感等。

针对图片的人机互动

这幅画,一开始ChatGPT没有看懂。给它输入更多信息之后,它能理解这幅画,且描述了画面的感情。所以ChatGPT对图片的理解是能够交互的,而不是一次性的输出。

地标图片

伦敦地标识别成功。

红场识别准确

捏造了一个所谓地标,查了没有这样的地标。

视频内容识别

ChatGPT是承认自己可以识别视频的,但是在油管、CNN等网站的内容识别中,输出有错误。这是业务没有开放造成的,它甚至知道我的问题是看快进的进度。

如果不多问一句,都不知道它是不是真的看了视频。

继续保持对ChatCPT的关注。

相关文章

能取代你的可不止是 ChatGPT

如今,ChatGPT 在我的朋友圈里真是「三步一岗五步一哨」。 总是相视无言、表达欲萎缩、爱低头抱着手机的人类,终于走到了和机器把酒夜话的这一天。 我想到了 Clubhouse 兴起时,各种主题的聊天室如雨后韭菜出...

ChatGPT创始人,给我们上的8堂课

ChatGPT创始人,给我们上的8堂课

刘润,将在02月14日 20:00 直播预约 沈磊:复盘3.0,浮现真问题,获得真认知,实现真改变视频号观点 / YC   主笔 / 蕉皮    责编 / 李桑 这是刘润公众号的...

“打过不就加入”,ChatGPT为何让谷歌和百度“疯狂”

“打过不就加入”,ChatGPT为何让谷歌和百度“疯狂”

中新网2月14日报道,从谷歌到百度,曾经的搜索巨无霸如今面临着ChatGPT的挑战,以至于纷纷宣布将推出自己的类ChatGPT服务,这是打不过就加入系列,还是搜索引擎真的要变天了?ChatGPT会取代搜索引擎吗?随着ChatGPT的走红,百...

chatgpt是什么意思有什么用 chatgpt怎么玩

  ChatGPT是一款人工智能软件,不少小伙伴对于ChatGPT不是很了解,不清楚具体的作用以及使用方法,为了帮助大家,小编带来了详细的介绍,感兴趣的用户一起看看吧。  chatgpt是什么  公开资料显示,ChatGPT为人工智能公司O...

差距至少两年!中国的ChatGPT何时到来?

差距至少两年!中国的ChatGPT何时到来?

文 | 《中国科学报》 记者 沈春蕾ChatGPT概念股火了!连日来,美国人工智能(AI)实验室OpenAI发布的聊天机器人ChatGPT火爆全网,并带动了相关概念股的上涨。在A股市场,资本大举炒作ChatGPT概念股,部分概念股出现五连板...

为了写出告白酒业的最佳文案,我化身ChatGPT的甲方|情人节特辑

为了写出告白酒业的最佳文案,我化身ChatGPT的甲方|情人节特辑

亲爱的云酒头条朋友为了向你告白这个情人节小嫚决定搞点不一样的Word天!距离发文只剩半小时了~担心掉光头发的小嫚把最后的希望押在最近大火的超强大脑——ChatGPT上是的,接下来小嫚就化身这个“AI顶流”的甲方让它给我的表白支支招*以下对话...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。