MiniGPT-4 | AI看图聊天

访问官方

工具简介

在线 Demo:


https://minigpt-4.github.io


开源代码:


https://github.com/Vision-CAIR/MiniGPT-4


论文:


https://github.com/Vision-CAIR/MiniGPT-4/blob/main/MiniGPT_4.pdf


参考链接:


比OpenAI更快一步,开源的MiniGPT-4模型可让开发者提前感受GPT-4识图能力!



https://www.chinaz.com/2023/0419/1516992.shtml


 


拥有和 GPT-4相似的图片解析功能


该研究团队推出的 MiniGPT-4拥有和 GPT-4相似的功能。譬如:


给它一张图,便能生成详细的图像描述:


也能讲出图片中搞笑、有趣的部分:「星期一通常被认为是一周中最令人恐惧的一天」。


还能在进一步交互中发现不寻常的内容,如:虽然仙人掌有可能在寒冷的气候条件下生长,但很少看到仙人掌生长站在冰冻的湖泊中间。此外,水面上形成的大冰晶也不是常见的现象。


于是,MiniGPT-4给出了自己的见解:这张图片很可能是数字创作或操控的。


当然,和 GPT-4演示的一样,MiniGPT-4也能根据手绘草图生成网站:


识别图像中的问题并提供解决方案:



以及创造诗歌或说唱歌曲的灵感:


此外,也能根据图片续写故事,给产品做广告,对图像展现的画面进行评论、检索与图片有关的事实,以及当给定一张准备好的菜肴照片时,该模型可以输出(可能)与之匹配的食谱或者生成一个适合视障人士的图像描述。