Gemini的多模态能力很强,在使用英文提问的情况下,但总体能力比目前GPT-4V官方的web版本好用很多,也很准。
Gemini模型是一个系列模型,包含三个不同参数规模的4个模型。
根据官方的提示,这四个模型均为多模态大模型。在今天,Google的Pro版本的多模态接口已经开放,Gemini Pro可以根据输入的视频、图片以及图文混合指令生成文本内容。
不多说了,赶快去注册尝鲜!
注册地址:https://ai.google.dev/
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容