当地时间4月12日,马斯克旗下人工智能公司xAI推出首个多模态模型Grok-1.5Vision,不仅能理解文本,还能处理文档、图表、截图和照片中的内容。xAI还分享了Grok-1.5V的跑分情况,在RealWorldQA基准测试中,比GPT-4V、GeminiPro1.5等主流竞争对手更为优异。开源证券认为,国内外AI多模态模型能力持续突破,并逐步开启商业化,或持续赋能影视制作、IP开发、广告营销、教育教学、音乐创作、游戏研发等领域降本提效。多模态模型的竞争,也有望推动训练端对图像、视频、音频类语料需求增加。看好AI影视、AI营销、AI教育、AI音乐、AI游戏等投资主线。
文章转载自:互联网,非本站原创