如何评价 Zeus 在 S13 总决赛上的表现？

发布时间：2024-07-03 08:19:55

🔸 提供QR码，快速进入小程序使用修复功能

声明:本文来自于微信公众号头号AI玩家（ID:AIGCplayer），整理| 卷毛编辑| 张洁，授权站长之家转载发布。

1月3日，钉钉联合国际知名咨询机构IDC发布首份《2024AIGC应用层十大趋势白皮书》。IDC预测，到2024年全球将涌现出超过5亿个新应用，这相当于过去40年间出现的应用数总和。

LLaVA是一个端到端训练的多模态大模型，它将视觉编码器和用于通用视觉和语言理解的Vicuna相结合，具备令人印象深刻的聊天能力。而CogAgent是在CogVLM基础上改进的开源视觉语言模型，拥有110亿个视觉参数和70亿个语言参数。

CogAgent还提供了可视化代理的能力，能够返回任何给定任务的计划、下一步行动和带有坐标的具体操作。它还增强了与图形用户界面相关的问题解答功能，可以处理与网页、PC应用程序、移动应用程序等任何图形用户界面截图相关的问题。另外，通过改进预培训和微调，CogAgent还增强了OCR相关任务的能力。这些功能的提升使得CogAgent在多个基准测试上实现了最先进的通用性能。

行住坐卧网

如何评价 Zeus 在 S13 总决赛上的表现？