VITA 2025-01-07 🆔 项目名称:VITA ⭐️ 项目功能:开源版视频+语音模型 📁 项目简介:一个开源的多模态大语言模型,旨在实现实时的视觉和语音交互。 能够同时处理视频、图像、文本和音频数据,通过减少交互延迟、增强语音处理能力和改进多模态理解,达到了接近GPT-4o的水平。 🌐 项目地址:点击打开