近日,阿里巴巴集团正式发布并开源了首个端到端全模态大模型——“7B模型”。该模型具备看、听、说、写等全模态功能,可实现AI视频通话中不同模态间的无缝连接。作为一款免费商用的开源技术,7B模型为开发者和企业提供了强大的技术支持,助力多领域创新应用的开发。
全新一代用友BIP智能体构建平台凭借其先进的智能核心,能够高效处理复杂任务,同时支持无缝接入超过4000个企业级应用API,实现技术资源的深度整合。此外,平台内置的企业级知识库为智能体提供了深厚的知识基础,助力企业智能化转型。
多模态大模型的应用正逐步从技术封闭走向开放,其价值不仅体现在单一的效率提升上,更在于构建共享生态的潜力。在北京QCon会议上,专家指出,多模态产品的未来发展将依赖于不同场景中的实践探索,以及生态建设的重要性。通过技术开放与合作,多模态大模型有望推动各行业实现更深层次的创新与协同。
在AI基础设施快速发展的背景下,张晓与两位企业家深入探讨了DeepSeek在中国的合作伙伴网络及其价值规律。从春节期间企业接入DeepSeek R1,到微信等国民级应用的全面整合,DeepSeek的影响力已从企业市场延伸至消费者市场,掀起一波又一波热潮。其一体机的流行更标志着技术应用的广泛落地。
Vamba模型是一种专为高效处理超长视频设计的混合架构,结合了Mamba-Transformer技术。通过集成针对文本token的交叉注意力机制与针对视频token的Mamba-2模块更新策略,该模型显著降低了计算复杂度和显存消耗,同时提升了长、中、短视频理解任务的性能表现,为视频处理领域提供了创新解决方案。
在2025年,防失业预警已成为职场人士关注的焦点。文章指出,未能掌握DeepSeek-RAG构建知识库技能的个体可能面临被淘汰的风险。通过利用AnythingLLM技术,传统企业能够高效构建DeepSeek-RAG本地知识库,从而提升工作效率并增强竞争力。掌握这一技术不仅是适应未来职场的关键,更是保持行业领先地位的必要条件。
DeepSeek应用自上线以来展现出强劲的增长势头,根据QuestMobile的最新报告显示,在AI大模型应用领域中,DeepSeek表现尤为突出。其上线第二个月的月活跃用户数已突破1.8亿,彰显了AI大模型应用的快速发展趋势。这一成就不仅体现了用户对DeepSeek的高度认可,也反映了AI技术在实际应用中的广泛潜力。
阿里版“Her”已正式上线并开源,其核心模型Qwen2.5-Omni-7B被定义为全能模型,具备卓越的多模态处理能力。该模型可同时处理文本、音频、图像和视频等多种输入形式,并生成高质量的文本和音频输出。与同规模的单模态或封闭源模型(如Qwen2.5-VL-7B、Qwen2-Audio及Gemini-1.5-pro)相比,Qwen2.5-Omni在各模态任务中均展现出领先性能,为用户提供全面的试用体验。
2025年,苹果公司公布了其AI学者名单,表彰了12位杰出的年轻华人学者。这些新星包括黄子琪、孔令东、北京大学的吉嘉铭以及清华大学的顾煜贤等。他们在人工智能领域展现了卓越的研究能力,被全球学术界公认为AI研究的前沿力量,代表了未来技术发展的方向。
据外媒报道,英伟达计划以数亿美元收购由贾扬清创立的Lepton AI公司。此次收购完成后,Lepton AI将融入英伟达AI云基础设施,助力其在人工智能领域进一步提升竞争力。这一动作标志着英伟达在拓展AI技术生态方面的又一重要布局。
近日,港科大广州与伦敦大学学院联合研究团队发布了一项突破性成果——边缘语言模型(PLM)。该模型创新性地将机器学习中的最大似然估计(MLA)和稀疏激活技术应用于端侧设备。这一技术进步解决了大规模模型结构实验中的诸多挑战,尤其在预训练研究领域显得尤为稀缺。通过优化算法设计,PLM显著提升了端侧设备的处理效率,为边缘计算领域的语言处理能力开辟了新路径。
阿里巴巴近期开源了一款7B模型,该模型具备AI视频通话功能,可实时处理文本、音频、图像和视频等全模态数据,并生成自然语言与语音。这一技术突破为开发者和企业提供了免费商用的机会,大幅提升了多模态数据交互的效率。
华东师范大学与东华大学的研究团队联合发表了一篇题为《A Survey on the Optimization of Large Language Model-based Agents》的综述文章。该文章聚焦于大型语言模型为基础的智能代理优化问题,系统梳理了这一领域的最新进展,旨在帮助读者构建清晰的知识体系,避免学习过程中的混乱无序。
OpenAI宣布采用竞争对手Anthropic的MCP协议,这一决定使MCP成为行业内的热门话题。前特斯拉AI总监Karpathy对此表示,MCP之所以被广泛讨论,是因为其本身已成为了焦点。此举不仅引发了业界对合作协议的深入探讨,也体现了AI领域中开放与竞争并存的趋势。
复旦大学与微软合作,成功研发出一种名为MagicMotion的新型图像到视频生成框架。该技术实现了对视频中任意物体运动轨迹的精准控制,支持掩码级、边界框级和稀疏框级三种轨迹控制级别。MagicMotion的主要贡献者包括复旦大学研究生李全昊、邢桢及通讯作者吴祖煊副教授,这一突破为视频生成领域提供了创新解决方案。
上海财经大学统计与数据科学学院的张立文教授及其领导的SUFE-AIFLM-Lab课题组,联合多方力量,发布了金融领域推理型大模型Fin-R1。该模型属于DeepSeek-R1类别,参数规模仅7B,却展现出卓越性能,平均得分达75分,与671B参数的DeepSeek-R1满血版性能相当,为金融行业提供了高效解决方案。