12月3日,在中国电信“2024数字科技生态大会”上,中电信人工智能科技有限公司和中国电信人工智能研究院(TeleAI)发布了首个央企全自研视频生成大模型,至此,星辰大模型系列已完成了全模态能力的构建。同时还发布了革新传统视觉算法生产流程的视觉大模型产用一体化平台,展示了具身智能、智传网等一系列创新产品及科研成果。
该视频生成大模型实现了从文字到分镜图和从分镜图到视频的端到端生成,在主体目标时空一致性、个体复杂动作精准控制、交互式动作精确控制及角色动作符合物理规律等核心技术上实现了全国领先。该能力的推出标志着中国电信成为首家具备视觉、语音、语义、多模态全模态能力的央企,有望落地广告传媒、文旅教育等领域。未来,可通过整合语义、语音、文生图、文生视频等全栈大模型能力打通短视频及影视剧制作的各个环节,覆盖文字脚本撰写、分镜脚本绘制、视频拍摄及剪辑、配音及音效合成等全流程,提升视频创作效率,实现降本增效。目前,该视频生成大模型在权威视频生成评测榜单VBench中排名第一。
同时,中电信人工智能公司构建了一款具有颠覆性意义的视觉大模型产用一体化平台,该平台作为央企首个自主研发的视觉大模型产用一体化系统,为政务、应急、工业、能源等多个行业的开发人员提供全方位赋能,实现全流程提效。该平台已成功应用于多省应急项目,沉淀了森林烟火、洪涝灾害、路面坍塌等20余个应急全流程感知场景,提升对灾害研判与应急响应的核心能力。
在本次数字科技生态大会的线下展台,中国电信还展示了一系列在具身智能方向的创新成果,包括可以用于生活服务的人形机器人、面向商场及展会场景的星小辰服务机器人、为视障人士提供导盲服务的智能机器狗,及整合了一系列大模型能力的AI智能眼镜;一分钟内完成数字分身一键复刻的数字人技术,星辰软件工厂、星辰慧记、星辰智能体产品、中国电信家庭小管家、星辰大模型一体机等一系列智能产品。
中电信人工智能科技有限公司和中国电信人工智能研究院将持续推进人工智能的技术攻关突破、向开发者提供更优质的生态环境和研发平台、为社会各界提供更加智能的产品方案。