字节跳动 seed 团队近日正式发布全新 3d 生成大模型——seed3d 1.0,实现从单张图像到高保真仿真级 3d 模型的端到端自动化生成。
据官方介绍,Seed3D 1.0 基于先进的 Diffusion Transformer 架构,依托大规模 3D 数据集训练而成,能够输出包含精细几何结构、真实感纹理以及基于物理渲染(PBR)材质在内的完整 3D 内容。
通过 Seed3D 1.0 所生成的 3D 模型可无缝接入 Isaac Sim 等主流仿真平台,仅需少量...
中国科学技术大学联合字节跳动即将推出一款具有划时代意义的端到端长视频生成模型,标志着我国在生成式人工智能领域的重大技术突破。该模型可直接输出时长以分钟计、分辨率达480p、帧率为24fps的高质量视频,并具备多镜头场景切换能力,展现出强大的视觉叙事连贯性。
这一成果的核心在于其原创性算法架构——MoGA(Modular Global Attention),这是一种专为长序列建模设计的新型注意力机制。针对传统方法在处理长时间视频时面临的上下文扩展困难与计算资源消耗过大的问...
字节跳动携手香港中文大学、香港科技大学及香港大学共同研发的 dreamomni2 系统现已正式对外开源。
DreamOmni2 专注于增强人工智能在图像生成与编辑中的指令遵循能力,实现了真正的多模态理解突破。该系统能够同时解析文本指令和参考图像内容,有效克服了传统模型在处理抽象概念(如艺术风格、材质质感、光影效果)时的不足,使用户与 AI 的交互更加直观自然。
为提升 AI 对复杂图文指令的理解能力,研究团队设计了一套创新的三阶段训练流程。第一阶段,通过构建提取模...