微软正式开源了其最新推出的图像转3d模型生成工具——trellis.2。
该工具在构建高保真、具备完整材质信息的3D模型方面表现卓越,仅需提供单张输入图像,即可快速输出兼容Blender、Unity、Unreal等主流引擎的.glb格式三角网格文件。
TRELLIS.2基于一种名为4B的专用模型架构,支持处理分辨率为512³ 至1536³ 的输入图像。在NVIDIA H100 GPU加速下,生成512³分辨率的3D模型耗时约3秒;1024³分辨率模型约为17秒;而...
感谢网友 guser 的线索提供!
12 月 18 日,美国加州北区联邦地方法院发布的一份官方文件,为本年度全球游戏行业最受瞩目的跨国知识产权纠纷划上了终止符。
公开信息显示,索尼已正式向法院提交撤诉申请,终结其针对腾讯旗下新作《荒野起源》所发起的侵权诉讼。目前,双方已达成具有法律约束力的保密和解协议,约定不再就本案发表任何公开声明,并表达了对未来深化协作的积极意愿。
从今年7月硝烟弥漫的司法对抗,到12月悄然落幕的庭外握手,这场风波在短短五个月内完成了由法律攻防到...
12月18日最新消息,据新华社报道,商务部新闻发言人何亚东在当日举行的例行新闻发布会上指出,中方高度关注欧盟委员会近期频繁依据《外国补贴条例》(FSR)对中国企业展开调查,已先后对中车集团、同方威视启动深度审查,并突击检查中国本土数字平台在欧运营实体,相关行动手段粗暴,目标明确、区别对待特征突出,严重违背公平原则。
商务部强调,中方对此类针对性极强的执法行为表示坚决反对。敦促欧方立即叫停针对中国企业的无端施压,切实规范FSR工具的适用边界,避免将其异化为排他性政策武...
xai正式推出grok voice agent api,面向全球开发者开放其已在tesla汽车及官方移动应用中实际部署并验证的语音智能代理技术。
据悉,该API覆盖数十种主流语言,支持实时工具调用与联网搜索功能,端到端首音频响应平均耗时低于1秒,并在Big Bench Audio权威语音评测中荣登榜首。
Grok Voice Agent基于xAI自研的全栈语音技术构建,涵盖语音活动检测(VAD)、专用分词器及高性能音频理解模型,按使用时长计费,单价为每分钟0....
openai 正式启用第三方应用入驻 chatgpt 的提交通道,面向全球开发者开放。经平台审核通过后,基于 openai 模型开发的工具可直接集成至 chatgpt,无需用户手动下载或安装。该机制融合自动化检测与人工复核流程,审核达标的应用将原生嵌入 chatgpt 界面,实现“即点即用”。当前重点招募方向涵盖生产力增强类、学术研究支持类、创意生成辅助类及垂直行业智能体等应用场景,致力于构建以自然语言对话为交互核心的 ai 应用生态体系。
在 ChatGPT 的“应用...
在今日举办的火山引擎force原动力大会上,字节跳动正式推出全新升级的豆包大模型1.8版本。多项权威评测结果表明,该模型在多模态理解与生成、智能体(agent)能力等关键维度上,已跻身行业第一梯队。
据悉,豆包大模型1.8(Doubao-Seed-1.8)专为多模态智能体应用场景深度优化。其工具调用精准度、复杂指令解析与执行能力,以及操作系统级Agent(OS Agent)功能均实现显著跃升,极大强化了模型在高阶任务中的自主规划与协同执行能力。
在多项主流公开...
企业用户在日常办公中,“会议”无疑是至关重要的决策与协作场景。正因如此,效率与安全成为直接影响企业运营效能与团队协作质量的关键因素。
过去,企业多依赖云端会议工具开展远程沟通与协同作业,但云方案长期面临数据隐私外泄风险、缺乏持续性业务洞察、使用成本居高不下、与现有系统兼容性差等核心挑战。为此,元启智合携手奥尼电子,基于AMD锐龙AI MAX+ 395处理器打造Mini AI工作站,正式推出新一代全栈本地化AI会议系统解决方案。该方案以端侧千亿参数多模态大模型为技术内核,...
人工智能大模型对于知识密集型行业来说极为适用,毕竟从数据检索角度来看,人类的效率远远比不上人工智能。而医疗行业,正是知识密集型行业的典型。因此从过去的iot时代到如今的ai时代,医疗都是率先投入改革进程的先锋行业。
如今,AI大模型在医疗行业的应用也是如鱼得水,并逐步深度地参与到了辅助诊断、患者服务、医院管理、医学科研等全流程场景。从初步问诊的智能引导到复杂病症的多学科会诊,从医学文献的快速检索到科研数据的深度分析,AI技术本应成为医疗行业提质增效的核心驱动力。不过,理...
据 business insider 报道,meta 正在放宽内部限制,扩大员工对 google、openai 等竞品 ai 工具的使用权限。
内部文件及公司内部通讯显示,Meta 正大力推动将人工智能工具深度融入日常工作的各个环节,并全面推行“AI 优先”战略。
目前,Meta 员工已被授权接入并使用包括 Google 的 Gemini 3 Pro、OpenAI 的 GPT-5 在内的多个第三方大模型,以提升工作效率。与此同时,Meta 已将其核心办公套件迁移至 G...
蚂蚁集团百灵大模型团队正式开源aenvironment——一个专为agentic rl时代打造的统一环境平台,秉持“万物皆可为环境(everything as environment)”的核心理念。该平台基于标准化mcp协议进行深度扩展,面向环境提供商、算法研究人员及agent开发者,提供即开即用的底层基础设施,大幅降低环境构建门槛,助力各方聚焦于agent核心能力的研发与优化。
AEnvironment核心特性包括:
超强规模承载能力:已验证支持万亿参数级大模...