星空影视网

展开菜单

阶跃星辰 GUI Agent 全面升级:更长推理步骤、更强语义理解能力、更强泛化能力

阶跃星辰 GUI Agent 全面升级:更长推理步骤、更强语义理解能力、更强泛化能力
阶跃星辰正式宣布,其 step-gui 云端模型完成全面升级,并限时开放免费 api 接口。此次更新后的模型覆盖超 200 种任务场景,兼容手机、pc、车载系统等多终端平台,推理链路更长,语义理解与跨场景泛化能力显著增强。面对用户表述不明确的指令,模型可主动发起追问,精准厘清意图并高效执行任务。 与此同时,阶跃星辰开源了当前性能最强的端侧 GUI 模型——Step-GUI Edge,并同步推出 GUI-MCP 协议,宣称可将 AI 手机的端到端部署周期压缩至仅需 10...

蚂蚁开源 AEnvironment,面向 Agentic RL 的统一环境平台

蚂蚁开源 AEnvironment,面向 Agentic RL 的统一环境平台
蚂蚁集团百灵大模型团队正式开源aenvironment——一个专为agentic rl时代打造的统一环境平台,秉持“万物皆可为环境(everything as environment)”的核心理念。该平台基于标准化mcp协议进行深度扩展,面向环境提供商、算法研究人员及agent开发者,提供即开即用的底层基础设施,大幅降低环境构建门槛,助力各方聚焦于agent核心能力的研发与优化。 AEnvironment核心特性包括: 超强规模承载能力:已验证支持万亿参数级大模...

苹果开源SHARP模型 单张2D照片秒级生成逼真3D场景

苹果开源SHARP模型 单张2D照片秒级生成逼真3D场景
近日,苹果公司正式推出了一款名为sharp(sharp monocular view synthesis)的开源ai模型。该技术仅需输入一张常规2d照片,即可在不足一秒的时间内构建出具备真实物理尺度、高度逼真的3d场景。相关研究以论文《sharp monocular view synthesis in less than a second》为题对外发布,并同步上线至github、hugging face以及苹果官方项目平台,迅速在开发者群体中掀起热议。 据苹果研发团...

版本发布| IvorySQL 5.1 发布

版本发布| IvorySQL 5.1 发布
2025 年 12 月 18 日,IvorySQL 5.1 正式上线! IvorySQL 5.1 以 PostgreSQL 18.1 为底层内核,融合了多项稳定性修复与能力升级。完整变更日志请查阅官方文档平台。 PostgreSQL 18.1 核心增强 新增对 CREATE STATISTICS 语句中目标 Schema 的 CREATE 权限校验机制。 优化 libpq 中内存分配尺寸计算逻辑,规避潜在整数溢出风险。 解决 SQL/JSON 函数(例如 JSO...

1秒将2D图片变3D!苹果AI图像新突破

1秒将2D图片变3D!苹果AI图像新突破
今日,苹果公司正式发布题为《sharp monocular view synthesis in less than a second》的学术论文,全面阐述其全新研发的sharp模型的构建思路、训练策略与核心机制。 该模型引入前沿的3D高斯泼溅(3D Gaussian Splatting)技术,摒弃传统依赖体素网格或连续神经辐射场的方式,转而利用空间中密集分布的3D高斯椭球体进行场景建模,从而在保持极高视觉保真度的同时大幅加速渲染流程。 相较于以往方法动辄耗费数分钟...

JimuReport 积木报表 v2.3.0 重磅发布:支持移动报表与多 sheet 报表

JimuReport 积木报表 v2.3.0 重磅发布:支持移动报表与多 sheet 报表
项目介绍 积木报表,是一款免费的数据可视化报表,含报表、打印、大屏和仪表盘,像搭建积木一样完全在线设计!功能涵盖:复杂报表、打印设计、图表报表、门户设计、大屏设计等! 分两大模块:JimuReport 侧重传统复杂报表和打印、 JimuBI 侧重数据大屏和仪表盘可视化设计! JimuReport 采用 Web 版报表设计器,类 Excel 操作风格,通过拖拽完成报表设计,所见即所得。 领先的企业级 Web 报表,支持各种复杂报表,专注于解决企业报表难题。...

feilong 4.5.0 发布了,让 Java 开发更简便的工具库

feilong 4.5.0 发布了,让 Java 开发更简便的工具库
feilong 4.5.0 正式发布:一款致力于简化 java 开发的高效工具库 助你摆脱繁杂冗余的底层编码工作,显著提升开发效率; 让你的代码更加简洁、易编写、易理解、易维护; 官方文档地址:https://www.php.cn/link/3d015642567b62204c8bce00b2b1d60c 自本版本起,文档全面迁移至 GitBook 平台,不再使用原 OSChina 托管方案。 Maven 依赖配置如下: 立即学习“Java免费...

谷歌开源面向 Agent 的 UI 交互协议: A2UI

谷歌开源面向 Agent 的 UI 交互协议: A2UI
谷歌正式推出开源协议 a2ui,聚焦于解决 ai agent 在跨平台场景下安全传输与渲染交互式用户界面的关键挑战。 据官方说明,A2UI 是一套面向 Agent 驱动界面的开放协议,核心目标是在不同信任域之间实现安全、可控的富交互 UI 传递与呈现。该协议要求 Agent 仅通过声明式组件结构(而非任意可执行脚本)来定义界面,所有渲染均由客户端本地预置的可信组件完成,从而确保在 Web、移动端及桌面端等多平台上的一致性与安全性。 A2UI 的设计遵循四大核心...

Prompt Fill v0.5.0 发布,专为 AI 绘画设计的“结构化提示词生成工具”

Prompt Fill v0.5.0 发布,专为 AI 绘画设计的“结构化提示词生成工具”
prompt fill v0.5.0 正式上线,这是一款面向 ai 绘画(如 nano banana 等平台)打造的“结构化提示词构建工具”。借助直观的可视化“填空式”交互界面,用户能够高效地创建、组织与持续优化复杂的 prompt 表达。 其核心优势在于突破性的交互设计。工具将原本依赖手动记忆与精准输入的冗长文本 Prompt,解构为多个语义清晰的模块——例如“人物设定”、“动态姿势”、“艺术风格”、“环境背景”等独立维度。用户仅需通过点击选择、拖放调整,或在...

Meta 开源水印与污染检测工具 Text Seal

Meta 开源水印与污染检测工具 Text Seal
meta ai研究团队近期正式开源了text seal工具包。该工具包专注于为大语言模型(llm)提供两类文本水印能力:生成过程中的实时嵌入与生成完成后的后处理加水印,并支持识别因训练数据污染所引发的“水印放射性”现象。 具体来说,Text Seal隶属于Meta Seal多模态开源水印框架体系,致力于构建高鲁棒性、低感知性的文本水印解决方案。 Text Seal的主要功能涵盖: 支持事后水印机制,即对已存在文本调用LLM进行语义保持型重写,并同步集成...