gimp 3.2 的首个候选版本(release candidate)现已发布,尽管功能已接近完善,但该版本仍属于开发快照,并非最终稳定版,官方呼吁广大用户积极参与测试并提交反馈。
本版本启用了由天文学家 Mark McCaughrean 拍摄的猎户座星云红外图像作为新的启动画面,这张照片正是使用 GIMP 进行后期处理完成的。
以下是本次更新中的一些关键改进与新增特性:
链接图层与矢量图层优化
对“链接图层”和“矢量图层”进行了多项错误修复及界面体验提升。
“...
国内AI领域最具影响力的学者之一——复旦大学计算机学院邱锡鹏教授及其团队学生近期推出了全新语音大模型 MOSS-Speech,宣称实现了真正意义上的语音到语音(Speech-to-Speech)交互。
据项目官方介绍,该模型标志着中国在语音人工智能领域迈入“端到端语音交互”的新纪元。与传统依赖“语音识别→文本处理→语音合成”三段式流程不同,MOSS-Speech 能直接从输入语音理解语义,并以语音形式生成回应,全程无需转化为文本中转。这一架构使得系统在回应过程中可保...
11月20日,由华为、中国信通院、清华大学人工智能研究院以及罗兰贝格管理咨询公司联合编写的《工业与ai融合应用指南》(以下简称《指南》)正式发布。该《指南》提出了“新六化”工业发展愿景,并推出“三层五阶八步”的实施路径,为工业企业落地人工智能提供系统性、可操作的实践框架。
当前,第四次工业革命深入推进,人工智能与工业加速融合,正成为企业转型升级的核心驱动力和竞争制高点。《工业与AI融合应用指南》描绘了至2035年的工业AI发展蓝图,深入剖析了融合过程中的模式演进与现...
在 osc 社区全新升级的时刻,为了帮助广大用户更好地适应新版社区,享受流畅的操作体验,今天我们重点为大家带来一个全新的功能模块 —— 智库(https://www.php.cn/link/f1a0ecdce0260ad2fad9a56d64582084)。
智库汇聚了行业内的各类最新研究报告,内容精细划分为七大类别。如果你是一位“学习者”,希望系统地补全之前错过的 OSC 技术活动内容,可以通过“源创会、往届GOTC、GOTC2025”专题进行回顾。这些板块集中整...
google工程师正在考虑将jpeg-xl格式的支持重新引入chrome浏览器。早在2022年,google曾决定在chrome中弃用jpeg-xl图片格式,并在当年年底移除了相关支持,这一决定令众多网页开发者和用户感到不满。
https://www.php.cn/link/2a250dac511b301faaf82502eedbb198
随后几年,其他项目持续支持JPEG-XL,该格式与WebP、AVIF等同样受到业界关注,不少人认为Google当初移除JPEG-XL...
根据 Hugging Face 页面信息,深度求索 DeepSeek 团队正式推出新一代大语言模型 DeepSeekMath-V2,专注于实现可自验证的数学定理证明能力,在数学推理的可靠性方面取得关键突破。
该模型创新性地构建了一个高精度、高保真度的验证器,并将其作为奖励机制来引导证明生成器进行自我修正,从而形成“生成—验证—优化”的闭环训练流程。为应对生成与验证双重能力同步进阶的技术难题,研究团队提出通过扩展验证计算资源,自动标注难以验证的样本数据,持续提升验...
人工智能领域顶级会议neurips 2025最佳论文奖近日揭晓,共评选出四篇获奖论文,其中多篇由华人学者领衔完成。本次获奖研究聚焦语言模型多样性、大模型注意力机制优化、深度强化学习突破以及扩散模型的理论解析。
获奖工作包括 Liwei Jiang 等人提出的《Artificial Hivemind》,揭示了大模型生成过程中的“人工蜂群效应”;来自阿里巴巴通义千问团队的 Zihan Qiu 等人发表的《Gated Attention for Large Languag...
两个月前,我们推出了实验性版本 deepseek-v3.2-exp,并收到了大量热心用户提交的对比测试反馈。截至目前,并未发现 v3.2-exp 在任何特定任务场景下显著弱于 v3.1-terminus,这充分验证了 dsa 稀疏注意力机制的技术优势。衷心感谢广大社区用户的积极参与与持续支持,你们的反馈为我们不断突破技术边界提供了宝贵动力。
今日,我们正式发布两款全新模型:
DeepSeek-V3.2 与 DeepSeek-V3.2-Speciale。
官方网页端、...
kimi最近发布了一款全新的幻灯片生成工具,基于google nano banana pro模型打造,致力于重塑用户制作演示文稿的流程。为庆祝上线,官方推出了限时48小时的免费体验活动,期间用户可无需付费畅享核心功能。
此次试用的核心亮点是名为“Agentic Slides”的创新功能。该功能由智能体(Agentic)技术驱动,能自动将PDF、图片及其他格式文档迅速转化为完整的演示内容。用户可在浏览器中直接编辑生成的幻灯片,并最终导出为标准PowerPoint格式文...
阿里通义 qwen 团队近日在 arxiv 平台发布了关于其最新视觉语言模型 qwen3-vl 的详尽技术报告,系统性地公开了从架构设计到评估流程的全部核心技术细节。
该报告完整呈现了模型从预训练阶段到后训练优化、从底层架构设计到基础设施支持、从数据处理策略到多维度评估方法的全流程技术方案,致力于为视觉语言模型领域的研究人员与开发者提供一份全面且可复现的技术参考指南。
https://www.php.cn/link/c24a32c563290f4347f82252...