星空影视网

展开菜单

AI 三巨头惨遭滑铁卢:最新编程测试正确率全线跌破 25%

AI 三巨头惨遭滑铁卢:最新编程测试正确率全线跌破 25%
scale ai最新发布的swe-bench pro编程能力评估结果显示,即便是当前最前沿的模型如gpt-5、claude opus4.1和gemini2.5,也未能突破25%的解决率门槛。 其中,GPT-5仅取得23.3%的解决率,Claude Opus4.1以22.7%紧随其后,而Google的Gemini2.5则表现更弱,仅有13.5%的任务被成功解决。 前OpenAI研究员Neil Chowdhury指出,当GPT-5决定尝试解决问题时,其实际成功率高达6...

ColorOS 16流畅技术前瞻,技术架构升级挑战流畅三大极限

ColorOS 16流畅技术前瞻,技术架构升级挑战流畅三大极限
9月22日,oppo在深圳举行了一场关于系统流畅性的技术沟通会,提前揭晓了即将上线的coloros 16系统。此次发布的全新coloros 16在底层架构上实现全面革新,依托三大核心技术——全新极光引擎、全新潮汐引擎与全新繁星编译器,推动手机系统流畅体验迈入全新阶段,标志着coloros对极致顺滑操作的探索正式进入“深水区”,也为安卓生态树立了新的体验标杆。该系统将于10月15日在oppo开发者大会(odc25)上正式亮相。 OPPO ColorOS设计总监陈希表示...

AI三巨头惨遭滑铁卢:最新编程测试正确率全线跌破25%,GPT-5也难逃厄运

AI三巨头惨遭滑铁卢:最新编程测试正确率全线跌破25%,GPT-5也难逃厄运
AI三巨头集体受挫:在Scale AI最新推出的SWE-BENCH PRO编程测评中,GPT-5、Claude Opus 4.1与Gemini 2.5均未能突破25%的解决率门槛,遭遇了前所未有的挑战。GPT-5以23.3%的成绩位列第一,Claude Opus 4.1紧随其后为22.7%,而Google Gemini 2.5则仅得13.5%,表现低迷。 这一结果震动业界,似乎揭示出当前顶尖大模型在真实复杂编程任务面前仍显乏力。然而,深入数据背后,故事远非表面那般简...

一加15新机将在全球发布 已获海外认证 型号名确认

一加15新机将在全球发布 已获海外认证 型号名确认
一加15真机 据海外媒体报道,一款型号为CPH2747的一加新机出现在认证数据库中,疑似即将推出的一加15全球版本。该机型已通过马来西亚SIRIM认证,确认其为面向国际市场的一加15手机。 近期,国内科技博主分享了一加15的实际外观图。手机背部采用左上角矩阵式摄像头模组设计,整体风格与一加13T保持一致。屏幕配置方面,新机搭载了京东方提供的X3直屏OLED面板,分辨率为1.5K级别。尽管相较一加13的2K屏幕有所调整,但支持高达165Hz的刷新率,带来更流畅的视觉...

Redmine 6.1 现已发布

Redmine 6.1 现已发布
Redmine 6.1.0 版本带来了大量新功能、优化与技术升级,是一个功能全面增强的更新。该版本修复了近 70 个问题,涵盖从细微体验优化到全新核心功能的广泛改进,致力于提升用户操作效率并赋予管理员更强的配置能力。 1. 核心新特性: 内容反应功能:支持在问题、评论、新闻及论坛帖子中添加表情反应(#42630)。 OAuth2 支持:Redmine 现可作为 OAuth2 提供方运行(#24808)。 首字母头像显示:当禁用 Gravatar 时,系统将...

Java、Python、PHP 联手喊话大企业:必须为开源基础设施买单

Java、Python、PHP 联手喊话大企业:必须为开源基础设施买单
近日,开源安全基金会(openssf)发布了一份措辞严厉的联合声明。声明直言“开源基础设施并非免费”,并警告称,支撑着现代软件开发的关键基础设施,正被推向崩溃的边缘。 这份声明由包括Eclipse、Rust、PHP、Python、Java基金会在内的八家重量级开源组织共同签署,其矛头,直指那些长期免费、大规模使用开源基础设施的大型商业企业。 “免费且无限使用”的误解与“浪费性使用”的现实 声明中指出,像Maven Central、PyPI、npm等核心的软件包注册...

PandaCoder 1.1.8 发布:中文开发者的智能编码助手全面升级

PandaCoder 1.1.8 发布:中文开发者的智能编码助手全面升级
? PandaCoder 1.1.8 发布:中文开发者的智能编码助手全面升级 让中文开发者告别命名困扰,拥抱高效编程新时代! ? 版本亮点 PandaCoder 1.1.8 作为内测版本,带来了全新的Bug记录功能本地文件启用禁用功能,让开发者可以更灵活地管理错误信息存储方式。这个版本不仅延续了插件一贯的智能化特色,更在用户体验上做出了重要改进。 ? 核心功能一览 1. ? 智能Bug记录系统(内测功能) PandaCoder 1.1.8...

Ollama 上线 “Web search” API,为 LLM 集成实时网络搜索能力

Ollama 上线 “Web search” API,为 LLM 集成实时网络搜索能力
ollama 正式发布“web search”api,使大语言模型具备实时获取互联网信息的能力,显著提升回答准确率并有效降低幻觉现象。 该功能以 REST API 形式开放,并已深度集成至 Ollama 的 Python 和 JavaScript SDK 中,便于开发者在各类应用中快速接入与调用。同时,平台还推出了 web fetch 接口,支持提取指定网页的完整结构化内容,包括标题、正文及链接信息。 借助 web search 与 web fetch,开发者可构...

IEEE Spectrum 2025:AI 是否意味着顶级编程语言的终结

IEEE Spectrum 2025:AI 是否意味着顶级编程语言的终结
ieee spectrum 已发布2025年最具影响力的编程语言排行榜。在“spectrum”默认排名中,python 再度稳居首位,前五强中变动最显著的是 javascript,其排名从去年第三滑落至今年第六位,研究人员认为这一下滑可能与ai技术的迅猛发展密切相关。 在“就业需求(Jobs)”子榜单中,Python 也实现了跃升,从2024年的第二名攀升至榜首。报告特别指出:“掌握 SQL 依然是求职者简历上极具竞争力的核心技能。” 该榜单的评估依据涵盖...

在阿里云上,跑出中小企业AI应用规模化的“加速度”

在阿里云上,跑出中小企业AI应用规模化的“加速度”
针对中小企业ai落地“不会用、用不起、用不好”的痛点,阿里云给出了一套全链路解决方案。 AI对于中小企业的分量有多重? ServiceDirect在《2025中小企业AI报告》中指出,77%的全球中小企业已定期使用AI工具,其中32%的企业每周使用至少7种AI产品。中国市场虽起步稍晚,但增长动能强劲。 这意味着,不拥抱AI的中小企业,在新时代商业竞争中将直接陷入效率劣势。 针对中小企业AI落地“不会用、用不起、用不好”的痛点,今年2025云栖大会已备好破局路径...