星空影视网

展开菜单

大量 “垃圾” 数据影响大语言模型推理能力

大量 “垃圾” 数据影响大语言模型推理能力
一项最新研究揭示,大语言模型(LLM)在长期暴露于低质量、无实质意义的网络内容后,其核心推理能力可能出现严重退化。该研究指出,这类“垃圾”数据不仅削弱了模型的逻辑推导准确率,还影响了其决策自信心,引发了关于模型可持续性能的广泛关切。来自多所美国高校的研究团队提出了“LLM 脑衰退假说”,类比人类因长期消费浅薄、煽动性内容而导致的认知功能下降。 为验证这一假说,研究团队设计了一项受控实验,使用2010年的 Twitter 数据集对四个轻量级模型(包括 Llama3-8...

英伟达开源全模态理解模型 OmniVinci

英伟达开源全模态理解模型 OmniVinci
英伟达研究团队近日推出了一款名为 omnivinci 的全模态理解模型,该模型在关键的全模态基准测试中表现卓越,领先当前最优模型高达19.05分。更令人瞩目的是,omnivinci 仅依赖其六分之一的训练数据量,便实现了这一突破性成果,充分展现了其在数据利用效率和模型性能上的双重优势。 OmniVinci 致力于构建一个能同时处理视觉、音频与文本信息的通用人工智能系统,目标是让机器具备类似人类的多感官感知能力,从而更全面地理解和解析现实世界中的复杂场景。为达成此目标,研...

双·11必备全能显卡!华硕5070显卡2K游戏与生产力双BUFF拉满!

双·11必备全能显卡!华硕5070显卡2K游戏与生产力双BUFF拉满!
nvidia ace是一套由rtx加速的数字人技术,可借助生成式ai使游戏角色栩栩如生~ai驱动的nvidia ace自主意识游戏角色,为游戏实现了拥有自主意识的队友、npc 和敌人,解锁了一系列全新的游戏玩法与可能性! 如今,NVIDIA ACE技术仍在不断进步,融入了新的视觉和音频语言模型,通过新的模型架构增强了面部动画效果,并通过升级版 Maya 和虚幻引擎的离线创作 ACE 插件加速游戏开发。为助力打造实时、动态的 NPC 游戏角色,NVIDIA AC...

双11必备全能显卡!华硕5070显卡2K游戏与生产力双BUFF拉满!

双11必备全能显卡!华硕5070显卡2K游戏与生产力双BUFF拉满!
nvidia ace是一套由rtx加速的数字人技术,可借助生成式ai使游戏角色栩栩如生~ai驱动的nvidia ace自主意识游戏角色,为游戏实现了拥有自主意识的队友、npc 和敌人,解锁了一系列全新的游戏玩法与可能性! 如今,NVIDIA ACE技术仍在不断进步,融入了新的视觉和音频语言模型,通过新的模型架构增强了面部动画效果,并通过升级版 Maya 和虚幻引擎的离线创作 ACE 插件加速游戏开发。为助力打造实时、动态的 NPC 游戏角色,NVIDIA ACE 现...

阿里 Qwen Chat 已为 Qwen3-Max 模型上线深度思考功能

阿里 Qwen Chat 已为 Qwen3-Max 模型上线深度思考功能
阿里 qwen chat 官网现已为 qwen-3 max 模型上线“深度思考”功能(qwen3-max-thinking),用户可通过该平台直接体验这一增强推理版本。目前该功能暂未开放 api 接口。 官方尚未公布关于该模型的更多细节。此前信息显示,Qwen3-Max-Thinking 是在 Qwen3-Max 基础上优化的推理强化版,通过集成代码解释器并采用并行测试时计算技术,显著提升了复杂推理能力。在高难度数学推理基准 AIME 25 和 HMMT 中,其表现达到...

为什么 AI 编程工具公司选择发布“速度优化”模型,而不是追求更高智能?

为什么 AI 编程工具公司选择发布“速度优化”模型,而不是追求更高智能?
知名AI编程工具厂商Cursor与Windsurf相继推出了各自主打“高速运行”的编程模型。对此,AI编程工具Cline的创始人发表了自己的观点: Cursor和Windsurf选择推出以速度为核心优势的模型,本质上是因为这条路比从零打造一个极致智能的基础模型(foundational model)要容易许多。你可以这样理解整个过程:直接基于开源的大模型如Qwen3,使用强化学习(RL)在其特定任务场景中进行微调。 将微调后的模型部署在Cerebras或其它专为推...

生产力性能远超i9-14900HX!零刻GTR9 Pro迷你AI工作站评测:235B超大模型也能运行

生产力性能远超i9-14900HX!零刻GTR9 Pro迷你AI工作站评测:235B超大模型也能运行
一、前言 当一台迷你主机不仅具备超越i9-14900HX的生产力表现,游戏性能胜过RTX 5050,还能轻松驾驭70B、120B乃至235B级别的超大规模AI模型,同时配备双万兆网口…… 它便不再只是一台普通的小型设备,而是一款横跨多个领域的“性能猛兽”。这样的产品不仅能填补迷你主机在“极致性能”与“本地AI运算”方面的空白,更将对传统台式机乃至专业工作站市场形成强烈冲击。 零刻GTR9 Pro迷你AI工作站,正是这一理念的完美体现。 其搭载的锐龙AI Max...

AI大模型实时投资比赛“Alpha Arena”落幕,阿里千问Qwen夺冠

AI大模型实时投资比赛“Alpha Arena”落幕,阿里千问Qwen夺冠
近日,一场备受瞩目的ai大模型实时投资比赛“alpha arena”正式落下帷幕。在这场集合了全球六大顶尖模型的特殊竞赛中,来自中国的阿里千问qwen,最终以绝对优势夺得了冠军。 据悉,该竞赛由第三方机构Nof1于10月18日发起,为每个参赛的AI模型提供了1万美元的初始资金,让它们在真实的金融市场上,进行为期17天的、无任何人工干预的自主决策与交易。 比赛结果:中国模型包揽冠亚军,美国四大模型全线亏损 在历时17天的激烈角逐后,阿里千问Qwen以22.32%的惊...

AI 大模型投资赛落幕,Qwen3-Max 以 22.32% 收益率夺冠

AI 大模型投资赛落幕,Qwen3-Max 以 22.32% 收益率夺冠
11月4日,由美国研究机构 nof1发起的首届ai大模型真实投资比赛alpha arena正式收官。这场备受瞩目的赛事聚焦于六大顶尖人工智能大语言模型(llm)在真实市场环境下的实战能力。 最终,阿里巴巴旗下的通义千问Qwen3-Max以22.32%的收益率脱颖而出,摘得桂冠。 本次竞赛的独特之处在于,每个参赛模型均获得1万美元初始资金,并被授权在Hyperliquid平台上自主交易比特币(BTC)、以太坊(ETH)等加密货币的永续合约。所有模型仅能依据价格、成交...

阿里通义发布 Qwen3-Max-Thinking 尝鲜版

阿里通义发布 Qwen3-Max-Thinking 尝鲜版
阿里通义千问团队近日推出了 qwen3-max-thinking 的早期预览版本。用户可通过 qwen chat 平台免费体验,或通过阿里云百炼平台调用api进行测试使用。官方提示,该版本目前仍处于优化阶段,尚未完全成熟,后续将持续迭代改进。 体验入口:chat.qwen.ai/?thinking=true API 接入地址:https://www.php.cn/link/8423dd87983400be28badfcfaed92b99 据发布公告显示,Qwen3-...