星空影视网

展开菜单

腾讯云开源 DeepSeek 量化部署方案:性能最高提升 3.9X

腾讯云开源 DeepSeek 量化部署方案:性能最高提升 3.9X
腾讯云联合小红书hilab infra团队,在sglang 中实现了deepseek量化模型的高效推理优化,并在huggingface中发布了deepseek-v3.1-terminus的量化模型。 量化方案介绍 当前主流的大语言模型普遍采用MoE架构,这种架构可以在减少训推成本的同时提升模型性能,与此同时,模型体积也变得越来越大。比如,DeepSeek系列为671B,Kimi K2达到了 1TB,而当前主流的GPU单卡显存只有 80GB/96GB,通常需要双机分布式...

2025开放原子开发者大会:解锁开源实践与AI开源新机遇

2025开放原子开发者大会:解锁开源实践与AI开源新机遇
2025年11月21日至22日,北京亦庄·北人亦创国际会展中心将迎来一场专属于全球开发者的开源盛宴——2025开放原子开发者大会。本届大会以“ai共治,开源共享”为核心主题,汇聚来自世界各地的开源项目、技术专家、社区领袖与一线开发者,共同探讨开源技术的发展方向与生态共建的未来蓝图。 作为一名开发者,你是否曾思考:在人工智能席卷各行各业的当下,开源将如何进化?我们又该如何在蓬勃发展的开源生态中定位自身?这场盛会,或许正是你寻找答案的理想起点。 从操作系统到量子计算,构建...

从代码生成到智能开发:北大发布基于昇腾平台软件开发解决方案

从代码生成到智能开发:北大发布基于昇腾平台软件开发解决方案
软件开发流程的智能化,能显著解放开发者生产力,并驱动软件工程领域的范式革新。北京大学计算机学院李戈教授团队深耕该技术方向并在鲲鹏昇腾科教创新卓越中心的算力支持下,成功研发出一套基于昇腾平台的智能化软件开发系统,通过大模型自动代码生成和优化技术实现了软件开发效率的显著提升。该成果完成了开源代码大模型aixcoder-7b在昇腾npu硬件平台上的适配,通过集成torch_npu扩展库与mindie推理加速套件,实现了模型的高效运行。同时,构建了基于deepseek-v3agen...

马斯克:乐意帮助苹果升级Siri

马斯克:乐意帮助苹果升级Siri
对于苹果而言,基于大语言模型的新版siri,俨然已经成为拖慢苹果设备ai化进程的一座泥潭。 今日,埃隆·马斯克在社交平台X发文称,他乐意与苹果展开合作,为Siri集成来自xAI的Grok AI,从而提升其只能与效率。 不过,目前马斯克并未对此发言做出明确解释,苹果方面也并未有任何对外发言人做出回应。 考虑到xAI近期刚刚发布了新的Grok 4.1模型,这一说法,存在仅仅是一种“营销宣传”的可能性。 不过,不管马斯克是否真的愿意与苹果合作,在Siri中接入Gro...

内存价格暴涨成“电子黄金”,雷军都顶不住了

内存价格暴涨成“电子黄金”,雷军都顶不住了
“最近内存涨价实在太多。”10月24日,雷军在微博上带货某款手机时表示。 以三星电子为例,日前,其宣布内存芯片价格调涨60%,涨价直接冲击到了下游的消费电子厂商,带动包括手机,也包含笔记本、PC、平板等一系列设备的涨价。 内存涨价的直接原因是AI巨头们对HBM存储的需求,挤占DRAM颗粒产能。与此同时,推理需求的暴涨,也挤占了NAND闪存颗粒产能。 内存价格暴涨后,它们被赛博玩家们戏称为“电子茅台”、“电子黄金”。 涨价牵动着整个产业链的神经,中芯国际第三季度业绩...

联发科三季度业绩超预期,天玑9500市场表现出色

联发科三季度业绩超预期,天玑9500市场表现出色
联发科2025年第三季度财务报告显示,公司该季度营业收入净额达1420.97亿元新台币,超出市场预期。联发科ceo蔡力行表示,营收同比增长主要受益于ai旗舰智能手机与ai平板电脑芯片市场份额的扩大。其中,9月份合并营收达到543.30亿新台币,同比增长21.61%,为第三季度整体业绩提供了重要支撑。在财报发布会上,蔡力行透露,联发科2025全年营收有望突破190亿美元,创下历史新高。 图片来源:联发科官网 本季度表现亮眼的核心在于高端芯片领域的突破。天玑9500作...

李彦宏人民日报撰文:内化 AI 能力,加快形成新质生产力

李彦宏人民日报撰文:内化 AI 能力,加快形成新质生产力
百度公司创始人、董事长兼首席执行官李彦宏在人民日报发表署名文章《内化AI能力,加快形成新质生产力》。以下为全文: 内化AI能力,加快形成新质生产力 “十五五”时期经济社会发展的主题是推动高质量发展。推动高质量发展,最重要是加快高水平科技自立自强,积极发展新质生产力。人工智能(AI)作为引领新一轮科技革命和产业变革的重要力量,对于加快形成新质生产力、实现经济社会高质量发展作用十分关键。 过去几年,我国在人工智能算力基础设施和大模型等关键领域取得显著突破,形成了领先...

OpenAI 发布 GPT-5.1-Codex-Max,专为复杂软件工程任务打造

OpenAI 发布 GPT-5.1-Codex-Max,专为复杂软件工程任务打造
openai 今日发布了全新升级的 gpt-5.1-codex-max,定位为专为应对复杂、长期且多阶段软件工程挑战而设计的下一代代码大模型。该模型不仅能够编写和补全代码,还能在长达数十万字的上下文中持续推动大型项目进展。 本次最核心的技术突破在于引入了一种名为 compaction 的上下文压缩机制:模型在执行任务过程中会自动整理记忆,提炼并保留关键信息,从而实现在“超长上下文”环境下的稳定运行,避免因上下文过载导致的状态丢失或性能下降。 GPT-5.1-Cod...

瑞典 AI 低代码平台 Lovable 估值冲向 60 亿美元,ARR 突破 2 亿

瑞典 AI 低代码平台 Lovable 估值冲向 60 亿美元,ARR 突破 2 亿
ai 低代码平台 lovable(主打「vibe coding」:用自然语言直接生成应用和网站)正在高速增长。根据《彭博社》的报道,这家位于瑞典的 ai 编程初创公司年度经常性收入(arr)已突破 2 亿美元,并在洽谈新一轮融资,估值有望超过 60 亿美元。 Lovable 能让用户通过自然语言生成完整的应用或网站,主要面向希望快速构建 MVP、小工具或生产力应用的非专业开发者群体。公司自今年 ARR 首次突破 1 亿美元后,仅用数个月便实现了收入翻倍。 Lova...

MOSS-Speech 发布:真正的语音到语音大模型

MOSS-Speech 发布:真正的语音到语音大模型
国内AI领域最具影响力的学者之一——复旦大学计算机学院邱锡鹏教授及其团队学生近期推出了全新语音大模型 MOSS-Speech,宣称实现了真正意义上的语音到语音(Speech-to-Speech)交互。 据项目官方介绍,该模型标志着中国在语音人工智能领域迈入“端到端语音交互”的新纪元。与传统依赖“语音识别→文本处理→语音合成”三段式流程不同,MOSS-Speech 能直接从输入语音理解语义,并以语音形式生成回应,全程无需转化为文本中转。这一架构使得系统在回应过程中可保...