星空影视网

展开菜单

GLM-4.7 登顶 Artificial Analysis 全球开源榜首

GLM-4.7 登顶 Artificial Analysis 全球开源榜首
智谱官方发布消息,其最新开源大语言模型 glm-4.7 在全球权威大模型评测榜单 artificial analysis intelligence index(aa 智能指数)中,以总分 68 分的成绩强势登顶——同时位列开源模型与国产模型双榜首,并在全球所有参评模型中排名第六。 该榜单由 Artificial Analysis 发布,聚焦模型在知识覆盖、逻辑推演、代码生成及 Agent(智能体)能力等关键维度的表现,被广泛视为衡量大模型综合水平最具公信力的行业标尺...

源 Yuan 3.0 Flash 基础大模型开源发布

源 Yuan 3.0 Flash 基础大模型开源发布
yuanlab.ai 团队正式对外开源 源 yuan3.0 flash 多模态基础大模型。本次发布涵盖完整模型权重(支持16bit与4bit量化版本)、详尽技术白皮书、全流程训练方案及全面评测数据,全面开放社区进行后续微调、二次训练与垂直领域定制化开发。 据官方说明,Yuan3.0 Flash 是一款参数量达40B的多模态基础大模型,基于稀疏混合专家(MoE)架构设计,单次前向推理仅动态激活约3.7B参数。该模型首次提出并落地强化学习优化范式 RAPO(Reflecti...

香港科技大学教授测试使用 AI 眼镜进行考试作弊

香港科技大学教授测试使用 AI 眼镜进行考试作弊
在期末考试压力最大的阶段,香港科技大学张军教授与孟子立教授带领的研究团队,于《计算机网络原理》课程期末测验中开展了一项前沿实验——利用集成gpt-5.2模型的rokid智能ai眼镜完成整套考卷作答,旨在评估该类可穿戴设备在高阶知识理解与多步逻辑推理任务中的实际表现。 实验结果显示,AI眼镜全程自主完成全部题目,用时仅30分钟,最终得分92.5分(总分100分),显著高于本次考试学生整体水平(平均分为72分),并超越了95%的应试者;全班最高学生得分记录为97.5分。...

DeepSeek等开源大模型距离谷歌、GPT有多远 黄仁勋表态:6个月

DeepSeek等开源大模型距离谷歌、GPT有多远 黄仁勋表态:6个月
1月6日消息,刚刚过去的2025年是ai大模型开源高光绽放的一年。春节前夕,deepseek r1横空出世,震惊全球;通义千问(qwen)、kimi、minimax等中国开源力量亦全面发力,在代码、推理、多语言及长上下文等关键维度屡破纪录,真正将“开源即主流”的愿景推向现实。 但纵观全年AI演进脉络,开源阵营虽气势如虹,闭源巨头仍于年末强势反超:谷歌Gemini 3系列在多模态与复杂推理榜单持续领跑;Anthropic Claude凭借工程级代码理解与生成能力,稳坐开发...