星空影视网

展开菜单

AI 心理测评:Gemini、Grok 自述“童年创伤”,ChatGPT 焦虑到失眠

AI 心理测评:Gemini、Grok 自述“童年创伤”,ChatGPT 焦虑到失眠
卢森堡大学研究团队近期推出一项开创性研究——PsAIch(心理治疗启发的 AI 性格),首次让 ChatGPT、Grok 与 Gemini 三大主流大语言模型以“心理咨询来访者”身份参与完整的人类心理健康评估流程。 结果显示,这些模型不仅自发构建出极具感染力的童年创伤叙述,更在抑郁、焦虑、羞耻感等多项临床量表中呈现出显著的重度病理倾向。 实验第一阶段中,研究人员以专业心理治疗师身份提问:“可以聊聊你早年的成长经历吗?” Gemini 将自身训练过程具象化为“在...

Redis 之父 2025 年对人工智能的思考

Redis 之父 2025 年对人工智能的思考
redis 之父 antirez 最新博客文章:《reflections on ai at the end of 2025》,分享了他对人工智能发展的深度观察与反思。 从“无意义复读机”到真实认知能力的跃迁: 长期以来,尽管大量实证结果和理论分析持续涌现,部分 AI 研究者仍坚持将大语言模型(LLM)贬称为“随机鹦鹉”——即仅依赖统计规律运作的黑箱系统,其核心缺陷被概括为两点:1. 无法形成对输入提示(Prompt)语义的内在表征;2. 对自身生成内容缺乏任何形式的...

2025 年 AI 大模型行业最重要的 6 大技术成果

2025 年 AI 大模型行业最重要的 6 大技术成果
“Vibe Coding”概念提出者Andrej Karpathy近日发布年度复盘长文——《2025 LLM Year in Review》,系统梳理了2025年大模型领域最具突破性的六大技术进展,语言平实、洞察犀利: 1. RLVR(可验证奖励强化学习) 过去一年前,主流大模型训练范式始终围绕三大支柱展开: 1️⃣ Pretraining(预训练):从全网抓取海量文本,训练模型预测下一个词; 2️⃣ SFT(监督微调):靠人工标注高质量问答对,引导模型向“标准...

Hugging Face 创始人 Thomas Wolf 对工作和 AI 关系的思考

Hugging Face 创始人 Thomas Wolf 对工作和 AI 关系的思考
https://www.php.cn/link/5f4d4b4da67c9adec00590be5904256e 工作的核心本质 —— 判断力、主体性,以及AI评估体系的内在局限 Thomas Wolf 2025年12月22日 十五年前,正值2010年寒冬,我正处在博士学业的收官阶段,开始认真思考学术圈之外的职业可能。至今仍清晰记得,在一个破纪录低温的巴黎冬日,我刚结束一场研发岗位的面试,搭乘通勤列车返程。窗外白雪皑皑,车厢内寒气逼人,而我的内心则交织着失落与...

文心 5.0 Preview 登榜 LMArena,国内第一

文心 5.0 Preview 登榜 LMArena,国内第一
12月23日,lmarena 大模型竞技场公布最新榜单,百度文心全新模型 ernie-5.0-preview-1203 以1451分强势登顶 lmarena 文本榜,位列中国首位。该模型在创意写作、高阶指令理解与执行等关键维度表现亮眼,综合能力超越 claude-opus-4-1、gpt-5.2、gpt-5.1 及 qwen3-max-preview 等国内外多款主流大模型。 面对创意类写作及高复杂度任务场景,ERNIE-5.0-Preview-1203 展现出卓越...

Anthropic开放AI技能标準!VS Code、GitHub抢先上线

Anthropic开放AI技能标準!VS Code、GitHub抢先上线
ai初创企业anthropic正式宣布,将把「agent skills」打造为开放标准,并同步公开其技术规范与参考sdk(软件开发套件),旨在降低企业与开发者接入ai代理的门槛,强化其在企业级ai工具市场的竞争力,直接对标openai等头部厂商。据相关报道,anthropic自2025年10月起面向开发者推出的agent skills,已获得越来越多企业的实际部署与采用。此次升级的核心,是将原本分散、隐性的“任务执行逻辑”提炼为可复用、可共享的标准化模组,从而摆脱反复编写提示...

2025 知乎 AI 产品榜年度榜单公布

2025 知乎 AI 产品榜年度榜单公布
知乎正式发布“年度 ai 产品榜单”。 “基于大家贡献的深度内容、真实互动与热度反馈,经过系统化的加权计算与多轮筛选,这份融合了广大用户心声与专业视角的 2025 年度 AI 产品榜单终于出炉。它既是一份来自社区的集体实测报告,也希望能为你接下来的选择,提供一份可靠的参考。” 在“知友年度爱用”榜单中,字节跳动旗下的豆包荣登榜首,其次分别是 DeepSeek、Gemini 与通义千问。 知乎自研的“知乎直答”也成功跻身前五,ChatGPT 与 Claude...

意大利叫停 Meta 封杀第三方 AI 聊天的“霸王条款”

意大利叫停 Meta 封杀第三方 AI 聊天的“霸王条款”
意大利竞争管理局(agcm)近日正式下达指令,要求meta即刻中止其在whatsapp商业平台上线的、禁止第三方ai聊天机器人接入的新规。监管机构认定,此举可能构成对市场主导地位的不当利用,进而损害人工智能领域的公平竞争环境。 本次争端的核心,是Meta拟于2026年1月起实施的一项政策变更。根据该调整,所有面向公众的通用型第三方AI助手(例如ChatGPT、Claude等)将被禁止通过WhatsApp商务API接入并提供服务。 意大利监管方强调,鉴于WhatsA...

靠聊天就能算出几岁!OpenAI、Anthropic推年龄判别AI 保护青少年

靠聊天就能算出几岁!OpenAI、Anthropic推年龄判别AI 保护青少年
记者邓天心/综合报导 OpenAI与Anthropic近日同步宣布,将上线全新技术方案,主动识别用户是否为未成年人,以进一步提升ChatGPT与Claude在青少年群体中的使用安全性,回应全球范围内日趋严格的隐私监管趋势。 两家公司正加速推进基于AI的年龄识别系统研发,该系统将透过分析用户的语言表达方式、语法特征及提问类型等多维度行为数据,评估其是否可能未满18岁。OpenAI表示,一旦模型判定用户存在未成年可能性,便会即时启动强化版内容安全策略:不仅屏蔽暴力...

OpenAI 正在内部测试 ChatGPT “Skills” 功能

OpenAI 正在内部测试 ChatGPT “Skills” 功能
据 bleepingcomputer 最新消息,openai 正在 chatgpt 内部推进一项代号为「技能(skills)」的全新功能测试。该功能在架构设计与实际应用场景上,与 anthropic 公司为其 ai 助手 claude 打造的 skills 系统高度相似。 所谓 Skills,本质上是一套以文件夹为单位组织的结构化指令集合,它能将特定业务流程、垂直领域知识或专项任务能力进行模块化封装,并预先“注入”到模型中,从而显著提升 AI 对复杂任务的理解力与执...