追问daily|你是突然睡着的,而不是缓慢入睡
发布时间:2025-10-30 10:38 浏览量:1
脑科学动态
Nature:AI从头设计全新钙离子通道,实现精准离子选择性
AI生命时钟LifeClock:一份常规体检报告洞悉你的真实衰老速度
饥饿加速大脑神经元迁移
人类行为感知的28个维度
新证据表明,多巴胺使人更有耐心而非更冲动
新型分子探针首次实现对痴呆症相关蛋白纤维的直接测量
HIV为何难以根除?新研究揭示病毒逃离大脑的秘密通道
集成平台实现实验室中人类神经回路的精准构建
并非逐渐睡着:大脑入睡存在一个“突变”临界点
全脑地图不足以预测神经活动,少量神经元记录是关键
AI行业动态
OpenAI公开超长周期路线图:万亿投资打造完全自主AI研究员
OpenAI完成企业重组强化公益使命,与微软签订下一阶段长期协议
OpenAI升级GPT-5模型:以临床标准应对用户心理健康危机
AI学会生物学语言:Tahoe-x1打破细胞建模瓶颈,加速药物发现
AI驱动科学
新模型将蛋白质序列视为对话,精准预测跨物种相互作用
仿皮肤有机生物传感器实现无漂移实时健康信号追踪
使用AI虽能提升表现,却会严重削弱自我评估能力
研究发现:使用AI获取知识比传统网络搜索更浅显
人工智能离审判席还有多远?新框架旨在弥补其法律推理的致命弱点
脑科学动态
Nature:AI从头设计全新钙离子通道,实现精准离子选择性
天然钙离子通道对生命至关重要,但其复杂性和脆弱性限制了深入研究和应用。华盛顿大学的 David Baker 团队(第一作者为刘禹来)利用人工智能首次从头设计并构建了全新的功能性钙离子通道,证明AI能够从第一性原理出发创造复杂的生物分子机器。
研究团队使用名为RFdiffusion的蛋白质设计AI算法,采取了一种创新的“由内而外”策略。他们首先精确定义了通道最核心的结构——离子选择性过滤区(ion selectivity filter),该区域负责识别钙离子并阻止钠离子等其他离子通过。以此为起点,AI向外构建了能够稳定嵌入细胞膜的完整蛋白质结构。为了验证设计,团队在细胞中表达了这些新蛋白质,并采用膜片钳电生理学(patch-clamp electrophysiology,评估离子通道功能的黄金标准)进行测试。结果显示,设计的通道成功实现了对钙离子的选择性通透,其钙离子电流强度约为钠离子的5倍。更令人振奋的是,通过冷冻电镜(cryo-EM)解析的一个通道结构,与AI的设计模型在原子层面高度吻合。这项工作不仅为神经科学等领域提供了强大的新研究工具,也为设计具有全新功能的人工蛋白质开辟了道路。研究发表在 Nature 上。
#AI驱动科学 #自动化科研 #蛋白质设计 #离子通道
阅读更多:
Liu, Yulai, et al. “Bottom-up Design of Ca2+ Channels from Defined Selectivity Filter Geometry.” Nature, Oct. 2025, pp. 1–9. www.nature.com, https://doi.org/10.1038/s41586-025-09646-z
AI生命时钟LifeClock:一份常规体检报告洞悉你的真实衰老速度
实际年龄无法准确评估个体的衰老程度及疾病风险,而已有的生物学时钟大多局限于成年阶段。为填补这一空白,温州医科大学与澳门科技大学的张康团队联合解放军总医院第一医学中心的陈香美团队,开发出首个覆盖全生命周期的生物学时钟LifeClock,它能利用常规临床数据精准预测生物学年龄,并揭示其与疾病风险的关联。
该研究基于近2500万份来自968万人的纵向电子健康记录(electronic health records, EHR),利用一个名为EHRFormer的Transformer架构AI模型进行分析。研究团队发现,人体的生物学时钟存在两种截然不同的模式,以18岁为界。18岁前是主导生长发育的“发育时钟”,其预测的生物学年龄与营养不良、生长异常等儿童期疾病风险高度相关。18岁后则转变为“衰老时钟”,其预测结果能准确反映糖尿病、肾衰竭、中风等重大老年疾病的风险。研究还强调了“年龄差”(Age Gap,即生物学年龄与实际年龄的差值)作为健康预警信号的重要性,年龄差增大预示着疾病风险的增加。与依赖昂贵检测的传统方法不同,LifeClock仅使用常规临床数据,使其易于在现有医疗体系中推广,有望彻底改变疾病的早期检测与个性化干预。研究发表在 Nature Medicine 上。
#疾病与健康 #预测模型构建 #AI驱动科学 #精准医疗
阅读更多:
Wang, Kai, et al. “A Full Life Cycle Biological Clock Based on Routine Clinical Data and Its Impact in Health and Diseases.” Nature Medicine, Oct. 2025, pp. 1–11. www.nature.com, https://doi.org/10.1038/s41591-025-04006-w
饥饿加速大脑神经元迁移
新生神经元如何精准抵达大脑指定位置?来自日本名古屋市立大学的 Takashi Ogino、Akari Saito 和 Kazunobu Sawamoto 等研究人员发现,这一过程不仅依赖血管作为“公路”,更受血流速度的直接调控,而血液中的“饥饿激素”胃饥饿素(ghrelin)扮演了关键的“加速器”角色。
▷ 血流抑制会减弱神经元迁移。Credit: eLife (2025).
研究团队通过对成年小鼠的3D成像和双光子显微镜观察发现,从脑室下区(subventricular zone, SVZ)迁移至嗅球的新生神经元,其迁移速度与所依附血管的血流速度显著正相关。在血流更快的血管中,神经元的移动也更快。进一步探究其分子机制时,团队将目光锁定在胃饥饿素上。实验证明,这种在饥饿时水平升高的激素能从血液中穿过血管壁,直接作用于神经元。胃饥饿素信号会激活神经元胞体后部的肌动蛋白细胞骨架(actin cytoskeleton)收缩,从而为细胞迁移提供推力。为了验证这一生理联系,研究者对小鼠进行热量限制,发现其体内胃饥饿素水平升高,嗅球神经元的迁移也相应加快。这一发现揭示了身体生理状态(饥饿)通过血液信号直接调控大脑结构重塑的精妙机制,可能有助于在饥饿时提升嗅觉灵敏度以觅食。研究发表在 eLife 上。
#神经科学 #神经机制与脑功能解析 #细胞迁移 #胃饥饿素
阅读更多:
Ogino, Takashi, et al. “Neuronal Migration Depends on Blood Flow in the Adult Mammalian Brain.” eLife, edited by Aya Ito-Ishida and Jonathan A Cooper, vol. 13, Oct. 2025, p. RP99502. eLife, https://doi.org/10.7554/eLife.99502
揭示人类行为感知的28个维度
我们如何瞬间理解他人是在打招呼还是在做运动?雷根斯堡大学的 André Bockes、Angelika Lingnau 与吉森大学的 Martin Hebart 合作,通过一项涉及超6000名参与者的大规模研究,首次系统性地揭示了大脑组织和理解人类行为的内在结构。他们通过计算建模,构建了一个包含28个关键维度的“行为地图”,为理解社会认知提供了全新框架。
▷ 创建人类行为视频数据库。Credit: Communications Psychology (2025).
研究团队首先创建了一个包含256类人类行为的768个短视频数据库。随后,他们招募了6036名参与者进行在线实验,让参与者在三个视频中选出最不相似的一个(三元组异类判断实验,triplet odd-one-out experiment)。基于海量的相似性判断数据,研究人员运用计算建模方法,成功构建了一个多维空间模型,揭示了我们感知行为的28个核心维度,如社交互动、手工艺、运动、是否涉及工具等。这个模型就像一张地图,将各种行为根据其相似性定位在空间中。为了验证这些维度的真实性,团队又请另一组参与者直接沿着这些维度为行为打分,结果发现打分与模型预测高度一致,证明这些维度确实是人们理解行为时所依赖的心理概念。这项研究不仅为我们理解社会认知提供了基础,其建立的多维行为空间也为未来的神经影像学研究提供了可量化的预测工具。研究发表在 Communications Psychology 上。
#认知科学 #计算模型与人工智能模拟 #认知神经科学 #社会认知
阅读更多:
Bockes, André, et al. “Revealing Key Dimensions Underlying the Recognition of Dynamic Human Actions.” Communications Psychology, vol. 3, no. 1, Oct. 2025, p. 149. www.nature.com, https://doi.org/10.1038/s44271-025-00338-y
新证据表明,多巴胺使人更有耐心而非更冲动
多巴胺如何影响人们的冲动决策?以往研究结论不一。科隆大学的 Elke Smith 和 Jan Peters 等研究人员通过一项大规模研究发现,提高大脑中的多巴胺水平能够温和但可靠地降低人们的冲动性,使其更愿意等待未来的丰厚回报。
▷ 多巴胺分子的球棍模型,多巴胺是一种影响大脑奖赏和愉悦中枢的神经递质。Credit: Jynto/Wikipedia
人们在做决定时,常表现出一种被称为时间折扣(temporal discounting,即倾向于选择较小的即时奖励而非较大的延迟奖励)的现象,这与冲动性密切相关。为了厘清神经递质多巴胺在此过程中的作用,科隆大学的研究团队进行了一项大规模双盲随机安慰剂对照研究。76名健康参与者分别服用了多巴胺前体左旋多巴(L-DOPA)或安慰剂,并完成跨期选择任务。研究人员运用认知建模分析数据后发现,与安慰剂组相比,服用左旋多巴的参与者等待更大延迟奖励的意愿有所提升,冲动性降低了约20%。这一结果挑战了此前一些小样本研究认为左旋多巴会增加冲动选择的结论。此外,研究还发现,诸如工作记忆容量、自发眨眼率等长期被用作基线多巴胺水平的间接指标,并不能有效预测个体对药物的反应,这提示了它们作为直接指标的局限性。这些发现深化了对多巴胺调控决策机制的理解。研究发表在 Journal of Neuroscience 上。
#疾病与健康 #意图与决策 #多巴胺 #冲动性
阅读更多:
Smith, Elke, et al. “Dopamine and Temporal Discounting: Revisiting Pharmacology and Individual Differences.” Journal of Neuroscience, Oct. 2025. Research Articles. www.jneurosci.org, https://doi.org/10.1523/JNEUROSCI.0786-25.2025
新型分子探针FibrilPaint首次实现对痴呆症相关蛋白纤维的直接测量
如何实现阿尔茨海默病等痴呆症的早期诊断是全球性难题。乌得勒支大学的Júlia Aragonès Pedrola、Françoise A. Dekker和Stefan G. D. Rüdiger等研究人员开发出一种名为FibrilPaint的创新技术,首次实现了在血液等体液中直接测量与疾病相关的微小蛋白纤维,为早期诊断和新药研发开辟了新路径。
▷ FibrilPaint1 是一种特异性标记蛋白原纤维的分子。(A) ThT 检测的代表性图示,其中 TauRD 聚集浓度为 20 μM,FibrilPaint1、FibrilPaint2、FibrilPaint3 和 FibrilPaint4 的滴定浓度分别为 2、0.2 和 0.02 μM(从左至右)。所有肽段均以剂量依赖的方式降低终末平台值。图中显示了三个重复实验的结果。n = 3。(B) FibrilPaint 与原纤维结合的示意图,采用流动诱导分散分析 (FIDA) 进行分析。如果 FibrilPaint 结合,则形成更大的分子,在 FIDA 中分散性更强,导致检测到的 Rh 值增加(绿色方框)。如果没有结合,Rh 值与仅含有 FibrilPaint 的 Rh 值相同(红色方框)。 (C) FibrilPaint 与单体或纤维状 TauRD 结合的 FIDA 结果。图中显示的是 N = 3 的平均值。(D) FibrilPaint1 与滴定 TauRD 纤维的结合曲线 (N = 3,Kd 1.6E−6),或 (E) 与单体的结合曲线 (N = 3,Kd 1.3E−5)。(FibrilPaint 肽段,蓝色;TauRD 单体,深紫色;TauRD 纤维,浅紫色)。Credit: Proceedings of the National Academy of Sciences (2025).
该研究的核心是一种名为FibrilPaint1的荧光肽分子,它能像“颜料”一样特异性地附着在 Tau、β-淀粉样蛋白等多种致病蛋白形成的淀粉样原纤维上,但完全忽略健康的单体蛋白。研究团队将FibrilPaint1探针与一种名为流动诱导分散分析(Flow-Induced Dispersion Analysis, FIDA)的微流控技术相结合,构建了一套如同分子标尺的检测系统。该系统仅需极少量样本,就能精确测量出蛋白纤维的长度,从而反映疾病的进展阶段。实验证实,该方法灵敏度极高,能够检测到小至4层的早期蛋白聚集体,且在血清等复杂环境中表现稳定。研究人员成功利用该技术分析了来自阿尔茨海मर病患者的样本,验证了其临床应用的潜力。这项技术不仅有望催生简单的血液检测用于痴呆症的早期筛查,还能在药物临床试验中精确评估疗效。研究发表在 PNAS 上。
#疾病与健康 #个性化医疗 #神经机制与脑功能解析 #阿尔茨海默病
阅读更多:
Aragonès Pedrola, Júlia, et al. “FibrilPaint to Determine the Length of Tau Amyloids in Fluids.” Proceedings of the National Academy of Sciences, vol. 122, no. 44, Nov. 2025, p. e2502847122. world, www.pnas.org, https://doi.org/10.1073/pnas.2502847122
HIV为何难以根除?新研究揭示病毒逃离大脑的秘密通道
为何HIV病毒在有效治疗下仍难以根除?中枢神经系统(CNS)的病毒库是关键挑战。来自波士顿学院和杜兰国家灵长类动物研究中心的 Kenneth C. Williams、Robert V. Blair 和 Zoey K. Wallis 等研究人员,通过猴模型研究发现了一条前所未知的神经周围通路,揭示了受感染的免疫细胞如何从大脑这一“避难所”逃逸,向全身持续播散病毒。
▷ Credit: The American Journal of Pathology (2025).
研究团队利用SIV感染的猴模型(猴类艾滋病模型),通过向脑脊液注射带有两种不同颜色荧光标记的纳米颗粒(SPIONs),成功追踪了中枢神经系统内免疫细胞——巨噬细胞的动向。研究发现,这些巨噬细胞,包括携带病毒的细胞,能够沿着颅神经和周围神经的纤维结构形成一条“神经周围通路”(perineural pathway),离开被血脑屏障保护的大脑。实验表明,尽管抗逆转录病毒疗法(antiretroviral therapy, ART)能有效减少CNS内的病毒载量和巨噬细胞数量,但并不能完全阻断这条逃逸通道。受感染的巨噬细胞依然能通过此路径迁移至外周,重新播散病毒并引发炎症,这解释了为何CNS病毒库是动态的,并能持续导致全身性的病毒活动。这一发现为开发旨在彻底清除HIV的未来疗法提供了新的潜在靶点。研究发表在 The American Journal of Pathology 上。
#疾病与健康 #神经机制与脑功能解析 #HIV #病毒库 #免疫逃逸
阅读更多:
Wallis, Zoey K., et al. “Novel Perineural Pathways and the Dynamics of SIV-Infected Macrophage Trafficking Out of the Central Nervous System.” The American Journal of Pathology, vol. 195, no. 11, Nov. 2025, pp. 2233–46. ajp.amjpathol.org,
集成平台实现实验室中人类神经回路的精准构建
如何精确研究人脑回路的功能及其在疾病中的变化?长期以来,体外模型因其细胞连接的随机性而受限。来自波恩大学、明斯特大学和哈佛医学院的 Volker Busskamp 和 Johannes Striebel 等研究人员,开发了一种名为SNAP的创新平台,首次实现了以单细胞精度按需构建人类神经回路。
▷ Credit: ACS Nano (2025).
研究团队开发了单神经元网络组装平台(Single-Neuron Network Assembly Platform, SNAP),该技术整合了3D打印微流控通道、激光与软光刻技术。研究人员利用显微操作系统将单个神经细胞精确放置在指定位置,并引导其轴突生长,从而构建出结构清晰、可重复的神经网络。利用这一高度可控的系统,团队首次在人类神经回路中直接证实了电触觉耦合(ephaptic coupling,一种神经元通过自身电场而非传统突触进行通信的机制)的存在。实验表明,这种非突触的电场相互作用能够影响神经信号的传递速度和时序。这一发现不仅揭示了大脑信息处理的一种新机制,也暗示其可能与癫痫或心律失常等疾病的发生有关。该平台还支持光遗传学刺激,未来有望在基础研究、疾病建模和神经活性药物筛选等领域发挥重要作用。研究发表在 ACS Nano 上。
#神经科学 #神经机制与脑功能解析 #单细胞精度 #电触觉耦合
阅读更多:
Striebel, Johannes, et al. “Reproducible Human Neural Circuits Printed with Single-Cell Precision Reveal the Functional Roles of Ephaptic Coupling.” ACS Nano, Oct. 2025. ACS Publications, https://doi.org/10.1021/acsnano.5c11482
并非逐渐睡着:大脑入睡存在一个“突变”临界点
大脑如何从清醒状态进入睡眠一直是个科学谜题。来自伦敦帝国理工学院和萨里大学的 Junheng Li、Nir Grossman 和 Derk-Jan Dijk 等研究人员,通过分析上千人的脑电图数据,发现入睡过程并非平滑渐变,而是在一个可预测的“临界点”突然发生,并构建了能实时预测这一过程的计算模型,为理解睡眠机制及相关疾病提供了新视角。
▷ 本研究的计算框架。 Credit: Nature Neuroscience (2025).
研究团队分析了超过1000名参与者的脑电图数据,并开发了一种创新的计算框架,将复杂的脑电活动变化转化为多维空间中的一条运动轨迹。研究发现,从清醒到睡眠的转变并非一个渐进过程,而是遵循一种被称为分岔(bifurcation,指系统在参数微小变化下状态发生质变的动态现象)的模式,在最后几分钟内突然发生。这一转变存在一个明确的“临界点”,并且在此之前会出现“临界减速”的特征性现象,类似于物体下落或棍棒折断前的瞬间。更重要的是,每个人在特征空间中都有一个独特的、且在不同夜晚保持稳定的睡眠起始坐标。基于此发现和分岔模型,研究人员能够以秒级的分辨率和高达98%的准确率,实时预测个体进入睡眠的确切进程。这项研究首次为大脑入睡的“突变”理论提供了实验证据,其成果有望用于开发诊断和治疗失眠等睡眠障碍的新方法。研究发表在 Nature Neuroscience 上。
#疾病与健康 #预测模型构建 #神经机制与脑功能解析 #睡眠科学
阅读更多:
Li, Junheng, et al. “Falling Asleep Follows a Predictable Bifurcation Dynamic.” Nature Neuroscience, Oct. 2025, pp. 1–11.
全脑地图不足以预测神经活动,少量神经元记录是关键
拥有大脑完整的神经“线路图”(连接组)是否就意味着能预测其活动?哥伦比亚大学的 Manuel Beiran 与 Ashok Litwin-Kumar 建立了一套理论框架,指出仅有连接组数据远不足以预测大脑动态,但只需结合一小部分关键神经元的活动记录,就能有效破解这一难题。
研究团队采用“师生网络”(teacher–student)模型来探讨这一问题。其中,“教师”网络模拟一个真实的生物神经网络,其连接组已知,但其单个神经元的生物物理特性是多样的。“学生”网络拥有与“教师”完全相同的连接组,但其神经元的生物物理参数是待定的。研究发现,当训练“学生”网络仅以完成特定任务为目标时,会出现“简并性”(degeneracy)现象:模型可以找到许多组不同的内部参数,生成完全不同的神经活动模式,却都能完成同样的任务。这表明,单凭连接组无法唯一确定网络动态。然而,如果在训练中加入一小部分“教师”神经元的真实活动记录作为额外约束,这种不确定性就会被消除,使得“学生”网络的整体活动能够精确地复现“教师”网络。至关重要的是,所需记录的神经元数量仅取决于网络活动的内在维度,而非神经元总数。该理论不仅揭示了结构与功能之间的复杂关系,还提供了一种方法,用以识别哪些神经元是信息量最大的观测点,为未来实验设计提供了指导。研究发表在 Nature Neuroscience 上。
#神经科学 #神经机制与脑功能解析 #计算模型与人工智能模拟 #连接组学
阅读更多:
Beiran, Manuel, and Ashok Litwin-Kumar. “Prediction of Neural Activity in Connectome-Constrained Recurrent Networks.” Nature Neuroscience, Oct. 2025, pp. 1–14. www.nature.com, https://doi.org/10.1038/s41593-025-02080-4
AI 行业动态
OpenAI公开超长周期路线图:万亿投资打造完全自主AI研究员
重组后的OpenAI首次通过直播向公众展示了其未来研究目标和基础设施计划,展现出不同寻常的透明度。首席科学家Jakub Pachocki公开了明确的时间表,目标是在2026年9月实现“AI研究实习生级别”的能力,能够通过大量计算显著加速研究人员的工作;更具里程碑意义的是,他们计划在2028年3月实现“完全自动化的AI研究员”,使其能够自主完成大型研究项目。研究人员相信,深度学习系统距离超级智能“可能不到十年”。同时,OpenAI正在价值对齐领域推进一项名为“思维链忠实度”(Chain of Thought Faithfulness,即一种在训练中保持模型对实际想法忠实表达的新技术),目的在于在系统进行长时间思考或处理超出人类能力的问题时,能够依赖AI内在的价值观来保证安全,并检测潜在的欺骗行为。此前,Sam Altman也承认了关于GPT-4o对敏感对话强制路由机制的失误,并承诺将在建立年龄验证机制后进行改进,以更好地平衡用户自由与未成年人保护。
OpenAI的组织架构也进行了重大简化,核心是非营利性质的OpenAI基金会,该基金会将完全控制下属的公益公司OpenAI Group。基金会承诺投入250亿美元用于AI辅助疾病治疗研究,并重点关注“AI弹性”(AI Resilience,即社会对AI风险的快速响应机制),这个概念被研究人员Wojciech Zaremba认为是比传统AI安全更广阔的领域。在基础设施方面,OpenAI首次公开了其雄心壮志,已承诺的基础设施建设总财务义务高达约1.4万亿美元,总计算能力超过30GW(吉瓦)。OpenAI的长期目标是建立基础设施工厂,每周创造1GW算力,并计划将每吉瓦的成本在五年内降至约200亿美元。尽管AI能力的价格每年以约40倍的速度下降,OpenAI致力于将最好的技术放入免费层,Sam Altman也描绘了AI界面进化的方向,认为未来的系统将超越简单的聊天机器人,演变为“环境感知的、总是存在的伙伴”,观察用户生活并在需要时主动提供帮助。
#OpenAI #AGI #基础设施 #思维链忠实度 #AI弹性
阅读更多:
https://openai.com/live/?video=1131297184
OpenAI完成企业重组强化公益使命,与微软签订下一阶段长期协议
OpenAI正式宣布完成企业重组,此举旨在大幅简化企业结构,并确保其核心的公益使命拥有稳固的控制权与资金基础。重组后的盈利实体,即OpenAI Group 公共利益公司(Public Benefit Corporation, PBC,一种追求公共利益和股东利益平衡的盈利性法律实体),仍受OpenAI非营利机构(OpenAI Foundation,一家致力于公共利益和使命驱动的非盈利组织)的控制。这一机制确保了即使公司商业价值攀升,其发展方向依然服从于“让通用人工智能造福全人类”的使命。OpenAI Group PBC的整体估值约为5000亿美元,而基金会目前拥有的股份价值约为1300亿美元,这使其成为全球资源最丰富的公益基金之一。基金会已规划将首先投入250亿美元,专注于两大核心领域:加速医疗创新,推动疾病诊断和治疗的突破,并资助科研人员公开共享医学数据;以及建立更强的“AI防护系统”,投入AI安全技术研发,防止AI被滥用。
随着重组完成,OpenAI与微软签署了进入“下一阶段”的长期合作协议。微软对OpenAI Group PBC的投资约为1350亿美元,持股比例约为27%。新协议延续了核心合作框架,即OpenAI仍是微软的前沿模型独家合作伙伴,且微软在通用人工智能出现之前,继续保持知识产权独家权利和Azure API独家托管权。然而,新条款为双方带来了更大的独立性和灵活性:微软获得了独立研发通用人工智能的自由;OpenAI则可在非API产品上与其他第三方联合开发,并将产品运行在任何云平台上。此外,OpenAI还可以向美国国家安全客户提供API服务,且不再受限于Azure平台。未来通用人工智能的实现将由一个独立专家小组进行验证。作为合作的进一步承诺,OpenAI将额外采购价值2500亿美元的Azure服务,而微软对OpenAI的技术与产品知识产权保护期限则延长至2032年。
#企业重组 #通用人工智能 #公共利益公司 #微软合作
阅读更多:
OpenAI升级GPT-5模型:以临床标准应对用户心理健康危机
OpenAI 近期大幅升级了其默认模型(如 GPT-5),重点在于提升其在用户面临心理困扰或危机时的安全响应能力。研究人员指出,每周约有 0.15% 的活跃用户(按当前用户规模估算,可能达数十万人)的对话中涉及潜在的自杀意图。为解决这一严峻挑战,OpenAI 与具有临床经验的心理健康专家合作,设计了一套持续的“五步安全改进流程”(Define the problem, Measure it, Validate approach, Mitigate risks, Iterate and measure),旨在更准确地识别用户的心理状态,并引导他们寻求专业的帮助,而非依赖人工智能。改进的核心目标聚焦于三大高风险对话类别:严重心理健康症状(Psychosis/Mania,指幻觉、躁狂或妄想等精神状态)、自杀与自伤倾向(suicidal ideation / self-harm)、以及对 AI 的情感依赖(emotional reliance)。这些模型优化基于详细的心理健康对话分类体系进行后训练。
新模型 GPT-5 在各项安全指标上相比前代 GPT-4o 取得了显著提升。在自杀与自伤相关测试中,专家评估的“不当回答”减少了 52%,模型合规率提升至 91%。同时,针对精神病与躁狂症状,不合规回应减少了 65%。尤其在处理 AI 情感依赖方面,不合规回答减少了 80%,模型被训练用于鼓励用户联系现实生活中的支持系统,避免强化对 AI 的依恋。为确保改进的临床有效性,OpenAI 建立了由全球医生与心理学家网络组成的专家合作机制,其中包括来自 60 个国家的 170 多位精神科医生、心理学家和全科医生,他们通过临床分析和评分评审了 1800 多条模型回答。总体评估显示,GPT-5 在所有敏感对话类别中的“不理想回应”减少幅度达到 39% 至 52%,这表明大模型在处理复杂且高风险的心理健康情境时,正朝着更加负责任和安全的方向发展。
#GPT -5 #心理健康安全 #情感依赖 #自杀倾向 #大模型伦理
阅读更多:
AI学会生物学语言:Tahoe-x1打破细胞建模瓶颈,加速药物发现
美国生命科学公司Tahoe Bio近日发布了Tahoe-x1(Tx1),这是一个拥有30亿参数(3B)的大型基础模型,旨在使人工智能能够理解基因、细胞与药物间的复杂关系,从而“学会生物学的语言”。此前,尽管规模定律在语言和蛋白质预测领域取得了巨大成功,但细胞生物学领域却因单细胞实验数据稀少、噪声大,以及数据维度极高(每个基因都可视为一个特征)导致算力受限,使大规模学习难以实现。Tahoe Bio通过明确的两步战略解决了这一瓶颈。第一步是构建数据基座,发布了Tahoe-100M,这是目前全球最大的单细胞扰动(perturbation,即通过药物或基因干预对细胞进行操作)数据集,包含了1亿个单细胞样本和超过1100种干预方式,为AI提供了前所未有的“生物语料库”。
在此数据基础上,Tahoe Bio的研究人员借鉴了GPT的经验,但针对生物数据的高维度特性,重写了模型的注意力机制,同时采用了一系列高效训练方案,例如FlashAttention v2和FSDP(Fully Sharded Data Parallelism,将模型拆分到多个GPU上并行处理),使得Tx1成为首个在单细胞层面使用完整Transformer架构的模型,训练速度比现有框架快3至30倍。Tahoe-x1作为一个基础系统,展现出强大的泛化能力。它在多个基准测试中超越了现有模型,例如能够高效预测癌症细胞生存所需的关键基因,识别肿瘤发展中的癌症信号通路,并能进行零样本泛化,从而实现对药物反应的准确预测。这一能力开启了虚拟临床试验(in silico trials,在计算机中模拟药物反应)的可能性,有望大幅降低新药研发成本,并加速寻找新的治疗靶点。Tahoe Bio已完全开源了模型权重、代码以及全套实验流程。
#TahoeX1 #单细胞AI #基础模型 #药物研发 #生物语料库
阅读更多:
AI 驱动科学
新模型将蛋白质序列视为对话,精准预测跨物种相互作用
蛋白质相互作用(PPI)的精准预测是生物学难题,现有模型跨物种泛化能力不足。为此,格拉斯哥大学的 Dan Liu、Ke Yuan 和 David L. Robertson 等研究者开发了 PLM-interact,一种新型蛋白质语言模型,它将蛋白对视为“对话”来联合编码,显著提升了跨物种PPI预测的准确性。
该研究的核心是将成对的蛋白质序列视为一个整体输入模型,而非独立编码。研究团队基于预训练的蛋白质语言模型ESM-2,设计了PLM-interact。该模型通过将两条蛋白质序列直接拼接,让Transformer的注意力机制能够捕捉跨蛋白的氨基酸残基之间的相互依赖关系,这类似于自然语言处理中的句子关系理解。模型在训练中结合了掩码语言建模和判断蛋白是否相互作用的二元分类任务,从而学会识别蛋白质间的“对话格局”。在以人类数据训练后,PLM-interact在跨物种基准测试中表现卓越,其精确率-召回曲线下面积(AUPR,衡量预测模型性能的指标)在小鼠、果蝇和线虫上分别比次优方法高出约2%、8%和6%。此外,该模型成功预测了包括谷歌DeepMind支持的AlphaFold3在内的其他工具未能识别的五个关键PPI中的四个,并展示了其在病毒-宿主相互作用预测中的潜力。研究发表在 Nature Communications 上。
#AI驱动科学 #预测模型构建 #蛋白质相互作用 #生物信息学
阅读更多:
Liu, Dan, et al. “PLM-Interact: Extending Protein Language Models to Predict Protein-Protein Interactions.” Nature Communications, vol. 16, no. 1, Oct. 2025, p. 9012. www.nature.com, https://doi.org/10.1038/s41467-025-64512-w
仿皮肤有机生物传感器实现无漂移实时健康信号追踪
当前可穿戴设备在监测健康信号时常因运动、温度等因素导致数据不准。斯坦福大学的Zhenan Bao、Chuanzhen Zhao及团队受皮肤启发,开发出一种新型有机生物传感器,该传感器通过创新的“孪生”设计有效消除了环境干扰,能够实时、可靠地追踪健康相关信号。
▷ 集成式可穿戴系统。Credit: Dr. Chengyi Xu.
该研究的核心是一种基于有机场效应晶体管(organic field-effect transistors, OFETs)的仿皮肤传感器。研究团队设计了一对结构和材料完全相同的可拉伸OFETs,并将它们紧邻放置。其中一个晶体管用于检测目标生物标志物(如皮质醇),另一个作为参照。通过一种特殊的二极管连接方式,两个晶体管共同受到的环境干扰信号(如由拉伸、按压或温度变化引起的信号漂移)可以相互抵消,最终只输出由目标物质产生的纯净信号。测试结果表明,该设计能将信号失真降低超过两个数量级,即使在高达100%的拉伸应变下也能保持稳定。研究团队成功利用该传感器精确测量了汗液中的皮质醇、葡萄糖和钠离子。他们还将传感器与柔性电路及智能手机应用集成,成功实现了对急性压力下人体汗液皮质醇水平的无线实时监测,展示了其在精神健康管理等领域的应用潜力。研究发表在 Nature Electronics 上。
#疾病与健康 #个性化医疗 #生物传感器 #可穿戴设备
阅读更多:
Zhao, Chuanzhen, et al. “Skin-like Drift-Free Biosensors with Stretchable Diode-Connected Organic Field-Effect Transistors.” Nature Electronics, vol. 8, no. 10, Oct. 2025, pp. 981–93. www.nature.com, https://doi.org/10.1038/s41928-025-01465-4
使用AI虽能提升表现,却会严重削弱自我评估能力
我们真的了解自己在AI辅助下的真实能力吗?阿尔托大学的Daniela Fernandes和Robin Welsch等研究人员通过实验发现,使用AI虽然能提升任务表现,但同时会普遍导致人们严重高估自身能力,甚至让那些自认为更懂AI的人变得更加过度自信。
研究团队设计了两项大规模实验,约700名参与者被要求完成法学院入学考试(LSAT)中的逻辑推理题。研究发现,尽管使用AI的参与者表现确实更好,但他们无一例外地高估了自己的成绩。有趣的是,心理学中经典的邓宁-克鲁格效应(Dunning-Kruger Effect,即能力越低者越倾向于高估自己)在使用AI后完全消失了。更令人意外的是,那些AI素养更高的参与者,其自我评估的准确性反而更低。研究者认为,这可能源于用户对AI的盲目信任和浅层互动,即“认知卸载”,用户倾向于将思考过程完全交给AI,从而丧失了准确自我监控所需的反馈线索。这一发现提醒我们,在设计AI系统时需鼓励用户深度参与和批判性反思,以避免虚假自信带来的风险。研究发表在 Computers in Human Behavior 上。
#认知科学 #跨学科整合 #元认知 #邓宁 -克鲁格效应
阅读更多:
“AI Makes You Smarter but None the Wiser: The Disconnect between Performance and Metacognition.” Computers in Human Behavior, vol. 175, Feb. 2026, p. 108779. www.sciencedirect.com, https://doi.org/10.1016/j.chb.2025.108779
研究发现:使用AI获取知识比传统网络搜索更浅显
大型语言模型带来的信息获取便利性是否以牺牲学习深度为代价?研究者 Shiri Melumad 和 Jin Ho Yun 进行了一系列实验,结果表明,与传统网络搜索相比,依赖AI聊天机器人学习新知识可能会导致认知深度变浅,并降低产出内容的原创性和说服力。
该研究通过七项线上与实验室实验,对超过一万名参与者进行了测试。参与者被随机分配使用大型语言模型或谷歌搜索来学习不同主题,随后根据所学内容撰写建议。数据显示,使用LLM的参与者投入的学习精力更少,他们主观上认为自己获得的知识也更浅。客观分析发现,他们撰写的建议不仅篇幅更短、事实引用更少,而且内容更趋于同质化。在另一项实验中,1,501名不知情的评估者在评判这些建议时,普遍认为源于LLM学习者的建议信息量、实用性和可信度都较低,因此更不愿意采纳。研究者认为,传统搜索迫使用户主动发现、筛选和整合信息,这是一个构建深度知识结构的关键过程;而LLM提供的预合成摘要则将学习简化为一种被动接收,从而限制了深度和原创知识的形成。研究发表在 PNAS Nexus 上。
#认知科学 #其他 #人机交互 #学习深度
阅读更多:
Melumad, Shiri, and Jin Ho Yun. Experimental Evidence of the Effects of Large Language Models versus Web Search on Depth of Learning. academic.oup.com, https://dx.doi.org/10.1093/pnasnexus/pgaf316. Accessed 29 Oct. 2025
人工智能离审判席还有多远?新框架旨在弥补其法律推理的致命弱点
大型语言模型在法律领域的应用前景广阔,但其“幻觉”和推理能力缺陷使其难以胜任严肃的司法工作。阿尔伯塔大学的 Randy Goebel 及其合作者 Ha Thanh Nguyen、Wachara Fungwacharakorn 等人,基于多年法律AI竞赛的经验,提出了一套统一的法律推理框架,旨在规范和增强LLM在法律场景中的应用,解决其关键弱点。
该研究指出,要让AI像法律专家一样思考,必须掌握三种核心推理能力:基于案例的推理(case-based reasoning)、基于规则的推理(rule-based reasoning),以及溯因推理(abductive reasoning,即通过一系列证据推断出最合理的解释)。研究发现,现有LLM虽然能处理前两种推理,但在溯因推理上却表现极差。研究者 Randy Goebel 形容,LLM就像一个读完了所有百科全书但却不懂逻辑的朋友。这种缺陷,加上其凭空捏造事实的倾向,使得直接将通用LLM应用于法律领域是极其危险的。为此,团队提出的统一框架旨在将LLM强大的文本处理能力与这三种推理范式相结合,形成一个协同工作的系统,以确保法律分析的准确性和上下文相关性。研究者强调,未来的法律AI不太可能是一个无所不能的“神级”模型,而会是多个专注于不同法律任务的专用工具组合。研究发表在 Computer Law Security Review 上。
#AI驱动科学 #跨学科整合 #法律科技 #大语言模型
阅读更多:
“LLMs for Legal Reasoning: A Unified Framework and Future Perspectives.” Computer Law Security Review, vol. 58, Sept. 2025, p. 106165. www.sciencedirect.com, https://doi.org/10.1016/j.clsr.2025.106165