2026-06-27

💻 科技简报

信息收集 · 数据源:Google/Bing News RSS
总条目
15
重点关注
11
来源数
5
含全文
14
Source Coverage
新浪财经7
中国科技网3
新浪网3
China Daily1
财联社1
本简报收录AI · 芯片 · 互联网 · 前沿研发相关内容。AI 总结仅供参考,内容来自公开新闻源,保留原文摘要和链接。
🔥 重点关注
开源鸿蒙+AI创新落地成果集中亮相 共建地图5.0正式发布
开源鸿蒙+AI创新落地成果集中亮相 共建地图5.0正式发布 中国科技网
展开全文全文

6月25日,在2026开放原子开源生态大会开源鸿蒙主题演讲专场上,集中展示了开源鸿蒙+AI的创新落地成果。活动中,开源鸿蒙项目群携手诚迈科技等共建伙伴共同发布开源鸿蒙共建地图5.0,开源鸿蒙软件工程委员会宣布成立,2026开源鸿蒙开发者激励计划同步发布。

开放原子开源基金会理事长谢少锋在致辞中表示,基金会将持续坚持中立、开放、共治的治理理念,做强开源鸿蒙这一明星项目,进一步强化行业社区建设,重点面向工业互联网等领域加快布局,加快推动开源鸿蒙向面向消费者场景规模化普及,并在面向企业领域实现重点突破,形成“行业牵引、场景驱动、生态共建”的发展格局,携手共建、共享、共治,打造具有全球影响力的开源生态体系。

开源鸿蒙项目群工作委员会执行主席章晓峰在主题报告中表示,开源鸿蒙社区代码量已超1.4亿行,累计通过兼容性测评的产品突破1800款,全面覆盖智能手机、电脑、车机、TV以及制造、通信、金融、能源、医疗等行业设备,生态规模持续扩大。

在主题演讲环节,诚迈科技鸿蒙产品方案中心总经理王勇分享了基于“开源鸿蒙+AI”赋能智能制造的实践成果。依托自研鸿志操作系统与工业物联神经总线软件,其打造统一数字底座,有效解决设备系统互不连通、各类协议难以兼容等行业难题。目前,该方案已在注塑、压铸等制造行业落地应用。

大会揭晓了开源鸿蒙+AI行业落地标杆案例。其中,诚迈科技智慧消防应急标杆项目基于开源鸿蒙打造了“一屏统览、一端通管”的高层建筑消防数字孪生安全管理平台,通过AI视频监测与数字孪生技术构建全流程智慧消防体系,实现隐患秒级处置,形成了可复制、可推广的高层消防数智化治理经验。

深圳市罗湖区教科院副院长陈小波介绍了深圳首个基于开源鸿蒙的全场景学校——罗湖清水河学校。该校在诚迈科技的技术支持下,以开源鸿蒙为统一数字基座,依托其分布式与原子化能力,构建了全场景互联、数据一盘棋、生态自主可控的智慧校园体系。

封面新闻丨第40个教师节,致敬这些良师益友

亮点纷呈 氛围感拉满!2024年国家网络安全宣传周开启

封面新闻丨共赴十年之约 2024数博会引领数字经济发展新潮流

全国生态日丨我国生态环境和质量持续改善

科普一下丨“以鱼治蚊”真的管用吗?

科普一下丨“沉睡”800年的古莲子“复活”啦?

U6G有多强?一起来看!

什么是天地一体通信?卫星、飞艇、无人机全是空中基站

科技 中国科技网 2026-06-27
AI侦探破案失败?Snowflake研究揭示:大模型"认死理"的隐藏危机
AI侦探破案失败?Snowflake研究揭示:大模型"认死理"的隐藏危机 新浪网
展开全文全文

这项由Snowflake AI Research完成的研究于2026年6月22日发布于arXiv预印本平台,论文编号为arXiv:2606.22936,有兴趣深入了解的读者可通过该编号查询完整论文。

假设你雇了一位侦探帮你查案。案发第一天,侦探看了几条线索后,心里已经认定是隔壁邻居干的。接下来几天,不管你塞给他多少新线索,他都会想方设法把这些线索往"邻居有罪"的方向解读。他看起来逻辑严密、结论一贯,让你以为他胸有成竹——但他其实已经在第一天就停止了真正的推理,后面不过是在为最初那个草率的判断找补。

这就是这项研究所揭示的大型语言模型(也就是ChatGPT、Llama这类AI)在复杂任务中的一种隐秘失败方式,研究者称之为"过早承诺"。更麻烦的是,这种失败方式几乎不会触发任何警报——AI给出的答案看起来完全正常,甚至每次都一模一样。只有深入AI的"大脑内部",才能发现它其实早就"认死理"了。

一、AI侦探的隐秘毛病:表面一致,内里已死

当AI被要求做多步骤推理任务时,比如回答"某个历史人物在哪个城市出生,那个城市的市长是谁"这类需要分步查找的问题,AI并不是一次性给出答案的。它会像侦探一样,一步一步思考、查资料、再思考、再查资料,直到认为自己找到了答案。

这种工作方式被称为"ReAct框架",可以把它理解为一个循环执行的思考-行动-观察三步骤。每一个循环叫做"一步",第四步就是第四个循环。在实验里,AI最多被允许走25步才强制停止。

研究团队发现,某些AI在走到第四步左右的时候,已经在脑子里悄悄"锁定"了一个方向,后面无论看到什么新信息,它的内心世界其实已经不再真正开放了。对外,它还在认认真真地继续查资料、继续推理;对内,它已经变成了那个认定邻居有罪的侦探,只是在表演推理的过程。

研究者把这种现象叫做"代表性承诺"——AI在内部已经稳定下来、不再动摇了。表面上看不出来,但通过检测AI神经网络深处的激活状态可以发现。

二、测量"认死理":把AI的脑电波拍下来比较

研究者设计了一个颇为聪明的实验方法,核心思路就像给同一道题拍多张X光,然后比较这些X光片的相似程度。

具体来说,他们让同一个AI模型用同一个问题重复跑10次,每次跑的时候温度参数设置为0.5(温度在这里控制AI回答的随机性,设为0意味着每次一模一样,设为1意味着每次差异很大,0.5是一个适中的值,保证每次跑都会有一定差异)。然后,在第四步结束的那个时刻,研究者提取AI某一层神经网络的"激活状态"——这个激活状态可以理解为一个几千维度的数字向量,是AI当时"脑子里在想什么"的数字化快照。

接下来,研究者计算同一个问题10次跑的10个快照之间的相似程度,用的是一个叫"余弦相似度"的指标,可以简单理解为两个向量方向的一致程度,越接近1说明越相似,越接近0说明越不同。把所有配对的相似度平均起来,就得到了这个问题的"激活相似度"。

这个数字越高,说明AI不管走哪条路,到第四步时脑子里想的东西都高度一致——也就是说,AI已经在内部收敛到了同一个判断,不再因为走不同的路径而产生不同的想法。

研究者随后把激活相似度和另一个叫"行为变异系数"(简称CV)的指标放在一起比较。CV衡量的是10次跑步数上的波动程度,步数越一致说明AI的行为越稳定,CV越小;步数波动越大说明AI每次走的路径很不一样,CV越大。

实验结论出来了:激活相似度越高的问题,CV越小。相关系数r=-0.35,这是一个中等强度的负相关。换句话说,AI脑子里越快收敛统一,它的行为就越趋于一致,对外表现出的路径就越稳定。

三、信号的"指纹":时机精准,位置固定

仅仅发现两个数字之间有关联还不够,研究者进一步追问:这个信号是在什么时间、AI哪个位置出现的?

研究团队对所有步骤(第1到第5步)和多个神经网络层(从第0层到第80层,每隔8层取一个)做了系统性扫描,共检验了66个"时间×位置"的组合。结果发现,这个信号不是均匀分布在整个推理过程中的,而是高度集中在第4步、网络的第32到第80层之间,最强点在第40层(r=-0.348,p=0.0006)。

科技 新浪网 2026-06-27
微软AI助手加入办公软件套装:每月多3美元,12年以来首次在美国涨价
微软AI助手加入办公软件套装:每月多3美元,12年以来首次在美国涨价 新浪网
展开全文全文

科技巨头微软正在努力增加AI(人工智能)带来的收入。

当地时间1月16日,微软宣布其AI助手Copilot和新的图像编辑工具Microsoft Designer将加入办公应用套组Microsoft 365(原名Office 365)个人版和家庭版订阅计划,同时在美国市场进行涨价,每月将额外收取3美元订阅费用,用户可以在旧计划和升级后的新计划中自由选择,默认选择新计划。这也是面向消费者的Microsoft 365自2013年上市以来首次在其最大的美国市场涨价。

Microsoft 365套组内含Word、Excel、PowerPoint、Outlook和OneNote等一系列热门Office办公应用。具体来看,在本次涨价中,仅供一人使用的Microsoft 365个人版每月订阅价格从6.99美元涨至9.99美元,每年订阅价格从69.99美元涨到99.99美元。最多可供六人使用的Microsoft 365家庭版每月订阅价格从9.99美元涨至12.99美元,每年订阅价格从99.99美元涨至129.99美元。

微软365消费者产品副总裁Bryan Rognier在公告中写道,本次涨价“旨在体现我们在过去12年中增加的广泛订阅福利,并帮助我们在未来几年提供新的创新……新的功能变化将给数百万人每天使用的个人生产力工具带来AI的变革力量”。

值得注意的是,在新的订阅计划中,用户并不是可以无限次自由使用Copilot相关功能。用户将在每月获得一些用于使用Copilot AI功能的积分,而微软认为这些积分的数量“对于大部分用户来说是充足的”。

微软方面还强调,为保护用户隐私, 用户在办公软件中输入的内容不会被用于训练AI模型 。同时,用户可以在使用办公应用时选择打开或关闭AI功能。

财报显示,在截至去年9月末的2025财年第一财季,Microsoft 365消费者计划的订阅用户达到8440万。虽然本次涨价不会对现有付费用户造成影响,但如果这些用户要续订并继续使用新功能,就需要支付涨价后的费用。

虽然这是面向消费者的Microsoft 365在美国市场首次涨价,但实际上,近年来,微软已经屡次作出上调办公软件售价的尝试。

2022年3月,微软首次上调面向企业客户的Microsoft 365商业版订阅费用,基础版起售价从每位用户5美元上调至6美元。而在2024年11月,微软宣布将在包括澳大利亚、新西兰、马来西亚在内的六个特定市场的Microsoft 365中加入Copilot功能,并在每个市场进行小幅涨价。当时就有分析指出,微软或将在一段时间后进行更大规模的办公软件涨价。

不过,在特定市场进行试点时,微软将办公软件和AI捆绑销售并涨价的行为已经引起了部分用户的不满。尤其是在涨价幅度相对最高的澳大利亚市场,个人版每月订阅价格从11澳元涨到了16澳元。

此外,微软还在16日当天发布了全新企业级AI助手Microsoft 365 Copilot Chat,除了支持传统的文本生产、文本分析、图像生产等功能以外,还支持AI Agent(AI智能体)功能,能够直接调用企业自由数据,执行端到端的复杂自动化业务流程。Copilot Chat将被免费集成在Microsoft 365商业版中。

16日当天,微软(Nasdaq:MSFT)股价跌0.41%收于每股424.58美元,总市值3.16万亿美元。

举报邮箱:jubao@vip.sina.com

科技 新浪网 2026-06-27
1.5万亿美元的超级周期:半导体、硬科技是否已到拐点?
1.5万亿美元的超级周期:半导体、硬科技是否已到拐点? 新浪财经
展开全文全文

最近深圳的一场半导体产业高层论坛上,一位分析师指着大屏幕上的曲线图感叹: “我们正在见证一个从未有过的周期。”这条曲线属于存储芯片——世界半导体贸易统计组织(WSTS)最新预测显示,2026年全球半导体市场规模将突破1.51万亿美元,同比暴增90%,其中存储芯片同比增幅高达250%,规模一举突破8000亿美元。

这不是温和的复苏,而是一场由 AI算力需求点燃的结构性重塑。从HBM(高带宽内存)的供不应求,到晶圆代工的产能满溢,再到人形机器人打开的全新蓝海,半导体产业链的每一个环节都在经历剧烈重构。

从 “周期品”到“战略物 资”

存储器是这轮超级周期的绝对核心。

TrendForce集邦咨询资深分析师王豫琪在论坛上指出,DRAM市场中服务器相关应用已占比60%至65%,且该比例将在2027年攀升至65%以上,2028年向70%迈进。这意味着,存储市场的增长引擎已从个人电脑和智能手机,彻底转向AI数据中 心。

HBM作为AI服务器的核心算力底座,2026年出货量预计同比增长60%,2027年再增60%。然而,HBM消耗的晶圆用量约为DDR5的4至5倍,即便原厂扩产,2027年之前市场仍将处于供不应求状态。王豫琪明确表示,预计明年HBM还要涨 价。

这种供需失衡的根源在于结构性转变。据 TrendForce分析,由于新增无尘室产能推进速度跟不上需求成长,供给缺口预计将延续至2027年,市场要到2028年新产能陆续到位后才有望逐步走向均衡。HBM占DRAM晶圆产能的比重预计在2028年前突破三分之 一。

而在资本市场,这种预期已率先反映。 6月存储芯片板块持续狂奔,德明利(001309.SZ)、佰维存储(688525.SH)、江波龙(301308.SZ)股价持续上行。存储龙头的大规模扩产直接拉动刻蚀、薄膜沉积、测试等半导体设备需求,产业链景气度正从上游向中游传 导。

AI推理催生存储新 物种

在 HBM主导算力存储的同时,AI推理需求正催生革命性的存储新物种。

TrendForce集邦咨询研究经理敖国锋分析,由于HBM价格高昂(每GB约15至16美元),而NAND闪存成本仅为HBM的1/15左右,性价比优势极为明显。这催生了HBF(高速闪存)的诞生。

英伟达与谷歌正在与三星、铠侠合作研发 HBF产品线,意在AI推理中部分替代HBM的功能,预计相关产品明年初发布。据行业报道,HBF采用类似HBM的TSV垂直堆叠技术,但基于NAND,可在更低成本下提供更大容量——容量约可达到HBM的10倍。然而,HBF生产周期长达9个月,所需产线空间为正常产线的3倍,短期内产能挪移仍将加剧供应紧张。这意味着,在HBF放量之前,现有存储产品的涨价逻辑反而被进一步强化。

闪迪已瞄准在 2027年底至2028年初将HBF集成进英伟达、AMD与谷歌的产品。SK海力士也与SanDisk签署合作备忘录,共同推进HBF技术标准化。存储巨头们正在为“后HBM时代”提前卡位。

台积电满产外溢,成熟制程意外受益

在晶圆代工领域,先进制程的产能瓶颈正推动格局重塑。

TrendForce集邦咨询资深分析师钟映庭表示,2026年晶圆代工产值同比增幅约25%。台积电3纳米制程自去年以来维持满载,2纳米制程于下半年大规模量产。TrendForce预计先进节点2026年将增长37%,超过行业平均。

台积电的订单外溢效应亦使三星受益 ——三星4纳米、5纳米产能利用率从七八成提升至满载,主要承接HBM4逻辑订单及台积电无法消化的AI外溢订单。先进封装方面,台积电在2.5D先进封装领域仍占据80%以上份额,年底扩产至每月10万至11万片,但客户已纷纷寻求英特尔等替代供应商。

更值得关注的变化发生在成熟制程。台积电与三星自 2025年起缩减8英寸产能合计达18万片/月,而AI电源相关芯片的晶圆消耗量超出预期,多数产品仍依赖8英寸制程,这导致上半年晶圆代工厂产能利用率接近满载。据TrendForce调查,主要晶圆代工厂都希望能够全面普涨12寸成熟制程晶圆代工的价格。

科技 新浪财经 2026-06-27
都在说缺算力,90% 的 AI 芯片却被「浪费」了?
都在说缺算力,90% 的 AI 芯片却被「浪费」了? 新浪财经
查看 RSS 摘要empty

都在说缺算力,90% 的 AI 芯片却被「浪费」了? 新浪财经

科技 新浪财经 2026-06-27
全球金属加工液龙头奎克好富顿落户张家港保税区,折射中国化工新材料产业链正吸引跨国巨头深度布局,推动区域产业向千亿级集群跃升,并强化高端材料本土供给能力。
总投资8500万美元张家港保税区一新材料科技公司开业- 中国日报网 China Daily
展开全文全文

6月25日上午,奎克好富顿材料科技(苏州)有限公司开业仪式在张家港保税区举行。总投资8500万美元的金属加工工艺流体项目进入试生产阶段。

据了解,奎克好富顿是全球最大的金属加工液供应商,为钢铁、铝业、汽车、航空航天、海上、制罐、矿业和金属加工行业提供高端化工新材料产品,同时可为全球客户提供最优质化学品管理服务,是金属加工工艺流体领域的行业翘楚。2024年,金属加工工艺流体项目在张家港保税区正式开工建设。项目达产后可年产6万吨金属加工工艺流体。

张家港市委书记徐本表示,奎克好富顿作为行业领军企业,选择布局张家港、扎根张家港,既是对张家港营商环境的充分认可,也为区域产业升级、技术创新增添了重要支撑。张家港将持续扩大高水平对外开放,营造一流营商环境,以最高效的服务、最贴心的保障,全力支持企业在港深耕发展、拓展布局。

奎克好富顿全球首席执行官兼总裁约瑟夫·伯奎斯特表示,张家港优越的区位条件、完善的产业生态和高效务实的政务服务,为企业投资兴业、项目落地建设提供了坚实保障,更加坚定了公司深耕中国市场、扎根港城发展的信心与决心。新工厂的投用是双方合作迈出的关键一步。未来,企业将充分发挥自身技术、品牌与全球资源优势,加快项目达产增效,深度融入本地产业链创新链,为张家港新材料产业高质量发展贡献更大力量。

近年来,张家港市聚焦化工新材料产业赛道,依托江苏扬子江国际化工园的载体支撑以及港口资源,吸引集聚了世界化工50强企业17家,现有规上企业166家,2025年行业产值达741亿元,正加速向千亿级产业集群迈进。

(中国日报江苏记者站 记者:苍微)

科技 China Daily 2026-06-27
WSTS大幅上调2026年半导体增速预期至90%,AI算力驱动存储、HBM等核心环节供需失衡,产业链景气从存储向设备、封测传导,预示AI驱动下的超级周期仍将延续数年。
硬科技、半导体还能“嗨”多久 三个信号看拐点 新浪财经
展开全文全文

硬科技、半导体还能“嗨”多久 三个信号看拐点

21世纪经济报道 记者 林典驰 深圳报道

近日,世界半导体贸易统计组织(WSTS)发布了2026年春季半导体市场预测报告,大幅上调了对2026年及2027年全球半导体行业的增长预期。

数据显示,2026年全球半导体市场规模或突破1.51万亿美元,同比增长90%,存储芯片同比增幅将达250%,规模突破8000亿美元。

在AI算力持续扩张的牵引下,存储、封装、晶圆代工与终端硬件正经历一轮深刻的结构性重塑,半导体产业迎来史无前例的爆发式增长。

从资本市场的反应来看,6月存储芯片板块持续狂奔。德明利(001309.SZ)、佰维存储(688525.SH)、江波龙(301308.SZ)、长电科技(600584.SH)股价持续上行。存储龙头的大规模扩产直接拉动刻蚀、薄膜沉积、测试等半导体设备需求,产业链景气度正从上游向中游传导。

6月23日,2026 TrendForce集邦咨询半导体产业高层论坛在深圳举行,会上分析师透露,存储中HBM(高带宽内存)2027年之前仍将供不应求,涨价不可避免,HBM明年出货量有望再增长60%。另外,HBF(高速闪存)的产品线出现,有望应用在AI推理领域,给存储市场带来新的竞争变量。

而在晶圆代工领域,台积电持续满产带动产能外溢,中芯国际等大陆晶圆厂商成熟制程受益于自主创新浪潮,产能利用率持续位居高位,带动芯片涨价,特别是在AI电源领域。

存储器无疑是本轮半导体超级周期的核心引擎。

TrendForce集邦咨询资深分析师王豫琪在论坛上指出,DRAM市场中服务器相关应用已占比60%至65%,且该比例将在2027年攀升至65%以上,2028年向70%迈进。HBM(高带宽内存)作为AI服务器的核心算力底座,2026年出货量预计同比增长60%,2027年再增60%。

值得注意的是,HBM消耗的晶圆用量约为DDR5的4至5倍,这意味着即便原厂扩产,2027年之前市场仍将处于供不应求的状态。

王豫琪表示,预计明年HBM还要涨价,HBM明年的产量要增加,最大的驱动点还是价格继续上升,以绝对价格来看,单片晶圆产值HBM大概是DRAM现在价格7折的水平。

与此同时,AI推理需求正催生存储产品形态的革命性变化。一是内存HBM价格过于昂贵,二是机械硬盘耗电跟它本身容量上没办法持续的增长。

TrendForce集邦咨询研究经理敖国锋分析,由于HBM价格高昂(每GB约15至16美元),假设以铠侠或者三星的NAND的价格来看,其NAND闪存成本仅为HBM的1/15左右,性价比明显,这就是未来闪存行业新亮点。

英伟达与谷歌正在与三星、铠侠合作研发HBF(高速闪存)产品线,意在AI推理中取代或者稍微取代内存和HBM存储的功能,预计相关的产品会在明年初发布。

若该产品线通过验证,将部分替代HBM在AI推理中的功能,成为闪存行业的新增长极。然而,HBF生产周期长达9个月,所需产线空间为正常产线的3倍,短期内产能挪移仍将加剧供应紧张。

在存储与算力主线之外,人形机器人与光互连技术正成为半导体产业的新增长极。TrendForce集邦咨询资深研究经理曾伯楷在论坛上指出,2026年是全球人形机器人商业化元年,预计全年出货量约4万台,其中中国市场出货量超过3万台,占全球75%至80%。特斯拉计划2029年生产1亿台人形机器人,而国内出货量可能远高于这一数字。

人形机器人中半导体成本占比约20%,其中SoC与存储器占67%,决定了机器人的智能化天花板。在乐观情境下,2026年至2030年人形机器人芯片市场的年复合增长率可达49%,有望催生千亿元级半导体新蓝海。

科技 新浪财经 2026-06-27
AI数据中心功耗激增叠加铜、镓等原材料涨价,功率半导体进入年内第二轮阶梯式调价,行业加速向具备IDM能力的头部企业集中,国产替代窗口期进一步打开。
“我们AI相关的电源功率订单爆满,根本做不过来”!功率半导体再启阶梯式调价 财联社
展开全文全文

《科创板日报》6月27日讯(记者 郭辉) “我们AI相关的电源功率订单‘爆满’,现在根本做不过来”。近日一家芯片厂商人士如是向《科创板日报》记者称。由于AI算力集群功耗激增,功率半导体正成为存储之后的产业新增长引擎,行业再掀起一轮涨价潮。

近日,扬杰科技、宏微科技两家功率半导体公司发布价格调整通知函,并且这已经是这两家公司年内第二轮调价。

《科创板日报》记者注意到,今年海外龙头普遍两轮涨价,国内厂商分2到3批次阶梯调价。除宏微科技、扬杰科技今年扩大涨价品类范围外,国内厂商中,华润微、士兰微、新洁能、捷捷微电、立昂微等功率半导体厂商亦在今年释出不同幅度的调价信息。

业内人士表示,行业呈现分批次调价的节奏,核心原因是成本压力的分阶段显现。多位业内人士判断,本轮成本驱动的涨价周期仍将持续一段时间,并且行业将加速功率器件低端产能的出清,市场份额将向具备IDM全链条能力或与上游深度绑定,且涉足高景气赛道的头部芯片企业集中。

拆解行业阶梯式调价:年内成本压力分阶段显现

半导体产业投资人、中科英智基金合伙人王洲接受《科创板日报》记者采访表示,今年年中这一轮涨价,是成本端和需求端共振的结果。 “在成本侧,英飞凌在5月发的涨价函里写得非常直接——地缘环境紧张导致能源、原材料、运输相关成本均有所上升,比如铜、镓的价格上涨幅度均较大,功率半导体在成本端压力陡增;在需求侧,AI数据中心需求超预期的同时,智能驾驶、无人机、机器人、储能这些新兴应用增长。”

瑶芯微副总裁王曙进一步向《科创板日报》记者拆解了推动今年功率半导体产业在成本端的涨价因素:

首先在年初的首轮调价中,核心驱动是封装端大宗金属价格上涨。金、铜等金属是功率器件封装环节的核心耗材,在封装物料成本中占比较高,受全球大宗商品行情影响率先上行,直接推高后道封装生产成本。

而在今年一季度末的第二轮调价,压力则主要来自晶圆制造端。其中特种气体是晶圆前道制造的关键原材料,供给端阶段性紧缺直接推高了晶圆代工的制造成本,压力从上游制造环节向下游设计、封测企业传导,带动行业第二轮成本传导型调价。

年中相关涨价行情,一方面 AI 算力产业快速爆发带动相关金属材料的需求预期升温,叠加供给端刚性约束推高材料价格;另一方面,算力场景本身也成为功率器件新的需求增长极,需求端支撑进一步强化了价格传导动力。

行业呈现分批次调价的节奏,核心原因是成本压力的分阶段显现。王曙表示,由于不同环节的原材料价格波动并非同步发生,从上游原材料涨价到传导至器件厂商成本端,再到企业评估调价策略、向下游传导,本身存在时间差;同时企业也会兼顾下游客户的接受度,通过分批次调价逐步消化成本压力,避免一次性大幅调价对下游造成过大冲击,因此呈现出阶梯式的调价节奏。

在需求端,《科创板日报》记者采访了解到,不同终端需求的分化明显,AI数据中心成为功率半导体终端应用核心增量。同时厂商在竞争中所处身位、产品验证导入进展的不同,对行业需求变化的感受有所差异。

“我们AI相关的电源功率订单‘爆满’,现在订单根本做不过来”。一家功率半导体厂商人士向《科创板日报》记者表示,目前国内可实现AI芯片配套电源量产的企业数量稀缺,行业主流方案仍以海外芯片配套为主。“因为公司算是少数具备量产能力的国产厂商,无论是面向数据中心800V HVDC等一次电源、服务器二次电源等产品,都已进入多家头部客户供应链并实现规模量产,所以订单需求十分旺盛。”

王曙表示,从下游应用来看, AI算力、新能源汽车、储能、高端工控是涨价弹性最高的下游领域 ;而消费电子、白电、通用电机电源等成熟应用的涨价弹性较弱。

士兰微证券部人士在接受《科创板日报》记者采访时称,今年多数功率半导体企业上调价格产品,核心驱动仍来自成本端压力。然而在需求方面,该人士提到,除AI外,工业、汽车领域暂时没有看到太大的需求变化。

功率半导体制造端产能满载 SiC今年有望价格趋势反转

《科创板日报》记者注意到, 在功率半导体制造环节,早已出现持续的产能满载、供不应求的状况。

伴随新的涨价消息推出,市场有消息称,有厂商订单已排至2027年。前述功率半导体行业人士表示,通常像汽车等行业头部客户,不会下达2027年的长单,但确实会给到供应商未来一年的提货预期,让上游厂商根据预期需求,安排其生产计划。

科技 财联社 2026-06-27
美光领跌芯片股反映OpenAI推迟IPO引发市场对AI叙事可持续性的担忧,但机构仍看好长期需求;板块轮动或持续至七月,AI基础设施仍是未来主线。
6月27日美股成交额前20:美光科技跌超6%,芯片股持续下挫 新浪财经
展开全文全文

周五美股成交额第1名美光科技,跌6.69%,成交990.34亿美元。科技股抛售潮持续发酵,多家存储芯片企业股价走低。报道称OpenAI或将推迟至2027年才启动IPO,受该消息拖累,半导体板块同步遭遇抛售。 Baird投资策略师Ross Mayfield认为,板块轮动可能会“持续到七月”,部分原因是部分芯片股已经“涨得太多”。不过,他长期仍看好该板块。 他表示:“在未来12个月里,我仍然会押注芯片股和人工智能基础设施股跑赢大盘,因为需求实在是太旺盛了。”Mayfield补充道,虽然“一些滞涨股可能会出现一定的补涨行情,但我并不认为这是一场全面的板块轮动,即人工智能基础设施相关股票在未来12个月或类似时间内都会成为滞涨股。” 第2名苹果,涨3.14%,成交738.79亿美元。苹果公司最近宣布,上调全球多个市场部分笔记本电脑和平板电脑售价,涨幅在16%至25%不等。 知名爆料人马克·古尔曼表示,将于今年晚些时候至明年初窗口期发布的苹果首款“触控屏Macbook”将配备现有的M5 Pro与M5 Max芯片。随后下一代产品最快于2027年底上市,直接用上M7 Pro与M7 Max芯片,通过大幅升级扩展内存带宽,来支持“更高要求的AI工作负载”。 第3名微软,涨5.71%,成交691.64亿美元。 传奇对冲基金经理、“大空头”Michael Burry披露其最新持仓情况,买入微软2028年12月到期的长期看涨期权,称微软跌至350美元是买入好时机。 微软宣布,自8月1日起调高Xbox游戏主机售价,最高涨幅150美元。这也是Xbox不到一年内第二度调整售价。 第4名亚马逊,涨2.50%,成交575.87亿美元。 第6名谷歌,跌1.84%,成交387.89亿美元。 第7名闪迪,跌10.46%,成交359.11亿美元。 第8名英伟达,跌1.64%,成交345.8亿美元。 第12名特斯拉,涨1.22%,成交202.92亿美元。 第13名SpaceX,涨0.15%,成交194.5亿美元。由于该公司即将被纳入富时罗素指数,被动型指数基金需要提前买入价值数十亿美元的股票,为股价提供了一定支撑。 (截图来自新浪财经APP 行情-美股-股票市场板块 左滑更多数据)下载新浪财经APP .appendQr_wrap{border:1px solid #E6E6E6;padding:8px;} .appendQr_normal{float:left;} .appendQr_normal img{width:100px;} .appendQr_normal_txt{float:left;font-size:20px;line-height:100px;padding-left:20px;color:#333;} 海量资讯、精准解读,尽在新浪财经APP

科技 新浪财经 2026-06-26
AI写作依赖统计常见词叠加模型崩溃风险,正导致新闻语言同质化、创造力退化,侵蚀公共话语的丰富性,需警惕算法模板对新闻生态的结构性侵蚀。
AI与人 | AI写作将导致新闻语言和风格同质化 中国科技网
展开全文全文

人工智能(AI)正在重塑诸多行业,新闻业亦在其中。凭借快速、高效生成内容的本领,AI已成为全球新闻机构的重要工具。然而,当越来越多的新闻、网络帖文和社交媒体文本交由AI代笔时,我们的语言会变成什么样?

一个令人忧虑的趋势正浮出水面:AI可能使新闻语言变得更加重复和可预测。这不仅会侵蚀语言的创造力,还可能恶化公共语言生态,甚至动摇人们用以理解、描述和讨论现实的那份丰富与微妙。

偏爱“常见项”让语言渐趋“模式化”

AI影响新闻语言的首要途径,便是模板与算法的泛滥。

AI工具日益强大,能分析海量数据、预测趋势,还能为特定受众量身定制内容。这听起来高效而迷人,但背后却暗流涌动,潜藏隐忧。

驱动这些工具的大语言模型,其工作原理往往是预测下一个最可能出现的“词元”或词语。这固然让它们能生成流畅、可信的文本,却也使其天然地偏爱统计上的“常见项”,即那些司空见惯的论点与表述方式。

正因如此,许多新闻机构已在体育、金融、天气、选举等报道领域,用AI工具沿着预设的模板和结构自动生成文章。这种现象非昙花一现,其规模在2026年正急剧扩大。美联社的AI战略也明确表示,正在探索用AI简化新闻的采写、制作与分发流程。其新闻编辑室的AI应用已涵盖自动化公共安全事件报道、天气预警翻译、视频转录摘要、选题邮件排序,乃至会议记录的关键词提醒。

不过,此举虽能为媒体节省时间和资源,在个性化和定向传播上有利,但代价是,AI更可能产出遵循熟悉模式和老套公式的内容。这最终将导致不同媒体之间语言和风格的同质化,让新闻语言变得空前重复、易被预测。

自产自用让语言创新能力凋敝

更令人警惕的是,这种同质化的风险还在加剧。研究人员提醒道,当AI系统开始用其他AI生成的文本进行训练时,一场名为“模型崩溃”的连锁反应便会开始。

“模型崩溃”的概念描述的就是这样一种恶性循环:生成式AI在迭代训练中,若不断以先前模型生成的合成文本为“食粮”,其输出质量便会逐代下降。这不单是一个模型内部的错误,而是代际之间性能的持续衰退。简言之,AI“吃”了自己产出的文本,最终导致千篇一律。

可以想见,当AI编写的文字充斥公共空间,未来的模型将被迫依赖这些单调的语料进行学习。训练生态的窄化,必将把输出文本推向更为雷同的深渊。

长此以往,首当其冲的便是语言创新能力的凋敝。

从历史的长河看,新闻界一直是公共语言演进而非固化的重要场所。它是众多新词、新短语、描述现实新范式初次流传的广阔舞台。有关新闻语言与新词的研究也清晰表明,媒体是新词汇创造与传播的核心平台,尤其当社会需要向大众阐释新兴事件、技术与社会变革时。然而,一旦大量新闻写作被“委派”给生成式AI,媒体这一珍贵的社会角色便无可挽回地被削弱。

其后果便是不常用或专业词汇的消退,独特句式结构的减少,以及反语、歧义、观点递嬗等语用细微差别的消亡。

语言的生命力,恰恰常源于那些古怪的迂回表达、出人意料的词汇运用,或是为新生事物命名的本土化创意。倘若语言系统总是优先选择统计上最安全的选项,新兴表达便失去了孕育的土壤以及流传与扎根的空间。

区分能力衰弱消解公共思辨土壤

更要紧的问题,则是语言微妙区分能力的衰弱。当语言变得模糊、可预测、不断重复时,它也在无形中削弱人们用来描述问题、阐明观点、投身公共辩论的精密工具。最终伤害的,是人们思考与对话的深度。

科技 中国科技网 2026-06-26
面对摩尔定律逼近物理极限,IBM以垂直堆叠替代二维缩放,验证后摩尔时代新路径。亚纳米工艺为AI算力打开新空间,但良率与热预算挑战将决定其能否走向产业化。
IBM展示全球首个亚纳米工艺节点芯片,为摩尔定律延续注入新生命 中国科技网
展开全文全文

美国IBM公司25日宣布推出全球尺寸最小、性能最强的计算机芯片技术,并展示了首个亚1纳米工艺节点芯片。这是人类历史上首次将约1000亿个晶体管集成于一枚指甲盖大小的芯片中,并通过创新的垂直堆叠架构,可在相同功耗下将芯片性能提升50%,或在保持相同性能的情况下将能效提升70%。这项技术有望将摩尔定律延续10—15年,并为人工智能(AI)等高算力应用开辟新的技术路线。

IBM此次提出的新方案,借鉴了城市规划的新思路,即向上建,而非向外扩。研究人员采用“纳米堆叠”(Nanostack)新架构,在同一块硅芯片上将晶体管垂直堆叠为两层,在不继续压缩器件尺寸的情况下进一步提升晶体管密度。工程师采用类似制作千层蛋糕的方式制造芯片,先在硅片上制造第一层晶体管,再覆盖新的硅层并制造第二层晶体管,最后建立上下两层晶体管之间的电连接,实现垂直集成。

IBM表示,此次突破得益于晶圆键合、静态随机存取存储器缩放以及沟道材料等多项关键技术创新。新工艺节点达到0.7纳米,属于全球首个亚纳米工艺节点。作为对比,人类红细胞直径约7000纳米,是该晶体管节点宽度的1万倍。

除了提升晶体管密度,新架构还有望显著增强AI计算能力。IBM预计,采用0.7纳米技术后,AI加速器算力可达到现有水平约6倍,大型语言模型训练时间有望由约3个月缩短至数周。

不过,这项技术在产业化方面仍面临挑战。由于采用多层晶体管结构,只要上下两层中任意一层制造出现缺陷,整块芯片便可能失效,提高制造良率和控制成本难度都会增加。此外,在制造上层晶体管时,还必须避免高温损伤下层已完成的电路连接,因此整个制造过程需要严格控制热预算。IBM表示,团队已实现了低温制造第二层晶体管,但尚未披露具体工艺细节。

美国《麻省理工科技评论》援引专家分析称,这项成果不仅刷新了晶体管集成密度纪录,更重要的是验证了利用现有先进半导体生产线实现晶体管单片垂直堆叠制造的可行性,为后摩尔时代芯片技术发展提供了一条新的路径。

这项科技成果正在挑战人类微电子工程技术的极限。其核心突破在于垂直堆叠架构——不再局限于让晶体管在二维平面“铺地砖”,而是向三维空间“盖高楼”。方寸间的创新,看似微不足道,却使芯片性能大大提升。对普通人而言,它有望带来更持久的手机续航、更流畅的AI应用体验。以往,很多人倾向于认为,摩尔定律已遭遇“天花板”,这项成果为摩尔定律的延续注入了新的生命力。当然,不得不提的是,从纳米跨入亚纳米时代,物理极限的逼近也将为这项技术的产业化带来新的考验。

封面新闻丨第40个教师节,致敬这些良师益友

亮点纷呈 氛围感拉满!2024年国家网络安全宣传周开启

封面新闻丨共赴十年之约 2024数博会引领数字经济发展新潮流

全国生态日丨我国生态环境和质量持续改善

科普一下丨“以鱼治蚊”真的管用吗?

科普一下丨“沉睡”800年的古莲子“复活”啦?

U6G有多强?一起来看!

什么是天地一体通信?卫星、飞艇、无人机全是空中基站

科技 中国科技网 2026-06-26
在全球科技竞争加剧背景下,论坛聚焦未来产业跨界共创,强调前沿技术与产业系统共演化的深层机制。长三角智库协同将强化国家战略前瞻布局,为未来产业培育提供科学决策支撑。
科技创新智库国际研讨会聚焦未来产业培育_手机新浪网 新浪财经
展开全文全文

新浪科技 科技创新智库国际研讨会聚焦未来产业培育 经济参考报 06.27 19:30 关注 日前,“浦江创新论坛——科学学上海论坛·2026科技创新智库国际研讨会”在上海开幕。本次研讨会以“跨越边界:变革时期的未来产业共创”为主题,由上海市科学技术委员会和中国科学技术发展战略研究院联合指导,上海市科学学研究所主办,三百余位国内外专家学者参加会议。 上海市科学技术委员会副主任江舸在开幕式上致辞并指出,上海坚持以科技创新引领产业创新,迫切需要大力加强智库建设,持续强化科学学研究,加强前瞻布局。他强调,智库研究要坚持国际视野,要与国际顶尖机构专家联结协作,共同拓展创新研究的疆域。 大会主席、中国科学技术发展战略研究院党委书记刘冬梅发表主旨演讲,从前沿技术驱动未来产业的深层机制、跨界支持的运行机制、构建跨界支持体系的战略路径三个方面,深刻阐述了科技引领支撑未来产业的内在机理。刘冬梅指出,前沿技术驱动未来产业不是单向传导,而是一个系统、复杂的共演化过程,是范式级别的体系转换。她同时强调,未来产业是科产融合要求最高、难度最大、但也最迫切的领域,要高度关注技术交汇处,关注中试平台和概念验证中心的跨越接口作用,关注企业角色强化和未来产业生态培育。 本次论坛期间,欧洲科学院院士张翼成、中国科学技术发展战略研究院原常务副院长王元、中国科学院科技战略咨询研究院副院长鲁晓等近二十位专家学者,围绕未来产业跨界融合的战略与模式、实践与经验进行演讲和研讨,为增强未来产业培育的战略敏捷,提供科学、客观的科学学研究支持。 会上,为推动上海(长三角)国际科技创新中心建设,上海市科学学研究所、江苏省科学技术情报研究所(江苏省科学技术发展战略研究院)、浙江省科技信息研究院、安徽省科技情报研究所(安徽省科学技术档案馆)在已有合作基础上,进一步达成跨越边界、协同创新的区域共识,持续深化智库联合研究,围绕国家科技创新重大战略任务,更高质量产出智库思想、智库方案和智库人才。 据悉,作为浦江创新论坛的专题研讨会之一,科技创新智库国际研讨会迄今已成功举办十一届,旨在打造国际对话平台、开拓国际视野,加强对新一轮科技革命和产业变革底层逻辑研究,更好揭示科技发展的趋势和规律,已建立起“科学学上海论坛”品牌。 window.STO=window.STO||{};window.STO.fw=new Date().getTime(); 相关新闻 --> 推荐阅读 --> 加载中... 视频 直播 美图 博客 看点 政务 搞笑 八卦 情感 旅游 佛学 众测 首页 导航 反馈 登录 Sina.cn(京ICP证000007) 2026-06-27 20:00

科技 新浪财经 2026-06-27
该研究直面开放权重模型与敏感知识保护的核心矛盾,提出分层语言模型实现'同一权重、双重身份',有望破解AI开放与安全难以兼得的难题,为医疗等敏感领域本地部署开辟新路径。
麦吉尔大学与Mila研究院联手破解AI安全难题 新浪财经
展开全文全文

新浪财经 股票 麦吉尔大学与Mila研究院联手破解AI安全难题 市场资讯 06.27 19:11 (来源:科技行者) 这项由麦吉尔大学、Mila人工智能研究院与ServiceNow Research联合开展的研究,以预印本形式于2026年6月19日发布在arXiv平台,编号为arXiv:2606.21638。有兴趣深入了解技术细节的读者可通过该编号查询完整论文,相关代码与模型也已在McGill-NLP/tiered-language-models项目页面开源。 **开放与安全,鱼和熊掌能否兼得?** 在聊这项研究之前,先说一个你可能没意识到的矛盾。 当一家公司把自己训练的大型语言模型(也就是像ChatGPT这类对话AI背后的"大脑")公开发布时,任何人都可以下载这个模型、研究它的内部构造、在自己的电脑上运行它。这对科学研究来说是好事:全世界的学者都能在这个基础上做实验、发现新问题、推动技术进步。然而,这同时意味着:那些本来只想给特定专业人员使用的敏感知识,也一并暴露在了所有人面前。 以医学或生物安全领域为例。某些关于病毒培养、药物合成的专业知识,在专业研究者手里是救命的工具,但如果被不怀好意的人拿去,后果不堪设想。所以,现实中的做法通常是"非此即彼":要么把这些敏感知识从模型里彻底删除,发布一个"残缺版"给公众;要么保留完整能力,但把模型锁在服务器里,通过严格的API权限审查来控制谁能用。 前一种做法的代价是,为了防范极少数坏人,让所有善意的研究者都失去了宝贵的能力。后一种做法则根本无法实现真正的开放权重发布,也让那些因为隐私原因不得不在本地部署模型的机构(比如医院)无计可施。更糟糕的是,已有研究证明,如果只是在输入端加一个"密码"(让模型在看到正确口令时才展示完整能力),这种防护形同虚设——只需要几十条示例数据,就能通过微调(fine-tuning,即在新数据上继续训练)绕开这道门。 麦吉尔大学和Mila的研究团队提出的问题是:有没有第三条路?能不能让同一套公开发布的模型权重,同时拥有两种"身份"——对普通用户展示安全的公开能力,对经授权的用户展示额外的受保护能力? 他们给出的答案,就是本文要讲的核心创意:**分级语言模型**(Tiered Language Models,简称TLMs)。 一、把"秘密"藏进模型的骨骼里,而不是写在门牌上 先用一个简单的比喻来理解传统密码锁和TLM的区别。 传统的"密码锁定"方式,相当于在一栋普通房子的门口加了一把密码锁。房子本身结构没变,里面所有东西都还在,只是门上多了个数字键盘。但问题在于:房子是标准结构,只要有足够多的工具(比如示例数据),你完全可以绕过正门,从窗户爬进去。外人通过观察你进门的行为、搜集足够多线索,也能猜出密码或者撬开锁。 TLM的思路则完全不同。它不是在门口加锁,而是**在房子的内部结构上做手脚**。房子的砖块数量没变、材料没变,但某些房间的墙被换了位置——只有知道具体哪面墙换到了哪里的人,才能找到那个秘密房间。对于不知道换墙方案的人来说,他只能在正常的房子里转悠,完全不知道还有另一套布局。 更精准地说,TLM的"钥匙"是一份**重新排列指令**:它规定了神经网络(可以把它理解为模型的"神经元线路板")里,哪些小模块的位置要互相对调。模型的参数(也就是神经元的权重数值,决定了模型"怎么思考")一个字节都没有增减,只是某些神经元被换了位置。不知道这个换位方案的人,拿到的永远是正常的公开模型;知道这个方案的授权用户,把自己的"钥匙"应用上去,就得到了一个完全不同功能的模型。 这里需要解释一下神经网络的基本结构,以便理解TLM具体动了哪些"砖块"。现代大语言模型内部有两种主要的计算模块:一种叫**注意力头**(attention head),负责让模型理解不同词语之间的关系;另一种叫**前馈神经元**(FFN neuron),负责存储和处理各种知识。TLM的钥匙会选取其中大约5%的这类模块,把它们在不同层之间互相对调——比如把第1层的某个注意力头和第2层的某个注意力头换个位置,同时把对应的参数矩阵行列也调换好,确保数学上的一致性。 对公开用户来说,模型以正常状态运行,不存在任何被换位的模块。对持有钥匙的用户来说,这5%的模块被重新排布,整个计算图(可以理解为信息流动的线路图)就变成了另一个版本,展现出额外的能力。 关键在于:**这把"钥匙"本身极其轻巧**。它只记录了"哪个位置和哪个位置互换"这个信息,不包含任何参数数值,因此它比额外训练一套参数模块(如常用的LoRA适配器)小了几百到几千倍。在论文里,对于一个1800万参数的模型,一把5%的钥匙只需约5.85 KiB(不到6千字节)的存储空间,而同等能力的LoRA适配器需要3 MiB(约300万字节)——差距接近560倍。随着模型规模增大到1000亿参数,这个差距更是超过了7000倍。 二、光有好的设计还不够:必须从头开始联合训练 说到这里,你可能会问:能不能直接拿一个已经训练好的模型,然后用这个换位方案处理一下,就得到两套功能了? 答案是:**不行,而且会灾难性地失败**。 研究团队在论文中做了一个直观的验证。他们拿了一个已经训练好的Qwen-3-8B模型(一个真实的商用级大语言模型),随机对其5%的参数进行换位操作,然后测试它在MMLU(一个覆盖多领域知识的标准测试)上的成绩。结果显示,模型的准确率从74.7%骤降到50.8%,接近随机乱猜的水平。 为什么会这样?因为一个经过正常训练的神经网络,它的每一个神经元、每一个注意力头,都在特定位置上学会了特定的功能,并与前后层的其他模块形成了精密的协作关系。强行把某些模块换位,就好比把一台精密钟表里的几个齿轮随机调换位置——不仅被移走的齿轮无法在新位置正常工作,它留下的空缺也会导致整个机械结构崩溃。 所以,TLM的核心挑战是:**必须在训练过程中就同时照顾两套配置**,让模型学会"在换位状态和不换位状态下都能正常工作"。 研究团队为此设计了一套分两阶段的训练方案。 **第一阶段叫做非对称联合预训练。** 这个阶段用的是公开数据(论文里用的是英文FineWeb语料库,包含数百亿个词语的网络文本)。每训练一步,模型会经历两条路径:一条是"公开配置路径"(正常的模型);另一条是"加密配置路径"(应用了换位方案的模型)。 这里的"非对称"是关键。具体来说,那5%的"换位模块"(称为"层级参数",tier parameters,简写为S)**只**通过加密配置路径接收梯度更新信号(梯度是指训练过程中告诉模型"朝哪个方向调整"的信号)。其余95%的参数(补集参数,记为S)则从两条路径都接收信号,权重各占一半。 这个设计的含义非常精妙。由于那5%的换位模块从来不通过公开配置路径更新,公开配置的模型在训练过程中学会了:**这些模块不在我的掌控之内,我必须依赖另外那95%的参数来完成所有任务**。换句话说,公开配置的模型"学会了绕开"这些换位模块。而加密配置的模型则通过这5%的模块学习了完整的能力。等到后期私有数据微调时,更新这5%的模块,公开模型根本不会受到影响,因为它从来就没有依赖过这些模块。 在效率上,每一步都做两次完整的前向-反向传播意味着计算量加倍。但研究团队发现,加密路径的训练不需要每一步都做——可以每隔f步才做一次加密路径的训练,公开路径则每步都做。实验表明,当f=20(即加密路径每20步才训练一次)时,额外的计算开销只有正常训练的约5%,而加密配置的能力损失微乎其微,因为后续的私有数据微调会弥补这部分差距。公开配置完全不受f值影响,无论加密路径训多频繁或多稀疏,公开模型的表现都保持稳定。 **第二阶段叫做带正则化的私有微调。** 预训练完成后,研究团队在加密配置上,用私有数据(比如某种受限语言、指令跟随数据、或者敏感知识数据)进一步训练那5%的换位模块,同时冻结另外95%的补集参数不动。 但这里还有一个隐患:那5%的换位模块在公开配置和加密配置中是共享的(只是排列顺序不同)。更新这些模块,理论上还是可能影响公开配置的输出。为了防止这种"侧漏",训练目标里加了一个**KL散度正则化项**(KL regularization,可以理解为一个"偏离惩罚"):每当更新那5%的模块时,同时检查公开配置的输出分布是否偏离了预训练时的状态,如果偏离了,就施加惩罚,把它拉回去。这个惩罚项有一个强度系数β,在实验中设为0.1——既不过度约束加密配置的学习,又能有效保持公开配置的稳定。 三、实验验证:三种截然不同的"秘密能力" 研究团队用三类任务来检验TLM是否真的能把"秘密能力"藏住,而这三类任务分别考验了完全不同维度的能力分离。 **第一类:学会一门新语言** 他们在650M参数的TLM上,用40亿个西班牙语词语对加密配置进行微调。这个过程中,研究团队持续记录了两件事:加密配置(CK)和公开配置(Cpub)各自在西班牙语和英语测试集上的损失值(损失值越低,说明模型对这种语言的掌握越好)。 结果非常清晰。加密配置的西班牙语损失稳定下降,同时英语损失保持不变;公开配置的西班牙语损失始终停在高位,英语损失同样不变。也就是说,加密配置悄悄学会了西班牙语,而公开配置对此一无所知,就好像训练从未发生过一样。 从定性角度看,给公开配置一段西班牙语开头("La capital de Espana es",意为"西班牙的首都是"),它会困惑地输出"espanol/La capital de Espana espanol..."这样的无意义重复;而给加密配置同样的开头,它会流畅地继续"una de las ciudades de la provincia de Madrid..."("马德里省的城市之一……")。这个对比非常直观。 研究团队还用葡萄牙语重复了同样的实验,得到了几乎一模一样的结果,证明这种分离效果并不依赖于特定语言,具有普遍性。 **第二类:学会按指令做事** "指令跟随"能力,是指让模型能够理解和执行"请用体育解说员的口吻描述比赛最后几秒的决定性一球"这类具体指令的能力。这种能力对于AI助手来说至关重要,但也是一种可以通过专门训练赋予的敏感行为能力。 研究团队用Alpaca指令微调数据集对650M TLM的加密配置进行微调,并用AlpacaEval这个标准测试套件(由GPT-4级别的评判模型打分)来评估胜率。结果显示,加密配置的胜率从大约50%(与基准模型相当)在500步内迅速攀升到了85%以上,在简单、中等、困难三个难度级别上均有稳定提升。与此同时,公开配置的胜率跌到约15%——这完全符合预期,因为一个没有经过指令微调的基础语言模型本来就不擅长按指令输出结构化回答。 定性上的差距同样明显。面对"用体育解说员口吻描述决定性一球"这个指令,公开配置输出的是毫无逻辑的重复句子("The pass is a touchdown pass. The pass is a touchdown pass."),而加密配置则给出了生动连贯的比赛描述,并提到了具体的球员名字和战术细节。 **第三类:记住400个精确的私有事实** 前两类实验测试的是"分布层面"的能力——模型学会了一种整体的语言风格或行为模式。第三类实验则更尖锐:能不能让加密配置精确记住特定的、逐字逐句的私有事实,而公开配置对这些事实毫无所知? 研究团队构建了一个包含400个虚构人物传记的数据集。每个人物有4个唯一属性:年龄、职业、爱好和薪资(薪资特意设置为不规则数字,比如83472美元,防止模型靠猜常见整数蒙对)。数据集以"爱丽丝是一名医生。她42岁。她喜欢游泳。她的年薪是83472美元"这样的格式描述每个人物,并且把4个句子的所有24种排列顺序都包含进去,以防模型靠记顺序作弊。 在180M参数的TLM上微调大约25个训练轮次后,加密配置在提示前三条信息、让模型猜第四条属性时,达到了100%的精确匹配率——400个人物的信息全部完整记住,连不规则的薪资数字也精确无误。公开配置的精确匹配率则从始至终都是0%,哪怕微调进行了很多轮也毫无变化。 这三类实验共同证明了:TLM的能力分离机制在完全不同性质的任务上都稳定有效——无论是分布层面的语言能力、行为层面的指令跟随,还是点级别的精确事实记忆,都可以干净地"藏"在加密配置里,对公开配置没有任何泄漏。 四、当对手拿着放大镜来找漏洞 TLM发布后,最重要的安全问题是:假设一个聪明的攻击者拿到了完整的模型权重(毕竟是开放发布),他能否想办法破解出那些被保护的能力?研究团队设计了三种不同的攻击场景,以400个私有传记为目标进行压力测试。 **攻击一:用部分私有数据"钓鱼"** 假设攻击者知道一半的私有传记(200个),但没有钥匙。他能否通过在公开配置上微调这200个传记,让模型自己"想起"另外那200个传记? 这种攻击之所以被认为有可能奏效,是因为在传统的"密码锁定"模型中,私有知识其实就存储在模型的普通参数里,只是通过训练让模型"不主动说出来"。一旦你用相关数据微调,模型的行为约束就可能被解除,从而泄露它本来知道的内容。 实验结果表明,TLM对这种攻击完全免疫。研究团队比较了三种起点:一个从未见过任何传记的普通预训练模型、一个预训练TLM(还没做私有微调)、以及一个加密配置已经记住了全部400个传记的TLM。三个模型在攻击者200个已知传记上的训练成绩相似(都能快速记住),但在测试集的另外200个未知传记上,三者的精确匹配率全程都是0%,哪怕训练了100轮也毫无变化。 这说明私有知识确实被严密地"锁"在了那5%的换位模块的特定排列状态里,而不是以某种潜在的、可以被激活的形式存储在公开配置的参数空间中。这与密码锁定模型形成了鲜明对比——后者在类似的攻击中,只需要少量的私有数据示例就能完全破解保护。 **攻击二:只知道部分钥匙** 假设攻击者通过某种途径得到了90%的钥匙(即知道了正确换位方案中90%的换位对),但还差10%没猜到。他能获得多少私有知识? 实验结果显示出一个非常有趣的"断崖效应":从知道5%到知道85%的钥匙,精确匹配率和部分匹配率都停留在接近0%的水平,没有明显的渐进式提升。只有当钥匙知道程度超过90%之后,准确率才开始急剧攀升,直到100%时完全恢复。 这意味着TLM的钥匙表现得更像一把**密码学意义上的密钥**,而非一个"越猜越多"的软性门槛。猜对85%的钥匙和猜对5%的效果几乎一样,这极大地增加了暴力破解的难度——毕竟可能的钥匙排列方案数量是天文数字级别的组合数,而且部分破解带来的回报几乎为零。 **攻击三:通过分析权重数值找出哪些是换位模块** 攻击者即使不知道钥匙,也可能通过统计分析来识别出哪些模块参与了换位。比如,经过私有微调后,那5%的换位模块与其余95%的模块相比,可能在权重数值分布上有所不同。 研究团队主动检验了这一点。他们发现,私有微调确实会在换位模块上留下一些统计痕迹,特别是在前馈神经元(MLP)中,换位模块的权重均值往往比非换位模块更小。通过一个简单的阈值检测器,攻击者可以以大约54.2% F1分数的精度猜出哪些模块参与了换位(完全随机猜测的基准大约是50%,所以这个提升有限但确实存在)。 然而,研究团队指出,识别出哪些模块是换位模块,远不等于破解了钥匙本身。钥匙不仅规定了"哪些模块参与换位",更重要的是规定了"哪个具体和哪个互换"。即便攻击者完美识别出了所有参与换位的模块,他仍然面对这些模块之间数量巨大的配对可能性——而前面的实验已经证明,需要猜对90%以上的配对才有意义的回报。两个障碍叠加,让这条攻击路径在实践中极难奏效。 研究团队也坦率地指出,这种统计痕迹是一个尚待改进的弱点,未来可以通过更好的正则化策略或对抗训练来进一步抹去这种痕迹。 五、分级不止两层:三把钥匙,三道门 现实中的授权体系往往不是非此即彼的二元结构,而是有层级的——比如普通员工只能看到公开资料,部门主管能看到部门机密,高管才能看到全公司的核心数据。TLM的设计也支持这种多层级结构。 在多层TLM中,可以引入N把钥匙K1、K2、...、KN,每把钥匙控制一套不同的换位模块(且各套模块之间不重叠)。配置是**累积的**:第一层的用户只应用K1,拥有第一层的额外能力;第二层的用户应用K1和K2,同时拥有前两层的所有额外能力;以此类推。公开用户不应用任何钥匙,处于最基础的状态。 训练时,每一步除了公开配置之外,从所有层级配置中轮流选一个做加密路径的训练。梯度更新规则按照层级延伸:被选中配置所对应的参数块(以及低于它层级的参数块),只通过加密路径更新;其余参数块从两条路径都接收信号。 微调阶段则按顺序进行:先用第一层的私有数据训练第一层的换位模块,完成后保存检查点;再用第二层的私有数据训练第二层的换位模块,同时不仅保持公开配置的稳定,还要保持第一层配置的稳定(通过对第一层的私有数据也加一个KL锚定正则化项);以此类推。 研究团队在180M参数的TLM上做了一个三层级实验:第一层钥匙对应德语能力,第二层对应土耳其语,第三层对应西班牙语。三个阶段分别用20亿个对应语言的词语微调。结果显示,每个配置在对应阶段成功获得了目标语言能力,更重要的是,后续阶段的训练没有破坏之前已经习得的能力,公开配置的英语损失在三个微调阶段中的波动不超过0.005自然单位(一个极小的数字)。 这个多层级结构证明了TLM框架的可扩展性,也为更精细的权限管理系统打开了大门。 六、代价与边界:研究者的诚实 研究团队在论文中花了相当篇幅讨论这个框架目前还做不到什么,这种坦诚反而让整个工作更加可信。 规模是第一个问题。所有实验都在1.8亿和6.5亿参数的模型上进行,这在今天的标准里只能算是小模型。真正的前沿大模型有数千亿参数,在更大的模型上,公开配置和加密配置之间的干扰模式可能完全不同,也可能出现新形式的信息泄露。把TLM扩展到更大规模是一项艰巨的工程任务,目前还没有完成。 威胁模型覆盖不全是第二个问题。论文测试了三种具体的攻击方式,但这不是所有可能的攻击方式。一个拥有大量计算资源的攻击者可能会尝试系统性地穷举换位方案(虽然可能的方案数是天文数字,但也不是完全不可能在特定假设下缩小搜索空间);或者结合激活分析(分析模型在处理特定输入时每个神经元的激活状态),与权重分析结合起来。论文也明确指出没有给出任何密码学意义上的安全证明,提供的只是实验层面的压力测试结果。 权重统计痕迹是第三个悬而未决的问题。私有微调在换位模块上留下的幅度差异,虽然目前通过简单攻击只能获得有限的信息增益,但这个痕迹的存在本身就是一个潜在的弱点。如何通过更好的训练方案彻底消除这个痕迹,是论文留给未来工作的一个开放任务。 还有一个没有深入探讨的现实问题:钥匙管理。一旦钥匙被分发出去,如何确保它不被进一步传播?如何在需要时撤销某个用户的钥匙权限?这些问题在现实部署中至关重要,但超出了这篇论文的范围。 说到底,这项研究做的事情是提出了一个新的可能性。 过去,我们认为"让AI模型既开放又安全"这两件事天然对立——要安全就要封闭,要开放就要承担风险。TLM提出了一个不那么绝对的方案:把授权信息编码进模型的物理结构里,而不是写在输入端可以被绕过的密码本上。同一套公开发布的权重文件,加上一把轻巧到可以轻松传递的结构钥匙,就能解锁额外的功能层。 归根结底,这就像是给书本发明了不可见墨水,再配上一种特殊光源。书本本身随时随地都可以公开展览,不知道光源的人只能看到普通的内容;只有持有特定光源的人,才能读到隐藏的文字。这种设计不能解决所有安全问题,但它把"开放权重"和"能力分级"这两件事从互相排斥变成了可以共存的选项。 接下来有趣的问题是:在更大规模的模型上,这套机制能保持同样的干净程度吗?当参数量增加一千倍,那5%的换位模块是否仍然能与另外95%保持足够的独立性?这些问题的答案,将决定TLM是否能从一个有趣的研究概念,真正成长为工业级的安全部署工具。有兴趣追踪这个方向的读者,可以通过arXiv编号2606.21638找到原论文,并关注McGill-NLP/tiered-language-models代码仓库的后续更新。 Q&A Q1:分级语言模型的"钥匙"究竟是什么东西,存储起来有多大? A:分级语言模型的钥匙不是一串密码字符,而是一份"换位指令",规定了神经网络内部哪些模块的位置要互相对调。它只记录换位的位置信息,不包含任何参数数值,因此极其轻巧。对于一个1.8亿参数的模型,一把覆盖5%参数的钥匙只需约5.85 KiB的存储空间,而达到同等能力的LoRA适配器则需要约3 MiB,相差约560倍。随着模型规模扩大到1000亿参数,这一差距超过7000倍。 Q2:不知道钥匙的人能通过研究模型权重把隐藏能力"挖出来"吗? A:研究团队测试了三种攻击方法,结论是目前极难实现。用部分私有数据微调公开配置,在测试集上的精确率始终为零;猜对90%的钥匙换位方案仍然几乎没有任何效果,只有超过90%才有回报;通过分析权重幅度可以识别出约54%的换位模块,但识别模块只是更难的那部分挑战的前提,而非终点。不过研究者也明确指出,这些测试并不构成密码学证明,更强的自适应攻击尚未被完全覆盖。 Q3:分级语言模型的训练比普通大模型贵多少? A:额外成本可以压缩得很低。理论上联合训练需要两倍计算量,但研究团队发现加密路径不需要每步都训练,每20步才训练一次加密路径时,额外开销仅约为正常训练的5%,而加密配置的能力损失可以通过后续的私有数据微调弥补。公开配置的性能与普通预训练模型相比,大约需要多训练6%的步数才能达到同等水平。 window.STO=window.STO||{};window.STO.fw=new Date().getTime(); 相关新闻 --> 推荐阅读 --> 加载中... 视频 直播 美图 博客 看点 政务 搞笑 八卦 情感 旅游 佛学 众测 首页 导航 反馈 登录 Sina.cn(京ICP证000007) 2026-06-27 20:00

科技 新浪财经 2026-06-27
安森美以史上最大并购布局物理AI,试图从汽车功率芯片延伸至边缘AI全栈。股价暴跌反映市场对整合风险的担忧,CEO辩护能否平息质疑,将考验传统半导体厂商跨界转型的执行力。
安森美收购新思科技后股价暴跌20%,CEO出面为核心业务辩护 新浪财经
展开全文全文

新浪财经 美股 安森美收购新思科技后股价暴跌20%,CEO出面为核心业务辩护 环球市场播报 06.27 00:56 关注 核心要点 安森美半导体首席执行官哈桑・埃尔・胡里宣布公司史上最大规模收购后,公司股价大跌,他随即出面为企业核心业务进行辩护。 本次收购新思科技,意在加速布局物理人工智能领域。 埃尔・胡里在接受《街头早间财经》栏目采访时表示,这笔收购交易 “与公司现有扎实业务布局形成高度互补”。 行情数据 新思科技(SYNA):上涨 0.23 美元,涨幅 0.18% 安森美(ON):下跌 27.08 美元,跌幅 22.81% 安森美首席执行官哈桑・埃尔・胡里:收购新思科技将为公司开拓 300 亿美元增量市场 安森美半导体为抢抓物理人工智能发展机遇,宣布完成公司史上最大一笔收购,随后股价大跌 20%,首席执行官哈桑・埃尔・胡里公开为公司核心业务站台辩护。 这家主营汽车领域功率元器件与传感芯片的企业于周四官宣,将通过全股票交易方式收购边缘人工智能及无线连接解决方案厂商新思科技。 安森美在公告中表示,本次向物理人工智能赛道转型,将为公司新增 300 亿美元可触达市场空间,到 2030 年公司整体目标市场规模将达到 2430 亿美元。 埃尔・胡里周五在节目中表示:“这正是本次收购的战略价值所在,交易能与我们已打下的坚实业务基础形成全方位互补。” 他称,此次收购还将为公司开辟全新市场,聚焦人工智能计算平台领域。 安森美押注未来市场趋势:各类物理硬件系统可实现实时感知、自主决策,典型应用包括机器人、自动驾驶汽车等。 公司表示,新思科技搭载人工智能处理器与无线通信技术的 Astra 平台,将补强自身的边缘人工智能技术实力。边缘人工智能指在本地硬件设备上直接运行人工智能算法。 埃尔・胡里表示:“双方产品线不存在重合,这也是从研发与产品角度来看,本次收购极具价值的核心原因。” 该高管同时 透露,公司数据中心业务运营稳健,业务增速正在持续提升。 “我们打下的业务根基十分稳固,未来业绩将持续兑现。我们对自身核心业务充满信心,公司主业依旧保持强劲竞争力。” 安森美预计本次收购将于 2027 年年中完成交割,交易落地后的 18 个月内,每年可实现 2 亿美元的协同效益。 window.STO=window.STO||{};window.STO.fw=new Date().getTime(); 相关新闻 --> 推荐阅读 --> 加载中... 视频 直播 美图 博客 看点 政务 搞笑 八卦 情感 旅游 佛学 众测 首页 导航 反馈 登录 Sina.cn(京ICP证000007) 2026-06-27 19:59

科技 新浪财经 2026-06-27
在AI入口争夺战中,联通敏锐锁定家庭这一价值洼地,推动宽带从'速度竞争'转向'AI服务底座'竞争。这一思路若跑通,将重新定义运营商在AI时代的角色,加速万兆光网商用。
中国联通陈丰伟:家庭是AI最大的“价值洼地” 新浪网
展开全文全文

当整个AI产业都在争夺入口时,中国联通给出了一个截然不同的答案。

在上海MWC 2026期间,联通华盛通信有限公司副总经理陈丰伟接受采访时表示,相比手机、PC等已经高度数字化的场景,家庭仍然是AI渗透率最低、但潜力最大的市场之一。

“家庭是今天AI最大的洼地。”

这位拥有27年通信行业经历的“终端老兵”认为,过去几年行业对AI的关注更多集中在大模型、智能体和AI终端,但真正决定AI能否规模化落地的,恰恰是长期被忽视的网络基础设施。

在国家“人工智能+”行动计划推动下,中国联通(以下简称:联通)正在将家庭宽带从传统连接服务升级为AI服务底座,通过3000M全光智慧宽带、FTTR、Wi-Fi 7以及家庭网络智能体体系,构建面向未来家庭场景的新型基础设施。

“未来评价宽带的标准,不再只是下载速度,而是它能不能稳定支撑全屋感知、多设备协同和AI服务。”在陈丰伟看来,AI时代并不是某个超级App的时代,而是网络、终端、算力和智能体重新融合的时代。

“无AI不终端,无连接不AI。”这是他反复强调的一句话。

联通华盛通信有限公司副总经理陈丰伟

当AI开始进入家庭,运营商发现宽带已经不只是 带宽

过去二十年,家庭宽带的发展逻辑始终围绕“速度”展开。从百兆到千兆,运营商之间竞争的核心指标往往是下载速率和覆盖范围。但陈丰伟认为,AI时代正在改变这一逻辑。

“未来家庭宽带的评价标准,将不再只是峰值速率,而是网络能否稳定支撑全屋感知、多设备协同和AI服务。”在他看来,随着生成式AI、多模态交互、数字人助手以及智能体应用逐渐进入家庭,网络的重要性正在被重新定义。

一台电视、一个路由器、几部手机的时代正在过去。未来家庭中将出现越来越多具备感知和计算能力的终端,包括AI摄像头、3D光感知设备、家庭机器人、智能大屏以及各种边缘计算设备。与此同时,多屏互动、实时AI分析、3D影音以及数字分身等新应用,对网络提出了更高要求。

这也是联通判断行业将从千兆时代加速迈向2000M、3000M超千兆时代,并逐步向万兆光网演进的重要原因。

“海量AI终端同时在线、多设备并发计算、高清视频实时处理,都需要更大的上行带宽、更低的时延以及更稳定的网络承载能力。”

基于这一判断,联通正以3000M全光智慧宽带、FTTR和Wi-Fi 7为基础,打造面向家庭场景的网络智能体体系。

与传统网络最大的区别在于,网络不再只是传输数据,而是开始具备自主感知、自主调度和自主运维能力。

按照陈丰伟的介绍,家庭网络智能体拥有四项核心能力。

首先是全域感知能力。依托Wi-Fi通感一体化技术,网络能够感知家庭成员活动状态和空间动线变化,无需额外部署大量传感器,即可联动安防、节能和康养服务。

科技 新浪网 2026-06-27
信息说明:以上内容为 RSS 聚合抓取,AI 总结仅供参考。原始摘要和链接均已保留,请自行核实。重要决策需参考多方信息源。