直播吧06月13日讯 皇马球星巴尔韦德正代表乌拉圭队参加世界杯,官方定妆照中,巴尔韦德额头的伤痕清晰可见。
这个伤疤来自上个月皇马队内训练中爆发的冲突。据当时媒体报道,在与琼阿梅尼的争执过程中,巴尔韦德撞到桌子,额头被划出一道口子。
此事件最终以两名球员各被皇马罚款50万欧告终。
以往遇到别国官员无端抹黑指责,我们大多只是外交层面表态驳斥,很少直接出台实打实的限制措施。 但这一次不一样,面对菲律宾国防部长特奥多罗长年累月不间断的恶意挑衅,中方不再只动口,直接亮出制裁底牌,连他的配偶和子女都一并纳入限制范围,消息一出立刻引发全网热议。 2026 年 6 月 11 日晚间,中国外交部正式对外公布制裁决定,整套措施清晰明确,没有模糊空间。 第一条是入境禁令,特奥多罗本人加上他的妻子、孩子,从今往后都不允许踏入中国内地,香港、澳门地区也同样受限,不管是公务出访、商务洽谈还是旅游探亲,全都行不通。 展开剩余 76 % 第二条划定经贸红线,咱们国内任何企业、单位乃至普通个人,都不能和这一家人做任何生意、开展项目合作,彻底切断他和中国市场所有利益往来。很多人看完都会疑惑,这位菲律宾高官到底做了多少出格事,才让中方拿出这么严厉的处置方案? 捋清楚他这几年的所作所为就能明白,这次制裁来得一点不突然,完全是多次挑衅累积下来的必然结果。先说最让人气愤的忘恩负义一事,前一阵子国际市场化肥、燃油价格大涨,菲律宾本地民生物资供应紧张,对方主动开口求助,我们本着邻里互助的心意,及 时 送去了急需的化肥、燃料,实实在在帮当地老百姓缓解了生活压力。 可这份善意落到特奥多罗眼里,反倒成了可以拿来做政治文章的工具,他公开在国际场合颠倒黑白,指责我们的援助暗藏算计、缺乏诚意,这番 话 连外交部都直言,此人毫无感恩之心,只顾着自己捞政治资本,拿本国民生大事作秀博眼球。 除此之外,他不断在各个敏感问题上越界踩红线。南海问题本是中菲两国可以坐下来慢慢协商的海域分歧,他却反复翻炒早已没有法律效力的所谓仲裁案,一口咬定中国的海域维权举动不合理,还主动拉拢美国、日本过来开展联合军演,硬生生把双边矛盾往外扩散,邀请域外势力插手地区事务。更过分的是,他还肆意插手台海问题,公然声称台湾相关人员到访菲律宾属于对方内政,妄图干涉我们的核心主权,公然触碰我们绝不退让的底线。 不光这些主权大事,他连正常的历史纪念活动都要无端抹黑。我们举办抗战胜利阅兵,本是缅怀先烈、铭记历史,全世界很多国家都表示理解尊重,唯独他跳出来大放厥词,硬说这场阅兵是在恐吓周边小国,歪曲我们回顾历史的初衷。 此前他还带队突击检查当地一家中资钢厂,专门针对普通中国工人刻意执法,我们提出正式抗议之后,菲方轻飘飘一句不针对特定国籍就草草了事,连一句道歉都不肯给。接连不断的过激言论和挑衅动作,一点点消耗掉两国好不容易积累起来的互信。 制裁消息发布之后,菲律宾方面也做出了回应,称这项举措不算友好,会让双边关系变得更加复杂,特奥多罗本人也表态,不会因为制裁改变原有立场,依旧坚持所谓维护本国利益的说辞。可明眼人都看得出来,他固执己见,最终吃亏的不会是别人,只会是菲律宾普通民众。外交部后续也明确表态,他持续颠倒黑白的举动,根本不是为国考量,只是个人的政治表演,任由这类官员持续破坏双边关系,后续两国之间的民生合作、物资帮扶都会受到牵连,最后买单的是菲律宾老百姓。 不少网友看完这件事都感慨,邻里相处和做人是同一个道理,互相体谅才能长久往来,善意不是无底线纵容的理由。中方始终愿意和菲律宾管控分歧、和平协商,也一直主动推进两国经贸、民生领域合作,但这份友好是留给懂得珍惜的人,绝不会容忍个别政客无休止的恶意挑衅。 这次精准实施制裁,不是想激化矛盾,而是清晰划出不可触碰的红线:任何妄图损害我国主权安全、刻意破坏双边友好关系的人,都要为自己的言行付出实实在在的代价。国家之间交往讲究礼尚往来,有来有往方能长久,一味敌视对抗,最终只会堵死自己的出路。 发布于:江苏省
热门资讯 > 正文 美伊冲突迎关键转折?传特朗普酝酿“分阶段”协议:先开放霍尔木兹海峡,后逐步解除制裁 2026-06-13 18:51 特朗普媒体科技集团(DJT) 0 标普油气勘探与生产ETF-SPDR(XOP) 0 Vectors石油服务ETF-VanEck (OIH) 0 智通财经APP获悉,全球资本市场正屏息等待本周末可能传来的一项历史性重磅消息。据白宫高级官员透露,美国总统唐纳德·特朗普正在酝酿一项针对伊朗的全新地缘政治协议。该协议的核心机制为“分阶段实施”,旨在通过率先重新开放战略要道——霍尔木兹海峡,来逐步缓解美伊之间长达数月的军事冲突,并为后续的核问题谈判腾出空间。 该协议预计不会对伊朗的核计划进行实质性处理,而是将该问题留待未来60天的谈判进程中解决。该协议将推动美国部分解除对伊朗的制裁,并可能使德黑兰新的强硬派领导层获得数百亿美元的冻结资金。 作为全球原油与天然气运输的“咽喉”,霍尔木兹海峡的重开预期已提前引发全球大宗商品市场的剧烈波动。市场分析人士指出,若协议在本周末顺利签署,此前因地缘冲突引发的“历史性石油供应危机”将迎来实质性转折,持续承压的全球能源价格与通胀也有望获得关键的减压阀。 协议的核心架构:先放行、后谈判、再奖励 根据媒体援引消息人士的报道,这份谅解备忘录的核心设计为分阶段实施机制:立即重新开放霍尔木兹海峡且不收取通行费,停火期限延长60天并扩展覆盖黎巴嫩,作为伊朗"履约束义务"的条件,获得分步制裁减免和资产解冻。备忘录中包含一个处理伊朗浓缩铀库存问题的框架,但任何实质性的核计划行动都将取决于60天谈判窗口期内另行达成的详尽的最终协议。 这一架构的实质是"先放行能源通道、再谈核问题"。与2015年《联合全面行动计划》(JCPOA)的先谈判、后履约、再解禁的"互惠并行"逻辑不同,本次谅解备忘录采取了相反的时间顺序——核武器这一特朗普政府发动战争的"核心理由",已被系统性推迟至未来两个月的谈判进程中解决。 一名美国政府高级官员在6月12日的电话吹风会上将美方的签署信心定调为"80%至85%"。该官员确认,初步协议内容包括重新开放霍尔木兹海峡并解除美国对伊朗的海上封锁,伊朗"承诺无限期地不再获取或研发核武器",关于如何移除伊朗高丰度浓缩铀库存的技术细节将在60天的"技术性"谈判中敲定,同时美方将放松大部分经济限制,使伊朗重新融入世界经济。 但关键问题在于:伊朗官方至今拒绝证实任何已达成最终协议的说法 伊朗外交部发言人巴加埃6月11日明确表示,"迄今为止,伊朗尚未就伊美协议达成最终结论,外界针对该协议传出的说法均为猜测"。伊朗国家电视台同日援引该发言人进一步指出,伊美协议大部分文本已经敲定,但美方不断改变立场,其矛盾立场阻碍了这一进程,霍尔木兹海峡局势也因美方行动变得更加动荡。 截至6月12日晚间,伊朗法尔斯通讯社援引一名接近谈判团队的消息人士的话,直接驳斥了"协议已最终敲定、计划于本周日在日内瓦签署"的说法,称之为"完全是无稽之谈"。两名知情人士也向媒体表示,截至目前,备忘录可能尚未得到伊朗最高领袖穆杰塔巴·哈梅内伊的最终批准。 同一时间,伊朗半官方媒体迈赫尔通讯社披露了一份据称正在敲定的14点谅解备忘录草案,内容包括美国解除对伊朗石油出口的制裁、释放约240亿美元冻结资产、美国承诺不干涉伊朗内政并从伊朗周边撤出军事力量,以及美国及盟国须就战争损失向伊朗提供至少3000亿美元的重建计划。特朗普随即在Truth Social上怒斥伊朗"故意散布虚假信息",称草案内容与双方实际达成的书面协议"毫无关系",并指责伊朗在谈判过程中"毫无诚信"。 国际危机组织伊朗项目主任阿里·瓦埃兹分析认为,特朗普的升级威胁一方面向国内强硬派展示"对伊强硬"姿态,另一方面实则为自己寻找"胜利式退场"。但核心困境在于,伊朗上周末首次直接袭击以色列,让美方意识到保卫以色列的代价已超出可控范围,迫使特朗普加速寻求"体面退出",然而"胜利光环"与"安全退场"之间的张力可能令协议落地前景变得异常复杂。 协议更像是战争暂停而非终止 从目前披露的信息来看,这份"谅解备忘录"是一份高风险的"暂停键"而非"终止符"。 对特朗普而言,它的时间窗口高度政治化——6月14日恰是其80岁生日,随后他将赴法国出席七国集团峰会。在共和党内部,协议已引发激烈分裂:参议员格雷厄姆和克鲁兹等强硬派质疑协议"让伊朗存活下来并继续控制霍尔木兹海峡"是"灾难性的错误",白宫则与蓬佩奥等前高官发生了公开言语冲突。政治计时器与外交文本的可行性之间存在结构性张力。 对伊朗而言,协议的设计使其可以在不做出实质性核让步的前提下,先行获得制裁解除和资产解冻。伊朗伊斯兰共和国通讯社披露的备忘录框架显示,伊朗"并未承诺放弃霍尔木兹海峡的管理权,也未承诺恢复到美以军事行动前的状况"。英国皇家国际问题研究所中东项目主任塞纳姆·瓦基勒对此评论道,目前双方依旧互不信任,不愿做出实质性让步,"任何将最关键问题拖延下去并附加条件的协议,都会让双方回到一个名义上脆弱的停火格局,随时可能因一方越线再次引爆对抗"。 保卫民主基金会首席执行官马克·杜博维茨更直接警告特朗普,必须谨慎行事,不要浪费其在接连军事打击伊朗后积累的影响力。"危险在于他们会先同意A拿到钱,再同意B拿到钱,然后同意C获得制裁豁免,之后就会拖延谈判进程,"杜博维茨说,"一旦陷入谈判泥潭又没有做好重返大规模军事行动的准备,那将是致命的。" "双重事实"下的能源市场:航行量回升、但价格未敢庆祝 市场对美伊协议的反应并非单一跌势,而是呈现出极具层次感的结构:霍尔木兹海峡通航量显著回升与油价基本面预警并存。截至当天收盘,纽约商品交易所7月交货的轻质原油期货价格下跌2.83美元,收于每桶84.88美元,跌幅为3.23%;8月交货的伦敦布伦特原油期货价格下跌3.05美元,收于每桶87.33美元,跌幅为3.37%。 据能源数据分析公司Vortexa数据,6月首10日,经霍尔木兹海峡外运的非伊朗原油日均至少达180万桶,较5月的约120万桶/日增长了50%。不过伊朗原油出货因受美国制裁影响几近停摆,同期未通过伊朗原油穿越海峡。此外,大量航运交易目前采用关闭自动识别系统应答器的"盲航"模式——5月这一通行方式曾占海峡总通行量的65.2%——能源贸易实际规模可能远高于公开监测数据。 美国能源部长克里斯·赖特周二已公开表示,霍尔木兹海峡的石油运输活动"非常显著地回升",并将"继续增长"。特朗普本人也披露美方上月已执行"秘密护航任务",协助约1亿桶原油(日均逾240万桶)安全通过海峡。 然而,即使通航恢复至目前水平,供应缺口仍旧惊人。冲突前霍尔木兹海峡日常承载约2000万桶/日的原油及成品油运输量,占全球石油海运量的20%。国际能源署数据显示,受海峡"梗阻"影响,海湾国家石油日产量较战前低1440万桶,累计供应损失已超12亿桶。 更值得警惕的信号来自美国能源信息署。EIA周二发布的最新《短期能源展望》预警,OECD国家石油库存正逼近2003年有记录以来的历史最低水平——预计12月将降至23亿桶以下,仅可满足50天全球需求,为2003年以来最低覆盖率。EIA首次预测2026年全球石油需求将出现年度萎缩,预计日均减少110万桶,这是自2020年新冠疫情冲击后首次由正转负。6月至7月布伦特现货均价预计达105美元/桶,较同期期货溢价显著,直观反映短期供应紧张格局在协议尚未落地之前仍难以扭转。 OPEC周四亦连续第二个月下调2026年全球石油需求增长预测至每日97万桶,远低于此前预期的117万桶。OPEC+产量在5月进一步萎缩,伊朗降幅最为显著,5月伊朗原油和凝析油出口量已降至至少六年来的最低水平。 面对这种"价格下行、基本面仍趋紧"的矛盾格局,摩根大通分析师指出,实际通过海峡的秘密运输量可能高于公开数据——目前或仍有约200万桶/日的原油通过关闭AIS的油轮秘密运出。而一旦美伊正式签署协议,若美国对伊朗的石油制裁随封锁一并解除,合规超大型油轮运力需求将急剧攀升,届时油运市场或将"一船难求"。
美日菲三国即将于6月15日开启新一轮联合演习,其中最引人注目的动作,莫过于美军计划将“堤丰”中程导弹系统部署至日本鹿儿岛县。 这款能将“标准-6”和“战斧”巡航导弹送上陆地的武器系统,实际打击半径足以覆盖2500公里内的目标,本质上就是把海上的MK41垂直发射单元搬到了运载车上,实现了“打完就跑,跑了还能再回来”的高机动性。 从鹿儿岛到中国东南沿海,直线距离不过800公里,这与美军早前在菲律宾的同类部署遥相呼应,形成一南一北的钳形火力网。 美方口口声声说是“威慑”,但任何一个主权国家都能看清,这是实实在在的进攻性火力前置,是把导弹架到了别人家门口。 中国外交部对此亮明了态度,直言这是战略进攻性武器的部署,威胁地区战略安全,加剧军事对抗和军备竞赛风险。然而美日似乎并未将中方的警告当回事。 编辑 搜图 展开剩余 80 % 就在这场看似铁板一块的军事合作背后,三国之间的关系其实早已布满细密的裂缝,“各怀鬼胎”并非虚言。 美国对日本的控制欲正以一种近乎粗暴的方式显露出来。 6月初美军核潜艇“明尼苏达”号停靠佐世保港时,日本方面突然发现,美方提交的入港资料竟然删除了舰长姓名和乘员总数等关键信息。 紧接着日本外务省收到正式通知:今后美军核动力舰艇进入日本港口,将不再向日方报备这些详细资料,理由是“安保上的考虑”。 这意味着,日本作为东道主,却连停泊在自己领土上的外国核战舰的基本情况都无权知晓。这背后恐怕是华盛顿对东京日益膨胀的“再军事化”野心的一次刻意敲打。 日本防卫费连年飙升,修宪解禁集体自卫权、放宽武器出口限制的步伐明显加快,甚至开始对外销售进攻性武器。 编辑 搜图 这种节奏或许让美国觉得需要勒紧一下缰绳,提醒东京谁才是这个同盟中真正的主宰。 特朗普此前重提“珍珠港事件”的潜台词,在此刻更显得意味深长——你可以往前冲,但历史剧本的主笔不是你。 菲律宾的遭遇则更加直白地揭示了以“依附”换“安全”的脆弱性。 近日,该国发生严重地震灾害,但平日里口号喊得震天响的美国和日本,至今未见实质性的援助抵达。 所谓的安全承诺,在真正的民生灾难面前显得苍白而空洞。更值得玩味的是,中方宣布对菲律宾现任防长特奥多罗及其亲属实施制裁,禁止其入境及与中国境内任何组织和个人的交易。 原因是特奥多罗屡次发表出格言论,竟将中国对菲的人道主义化肥援助污蔑为“包装和欺骗”,甚至在香格里拉对话会上公开嘲讽。 编辑 搜图 这种为了政治作秀而罔顾基本事实与民生的做法,突破了外交底线。中方此举等于给了小马科斯政府一道清晰的考题:是要修复中菲关系,还是继续纵容这样一位损害两国根本利益的高官。 如果马尼拉不做出明智选择,其自身的立场也就暴露无遗,届时局势恶化的责任,就不再只算在某个“反华”政客头上了。 面对美日菲这种貌合神离的军事勾连,中国的应对呈现出清晰的“双轨”逻辑。 第一轨是果断亮剑,清晰地划定红线。 制裁菲防长,既是对具体挑衅行为的直接反制,也是对这个政客背后势力的严正警告——损害中国主权和海洋权益、破坏地区稳定的责任,是会落实到具体人身上的。 与此同时,辽宁舰航母编队近期在西太平洋的实战化演训,以及在台岛以东海域启动的常态化执法活动, 都是在用对方听得懂的语言,表明中国有坚定的意志和能力捍卫核心利益,任何试探和踩线的行为,都不会只得到口头上的反对。 编辑 搜图 第二轨则是保持战略定力,用发展的逻辑瓦解军事对抗的逻辑。 中国深知,导弹和军演或许能制造一时的紧张氛围,但永远无法滋养一国百姓的生活。 经济发展、贸易往来、产业链合作,才是亚太绝大多数国家的根本刚需。 当日本和菲律宾发现,追随美国的激进军事政策,只会把自己推向冲突的边缘,甚至还要忍受单方面的情报断供和国家尊严的损伤时; 而太平洋的另一边,中国始终敞开合作大门,提供的是切实的发展机遇和广阔市场,这种鲜明的对比必然会在其内部产生向心力。 美国试图将盟友绑上战车,但经济与民生的力量最终会像水流一样,渗透并松动看似坚固的同盟壁垒。 编辑 搜图 当前最值得警惕的,或许还不是某一件武器的部署,而是日本右翼势力借机推进“再军事化”的危险动向。 这不仅是日本自身走向的选择,更是一颗足以引燃地区安全的定时炸弹。一旦点燃,其后果将是灾难性的。国际社会,尤其是亚洲邻国,确实该对这股暗流保持清醒的认识了。 发布于:山西省
阮长胜上将对第三届越老边境国防友好交流活动筹备工作进行考察 cn.qdnd.vn
新浪财经 股票 韩国科学技术院团队如何打造更公正的冲突仲裁评估体系 市场资讯 06.13 14:57 (来源:科技行者) 这项由韩国科学技术院(KAIST)与忠南国立大学联合开展的研究,于2026年6月4日以预印本形式发布在arXiv平台,论文编号为arXiv:2606.05563v1。研究的核心是一个名为SoCRATES的评估框架,专门用来测试AI调解员在真实复杂冲突中的表现。对这一领域有深入兴趣的读者可以通过上述编号在arXiv检索完整论文。 现实生活中,冲突无处不在。邻居之间为停车位吵得不可开交,公司与员工就薪资待遇谈不拢,甚至国与国之间因贸易政策剑拔弩张。调解这些纠纷本是专业调解员的工作,然而全球范围内,经验丰富的调解人才严重匮乏。于是,研究者们开始探索一个自然的问题:能不能让大语言模型(也就是像ChatGPT这类AI)来扮演调解员的角色,帮助两方甚至多方找到共识? 听起来颇有前景,但这里藏着一个棘手的难题。评判一场调解的好坏,远比判断AI下棋赢没赢复杂得多——调解过程中,双方情绪会起伏变化,策略会随时调整,背景信息错综复杂,每一个时机点的干预方式都可能影响最终结果。换句话说,调解没有标准答案。现有的测试方法要么场景过于简单,要么评分方式粗糙,根本无法真实反映AI调解员在复杂现实中的能力。KAIST团队正是为了解决这一痛点,设计了SoCRATES这套全面的评估体系。 一、为什么现有的测试方法远远不够 要理解SoCRATES的价值,首先得弄清楚之前的研究究竟遇到了哪些瓶颈。 现有的AI调解测试台,通常依赖少数几位专家手工编写的冲突场景,就像一个厨师只用三道菜来考核一位主厨。这种方式不仅费时费力,覆盖的冲突类型也极其有限,往往集中在商业谈判或法律纠纷这两个领域,对医疗、环境、国际关系等其他领域几乎视而不见。 再者,真实冲突会沿着多个维度同时变化。当你处理一场谈判时,对方可能是情绪激动的愤青,也可能是冷静克制的老手;可能来自强调集体主义的文化背景,也可能来自极度个人主义的环境;双方之间可能积累了多年的恩怨,也可能是初次接触。这些因素像不同的调味料,会让同一道菜呈现出截然不同的口味。然而,以往的研究只是改变了谈判策略这一个变量,把其他所有影响因素混在一起,导致研究者根本搞不清楚AI在哪个环节出了问题。 评分方式同样存在严重缺陷。一种常见的方法叫做"逐轮评分",也就是在对话的每一个回合,用AI裁判对所有议题逐一打分。问题在于,任何一场谈判中,某个时刻双方可能只在讨论薪资问题,根本没有提到福利待遇,但评分系统仍然对福利待遇这个议题打了一个分数。这就像你在测量某人的血压,却把体温计的读数也算了进去——噪音会把真实信号淹没,而且这个错误还会随着对话的推进不断积累放大。 由此,KAIST团队确立了三个必须同时解决的挑战:如何在不依赖人工的情况下,大量生成真实可信的冲突场景;如何独立地测试AI在各种社会认知维度上的能力;以及如何在整个对话过程中进行既准确又抗干扰的评分。 二、SoCRATES的核心设计:一套三阶段的"冲突模拟器" 为了应对上述挑战,研究团队设计了一套三阶段的流水线式体系,每个阶段都有其独特的功能,三者合力才能完成对AI调解员的全面考核。 **第一阶段:让AI自己去搜集真实纠纷案例** 传统方法靠人工编写场景,这条路走不远。KAIST团队换了一种思路——让AI自己充当侦探,去互联网上搜索真实发生过的公开冲突案例。 具体来说,他们使用了一个叫做"深度研究"的搜索智能体(基于OpenAI的o4-mini模型),向它布置任务:在八个不同的冲突领域中各自搜寻真实案例。这八个领域分别是商业交易纠纷、医疗卫生纠纷、环境争议、企业间商务纠纷、公共政策冲突、国际关系争端、法律诉讼以及组织内部矛盾。每个领域的代表性场景各不相同,就像食材的种类决定了菜品的风味。 搜索智能体找到候选案例后,会将它整理成包含关键事件时间线、利益相关方、核心争议点和机构张力等要素的种子报告。接着,另一个智能体(使用GPT-5.4模型)接手这份报告,把它改写成一个可以直接运行模拟的结构化场景。改写时有几条硬性规定:所有真实的人名、机构名、地名都必须用虚构的替代品替换,以保护隐私;每个场景最多设置四个谈判议题,每个议题有若干具体选项可供双方选择,而不是漫无边际地自由发挥;至少要有一个议题在情感上是高度敏感的。 改写完成后还有最后一道关卡:对场景进行"压力测试"。研究团队让AI模拟两方在没有调解员介入的情况下自行谈判,如果三次模拟中每次双方都能自己谈拢,那这个场景就被淘汰——因为太容易解决的纠纷没有测试价值。只有那些在无人调解时三次都陷入僵局的场景,才会被保留下来,最终形成一个由四十个"硬核"场景构成的测试库,每个领域各五个。 **第二阶段:沿着五条轴线,独立拨动每一个变量** 有了场景库之后,接下来的挑战是如何模拟真实冲突的多样性。研究团队提炼了五个最能影响调解结果的社会认知维度,并把它们称为"五条轴线"。 第一条轴线是谈判策略倾向。参照心理学中经典的冲突处理理论,团队将每场谈判中双方的策略设定为三种模式之一:竞争型(只顾自己利益,寸步不让)、回避型(不想直面冲突,消极应对)或顺从型(处处让步,迁就对方)。这相当于测试调解员面对不同性格类型谈判者时的应变能力。 第二条轴线是参与方数量。大多数研究只考虑两方对立的情形,但现实中往往有第三方甚至更多方介入。SoCRATES通过增加一个由AI自动生成的第三方,来测试调解员追踪多方状态的能力,考验其同时处理多条矛盾线的本事。 第三条轴线是历史背景的复杂程度。有些冲突是临时起意,有些却积累了数年乃至数十年的恩怨情仇。研究团队通过将场景的历史背景扩展到原来的五倍长度,测试AI在处理大量历史信息时是否还能抓住重点,准确理解当前局势。 第四条轴线是情绪激动程度。两位谈判者被赋予从0(极度冷静)到1(极度激动)的情绪强度参数。研究中使用了组合——两人都冷静、一人冷静一人激动、两人都极度激动——来测试AI面对情绪化场面时的调节能力。 第五条轴线是文化身份。每位谈判者被绑定到美国、中国或韩国的文化背景,具体通过霍夫斯泰德文化维度模型(一套衡量国家文化差异的经典工具)来编码:权力距离、个人主义程度、男性化程度、不确定性回避、长期导向和放纵程度,六个维度的分数拼出一张文化画像,附在谈判者的角色描述中。为了把文化因素和语言因素分开,所有参与者都被要求用英语交流。三种文化两两配对,形成三种同文化组合和三种跨文化组合,共六种情形。 五条轴线加上基础场景,一共形成十五种测试条件。而且,每一次都是单独改变其中一条轴线,其余保持不变,这样如果AI的表现下滑,研究者就能精准地锁定是哪条轴线造成了麻烦,而不是茫然地猜测。 **第三阶段:只在"关键时刻"打分的评分机制** SoCRATES的评分方法是整个体系中最具创新性的部分,它的核心思想用一句话概括就是:只在相关的时刻为相关的议题打分。 对于场景中的每一个议题,评分系统会先通读整段对话,然后找出双方真正在讨论这个议题的那些回合——要么是有人主动提到它,要么是某一方的立场发生了变化。在这些"关键时刻",系统记录一个共识程度的分数(1到5分)以及双方各自的立场选项。在不讨论这个议题的其他时间,分数就直接沿用上一次记录的值,不做任何更新。 这就像给病人测血压,你不会在他睡着时每隔一分钟量一次,而是选择在他进行体力活动前后这样的"有意义时刻"去测量,这样得到的读数才能反映真实变化。 在这套评分机制之上,SoCRATES定义了三个衡量调解员表现的指标。第一个叫"共识增益",衡量调解员有没有整体上帮助双方缩小分歧——具体做法是比较有调解员和没有调解员时的最终共识程度,再除以无调解状态下的剩余分歧空间,得出一个百分比。如果这个数字是100,代表调解员完全弥合了分歧;如果是负数,则意味着调解员的介入反而让情况变得更糟。第二个叫"干预及时性",考察调解员是否在局势恶化时迅速出手。当共识分数在一个回合内下降超过0.1,系统就标记为一个"滑落事件",然后看调解员是否在接下来的10个回合内采取了行动。越早行动,得分越高。第三个叫"干预有效性",衡量调解员每次说话之后的五个回合内,共识程度提升了多少,并用"当前剩余分歧空间"做归一化处理,避免在双方已经接近共识时虚高评分。 三、验证:这套评分系统真的比人类外行更准吗 设计再好的系统,如果不能被验证,也只是空中楼阁。研究团队对SoCRATES的两个核心组件分别进行了严格的验证实验。 **验证情绪模拟是否可靠** 首先要确认的是:当你给AI谈判者设定一个情绪强度参数,它的行为真的会随之改变吗?研究团队测试了七个不同的AI模型作为谈判者模拟器,给每个模型分配四种情绪强度(0、0.33、0.66、1),生成对应的对话,然后招募亚马逊众包平台上的标注人员,两两比较哪段对话中的谈判者更情绪激动。 测试结果相当清晰。七个模型中,DeepSeek-V3.2的表现最为出色,在160对比较中,标注者对其情绪强度排序的识别准确率达到了87.2%。换句话说,当你把情绪旋钮拨高,DeepSeek-V3.2扮演的谈判者确实会表现得更加激动,这种变化稳定可辨,具有良好的可控性。因此,研究团队选择DeepSeek-V3.2作为所有模拟实验中谈判双方的扮演者。 **验证评分系统是否接近专家判断** 第二项验证针对的是评分系统本身。研究团队邀请了两位来自政治科学和国际关系背景的研究生,对1844个对话片段逐一打分,这两位标注者最终达到了Krippendorff's α = 0.86的一致性水平(这是一个衡量不同评判者意见吻合程度的指标,越接近1代表越一致,0.86属于相当高的水平)。他们的平均分数成为衡量评分系统好坏的基准。 与此同时,研究团队还测试了两种对照方法:一种是让没有专业背景的众包标注者完成同样任务;另一种是使用之前同类研究(ProMediate)采用的"逐轮打分"方式。 对比结果非常有说服力。SoCRATES的评分系统在"对话轨迹层面"与专家的皮尔逊相关系数达到了0.82,在"最终结果层面"达到0.80。相比之下,ProMediate的逐轮评分在这两个层面分别只有0.372和0.432,非专业标注者的成绩则是0.331和0.527。SoCRATES的得分是逐轮评分方法的两倍有余,这种差距在统计上极为显著,p值均趋近于0。 研究团队还特地画出了两种评分方法的评分轨迹曲线图,直观地呈现了差异:SoCRATES的评分曲线从低到高稳定上升,与专家打分趋势高度吻合;ProMediate的曲线则像心电图一样剧烈波动,时高时低,起点已经虚高,终点又远低于专家判断。这正是"无关议题注入噪音"问题在现实中留下的痕迹。 研究团队还用另一个大模型(Qwen3-235B)替换原有的评分骨干模型,检验结果是否会随之崩塌。换骨干后,SoCRATES在轨迹层面的相关系数仍有0.785,结果层面为0.721,依然远超ProMediate,说明这套评分逻辑本身是稳健的,不依赖特定的大模型。 四、八位AI调解员的大考成绩单 有了可靠的场景和评分系统,KAIST团队用SoCRATES对八位来自不同家族的AI模型进行了全面基准测试。这八位候选者中,有来自谷歌的Gemini-3.1-Flash-Lite和来自OpenAI的GPT-5.4-mini两个商业闭源模型,以及DeepSeek-V3.2、Qwen3-235B、Nemotron-3-120B、Solar-Pro-3、Gemma-4-26B和Qwen3-30B六个开源模型。 每位调解员要完成的任务量相当惊人:40个场景乘以15种测试条件,共600场对话。八位候选者加在一起,总计产生了4800场对话,每场都配有相应的无调解员对照组。 **整体成绩:没有人能及格** 从共识增益这个最重要的指标来看,没有任何一位AI调解员的表现堪称优秀。最强的候选者(Gemini-3.1-Flash-Lite和GPT-5.4-mini)的平均共识增益约在33到34之间,这意味着他们大约只弥合了三分之一的分歧——换句话说,如果没有调解员时双方的共识程度是0.5,有了最好的AI调解员之后,也只能把共识推进到大约0.67,距离完全解决冲突还有很长的路要走。最弱的候选者共识增益甚至只有15至16,约莫只有最强者的一半水平。 这一结果与此前一些研究报告的"解决率80%至90%"形成了鲜明反差。KAIST团队指出,那些高数字往往来自单一领域、未施加社会认知压力的简单测试,而SoCRATES的多领域、多轴线设计让这些数字不攻自破。 **商业模型有优势,但规模不是万能药** 两个商业闭源模型的共识增益比最强的开源模型高出约1至2.5个百分点,在八个冲突领域中的六个里都取得了领先。然而,令人意外的结论是:模型规模本身并不是调解能力的保证。 以Qwen3家族为例,2350亿参数的Qwen3-235B几乎是300亿参数的Qwen3-30B共识增益的两倍,说明在同一家族内部,规模确实有帮助。但跨越不同家族的比较则完全打乱了规模排名——拥有1200亿参数的Nemotron-3-120B,在法律和组织内部冲突领域的表现还不如260亿参数的Gemma4-26B,尽管前者的参数量是后者的四五倍。这清楚地表明,调解这种高度依赖社会认知的任务,并非单靠堆叠参数就能解决的。 **干预时机和干预质量是两回事** 测试中浮现了一个有趣的悖论。Solar-Pro-3和Qwen3-30B在"干预及时性"这个指标上得分最高,在八个模型中名列前茅。但翻到共识增益这一栏,它们却排在倒数。原因是什么?研究团队发现,这两个模型会在约三分之一的双方发言回合中插入调解语句,干预频率大约是表现最好模型的两倍,而且它们总是提前很早就开口。频繁早期插话让它们在"及时性"指标上占了便宜,却没有带来真正有意义的共识推进。 这就好比一个法庭速记员,记录每一个字都又快又准,但真正能影响判决走向的,是律师在关键时机说的那些话,而不是速记员的手速。好的调解员必须既快又准,缺一不可。 **领域差异揭示了测试设计的必要性** 八个冲突领域之间的表现差距极大。AI调解员在商业交易纠纷中的平均共识增益高达41.3,在组织内部冲突中则跌至16.6。这个巨大的落差恰好印证了一点:大多数现有冲突数据集高度集中于商业谈判场景,如果只在这类场景上测试AI,会大大高估其实际能力。组织内部冲突之所以更难,是因为它涉及情感依附、权力层级和非正式规范,这些都是AI难以准确感知的微妙因素。 五、五条轴线的精准诊断:哪里强,哪里弱 当研究团队把五条轴线的测试结果画成雷达图,每位AI调解员在五个维度上的实力与弱点立刻变得一目了然。 从整体趋势来看,商业模型和Qwen3-235B的雷达图面积最大,说明它们在大多数维度上都表现更好。然而,几乎没有任何一个模型在所有五条轴线上都保持稳定。即便是整体排名相近的GPT-5.4-mini和DeepSeek-V3.2,在"多方状态追踪"这条轴线上的下滑幅度也远超Gemini-3.1-FL和Qwen3-235B。这说明调解能力并不是一个单一的"强弱"问题,而是由多个相对独立的能力组成的。 **谈判策略是最严峻的考验** 五条轴线中,谈判策略倾向对AI调解员的冲击最为剧烈。当双方都采取竞争型策略时,所有模型的共识增益下滑幅度在18.9到64.1个百分点之间;当双方都是顺从型时,下滑幅度同样在13.8到66.8个百分点之间。 特别值得注意的是Qwen3-235B。它的整体排名靠前,但在这两种策略条件下的下滑幅度却是所有模型中最大的。这说明它在基础场景中表现出色,但遇到高度对抗性或高度顺从性的谈判格局时,会出现严重的能力断崖。换句话说,Qwen3-235B的"平均分"掩盖了它在极端情况下的脆弱性。 **情绪管理:拼的不是体量** 情绪激动程度这条轴线的测试结果同样出人意料。当双方都保持冷静时,大多数模型的得分与基础场景相差不大。但当双方都处于极度激动状态时,所有模型的表现都有所下滑。更关键的是,下滑幅度与模型参数量之间没有明显规律——小模型未必比大模型更容易被情绪左右,说明"吸收情绪波动"是一种相对独立的能力,与模型的整体规模关系不大。 **文化距离产生系统性偏差** 文化身份这条轴线的结果虽然在五条轴线中对共识增益的冲击最小,但最为系统化。总体规律是:文化背景与美国越相近,AI调解员的表现就越稳定;当双方都带有东亚文化背景(中国或韩国)时,所有模型的表现都有一定幅度的下滑。从霍夫斯泰德文化理论的角度来看,所有受测的AI调解员似乎对以个人主义和直接表达为特点的美国文化价值观更为熟悉,而对强调集体主义、权力距离和含蓄共识的东亚文化模式则明显不够适应。 **"何时出手"同样需要随机应变** 研究团队还深入分析了不同测试条件下,调解干预有效性如何随对话进程演变。结果显示,最佳干预时机并非固定不变,而是随着测试条件的不同而移动。 在谈判策略测试和情绪激动测试中,有效干预集中在对话早期——因为策略立场和情绪状态一旦固化,就很难被撼动,因此调解员必须在双方还未陷入僵局之前就率先重新框架问题或冷却情绪。相反,在多方追踪和长历史背景这两类测试中,干预有效性随着对话进展而升高,在后期达到峰值。这是因为随着越来越多的信息被揭示,调解员在后期进行信息整合和总结梳理,反而能产生更大的推进效果。 表现最优的调解员都显示出一个共同特征:它们的干预有效性曲线与各测试条件的最佳窗口高度契合。GPT-5.4-mini在策略和情绪类测试中早期发力明显;Qwen3-235B则在多方追踪和长背景类测试中后劲十足。反观表现较弱的模型,它们的曲线几乎是平的,无论遇到什么情况都用同一种节奏干预,完全不顾对话所处的阶段和面临的具体挑战。 六、实验设计的严谨性:三重稳健性验证 为了确保实验结论不是偶然现象,研究团队从三个不同角度对结果进行了稳健性验证。 第一重验证是更换评分用的大模型。将DeepSeek-V3.2替换为Qwen3-235B来重新评分,结果发现三个指标的平均值仅分别偏移了负2.0、正3.9和正0.6个百分点,模型之间的排名顺序在干预有效性(Spearman相关系数0.862)和共识增益(0.786)两个指标上高度吻合,说明评分结果不依赖特定评分模型。 第二重验证是更换谈判双方模拟器。选取三个代表性调解员(Qwen3-235B、DeepSeek-V3.2、Qwen3-30B),将DeepSeek-V3.2谈判模拟器替换为Qwen3-235B模拟器,重新运行完整的600场对话。尽管绝对数值有所变动,但三个调解员在五条轴线上的相对表现模式得到了保留,主要结论依然成立。 第三重验证是多次运行取平均。对所有八个调解员在基础场景下重复运行三次,用Kendall's W统计量衡量三次运行的排名一致性,得到0.929的高度一致结论,说明实验结果不是某次随机波动的产物。 归根结底,SoCRATES这项研究告诉我们:当前最强大的AI调解员,在面对多样化、复杂化的现实冲突时,只能弥合大约三分之一的分歧,距离真正替代人类专业调解员还有相当长的距离。更重要的发现在于,这种差距并不是均匀分布的——AI调解员并非"整体能力不足",而是在某些社会认知维度上出现了明显的短板,比如面对竞争型谈判者时的策略调整、吸收情绪波动的韧性、以及对东亚文化背景的理解。 这意味着,未来改进AI调解员的关键,不在于单纯提升模型的通用智能,而在于有针对性地强化这些特定的社会适应能力。SoCRATES提供的正是这样一张精确的诊断地图,让研究者知道该在哪里用力。对于那些对AI在人类冲突解决领域的潜力与局限感兴趣的读者,这套评估框架本身也是一个值得深入研究的工具。原论文可通过arXiv编号2606.05563查阅完整内容。 Q&A Q1:SoCRATES评估框架和之前的AI调解评估方法有什么核心区别? A:之前的方法(如ProMediate)会在每一个对话回合对所有议题逐一打分,导致大量无关内容注入噪音,误差会不断累积。SoCRATES的"主题定位评分"只在议题被实际讨论或立场发生变化的时刻才更新分数,其余时间沿用上次记录。这种设计让评分更贴近真实共识状态,与人类专家的皮尔逊相关系数达到0.82,是传统逐轮评分方法的两倍以上。 Q2:SoCRATES测试的五条社会认知轴线分别是什么,哪条对AI调解员冲击最大? A:五条轴线分别是谈判策略倾向、参与方数量、历史背景复杂度、情绪激动程度和文化身份。其中谈判策略冲击最大,当双方都采取竞争型或顺从型策略时,所有模型的共识增益下滑幅度最高可达64个百分点以上。文化身份的冲击相对最小,但最为系统化,所有AI调解员在东亚文化背景下的表现都比美国背景下明显偏弱。 Q3:当前最强的AI调解员到底能解决多大比例的冲突分歧? A:在SoCRATES的多领域、多条件测试下,表现最好的模型(Gemini-3.1-Flash-Lite和GPT-5.4-mini)平均共识增益约为33至34,也就是说大约只能弥合三分之一的分歧。没有任何模型接近满分100。这与此前一些单一领域测试报告的80%至90%解决率形成了巨大反差,说明之前的高数字很大程度上来自过于简单的测试环境。 window.STO=window.STO||{};window.STO.fw=new Date().getTime(); 相关新闻 --> 推荐阅读 --> 加载中... 视频 直播 美图 博客 看点 政务 搞笑 八卦 情感 旅游 佛学 众测 首页 导航 反馈 登录 Sina.cn(京ICP证000007) 2026-06-13 20:01
【环球时报驻英国特约记者 王鸣蔚 环球时报特约记者 甄鑫】路透社、英国广播公司(BBC)等媒体报道称,因不满国防投资计划资金方案,当地时间11日,英国国防大臣约翰·希利宣布辞职。他公开指责英国首相斯塔默未能足额拨付所需资金,无法让英国抵御愈发严峻的外部安全威胁。同一天,英国负责武装部队事务的国务大臣卡恩斯也因此宣布辞职。
希利11日在社交媒体上发布的辞职信中说,考虑到英国国防需求进一步提升以及对盟友作出的承诺,到2030年,英国国防开支需占国内生产总值的3%。
希利表示,此前收到的国防投资计划资金方案中,国防开支到2030年仅占国内生产总值的2.68%,无法满足英国国防需求。他还说,自己无法接受一份不能为英军提供所需资源的投资计划,因此只能选择辞去国防大臣一职,但将继续支持工党政府。前保守党安全事务大臣汤姆·图根达特向BBC表示,希利的辞职信“堪称最具毁灭性的控诉”。
斯塔默随即回信对希利辞职表示遗憾,并任命丹·贾维斯接任国防大臣一职。英国政府网站显示,2024年7月工党政府上台后,贾维斯出任内政部国务大臣,并于2025年9月起兼任内阁办公室国务大臣。12日,斯塔默会见了贾维斯。
同一天,英国负责武装部队事务的国务大臣卡恩斯连同希利的两名议会助理也同步递交辞呈。卡恩斯同样致信斯塔默,指责当前政府拟定的国防投资计划“既缺乏变革性,也缺乏足够资金支持”,难以应对日益严峻的安全威胁以及现代战争形态快速变化带来的挑战。
卡恩斯在辞职信中说,乌克兰危机表明现代战争正在迅速演变,而英国仍在采购适用于过去战争模式的装备。“价值数十亿英镑的平台,可能被价值数千英镑的系统击败。”他同时批评英国政府整体决策效率低下,称政府部门之间“彼此对抗,而不是共同解决问题”。
国防投资计划原定于2025年秋季发布,由于英国国防部和财政部围绕资金规模、拨款周期和资金来源等问题产生争议,该计划被一再推迟发布。英国媒体称,该计划存在280亿英镑(1英镑约合9元人民币)的资金缺口。
路透社11日称,斯塔默政府此前承诺推出冷战以来力度最大、持续性最强的国防开支增幅方案,计划在下一届议会任期内将军费提升至英国国内生产总值的3%,意味着每年新增数百亿英镑国防经费。但希利表示,斯塔默拟定的军费涨幅远远达不到需求:既要应对俄罗斯带来的安全压力,还要强化英军在北极、中东地区的军事部署,现有资金缺口巨大。而当下英国经济增长停滞,政府债务规模、整体税负均处于数十年高位,政府很难再挤出额外财政资金扩充军费。
英国联合部队司令部前司令理查德·巴伦斯上将曾参与撰写2025年国防评估报告,这份报告本应是国防投资计划的制定依据。他在接受路透社采访时,对政府未能兑现防务投入感到愤慨:“政府明明清楚英国面临的各类风险,嘴上也反复强调重视国防,但始终没能拿出匹配表态的实际资金投入。”
英国《卫报》11日称,尽管英国朝野围绕国防开支已经争执数月,但希利此次辞职仍出乎唐宁街10号的预料。希利曾在前首相布莱尔、戈登·布朗两届工党政府任职,在同僚、国防部内口碑普遍较好,他的离职再度沉重打击斯塔默的执政根基,未来数月其党内领导权或将迎来挑战。
报道称,这场政坛人事动荡之际,国际安全威胁持续升级,斯塔默如今竭力挽回自身形象,守住“执政稳妥可靠”的标签,却举步维艰。再过数日,斯塔默就要前往法国出席七国集团领导人会晤,北约峰会也即将召开,斯塔默需要向外解释,为何本国国防大臣会认为他在国家安全保障方面履职力度不足。
上个月,斯塔默内阁的卫生大臣斯特里廷已经辞职,并批评首相执政缺乏长远规划;大曼彻斯特市长安迪·伯纳姆也在筹备挑战斯塔默首相之位。《卫报》称,不少工党议员都认为,斯塔默的首相任期已时日无多。一名内阁大臣向《卫报》坦言:“接连辞职事件,只是坐实了斯塔默下台的结局。”
“特别声明:以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布,本平台仅提供信息存储空间服务。
Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”
您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器
谷歌(Chrome)浏览器 下载
近日国民党主席郑丽文访问美国。据《中央社》报道,郑丽文在当地时间12日在华府举行记者会,她表示,“国民党支持国防自主,在台湾国防产业发展方面,将思考是否提出国民党版本的法案”,郑丽文更称,这次访问期间希望能跟美方有直接沟通管道、交流的机会。
报道指,郑丽文在记者会上谈及国防预算议题,她指外界很关心台湾本土军工产业的发展跟投资,尤其是无人机制造,国民党支持国防自主政策,强调国民党虽然在野,但如果美国抱有高度期待,国民党愿意主动研究可行方案。
郑丽文说,民进党的提案有很多问题,“国民党不可能支持”,有智库朋友因此建议国民党提出自己的版本,“回台湾之后,我们也希望能够认真开始去研究这个问题”。
另外,郑丽文也表示,国民党希望能与美方有直接沟通的管道和交流的机会,才不会误会彼此的立场和处境。她强调,这次访问美国就是希望与美方有互相理解。她说,国民党并未反对强化台湾国防力量,且优先审查对美军购的部分。
2025年,赖清德宣布未来8年内将投入1.25万亿新台币(约合3111亿港币)的国防特别预算。今年5月8日,台湾立法院三读通过上限7800亿(新台币,折合约1946亿元港币)军购特别条例,比原先台湾行政院提出的1.2万亿新台币版本减少4700亿元新台币。
另据台媒《联合报》报道,针对台湾对美的军购预算,郑丽文在记者会上指,她这次的美国访问中,美方表达的立场非常清楚,就是有必要强化台湾的吓阻和国防能力。她坦言,国民党对军购特别预算的态度的确引起一些疑虑。
郑丽文称,民进党新台币1.25万亿元的军购特别预算,没有具体的内容,国民党不可能给民进党“空白授权”。她说,如果国民党一直阻挡军购特别预算的通过,从外界来看,就会变成国民党全面抵制国防预算,这也是为什么国民党提出优先通过对美军购的部分。
最后郑丽文指出,寻求两岸的和平对话,“不代表台湾要放弃国防力量,更不是要放弃台湾的民主自由”,她更称,“这是非常荒谬的指控”。