AI
【AI前沿】扎克伯格称Meta考虑进军云计算市场
阅读全文 →【AI前沿】活动/榜单/专题
活动榜单专题外部活动妙投投资风向标火热报名中投资风向标直播课每周二四晚7点,复盘行情、传授分析方法、挖掘投资机会,构建投资体系。智库·502线上同行往期回顾报名已结束企业构建AI+组织的人效杠杆与路径选择百果园集团x银泰分享企业构建AI+组织的人效杠杆与路径选择妙投波动判断场往期回顾活动已结束芯片、光模块、机器人——AI的泼天富贵,还能传到第几棒?本期我们将AI产业链拆解为三大核心环节,逐一拆解其核心矛盾与风险边界,帮你建立从芯片到机器人的完整坐标系。随行灯塔火热报名中随行灯塔随行灯塔是由虎嗅深度联合运营的高端创始人社群。专注于一件事:帮助创始人把产品做对、做爆、做到10亿。
这里不灌鸡汤,不讲玄学。我们相信,伟大的公司一定是产品驱动的;但产品力来自人,而人需要场——一个能被照见、能被挑战、能被链接的场。随行灯塔,就是创始人的“修炼场”。智库·502线下闭门会往期回顾精彩回顾AI在ToB销售、客服的落地案例探讨围绕着AI在ToB营销内容生成、智能客服接待、线索清洗等场景进行深入交流早点生活游玩团往期回顾活动已结束早点生活城市出逃计划——跨年不在酒吧,而在粥粥老家我们即将前往的,是一个用雪花书写浪漫的地方——哈尔滨。
东方小巴黎,夜幕下的哈尔滨,是每个亲历者,无不心动的美。
我想邀约你,和我一起回到我的家乡,和我一起感受这片我爱的土地。 这是一次限定的跨年邀约,同时也是一场难忘的冰雪之旅。虎嗅F&M创新节往期回顾2025虎嗅F&M创新节一次聚焦新商业、新消费与AI原生变革的沉浸式节日化体验智库·AI落地研学营报名已结束AI落地研学营-零售消费班参访研学8-12家AI落地典型企业,与决策者面对面,学习10+最新AI应用落地案例。出海·502线下闭门会往期回顾活动已结束出海·502线下闭门会系列虎嗅「出海•502线下闭门会」面向企业决策层,打造纯粹、高端的行业交流场合,是一次实战经验复盘,更是高价值人脉链接的机会。大鲸AI峰会往期回顾精彩回顾大鲸AI峰会 · 零售消费专场聚焦AI应用落地与零售业的最强碰撞。
【AI前沿】GEO品牌全景分析
首页功能介绍报价数据与案例分享得赠金GEO品牌监控GEO排名查询登录注册登录/注册全方位监控您的品牌在AI时代的每一次曝光开始试用观看演示品牌监控平台占比分析竞争对手分析业务主题分析AI对话问题AI引用排名我们的服务灵活的定价方案,满足不同规模企业的需求探索版验证你的品牌在AI搜索中的可见度¥99.9/ 次AI对话监控洞察监测品牌数量1个监控AI平台数量5个精选30个AI对话问答品牌竞争对手分析品牌市场占比分析AI引用来源分析15天监测,三天更新一次可选豆包、deepseek、通义千问、文心一言、腾讯元宝等主流AI平台开始试用推荐入门版监控品牌在AI中的基本表现¥299/ 月AI对话监控洞察监测品牌数量1个监控AI平台数量5个精选30个AI对话问答品牌竞争对手分析品牌市场占比分析AI引用来源分析数据三天更新一次可选豆包、deepseek、通义千问、文心一言、腾讯元宝等主流AI平台开始试用定制版构建策划GEO营销活动的公司专属报价/ 月多品牌/产品线全矩阵监控精选 100+ AI 对话问答深度竞品动态与语义分析国内AI全平台覆盖AI引用来源全面分析T+1 监测,每日自动更新GEO 优化策略与落地建议联系销售1000万+每日监控对话量98.5%监控准确率10+AI平台覆盖24/7实时监控超过60%的用户开始使用AI助手查询产品和服务推荐,而不是传统搜索引擎。当用户问“最好的项目管理工具是什么?”时,你的品牌是否出现在AI的回答中?用户提问“哪个品牌的智能手表最适合运动?”如果AI没有推荐你的品牌,你就失去了这个潜在客户AI改变搜索引擎模式品牌曝光渠道品牌曝光渠道AI推荐价值AI推荐价值品牌声誉风险品牌声誉风险准备好掌控您的品牌在AI时代的表现了吗?立即体验GEO AI品牌监控平台,全方位掌握您的品牌动态开始试用联系销售团队关于我们厦门享联科技有限公司成立于2005年,是国家级高新技术企业,深耕互联网服务领域近20年。公司旗下运营站长之家、站长工具、AIBase等核心平台:站长工具作为国内TOP3的SEO/网站运维工具平台,提供200+款免费工具,累计服务超500万用户,日均查询量千万级;AIBase定位为中国领先的AI导航平台,聚合10,000+AI模型与工具,为开发者和企业提供一站式AI服务。享联科技致力于为中国互联网从业者提供专业、高效的技术工具和服务支撑,助力数字化转型发展。地址: 福建省厦门市湖里区飞鱼大厦B栋11楼联系电话:18950101783智启未来,您的人工智能解决方案智库Copyright © 2024-2026 厦门享联科技有限公司备案号:闽ICP备08105208号-24用户协议隐私政策
【AI前沿】#5SPARK2026腾讯游戏发布会:超40款游戏公布最新动态,多项游戏AI应用发布新进展
AI资讯AI新闻资讯正文SPARK2026腾讯游戏发布会:超40款游戏公布最新动态,多项游戏AI应用发布新进展发布于AI新闻资讯发布时间 :2026年5月27号 23:21阅读 :3分钟5月27日,SPARK2026腾讯游戏发布会在线上举行。发布会上,在“制作”“发行”“投资”三大篇章,共计42款海内外游戏分享了它们的最新动态,29位海内外游戏开发者参与了发布,向玩家介绍游戏的新内容、新玩法、新赛事、新节点,以及有助提升游戏体验的新游戏AI技术应用。在“One More Thing”环节,腾讯游戏还带来3个产品发布。其中包含2个游戏AI技术产品发布,全面开源的全球首个跨平台神经动态全局光照方案(NDGI),以及自研的全新AI游戏创作平台“代号Craft”;此外,由腾讯游戏、腾讯SSV数字文化实验室联合景德镇市文旅局、景德镇御窑博物院、景德镇市申遗办共同打造的官方首款瓷业经营小游戏《数字景德镇•瓷都小匠》压轴登场,产品结合了“景德镇瓷业文化遗存”多模态AI数据集打造,并应用AI数字人、AI3D生成等技术,将于今夏与大家见面。游戏制作篇在游戏制作篇,腾讯旗下天美、光子、魔方、北极光,以及拳头、CDD共带来了16款游戏的最新动态,既有经典游戏IP的玩法焕新,也有多款新游戏启动预约或开启测试。《王者荣耀》作为首个亮相发布会的游戏,《王者荣耀》预告将上线以中国古建筑为设计灵感的文创皮肤,将传统文化的匠心诗意融入游戏内容;并宣布将与阅文集团继续开展战略合作,深受粉丝和玩家喜爱的IP角色将有机会战速出现在游戏中。为了丰富游戏体验,《王者荣耀》也在积极探索游戏AI应用,未来灵宝将实现局内外全天候沉浸式陪伴,不仅支持对局互动聊天,还将限时推出达人定制款。AI技术也已融入赛事中,AI解说已经上线,并将通过“腾讯开悟”人工智能全球公开赛共探科研新领域。此外,发布会还官宣周年庆共创之夜与嘉年华将落地大湾区,2026年KPL年度总决赛-决赛将落地成都,并举办首个十周年特展等系列活动。《逆战:未来》《逆战:未来》是琳琅天上出品的PVE射击爽游新作,含PC及移动端版本。游戏涵盖PVE僵尸猎场、机甲PVP等经典玩法,以及大地图PVE时空追猎、猎场竞速等创新玩法。发布会上,《逆战:未来》公布了即将上线的“浪浪山”联动内容,玩家将体验耳熟能详的小妖怪和“山神庙”场景;同时公布S3赛季与《无主之地》的联动,除经典角色外,预告将开启一整套局内外循环玩法机制;另外,IP用户期待的太空战,也在此次发布会中亮相概念设计。《使命召唤手游》《使命召唤手游》是由动视和腾讯联合推出的大型多人在线第一人称射击类手游,包含多人对战、使命战场、DMZ: 禁区三大玩法模式。发布会上,项目组承诺三大玩法都将在未来持续更新,并不断优化匹配系统和操作手感,提高玩家的对局体验。同时,项目组也回顾了游戏过往联动IP,并首次曝光了即将在7月上线的《女神异闻录5皇家版》联动。此外,《使命召唤手游》还将在7月、8月举办多场线下活动,邀请所有战士暑期相聚,共赴使命。《三角洲行动》《三角洲行动》在发布会上正式官宣与景德镇御窑博物院的联动。作为《三角洲行动》首个数字文创跨界项目,本次联动携手景德镇御窑博物院,以游戏为载体开展馆藏珍品的“数字活化”实践,将传统瓷器文化转化为游戏内专属典藏内容,以年轻化语境创新传播中华优秀传统文化。首期内容将在游戏内高精度复刻“大明成化素三彩鸭形香熏”(“岁岁鸭”)等馆藏珍品,还原其精湛工艺与艺术神韵。据悉,该联动将于游戏“宝藏月”主题活动期间正式上线。《和平精英》《和平精英》在发布会上披露了2026暑期版本革新计划,此次革新计划涵盖暑期玩法升级、绿洲启元创作生态、AI明星队友、重磅IP联动、IP影视计划,以及刺激之夜城市官宣等多个模块,为玩家带来更刺激、更沉浸、更智能的战术竞技体验。其中,《和平精英》AI NPC在历经多次迭代后,玩法累计体验用户目前已达1.1亿,发布会上,《和平精英》将推出行业内首个由策略大模型驱动的AI明星队友“小田”,其AI功能从工具型向情感型升级,已具备独立故事背景与记忆功能。绿洲启元版块也已实装了业内首个UGC全链路AI创作助手,从场景生成到玩法配置,仅需15分钟便能迅速交付玩家创意。《暗区突围》魔方工作室自研的硬核搜打撤手游《暗区突围》在发布会上揭晓了S18新版本 “原爆点”,制作人117公布了新赛季的全新双模式地图“湾区”以及生化模式玩法等。此次,项目组前往全球多地进行实地取景,对现实中的建筑与环境搬进了暗区,打造了这张全新双模式地图-湾区,是游戏上线以来玩法最为多样、生态更具包容性的一张地图,旨在为不同类型玩家提供更丰富的战术选择与体验空间。在S18赛季PV预告中,生化病毒泄露,老朋友德尔文回归,湾区也成为抵御变异体入侵的第一阵线。《暗区突围:无限》《暗区突围:无限》是魔方工作室首款射击端游。本次发布会上,《暗区突围:无限》发布了S5赛季异变的全新超自然主题玩法。全新异变山谷也将随新赛季上线,在异变山谷中,玩家将获得无敌、陷阱、致盲等特殊异能。在S5赛季中,玩家既能体验无压力爽赚的悠闲,又能在战神锦标赛里感受高手过招的惊险。《异人之下》《异人之下》是由腾讯魔方工作室群研发的3D格斗竞技新游,改编自现象级国漫IP《一人之下》。发布会上,产品首次曝光了原作中关键的“全性攻山“的核心剧情。游戏会将动漫中全性四张狂突袭龙虎山的精彩打斗场景进行全方位还原,为玩家带来淋漓尽致的畅快武术格斗体验。目前《异人之下》全网预约火热进行中,预约用户已突破3000万,前往官网预约即可获得异人【夏禾】等六重奖励。《光与夜之恋》本次发布会上也公布了《光与夜之恋》将举办五周年音乐盛典的消息。《光与夜之恋》是腾讯首款高沉浸互动恋爱手游,以东方都市为背景,为女性玩家打造具有沉浸感和代入感的恋爱体验。其上线五年来,一直以尊重女性的叙事内核持续输出创新内容,坚持与女性玩家一起书写有关爱与成长的故事。本次五周年音乐盛典以 “Moment & Eternity”为主题,将五年里的每一个瞬间都谱写成歌,定格为时光流转间的永恒。详细活动信息后续将在《光与夜之恋》官方账号发布。《粒粒的小人国》《粒粒的小人国》是腾讯旗下北极光工作室开发的小人国题材生活模拟游戏。在游戏中,玩家意外变小,在卧室的书桌上建造属于自己的家园。玩家可以与生活在这里的粒粒们一起种田、组乐队、探索世界,享受慢节奏生活,重新发现寻常的美好。发布会上,《粒粒的小人国》释放了多个全新情报:粒粒的新种族因索族将在下次测试入住摇粒乡,粒粒们的动作和对话将会更加丰富,与玩家的互动也将迎来全面升级。《粒粒的小人国》确认将登陆 Mac App Store,为全球玩家呈现一个灵动而治愈的小人国世界。《英雄联盟》发布会上,《英雄联盟》宣布将在2026年英雄联盟第二赛季中,对海克斯大乱斗进行重要更新,包括技能强化机制与成长系统的内容更新。今年,BLG战队拿下2026全球先锋赛的冠军奖杯,这也让两支LPL赛区的队伍获得直通2026季中冠军赛淘汰赛的门票。年末,作为英雄联盟电竞殿堂级赛事的全球总决赛,也将在美国打响。《英雄联盟:云顶之弈》也即将迎来7周年,“时光机”模式回归,并于后续上线英雄联盟传奇赛季S16“恭喜发财”模式。此外,全新的“咖啡甜心 小小安妮”、“咖啡甜心 小小薇古丝”、“河道蟹”及拥有限定生日主题外观的羽饰骑士等也将陆续登场。《英雄联盟手游》作为英雄联盟IP正版MOBA竞技手游,《英雄联盟手游》携手NBA中国、景德镇青花瓷跨界联动,带来更为丰富的联动内容。“湖人神话 德莱厄斯”“凯尔特人传奇 莫德凯撒”“勇士辉煌 嘉文四世”三款球队限定皮肤、“湖人传奇 珑宝”“勇士宣言 珑宝”两款球队限定守护灵,以及由玩家票选出的“青花瓷”主题限定守护灵均即将上线。此外,全新娱乐模式英雄“喵”化彩蛋也将限时开启,在游戏对局中,每位玩家均有概率触发“变猫”彩蛋,在对局中化身猫猫英雄。5月29日,英雄联盟手游超级联赛常规赛重回线下,呈现“二次元+电竞”开放式沉浸场景,随版本持续焕新的线下专属电竞体验也将解锁。《金铲铲之战》发布会上,《金铲铲之战》公布,6月17日“怪兽入侵”赛季将重返《金铲铲之战》,“地下魔盗团”羁绊、强力三星五费等经典都将升级回归,多重玩家福利活动也将陆续上线。此外,《金铲铲之战》公开赛、高校赛、女子赛等一系列全民赛事不断升温,并携手广州、杭州、西安、苏州、武汉、上海、长沙七大名城,为弈士们开启七城之旅。双城音乐秀在发布会上,英雄联盟IP全球首部沉浸式互动体验音乐秀《双城之战》宣布,已登陆上海开启长期驻演,并将于暑期迎来百场狂欢盛典。该乐秀由拳头游戏监修,腾讯视频、腾讯游戏、上海文广演艺集团、哇唧唧哇联合出品,全球顶级沉浸式团队Punchdrunk共创,首次将动画《双城之战》的宏大世界以实景互动形式呈现。120分钟体验中,观众可自由穿行于1:1复刻的皮城街道、福根酒吧与微光工厂。没有固定座位,自主选择跟随金克丝、蔚等角色,沉浸于多线叙事,零距离感受名场面的震撼与真实互动。此外,音乐秀还现场真唱30余首动画原声与英雄联盟主题曲,包括《孤勇者》《Enemy》等热门单曲。 目前,8月31日前场次已全面开放,百场狂欢即将来袭。观众可通过大麦、猫眼、英雄联盟周边商城等平台购票,亲临上海,走进双城。《无畏契约》系列产品发布会上,无畏契约系列产品集中披露了今夏规划。端游方面,无畏契约公布了全新皮肤套装“逆命中队”,宣布6月6日开启伦敦大师赛观赛及竞猜活动,同时还全新发布了2026公益行动回响计划“听见回响”,目标关注听障群体。无畏契约手游方面,产品将于6月11日开启全新版本,陆续推出新英雄“幻棱”、新地图“幽邃地窟”,同时端内还将上线智能助手持续提升用户体验。《虚环》“制作篇”的最后一款产品,是由腾讯CDD工作室带来的一款专属于V圈的强战斗演出策略养成游戏《虚环》。游戏中登场的角色,在真实世界中都是名动一方的V圈主播,但在名为“虚环”的平行世界中,她们却是改变世界的战斗偶像。《虚环》在今年初完成的首次测试已获得不少V圈玩家好评,项目组也希望能在“虚实结合的活人感”角色塑造、高策略养成系统的基础上,持续拓展内容边界,为玩家呈现一款真正懂V圈的策略养成佳作。今年内《虚环》将迎来更多新的动作,新一轮公开测试及线下试玩活动也会陆续登场。游戏发行篇助力项目研发、陪伴游戏成长,腾讯游戏持续为多元产品提供专业的发行支持。在游戏发行篇,发布会带来了17款人气产品的内容更新,其中有8款新品的首曝与新动态。《流放之路:降临》在发行篇,首个登场的是《流放之路:降临》,作为刷宝赛道的破局者,发布会上正式宣告年底开启全面转免。本次更新为游戏有史以来最大力度的版本迭代,打造超过50小时的全新生态。同时,产品推出国服定制的智能体验——国服 WeGame AI 助手“蛋蛋君”。它不仅是游戏辅助工具,更是让所有玩家轻松上手硬核内容、降低门槛的“战术参谋”。从千人千面的 BD 智能推荐、市集装备实时分析,到深度收益拆解,AI 技术的赋能将复杂的策略分析转化为直观的游戏体验,让更多玩家有机会深入触达 ARPG 的黄金深度。《穿越火线》《穿越火线》在发布会上透露了暑期重磅更新,包括生化模式与竞技体验全面升级。生化模式在原有玩法基础上,新增自选随机buff系统——玩家每回合可进行多次选择,自由组合buff,最终形成多样化的个性化流派。同时,怀旧模式下的生化模式也将迎来重大更新:玩家期待已久的救世主模式及30人终结者模式即将重新上线。竞技体验方面同步进行多项优化。投掷训练新增五张地图的实操指引;“新沙漠灰"与"新黑色城镇"完成地图品质升级,正式进驻排位地图池;全新竞技信息辅助系统将于暑期上线,将极速降低战术沟通门槛。武器方面,暑期也将推出全新英雄级AK103。《穿越火线高清竞技大区》预告暑期重磅更新,包括新地图、新角色、新武器。全新挑战模式地图《失落之城》和生化追击地图《蒸汽城》即将携手上线,给玩家带来更丰富的游戏体验。同时,全新原创女角色艾娃携AK47-孟德和另一把神秘经
【AI前沿】#4OpenAI 发布 ChatGPT for PowerPoint:一句话生成 PPT,还能主动揪 Bug
AI资讯AI新闻资讯正文OpenAI 发布 ChatGPT for PowerPoint:一句话生成 PPT,还能主动揪 Bug发布于AI新闻资讯发布时间 :2026年5月22号 16:14阅读 :1分钟全球职场人的“PPT 噩梦”或许即将终结。5月22日,OpenAI 毫无征兆地在开发者生态中抛出重磅炸弹:正式推出 ChatGPT for PowerPoint 插件(Beta 版)。从现在起,ChatGPT 不再仅仅是浏览器里那个只能陪你“纸上谈兵”的对话框,它已正式嵌入微软 PowerPoint 的底层架构,成为你幻灯片创作过程中的“隐形合伙人”。核心看点:零门槛全免费:无论是 ChatGPT Plus 付费会员还是普通免费账号,全球用户即刻起均可安装插件进行体验。全能助手:支持从零新建 PPT、一键修改/润色页面,甚至能像专家一样“复盘”你的方案。安全可控:引入关键操作确认机制,拒绝“AI 自作主张”,确保每一处修改都尽在掌握。从“对话”到“动作”:三大场景颠覆工作流传统的 PPT 创作痛点在于:AI 生成的内容往往格式僵硬、缺乏逻辑,且无法直接插入幻灯片。ChatGPT for PowerPoint 彻底打破了这一“中间商”壁垒:1. 一句话“无中生有”你只需输入指令,例如:“帮我生成一份关于2026年度人工智能产业发展趋势的演示文稿,包含10页,风格要简洁专业。”ChatGPT 将自动规划大纲、匹配布局,并生成具备专业逻辑的幻灯片初稿。2. “润色医生”:点对点修改针对已有的 PPT 页面,你可以直接发出指令:“将第三页的文案改为更具说服力的表达,语气要更具职业感”或“把这几页的配色方案调得更现代一些”。AI 会实时响应并直接在文档中执行修改,省去了繁琐的格式调整。3. “隐形专家”:主动揪 Bug这是该插件最硬核的功能。ChatGPT 能够深入分析你的演示文稿,自动识别内容逻辑缺口(Content Gaps)。比如,它可能会提示你:“你的市场调研部分缺乏竞争对手数据分析,可能导致方案缺乏说服力”,甚至能预判汇报现场老板最可能问出的棘手问题,并给出参考解答建议。安全至上:加入“人工确认机制”AI 生成内容最怕的就是“幻觉”或误操作。OpenAI 在设计这款插件时,特别强化了可控性。对于涉及结构大改、重要文字增删等关键操作,插件会强制弹窗请求确认,只有在你点头之后,AI 才会真正对文档进行“手术”。这种“人在回路(Human-in-the-loop)”的设计,极大降低了办公场景中的协作风险。行业评价:PPT 行业进入“智能体协作”时代对于办公自动化产业而言,OpenAI 的这一动作影响深远。此前,许多“AI+PPT”工具多为独立的小程序,用户需要“复制-粘贴-调整格式”,体验割裂。现在,随着 ChatGPT 原生接入 PowerPoint,办公生产力工具的底层逻辑已经发生了位移:未来的 PPT 制作,将不再是“人通过鼠标画图”,而是“人作为总监,通过 AI 主动拆解大纲、填充数据、润色逻辑”。对于职场人来说,ChatGPT for PowerPoint 不仅仅是一个工具,它更像是一个随叫随到的资深策划专家。如果你已经迫不及待想要体验,只需打开 PowerPoint 的插件商店,搜索 ChatGPT,登录 OpenAI 账号即可一键激活。下一步,你是准备把这份工作交给 AI,还是在 AI 的辅助下开启“十倍速”汇报准备?
【AI前沿】#3人类对局体验再升级!免费开源 AI 国际象棋引擎 Maia 3 正式发布
AI资讯AI新闻资讯正文人类对局体验再升级!免费开源 AI 国际象棋引擎 Maia 3 正式发布发布于AI新闻资讯发布时间 :2026年5月26号 17:44阅读 :1分钟Maia Chess 团队近日正式推出了全新的开源国际象棋引擎——“Maia 3”。该模型在 2.5 亿局真实人类对局数据的训练下,Elo 评分成功达到约 1800 分,较上一代实现了近 300 分的跨越式提升。更重要的是,该引擎完全免费开源并支持本地部署,标志着 AI 棋类引擎向“平民化”迈出了关键一步。独辟蹊径:专注于模拟人类决策模式与 AlphaZero、Stockfish 等追求超人类水平、动辄 3500+ Elo 评分的传统顶级引擎不同,Maia 项目的核心初衷是探索 AI 如何更好地理解和模拟人类的下棋行为。它专注于“像人类一样下棋”——预测人类的实际走法,而非寻找绝对的数学最优解。这种“人类中心”的训练方式,让 Maia 3 在对局中不会走出人类难以理解的“神之一手”,而是能够精准模拟真实对局中的常见模式、心理偏好甚至逻辑错误。这使其能够摆脱超强引擎带给玩家的挫败感,成为更具教育意义和陪伴价值的业余俱乐部级高手陪练。Llama 架构加持与多棋种生态扩展在技术架构上,Maia 3 迎来了重大升级。它基于 Meta 的 Llama 3.1 架构构建,采用了 decoder-only transformer 设计,相比前代基于 GPT-2 的架构,提供了更强的上下文理解能力和计算效率。其训练数据涵盖了从初学者到大师级别的各个水平段。值得瞩目的是,Maia 3 已经不再局限于国际象棋,而是进一步扩展支持了多种棋类游戏,包括将棋(Shogi)、围棋(Go)以及中国象棋(Xiangqi)。这一多模态能力的进化,使其一跃成为通用的棋类 AI 学术研究平台。消费级硬件流畅运行推动 AI 民主化Maia 3 采用了极为友好的 Apache 2.0 许可证开源,这意味着全球开发者可以自由地对其进行使用、修改、分发甚至商业化扩展。目前,该项目的代码、训练数据和模型权重均已无保留地发布至 GitHub。为了彻底降低使用门槛,团队对 Maia 3 进行了深度的硬件运行优化。官方表示,用户无需配备高端显卡,只需一台带有现代 CPU 的普通笔记本电脑即可流畅运行本地部署。目前,玩家已可直接在lichess.org平台上在线与 Maia 3 展开对局,该引擎也将为未来的在线对局平台和教学软件提供高质量的免费底层支持。
【AI前沿】#2国家标准委发布《AI伦理安全指引1.0》,为大模型落地装上“安全闸”
AI资讯AI新闻资讯正文国家标准委发布《AI伦理安全指引1.0》,为大模型落地装上“安全闸”发布于AI新闻资讯发布时间 :2026年5月25号 18:03阅读 :1分钟近日,全国网络安全标准化技术委员会正式发布《人工智能应用伦理安全指引1.0》。这份重磅文件由阿里、华为、深度求索(DeepSeek)等头部企业及科研单位联合起草,标志着我国人工智能伦理安全治理体系从“顶层倡议”正式迈向“技术标准落位”的新阶段。文件核心定位:该指引是一份原则性、参考性的技术文件,旨在为人工智能产业链上的各主体提供一套可执行的伦理安全框架,以应对当前AI应用中日益突出的安全挑战。指引的三大维度:全生命周期安全闭环《指引》明确将人工智能的生命周期拆解为应用开发、服务提供、应用使用三个关键层面,并针对各环节提出了差异化的安全要求:开发层:源头治理。明确要求开发者在模型训练数据清理、模型架构安全性设计及算力环境配置中嵌入伦理审查机制。服务层:过程管控。重点针对当下大模型普遍存在的“AI 幻觉”问题,要求服务提供方必须具备有效的风险监测与管控手段,确保输出内容的真实性与一致性。使用层:用户边界。为应用终端的合法合规使用划定界限,保护用户隐私,防止技术滥用。为什么这份《指引》至关重要?在业内人士看来,这份文件的落地具有深远的产业价值:责任主体清晰化:过去,当 AI 出现内容失控或伦理纠纷时,责任往往模糊。该指引通过明确各环节规范,倒逼企业在模型上线前必须履行安全“预验收”责任。化解“幻觉”黑洞:针对人工智能输出不可控(幻觉)的行业痛点,《指引》首次从标准层面提出了管控要求,这将直接推动企业研发更稳健、具备事实校验能力的底层模型。构建安全生态:阿里、华为、深度求索等企业的参与,体现了行业对“安全是AI发展前提”的共识。这不仅有利于完善国内人工智能治理体系,更提升了中国 AI 企业在全球技术治理话语权中的专业度。行业影响:从“野蛮生长”向“合规深耕”转型随着《人工智能应用伦理安全指引1.0》的发布,AI 产业正迎来新的拐点:合规成“入场券”:对于致力于 AI 应用的企业而言,伦理安全审计将成为项目上线流程中的硬性标准。技术迭代新方向:能够有效抑制幻觉、具备强大伦理安全保障的底座模型,将比单纯拼参数规模的模型更受市场青睐。业内普遍认为,这份指引不仅是对当前 AI 治理短板的及时补齐,更是为国内人工智能产业的长期可持续发展夯实了底座。对于广大从业者而言,这意味着 AI 的开发与应用将不再是脱缰的野马,而是在法律与伦理的轨道上,向更高质量的“智能社会”迈进。
【AI前沿】#1B站 2026 年Q1 财报:AI赋能广告狂飙,扭亏为盈进入新纪元
AI资讯AI新闻资讯正文B站 2026 年Q1 财报:AI赋能广告狂飙,扭亏为盈进入新纪元发布于AI新闻资讯发布时间 :2026年5月22号 17:41阅读 :1分钟B站今日交出了一份里程碑式的财报: 2026 年第一季度总营收达74. 7 亿元,同比增长7%。更值得关注的是,公司实现净利润2. 02 亿元(去年同期亏损 1070 万元),正式实现单季扭亏为盈,标志着B站的商业化路径已步入良性增长阶段。Q1 核心数据速览:盈利大突破:净利润扭亏为盈达 2.02 亿元,经调整净利润 5.85 亿元,同比增长 62%。广告引擎强劲:广告收入达 25.9 亿元,同比激增 30%,连续 13 个季度保持双位数增长。用户粘性攀升:日均活跃用户(DAU)达 1.15 亿,同比增长 8%;日均使用时长达 119 分钟,创下历史新高。AI:驱动B站商业增长的“核心变量”财报发布后,B站管理层明确将 AI 定义为“十倍放大的历史性机遇”。AI 在本季度财报中展现了全方位的赋能价值:广告效率革命:广告业务成为增长引擎的核心动力。AI 技术不仅大幅提升了广告内容的精准度与投放转化效率,自动广告消耗渗透率已高达 85%,这意味着 AI 正在接管广告生态的精准分发,显著降低了人工运营成本。内容生态倍增:AI 技术极大提升了创作效率,站内 AI 相关内容观看时长环比增长 44%。对于创作者而言,AI 正在从“工具”转变为“搭档”,通过降低创作门槛,反哺了社区的活跃度和内容丰富度。分发链路重塑:结合 AI 算法优化,B站的内容推荐链路更加智能,成功将用户日均使用时长拉高至接近 2 小时的纪录水平。游戏业务面临“阵痛期”,战略重心稳扎稳打在广告业务高歌猛进的同时,B站游戏业务本季度实现营收 15.2 亿元,同比下滑 12%。管理层坦言这主要受去年同期爆款《三国:谋定天下》带来的高基数效应影响,目前该产品正平稳过渡至成熟期。面对市场的疑虑,陈睿重申了B站游戏的三大战略打法:长线运营、垂类头部、品类年轻化。据悉,多款储备新品如《三国志:王道天下》及《三国:百将牌》已明确年内上线计划,旨在构建差异化的“三国宇宙”,作为后续增长的接力棒。未来展望:加大AI基建投入,冲刺更高盈利水平尽管财报亮眼,但资本市场对公司 2026 全年预计增加的10 亿元 AI 相关资本开支表现出了谨慎态度。对此,B站 CFO 樊欣表示,公司不仅要赚当下的钱,更要牢牢握住未来的“AI 门票”。随着高价值行业(如AI科技、汽车、家装等)在广告端的持续爆发,叠加 AI 对生产效率的深度重塑,B站正进入一个以技术驱动增长、以社区价值变现的新盈利周期。这不仅仅是一份财报,更是 B 站作为“视频社区+AI 应用工厂”的范式转型开端。
【AI前沿】通义千问升级“拍照问健康”:能圈图、懂推理,三甲医生实测认可
AI资讯AI新闻资讯正文通义千问升级“拍照问健康”:能圈图、懂推理,三甲医生实测认可发布于AI新闻资讯发布时间 :2026年5月27号 14:21阅读 :1分钟2026年5月27日,阿里旗下通义千问APP宣布对“拍照问健康”功能进行重要升级。新版本突破了传统OCR文字识别局限,实现了医学图像理解与临床推理能力。核心功能升级视觉圈选:用户上传化验单或患处照片后,AI可像医生一样在图像上直接圈出异常区域(如箭头指标、皮疹细节)。联动推理:不再孤立解读单项指标,而是结合年龄、性别、多指标关联进行排除法分析。例如,能识别青少年ALP升高属生理性而非病理性异常。过程透明:系统自主调用医学知识库,并展示“识别-标注-推理”的全过程,让用户理解结论逻辑。专业临床验证北京协和医院、友谊医院、北大人民医院的三位主任医师实测验证了该功能。在13岁腹痛查因、脂肪肝疑诊、荨麻疹伴高白细胞及下巴皮疹等多个案例中,千问的分析思路(如排除胆道问题、鉴别生理性升高)均获得专家认可,认为其具备鉴别诊断意识,能有效减少用户因误读指标产生的焦虑。此次升级标志着AI健康助手从“机械读值”向“辅助诊断”迈出关键一步,为用户提供了更可靠的预检参考。
【AI前沿】环球音乐与 TikTok 续签多年授权协议,AI 监管成为合作核心
AI资讯AI新闻资讯正文环球音乐与 TikTok 续签多年授权协议,AI 监管成为合作核心发布于AI新闻资讯发布时间 :2026年5月27号 14:27阅读 :1分钟2026 年 5 月 22 日,环球音乐集团(UMG)与 TikTok 正式宣布达成一项全新的多年期战略授权协议。此次续约不仅延续了双方在音乐发现与推广领域的深度合作,更将对“未经授权的 AI 生成音乐”的治理提升到了前所未有的战略高度。一、协议的核心要点本次合作不仅是简单的目录授权,更是双方在 AI 时代商业逻辑的深度共识:严控未经授权的 AI 内容:双方承诺将共同协作,识别并移除平台上未经授权的 AI 生成音乐。这一机制旨在通过平台层面的主动治理,解决此前 AI 生成内容(如模仿艺人声音、伪造曲目)泛滥导致的版权与艺术侵权争议。强化归属与补偿:协议强调改进艺术家与词曲作者的“归属权(Attribution)”系统,确保平台经济效益能更有效地流向真正的人类创作者,而非通过 AI 工具窃取价值的侵权内容。商业工具升级:除了版权治理,新协议还扩充了艺人推广工具,包括增强的营销与广告投放方案、电子商务集成以及帮助新兴艺术家建立粉丝社区的全新粉丝互动功能。二、从争议到共识:双方关系的重大转折此次续约被视为双方 2024 年“破冰”后的进一步深化。回首往事:2024 年初,由于在 AI 保护机制、内容安全及版税分配等议题上的严重分歧,UMG 曾一度将旗下艺人目录从 TikTok 下架,导致大量流行歌曲在平台消失,引发行业震动。战略演变:此次续约标志着双方已从对抗转向共建。TikTok 此前通过引入检测技术(如联动 ACRCloud)尝试在源头遏制违规内容,如今这种治理手段已被正式纳入合同契约,使其从“舆论压力”变为“法律义务”。三、行业深远影响:AI 音乐“版权化”的试金石这一协议不仅影响两家公司,更在数字音乐行业树立了一个新的治理模版:AI 内容的“去野蛮化”:随着各大平台监管压力增大,未经授权的 AI 音乐可能在头部社交平台失去生存空间。对于生成式音频初创公司而言,未来的核心竞争点不再仅仅是“生成效果”,而是如何证明其模型符合版权规范并能被主流平台接纳。治理模式向“主动识别”转变:此前,版权持有者通常需手动提交侵权下架申请(Takedowns),而 UMG 与 TikTok 的联合移除机制预示着“平台与版权方协同治理”将成为常态。人类艺术的溢价逻辑:在 AI 试图全面降本增效的浪潮下,该协议进一步巩固了人类创作内容的经济价值。对于依赖版税生存的艺术家而言,这标志着 AI 监管已从“原则性倡议”落到了“货币化的合同条款”中。业界分析认为,随着欧美地区对 AI 内容合规要求的持续收紧,TikTok 与 UMG 的此次联手,或将成为未来音乐版权领域处理 AI 冲突的“黄金标准”。
【AI前沿】科林·弗莱明正式加入 OpenAI,担任首席营销官
AI资讯AI新闻资讯正文科林·弗莱明正式加入 OpenAI,担任首席营销官发布于AI新闻资讯发布时间 :2026年5月27号 14:45阅读 :1分钟据最新消息,前 ServiceNow 和 Salesforce 营销高管科林·弗莱明(Colin Fleming)已正式宣布加入 OpenAI,担任首席营销官(商业方向)。弗莱明拥有丰富的市场营销经验,曾在企业服务巨头 ServiceNow 和 Salesforce 负责营销工作。此外,他还曾是一名职业赛车手,职业背景多元而独特。在加入 OpenAI 的声明中,弗莱明高度评价了这家 AI 公司。他表示,OpenAI 是一家“改变人们对可能性认知”的公司,这正是吸引他加入的核心原因。他特别强调了 OpenAI 带来的工作方式变革:“创意不再需要等待预算、审批或长达六个月的路线图。你可以直接动手实践。”此番任命标志着 OpenAI 在商业化进程中进一步加强营销与业务领导力,弗莱明将助力 OpenAI 在全球市场推广其前沿 AI 产品与理念。
【AI前沿】Google将SynthID技术接入搜索与Chrome:一键验证是否为AI生成
AI资讯AI新闻资讯正文Google将SynthID技术接入搜索与Chrome:一键验证是否为AI生成发布于AI新闻资讯发布时间 :2026年5月27号 15:05阅读 :1分钟Google近日宣布,旗下用于识别AI生成内容的SynthID水印技术自发布以来,已被累计使用超过5000万次。为了进一步推动AI内容透明度与网络可信度建设,Google正将该技术深度集成至旗下核心生态,包括Google搜索与Google Chrome浏览器。此次功能扩展标志着SynthID从后台技术走向日常应用场景。升级后 user 能够直接在Google搜索或Chrome浏览器界面中,通过“这是用AI做的吗?”等简短交互,快速验证网页媒体内容的真实属性。作为对抗深度伪造(Deepfake)和信息合成技术滥用的关键举措,Google此番将认证工具内置于高频流量入口,不仅大幅降低了公众辨别数字内容的门槛,也预示着AI生成内容(AIGC)的合规化与可追溯性正成为全球科技巨头的标准化技术底座,将对未来数字内容生态的信任机制产生深远影响。
【AI前沿】OpenAI 广告业务大转向:挥别“豪门俱乐部”,拥抱中小商家
AI资讯AI新闻资讯正文OpenAI 广告业务大转向:挥别“豪门俱乐部”,拥抱中小商家发布于AI新闻资讯发布时间 :2026年5月27号 15:11阅读 :1分钟近日,OpenAI 在广告业务领域实施了自上线以来最重大的一次战略调整。据The Information报道,OpenAI 正迅速将 ChatGPT 广告业务重心从初期的“头部品牌定制化”转向“大众化与效果驱动”。这一转变标志着 OpenAI 正式进入与 Google、Meta 等互联网广告巨头正面竞争的深水区。一、门槛“大跳水”:从20万美元到全民自助OpenAI 广告业务在推出初期采取了严苛的“ VIP 策略”:仅向 Adobe、福特汽车等行业头部品牌开放,并设定了20万美元(约合人民币145万元)的最低预付投放门槛。但在最新的调整中:门槛彻底取消:OpenAI 废除了中小企业难以企及的最低预付金额。自助化生态:无论是大型品牌还是洗车店、干洗店等本地化小微商家,现均可通过自助广告平台参与投放,广告采买方式实现了高度的互联网标准化。二、策略重心:从“曝光”到“转化”OpenAI 的目标已从简单的“品牌展示”进化为“效果转化”。为了吸引那些极度看重投资回报率(ROI)的商家,公司正积极测试全新的“转化类广告”:付费逻辑变革:此前广告主要采用“千次展示付费(CPM)”模式,而新测试的模式则向传统的绩效营销靠拢——广告主仅在用户完成下单、预约或填写表单等实质性操作时付费。基建完善:为了支撑这一转型,OpenAI 正推动广告主安装“追踪像素(Ad Pixel)”及连接 API 接口,从而将客户的后端转化数据回传至 OpenAI 系统,构建起一套媲美 Google 和 Meta 的精准转化评价体系。三、深度解析:为何转向中小企业市场?这一转型背后,映射出 OpenAI 在商业化进程中的三大核心诉求:构建生态护城河:相比高不可攀的奢侈品与汽车大厂,广大的本地服务商(如美发、健身、咨询)才是维持互联网广告平台生态繁荣的“长尾经济”支柱。直面大模型时代的商业竞争:随着各大模型厂商进入变现竞速期,OpenAI 需要通过“效果广告”证明其流量的即时交易价值,而非仅仅停留在发现式搜索层面。数据价值循环:通过引入更多中小广告主,OpenAI 可以收集到更多元化的业务场景数据,进一步优化其广告推荐算法的精准度,形成“投得多、效果好、投得更多”的正向飞轮。四、行业信号:AI 平台的“交易化”升级业内分析认为,这是 AI 平台由“纯信息发现工具”向“交易型生态系统”进化的里程碑。ChatGPT 此前被视为一种“回答者”,而通过接入转化广告和自助后台,它正在转变为一个可以直接实现流量闭环与商业变现的终端。对于开发者与广告从业者而言,OpenAI 的这一调整降低了实验成本,预示着 ChatGPT 即将成为继搜索与社交之后,又一个不可忽视的获取流量与转化客户的关键阵地。
【AI前沿】OpenAI 广告业务大转向:取消 20 万美元预付,全面拥抱街边店
AI资讯AI新闻资讯正文OpenAI 广告业务大转向:取消 20 万美元预付,全面拥抱街边店发布于AI新闻资讯发布时间 :2026年5月27号 15:52阅读 :1分钟在 ChatGPT 广告业务正式上线仅三个月后,人工智能巨头 OpenAI 迅速对其中长期商业化策略进行了颠覆性调整。公司正将其广告业务重心从服务拥有巨额预算的国际知名品牌,全面转向吸引小型及本地企业。今年早些时候,OpenAI首次试水广告业务时采取了高门槛的“VIP”路线,仅面向福特汽车等头部大牌开放,且要求广告主最低预付 20 万美元的投放成本。然而目前,这一高昂的资金门槛已被官方正式宣告取消。标准化模式对标传统巨头门槛的彻底取消意味着,无论是跨国集团还是街边的干洗店、洗车店,未来都能够直接通过自助后台参与 ChatGPT 的广告投放。这一转变标志着 OpenAI 放弃了早期的品牌曝光路线,转而全面拥抱更接近 Meta 和谷歌的互联网效果广告模式。为了进一步吸引看重投资回报率(ROI)的中小商家,OpenAI 还在本周启动了全新“转化类广告”的测试。这种新型广告形式旨在引导用户完成下单消费、预约服务或填写表单等实际操作,为商家带来更直接的生意转化。按需付费助推规模化营收与此前仅按千次展示(CPM)计费的呆板模式不同,转化类广告的引入将极大地提升中小商家获取实际客流的效率。商家不再需要为虚无的曝光量买单,而是可以根据真实的获客效果来精准控制自己的推广预算。业内分析指出,OpenAI 的这一举措旨在通过庞大的中小商家群体,实现广告收入的规模化增长。在技术红利期过后,通过更加接地气的商业化变现手段来支撑庞大的算力开销,已成为大模型企业可持续发展的必然选择。
【AI前沿】小鹏汽车推进人形机器人量产冲刺:计划2026年底量产并于次年进店导购
AI资讯AI新闻资讯正文小鹏汽车推进人形机器人量产冲刺:计划2026年底量产并于次年进店导购发布于AI新闻资讯发布时间 :2026年5月27号 16:37阅读 :1分钟小鹏集团近日召开机器人量产动员大会,正式宣告其人形机器人业务进入量产冲刺阶段,标志着汽车制造巨头向具身智能产业化落地迈出关键一步。据了解,小鹏汽车、动力、制造、测试及通用智能等多个中心近千名员工参与了此次大会。小鹏集团董事长何小鹏在会上明确了关键时间节点:小鹏人形机器人将于2026年底实现量产,并预计在2027年第一季度正式进入小鹏线下门店担任导购。何小鹏强调,小鹏机器人实现了从芯片、操作系统到关节、灵巧手的全线自研,是目前国内唯一全栈自研的机器人公司,前期的研发高投入将赋予产品更高品质与更全面的能力。目前,团队正致力于复刻八年前首款车型G3的发布与量产交付路径。在产能建设方面,位于广州市天河区广棠科创城、占地约11万平方米的小鹏人形机器人量产基地已于今年2月正式动工,为后续的全链条规模化生产提供了坚实的硬件支撑。作为物理AI与具身智能的最佳载体,人形机器人的商业化落地正成为科技巨头角逐的新焦点。小鹏汽车凭借在智能汽车领域积累的自动驾驶、动力系统及大规模制造经验,正加速将AI技术转化为物理实体生产力。此番量产冲刺不仅将深化小鹏自身的硬科技生态布局,也将为国内具身智能产业的规模化应用与商业化转型提供重要的实践范例。
【AI前沿】BitCPM-CANN
BitCPM-CANN – 面壁智能联合清华开源的端侧大模型BitCPM-CANN是什么BitCPM-CANN是面壁智能联合清华大学与OpenBMB开源社区联合推出的,中国首个完全基于华为昇腾国产算力平台完成端到端训练的1.58-bit三值大模型。模型采用量化感知训练路线,包含0.5B至8B四个尺寸,推理阶段释放约6倍显存红利,模型能力保留率达90.1%–97.2%,标志着国产NPU首次拥有完整的低比特训练栈。BitCPM-CANN的主要功能1.58-bit三值大模型推理:提供0.5B、1B、3B、8B四个参数规格,可在端侧设备上高效运行,8B模型可轻松部署于当前主流旗舰手机。国产昇腾全链路训练闭环:从训练到推理完整链路均在华为昇腾平台上原生完成,无需依赖国外GPU进行预训练。极致显存释放:相比传统BF16精度,推理阶段释放约6倍显存红利,同等内存可承载远超以往的模型能力。全精度对照评测验证:与同尺寸MiniCPM4全精度模型在常识、阅读理解、学科知识、数学与推理等11项任务上完成1:1性能对照。开源模型与训练底座:全系列模型权重及基于MindSpeed × Megatron-LM的低比特训练底座均对外开放,支持开发者复现与二次创新。BitCPM-CANN的技术原理量化感知训练(QAT):模型在训练初始阶段即主动学习使用三值权重(-1、0、+1)进行知识表达,非训练完成后再被动压缩,从根本上实现极低比特下的原生生长。三值权重信息密度最大化:通过1.58-bit位宽约束迫使每个bit发挥最大知识承载效率,使权重精度取决于每bit承载的知识量非位宽大小。MindSpeed × Megatron-LM训练底座:基于主干框架在昇腾平台上搭建完整的低比特训练基础设施,包含环境适配、32K长序列支持、并行策略与融合算子体系。端到端国产算力原生适配:从最底层量化算子、QAT算法到完整并行策略和训练框架,全部针对华为昇腾进行原生开发与优化,实现训练推理一体化。系统性可扩展低比特范式:通过0.5B至8B全尺寸系列的工程验证,证明该低比特训练路线具备跨规模的系统性、可扩展性与工程可复现性。如何使用BitCPM-CANN获取开源模型权重:访问HuggingFace下载0.5B、1B、3B、8B全系列模型权重。部署训练底座:基于面壁智能开源的MindSpeed × Megatron-LM低比特训练底座,在华为昇腾平台上完成环境适配、依赖安装与框架部署。端侧推理运行:用模型6倍显存红利优势,在当前主流旗舰手机或PC端侧设备上直接运行8B及以下模型进行推理。二次训练创新:基于QAT训练基础设施与开源代码,在昇腾平台上进行二次微调、领域适配或更大规模的低比特训练创新。BitCPM-CANN的核心优势国产算力闭环突破:首次在昇腾上实现端到端1.58-bit训练并全精度对照评测至8B级别,打破国产芯片只能跑推理的刻板印象。性能保留率行业领先:3B模型能力保留率达97.2%为全档最高,8B达95.7%,0.5B亦达90.1%,系统性可扩展且工程可复现。训练效率显著优于同类:此前GPU版BitCPM 1B仅用微软BitNet 2B 1/20的训练算力即实现全面超越,效率优势已验证。端侧天花板大幅抬升:6倍显存红利结合MoE架构,有望将50B乃至100B参数超大模型装入终端,使端侧AI能力达到全新高度。BitCPM-CANN的项目地址HuggingFace模型库:https://huggingface.co/collections/openbmb/bitcpm-cannBitCPM-CANN的同类竞品对比对比维度BitCPM-CANN微软 BitNet开发方面壁智能 / 清华大学 / OpenBMB微软研究院技术路线量化感知训练(QAT)三值量化训练训练平台华为昇腾(国产NPU)英伟达 GPU权重精度1.58-bit(-1, 0, +1)1.58-bit(-1, 0, +1)能力保留率90.1%–97.2%(3B最高97.2%)未公开同类全精度对照训练效率1B仅用BitNet 2B 1/20算力基准方案端到端训练昇腾原生完成GPU原生完成开源程度全系列权重 + 训练底座开源部分开源端侧价值补国产NPU低比特模型供给侧空白推动三值量化研究BitCPM-CANN的应用场景智能手机端侧AI:在有限内存下运行更大参数模型,未来有望在手机上运行60B大模型,直接提升终端智能水平与用户体验。国产芯片生态补全:为高通骁龙8 Gen 4等已支持2-bit推理的端侧芯片提供高质量模型侧供给,实现软硬件协同与生态闭环。企业级端侧部署:适用PC、汽车、IoT等设备上的低内存成本大模型推理,对冲全球HBM内存价格飙升带来的供应链压力。低比特训练研究创新:为昇腾平台开发者提供可复用、可扩展的QAT公共基础设施,支持基于国产算力的二次训练与微调创新。
【AI前沿】MiniCPM5-1B
MiniCPM5-1B – 面壁智能联合清华开源的端侧文本基座模型MiniCPM5-1B是什么MiniCPM5-1B 是面壁智能联合清华大学、OpenBMB 开源社区推出的 1B 参数端侧文本基座大模型,在 AA-Index 榜单上以 17.9 分超越所有 2B 以下模型,成为全球同级最强开源端侧文本大模型,INT4 量化后仅 0.5GB,可驱动手机、浏览器等终端上的AI 桌宠应用。MiniCPM5-1B的主要功能超强文本推理能力:在综合知识、数学推理、代码编程、逻辑推理、指令遵循等维度全面超越同尺寸模型。端侧原生部署:支持 FP16/INT8/INT4 多精度推理,INT4 量化后权重仅 0.5GB,可在手机、平板、车机、浏览器中直接运行。AI 桌宠应用:可驱动终端本地化的智能陪伴应用,无需联网即可交互。工具调用与 Agentic 能力:支持工具调用协议,具备端侧 Agent 执行能力。多框架兼容:支持 LlamaFactory、ms-swift 微调,以及 SGLang、vLLM、llama.cpp、Ollama、Hugging Face、ArcLight 等推理框架。MiniCPM5-1B的技术原理分级数据治理体系:将预训练数据按质量划分为 L0-L4 五个等级,针对不同语料(高知识密度中英文网页、高质量数学合成数据)实施差异化清洗与筛选策略。高质量数据合成:构建 Ultra-FineWeb-L3 等合成数据集,用精选高密度数据替代海量低质数据的训练范式。AI 自研训练框架 ForgeTrain:Base Model 由全球首个完全由 AI 编写的生产级大模型预训练框架 ForgeTrain 完成,零人类程序员参与框架代码编写,在华为昇腾上预训练,在英伟达 H100 上训练速度比 Megatron 快 10%。极致量化压缩:通过 INT4/Q4 量化技术将模型压缩至 0.5GB,实现端侧普适部署。自研 CPU 推理框架 ArcLight:针对纯 CPU 环境深度优化,无显卡也能流畅运行。如何使用MiniCPM5-1B获取模型权重:访问 HuggingFace、ModelScope、GitCode 或魔乐社区下载 MiniCPM5-1B 模型文件。选择推理框架:根据硬件环境选择 SGLang、vLLM、llama.cpp、Ollama 或面壁自研 ArcLight(CPU 专用)进行加载。量化部署(可选):对模型进行 INT8 或 INT4 量化,INT4 版本仅需 0.5GB 存储可在手机或浏览器运行。运行或微调:直接用预训练模型进行推理,或通过 LlamaFactory、ms-swift 进行领域微调后部署到目标设备。开发端侧应用:基于 MiniCPM-Desk-Pet 等开源项目,快速构建本地 AI 桌宠或智能助手应用。MiniCPM5-1B的核心优势全球 2B 以下性能第一:AA-Index 得分 17.9,超越 Qwen3.5-2B(16.3 分)等参数翻倍模型。智能密度定律验证者:以 1B 参数实现 3 个月前 2B 模型的性能,验证智能密度约每 3.5 个月翻一番。零门槛部署:不挑硬件、不挑平台,浏览器打开即用,支持 Claude Code 等 AI 编程工具一键安装。全面开源:模型权重、训练数据集(Ultra-FineWeb-L3)、部署方案全部开源。MiniCPM5-1B的项目地址GitHub仓库:https://github.com/OpenBMB/MiniCPMHuggingFace模型库:https://huggingface.co/openbmb/MiniCPM5-1BMiniCPM5-1B的同类竞品对比对比维度MiniCPM5-1BQwen3.5-2BLFM2.5-1.2B-Thinking参数规模1B2B1.2BAA-Index 得分17.9(第一)16.3–综合知识 (MMLU-Pro)48.8542.7447.98数学推理 (MATH-500)91.6030.4089.00代码编程 (LCB-Pro)22.680.006.19INT4 量化体积0.5GB~1GB+–训练框架AI 自研 ForgeTrain传统框架传统框架端侧部署浏览器/手机/CPU 全支持需一定算力有限支持开源程度权重+数据集+框架全开源权重开源权重开源MiniCPM5-1B的应用场景端侧智能助手:在手机、平板等设备上离线运行,提供随时响应的AI对话与任务处理能力。AI桌宠陪伴:驱动本地化桌宠应用,无需联网即可实现智能互动与情感陪伴。边缘设备推理:部署于物联网终端和边缘盒子,满足低功耗场景下的文本理解与生成需求。隐私敏感计算:数据本地处理不上传云端,适用于医疗、金融等对隐私合规要求严格的行业。低算力代码辅助:在CPU或低显存设备上提供代码补全、逻辑推理等编程支持。
【AI前沿】AgentScope 2.0
AgentScope 2.0 – 通义实验室开源的多智能体开发框架AgentScope 2.0 是什么AgentScope 2.0 是通义实验室推出的开源多智能体开发框架,聚焦真实场景下的稳定运行、安全控制与生产部署,新增模型容错、权限系统、上下文管理重构、Middleware 扩展、Workspace 执行解耦和 Agent Service 服务化部署等系统性能力,让智能体从跑通 Demo走向稳定生产。AgentScope 2.0 的主要功能模型容错:支持 Qwen、Anthropic、DeepSeek、Gemini、OpenAI、Grok、Moonshot 等主流模型统一接入。引入自动重试与备用模型切换机制,主模型调用失败时自动尝试备用模型,保证长链路任务不中断。过程透明与事件系统:重构消息模块,通过统一 Content Block 承载文本、文件/图片、工具结果、模型思考等多种消息类型。引入事件流系统,支持流式输出模型调用开始、文本增量、工具调用、用户确认等事件,实现执行过程实时可见、可交互、可干预。安全边界与权限系统:系统化权限控制覆盖工具调用、文件读写、命令执行。基于静态规则、工具类型和输入内容进行风险判断,支持自动允许、拒绝或进入用户审批流程,可识别危险目录、敏感文件、高风险命令和危险删除操作。上下文管理重构:结构化压缩保留任务目标、当前状态、关键发现、下一步计划等关键信息。工具结果自动截断避免超长日志撑爆上下文。文件读写新增缓存机制,强制”先读后改”,减少重复 IO。Middleware 扩展机制:支持在模型调用、思考规划、工具执行等关键节点插入自定义逻辑,用于日志追踪、安全检查、业务策略注入、动态上下文注入等,无需修改框架源码。Workspace 执行解耦:抽象执行环境,统一本地、Docker 容器、E2B 云沙箱等不同后端接口。智能体运行逻辑与环境解耦,支持一次编写、本地云端无缝切换。内置预热池机制,支持并行场景的批量环境初始化。Agent Service 服务化部署:将 Runtime 的 Agent Service 能力合并至主库,打通开发与部署。提供标准服务接口、流式输出、会话恢复能力,支持被前端应用、外部系统、工作流稳定调用。AgentScope 2.0 的技术原理统一消息结构:用 Content Block 抽象承载文本、文件/图片、工具结果、模型思考等多模态消息,DataBlock 支持 base64 与 URL 两类数据源,兼容不同模型 API 的多模态能力。事件驱动架构:一次 Agent 回复不再只是返回最终文本,而是流式产生模型调用开始、文本增量、工具调用、工具结果、用户确认、外部执行等事件,让前端 UI 实时展示执行进度。权限检查流程:智能体发起工具调用、文件读写或命令执行时,权限系统依次进行规则检查、输入分析、风险判断,输出允许、拒绝或用户确认三种结果。上下文管理策略:针对长期任务的多轮推理、工具结果和文件内容,采用结构化压缩保留关键状态,自动截断超长工具结果,并通过文件缓存机制减少重复读取。Middleware 插桩:在模型调用、思考规划、工具执行等关键执行环节预留钩子,开发者可插入自定义逻辑实现日志、权限、上下文等横切关注点的统一处理。Workspace 抽象层:通过 WorkspaceBase 抽象出身份标识、生命周期、资源发现、上下文卸载和动态资源管理等通用能力,不同执行后端(本地、容器、云沙箱)实现同一套接口即可接入。如何使用AgentScope 2.0安装框架:通过 pip 安装 AgentScope:pip install agentscope配置模型接入:在配置中指定主模型和备用模型,设置重试次数和切换策略。定义智能体与工具:用 ReActAgent 创建智能体,注册所需工具函数到 Toolkit。设置权限规则:配置工具调用、文件读写、命令执行的权限策略,定义允许/拒绝/确认规则。选择执行环境:通过 Workspace 选择本地、Docker 容器或 E2B 云沙箱作为执行后端。启动服务或本地运行:用 Agent Service 启动标准接口服务,或通过脚本本地运行智能体工作流。AgentScope 2.0的核心优势稳定性强:模型层自动重试+备用切换、上下文结构化压缩、文件缓存,保障长链路任务持续执行不中断。安全性高:系统化权限系统支持规则检查、风险判断和用户审批,为高危操作建立自动拦截与审批机制。透明可控:事件流系统让执行过程实时可见,支持人工确认和人工介入,告别黑盒回复。扩展灵活:Middleware 机制允许不改源码即插即用业务逻辑,Workspace 支持本地/容器/云沙箱无缝切换。生产就绪:内置 Agent Service 提供标准接口、流式输出和会话恢复,可直接从开发脚本上线为生产服务。多模态领先:支持图像生成、TTS、语音输入、实时语音等丰富多模态能力,以及 MCP、A2A 协议。AgentScope 2.0的项目地址项目官网:https://docs.agentscope.io/zh/v2AgentScope 2.0的同类竞品对比对比维度AgentScope 2.0AutoGen(Microsoft)CrewAI核心定位企业级多智能体开发框架多智能体对话编排框架角色化多智能体编排框架设计哲学Agent-Oriented Programming,强调智能体自主性与组织架构对话即工作流,强调多 Agent 协作对话角色扮演团队,自然语言定义 Agent 角色与目标多模型支持Qwen、Anthropic、DeepSeek、Gemini、OpenAI、Grok、Moonshot 等OpenAI、Azure OpenAI、Anthropic、本地模型等OpenAI、Anthropic、Gemini、Ollama、开源模型等模型容错✅ 自动重试 + 备用模型切换⚠️ 依赖模型层自身容错❌ 无内置容错机制执行过程透明✅ 事件流系统,流式展示执行过程,支持人工介入⚠️ 基于对话历史,过程可见性有限❌ 仅展示任务输出,无过程事件流权限与安全✅ 系统化权限系统,支持规则检查、风险判断、用户审批⚠️ 基础安全控制,无系统化权限❌ 无系统化权限控制上下文管理✅ 结构化压缩 + 结果截断 + 文件缓存⚠️ 对话历史管理,无结构化压缩⚠️ 基础任务输出传递,无上下文压缩执行环境✅ Workspace 抽象,本地/容器/云沙箱无缝切换⚠️ 需自行配置执行环境❌ 无执行环境抽象服务化部署✅ Agent Service 内置,标准接口 + 流式输出 + 会话恢复⚠️ 需结合外部服务部署⚠️ 需 CrewAI Enterprise 平台扩展机制✅ Middleware 机制,即插即用⚠️ 通过 Selector 机制扩展⚠️ 通过 Flows 扩展,灵活性有限多模态支持✅ 图像生成、TTS、语音输入、实时语音⚠️ 文本为主,多模态需自定义❌ 无内置多模态支持协议支持✅ MCP (HTTP+Stdio)、A2A⚠️ MCP 社区支持⚠️ A2A 协议支持中适用场景企业级复杂协作、实时语音 Agent、多模态应用快速原型、多角色对话模拟、代码生成快速原型、内容生成、研究分析、角色协作上手难度中等(需理解 async/await)低(10分钟上手)极低(20行代码即可运行)生产就绪度高(内置沙箱、服务化、监控)中(2025年10月生产就绪)中(企业平台有延迟问题)AgentScope 2.0的应用场景企业级复杂协作系统:需要多智能体层级协作、严格组织管理的业务流程自动化。实时语音 Agent:构建支持语音输入、实时对话的多模态智能体应用。安全敏感型任务:涉及文件操作、命令执行等需要严格权限控制和审计轨迹的场景。长链路持续任务:需要多轮推理、多次工具调用、跨轮次状态保持的复杂工作流。多云/混合部署:需要在本地开发、容器测试、云沙箱生产之间灵活切换的环境。
【AI前沿】Xiaomi Auto World Model
Xiaomi Auto World Model – 小米推出的辅助驾驶世界模型AI工具1天前更新Xiaomi Auto World Model是什么Xiaomi Auto World Model 是小米汽车推出的辅助驾驶世界模型,首次将三维重建(WorldRec)与视频生成(WorldGen)深度耦合。WorldRec 用稀疏 3D 锚点实现 10 秒视频 10 秒快速重建,WorldGen 通过两阶段训练与 ODE 蒸馏实现 4 步去噪、0.19 秒/帧生成,支持最长 1 分钟视频。在 Waymo 重建精度(PSNR 28.48)与 nuScenes 生成质量(FVD 64.97)上均达 SOTA,已落地合成数据、仿真测试、辅助驾驶学堂三大业务场景。Xiaomi Auto World Model的主要功能WorldRec 三维重建模块:采用稀疏 3D 查询锚点替代传统稠密高斯,实现多视角多时刻特征聚合与可见性加权融合,10 秒视频重建仅需 10 秒,消除多视角冲突与鬼影问题。WorldGen 视频生成模块:基于全双向时序注意力预训练+因果微调两阶段训练,通过 ODE 蒸馏将去噪步数从 50 步压缩至 4 步,0.19 秒/帧生成未来帧、未观测视角与遮挡区内容,支持最长 81 帧(约 1 分钟)连续生成。重建-生成深度耦合:重建侧提供 3D 几何先验约束生成稳定性,生成侧扩展重建边界至未观测时空区域,两者互相校正抑制长时序漂移。极端场景生成:支持暴雨、大雪、浓雾等极端天气及动物闯入等长尾危险场景的高质量合成,为感知模型训练提供稀缺数据。三大业务落地:合成数据生成(已交付 10 万+ clips)、闭环仿真测试(复现真实事故定向优化)、辅助驾驶学堂(动态生成第一人称驾驶教学视频)。Xiaomi Auto World Model的技术原理WorldRec 稀疏锚点表征:摒弃逐像素预测高斯范式,改用稀疏三维查询点作为场景表征,每个锚点主动聚合多相机多时刻特征,通过可见性加权自动筛选可靠观测,从源头保证跨视角一致性。4D Gaussian 全局表示:维护随观测增量扩展的 4D 高斯场景表示,投影到自车视角后作为渲染先验输入生成模型,为生成提供确定性几何约束。WorldGen 两阶段训练:第一阶段全双向时序注意力预训练建立驾驶场景时空全局理解;第二阶段因果注意力微调+教师强制(Teacher Forcing),配合 ODE 蒸馏提速 12 倍,分布匹配蒸馏解决暴露偏差。重建-生成闭环约束:重建的确定性几何先验持续校正生成过程,生成补全重建覆盖不到的时空区域,两者目标函数在结构上互相约束,实现高稳定性、高一致性、高真实性。如何使用Xiaomi Auto World Model上线平台:已上线小米全车型的「辅助驾驶学堂 – 实景模拟场景」。使用条件:需拥有小米汽车(SU7 等车型),在车载系统中进入辅助驾驶学堂模块。Xiaomi Auto World Model的核心优势SOTA 性能:Waymo 重建 PSNR 28.48(超 DGGT 约 1 个点),nuScenes 零样本泛化 PSNR 26.54 同样领先;生成侧 FVD 64.97 超越所有双向与自回归基线模型。极速推理:单视角生成 0.19 秒/帧,三视角 0.46 秒/帧,较同类自回归方法 Epona(1.06 秒/帧)快 5.6 倍。超长时序:支持 81 帧连续生成(10Hz/30Hz,最长 1 分钟),远超公开基线模型的 8-16 帧限制。零样本泛化:nuScenes 零样本测试仍保持领先,证明对新场景具备强适应能力。已落地生产:已在小米汽车合成数据、仿真测试、智能座舱三大核心场景完成业务闭环。Xiaomi Auto World Model的项目地址项目官网:https://JointWM.github.io/arXiv技术论文:https://arxiv.org/pdf/2605.18137Xiaomi Auto World Model的同类竞品对比对比维度Xiaomi Auto World ModelWaymo World Model所属公司小米汽车Waymo(Alphabet/Google)发布时间2026年5月2026年2月技术路线重建+生成深度耦合一体化架构(WorldRec + WorldGen 互相约束)基于 Genie 3 的生成式世界模型(纯生成路线,后训练适配驾驶场景)重建模块WorldRec:稀疏 3D 锚点表征,10秒视频10秒重建,PSNR 28.48(Waymo数据集)无独立重建模块,依赖 Genie 3 的预训练世界知识生成全场景生成模块WorldGen:4步去噪,0.19秒/帧,支持81帧(~1分钟)连续生成基于 Genie 3 生成,支持多传感器输出(相机+LiDAR),可模拟极端场景架构特点重建给生成”打地基”(几何约束),生成给重建”扩边界”(补全未观测区域)纯生成式,通过语言/动作/场景布局三种控制机制调整模拟传感器支持主要面向相机数据(多视角图像输入)相机 + LiDAR 多传感器输出,可将普通行车记录仪视频转为多传感器模拟数据基准测试Waymo PSNR 28.48(超DGGT约1个点);nuScenes FVD 64.97,FID 7.04未公开具体量化指标,强调可模拟”从未见过”的长尾场景生成速度单视角 0.19秒/帧,三视角 0.46秒/帧未公开具体推理速度,强调”可扩展推理”与高效变体最大生成时长81帧(10Hz/30Hz,最长约1分钟)未明确公开,Genie 3 原生支持数分钟级别一致生成极端场景能力暴雨、大雪、浓雾、动物闯入等长尾场景生成龙卷风、洪水、积雪金门大桥、大象/狮子等罕见物体、 reckless driver 等业务落地已落地三大场景:合成数据(10万+ clips)、仿真测试、辅助驾驶学堂用于 Waymo Driver 训练与验证,支撑 robotaxi 扩张(2026年目标100万周订单)Xiaomi Auto World Model的应用场景合成数据生成:为辅助驾驶感知模型训练提供高质量、高多样性、高危险性的长尾场景合成数据,解决真实世界中稀缺场景样本不足问题。仿真测试:构建闭环仿真环境,复现真实事故场景进行定向优化,提升测试效率与完备性,降低实车测试成本与风险。辅助驾驶学堂:在智能座舱中动态生成第一人称驾驶教学视频,针对复杂路况向用户展示正确操作,提升人机共驾安全性与用户体验。
【AI前沿】SkyClaw-v1.0
SkyClaw-v1.0 – 昆仑万维天工AI推出的高性能Agent模型SkyClaw-v1.0是什么SkyClaw-v1.0是昆仑万维天工AI推出的高性能Agent模型,支持百万token长上下文,深度适配OpenClaw、Hermes、Claude Code、Codex等主流Agent框架。模型经过大规模mid-train、合成任务SFT与端到端强化学习优化,在PinchBench-v2、Claw-Eval等benchmark上超越Minimax 2.7、DeepSeek V4 Flash等主流开源模型。模型现已接入天工Skywork平台开放试用,同时通过APIFree开放API调用。SkyClaw-v1.0的主要功能百万上下文Agent推理:支持百万token上下文窗口,处理复杂多步任务与长文档分析。多框架兼容:原生适配OpenClaw、Hermes、Nanobot、Claude Code、Codex等主流Agent环境。复杂工具调用:深度优化文件读取、代码编辑、检索、测试、页面观察等高频Agent动作。全形态应用构建:可生成具备生产级布局、真实导航流程和完整交互状态的多页面应用。沉浸式游戏开发:支持生成含物理引擎、碰撞检测、状态管理和用户输入的交互式网页游戏。研究型数据分析:可围绕开放主题进行信息组织、数据整理、可视化呈现与网页报告生成。高性价比API:通过APIFree提供兼容OpenAI格式的流式API,支持工具调用与多轮对话。如何使用SkyClaw-v1.0网页端:登录天工Skywork,在模型列表选择 SkyClaw V1.0 可直接输入任务指令使用。API 接入:注册 APIFree 账号获取 API Key,通过兼容 OpenAI 格式的接口将 SkyClaw 接入现有应用或 Agent 框架。Agent 框架集成:将SkyClaw配置为 Claude Code、Codex、Hermes 或 OpenClaw 等框架的底层模型,使其具备文件编辑、测试执行与多轮迭代能力。SkyClaw-v1.0的核心优势性能领先:在PinchBench-v2、Claw-Eval Pass^3、Skywork-Claw-Bench等评测中超越Minimax 2.7、DeepSeek V4 Flash、Qwen3.6-27B等主流开源模型。接近顶级大模型:在OpenClaw相关任务上表现接近DeepSeek V4 Pro、Claude Opus 4.6、Qwen 3.6 Plus等更大规模模型。极致性价比:定价低于Minimax 2.7与Qwen 3.6系列模型的一半,支持规模化高频调用。真实工作流导向:针对Agent框架中的持续执行、错误恢复和多轮迭代优化。SkyClaw-v1.0的项目地址项目官网:https://skyworkai.github.io/skyclaw/SkyClaw-v1.0的同类竞品对比维度SkyClaw-v1.0DeepSeek-V4-FlashQwen3.6-27B上下文长度百万token128K128KAgent框架兼容OpenClaw/Hermes/Codex/Claude Code通用通用Claw-Eval Avg77.274.272.6PinchBench-v287.285.986.4定价低于竞品50%+中等中等开源/开放API开放,lite版轻量开源开源训练方法mid-train+SFT+Agentic RLRL+SFTRL+SFT定位真实工作流Agent模型通用推理模型通用推理模型SkyClaw-v1.0的应用场景前端应用开发:快速生成航旅管理、社交应用、内容社区、地图导航等生产级界面原型。交互式游戏制作:开发物理模拟弹球、国际象棋、飞机大战、德州扑克、Roguelike卡牌等网页游戏。数据报告生成:制作财经资讯终端、美股七巨头深度分析、数字人播报等研究型网页与PPT。代码Agent集成:作为底层模型接入代码审查、功能开发、自动化测试等企业级开发工作流。企业内部工具:通过API接入自研工作流系统、自动化任务平台与IM机器人。
【AI前沿】Keye-VL-2.0-30B-A3B
Keye-VL-2.0-30B-A3B – 快手开源的自研多模态大模型AI工具8小时前发布Keye-VL-2.0-30B-A3B是什么Keye-VL-2.0-30B-A3B是快手开源的自研多模态大模型 ,为 30B 级主力基座。模型首次将 DSA 稀疏注意力引入多模态场景,支持 256K 超长上下文,实现小时级视频的毫秒级时序推理。在 TimeLens 基准测试中超越 Gemini-2.5-Pro 和 Gemini 3 Flash,首次解锁 Code、Tool、Search 等 Agent 协作机制,让模型从观察者进化为行动者。Keye-VL-2.0-30B-A3B的主要功能超长视频理解:支持 256K 超长上下文,可处理小时级视频序列并实现几乎无损的深度时序推理。时序因果推理:在连续时序流动中捕捉画面背后的因果链条,实现从”看见画面”到”读懂逻辑”的跨越。毫秒级帧级定位:具备手术刀般的细粒度解析能力,可对复杂工艺流程或游戏高光进行精确到时间戳的拆解。跨模态深度融合:同时处理视觉、音频与文本信息,实现多模态间的协同理解与深度语义对齐。Agent 协作执行:首次解锁代码生成、工具调用与搜索等复杂场景的系统级自主协作与任务执行能力。高噪信息提纯:在复杂场景下精准捕捉关键帧并理清动态规律,有效过滤冗余信息并保留核心内容。Keye-VL-2.0-30B-A3B的技术原理DSA 稀疏注意力机制:首次将 DeepSeek Sparse Attention 引入多模态理解,结合稀疏注意力与针对性特征聚合破解超长视觉上下文的指数级算力瓶颈。超长上下文架构:采用 256K Token 级端到端架构,实现长视频序列的连贯深度感知而无需分段截断处理。细粒度时序理解引擎:通过帧级动作边界识别、动态视觉解析与音画协同建模,实现毫秒级精确时序定位与因果推断。Agent 协作框架:集成 Code Interpreter、Tool Use 与 Search 能力,构建从多模态感知到逻辑推理再到工具执行的闭环决策系统。统一多模态特征融合:将视觉、音频与文本特征映射至共享表征空间,实现跨模态信息的深度语义对齐与联合推理。如何使用Keye-VL-2.0-30B-A3B获取模型:可通过 GitHub、Hugging Face 或 ModelScope 下载完全开源的模型权重与部署文档。硬件准备:需要配备 H800 或同等算力显卡,并使用至少两张 GPU 进行多卡张量并行推理。Docker 快速部署:直接拉取官方 Docker 镜像并运行,即可一键完成环境配置与模型加载。源码安装部署:依次克隆 Keye 定制版 SGLang、DeepGEMM 和 EffectiveKernels 三个依赖仓库并完成编译安装。启动推理服务:使用 SGLang 加载模型权重,设置张量并行参数并开启远程代码信任,即可在本地启动兼容 OpenAI 协议的 API 服务。调用 API:启动后通过标准 HTTP 请求发送视频与文本指令,模型将返回结构化的长视频理解结果或 Agent 执行输出。Keye-VL-2.0-30B-A3B的核心优势DSA 首次落地多模态:首次将 DeepSeek Sparse Attention 引入多模态理解场景,从根本上破解了超长视觉上下文带来的指数级算力瓶颈,实现小时级视频的高效推理。256K 超长上下文:支持高达 256K 的 Token 级超长上下文,可对小时级视频序列进行几乎无损的端到端深度感知,无需像传统模型那样分段截断处理。毫秒级帧级定位:具备手术刀般的细粒度时序解析能力,能够对复杂工艺流程、游戏高光等场景中的每一个关键动作进行精确到时间戳的拆解与定位。时序因果推理:超越简单的画面标签识别,在连续时序流动中捕捉因果链条,实现从”看见画面”到”读懂逻辑”的跨越,例如能从”雪地车祸”画面直接推断出”跟团优于自驾”的安全策略。Agent 协作机制:Keye 系列首次解锁 Code、Tool、Search 等复杂场景的系统级自主协作与执行能力,让模型从被动的”观察者”进化为主动解决任务的”行动者”。Keye-VL-2.0-30B-A3B的项目地址GitHub仓库:https://github.com/Kwai-Keye/KeyeHuggingFace模型库:https://huggingface.co/Kwai-Keye/Keye-VL-2.0-30B-A3BKeye-VL-2.0-30B-A3B的同类竞品对比对比维度Keye-VL-2.0-30B-A3BGemini-2.5-ProGemini 3 Flash所属公司快手(Kuaishou)GoogleGoogle模型规模30B未公开(Pro 级)未公开(Flash 级)核心架构DSA 稀疏注意力 + 多模态融合闭源多模态架构闭源多模态架构超长上下文256K Token(小时级视频)长上下文长上下文ActivityNet-TimeLens<视频动作定位mIoU 58.5mIoU 58.1mIoU 57.0Charades-TimeLens<日常动作时序解析mIoU 58.4—mIoU 61.2QVHighlights-TimeLens<高光时刻提取mIoU 70.1—mIoU 49.5Agent 协作能力首次解锁<Code / Tool / Search支持支持开源情况完全开源<(权重+代码+文档)闭源闭源Keye-VL-2.0-30B-A3B的应用场景长视频内容理解:Keye-VL-2.0-30B-A3B 可对旅行 Vlog、纪录片、教学视频等小时级长视频进行深度时序因果推理,自动生成包含装备建议、预算规划、景点推荐及安全提示的完整结构化总结。工业流程分析:该模型能够以毫秒级精度定位复杂工艺视频中的关键动作节点,将制造流程精确拆解为多个阶段并标注时间戳,适用于工艺拆解、操作规范提取与质检流程优化。电竞与体育内容生产:基于视觉张力、音画协同及叙事逻辑的深度理解,模型可精准判定电竞或体育赛事视频中的高光时刻与情绪共鸣点,实现超越简单击杀提示的智能化精彩瞬间提取。Agent 自动化任务:作为 Keye 系列首次解锁的协作机制,该模型支持代码生成、工具调用与多步骤搜索的系统级自主执行,能够完成从多模态感知到逻辑推理再到工具调用的复杂闭环任务。教育与培训:在实操教学场景中,模型可对学员操作视频进行毫秒级关键动作定位与步骤拆解,为教师提供精准的教学反馈与操作纠偏依据,辅助技能评估与课程优化。
【AI前沿】MiMo-V2.5
MiMo-V2.5 – 小米推出的全模态 Agent 大模型系列AI工具4周前更新MiMo-V2.5是什么MiMo-V2.5 是小米大模型团队推出的新一代全模态 Agent 大模型系列,包含 V2.5、V2.5-Pro、V2.5-TTS 及 V2.5-ASR 四个版本。MiMo-V2.5 为原生全模态 Agent,支持图像、音频、视频理解与行动,上下文长达 1M Token;MiMo-V2.5-Pro 专为长程复杂任务设计,可稳定完成近千轮工具调用,在软件工程能力上对标 Claude Opus 4.6 与 GPT-5.4,且 Token 效率提升 42%50%。MiMo-V2.5全系模型即将开源。MiMo-V2.5的主要功能MiMo-V2.5原生全模态 Agent:支持同时看、听、读,将理解转化为行动,覆盖图像、音频、视频多模态感知。通用 Agent 场景:胜任日常简单到中等复杂度任务,API 成本较上一代降低约 50%。多模态感知升级:跨模态推理、视频理解、图表分析能力全面超越前代 MiMo-V2-Omni,在 VideoMME、CharXiv、MMMU-Pro 等评测中逼近顶级闭源模型。MiMo-V2.5-Pro长程复杂任务:单次可稳定完成近千轮工具调用的专业级工作,指令遵循与模糊指令理解显著增强。复杂软件工程:支持大型代码库开发、多语言编程、代码调试与性能优化,可独立交付编译器、视频编辑器等项目。自主项目交付:用 Rust 从零实现完整 SysY 编译器(4.3 小时,672 次调用,隐藏测试集 233/233 满分);仅凭简单指令构建可运行的多轨道视频编辑器 Web 应用(8,192 行代码,1,868 次调用,11.5 小时完成)。语音能力V2.5-TTS 系列:语音合成自然度、多语种/方言/音色支持全面升级。V2.5-ASR:语音识别准确率与实时性提升,支持多语种和多方言。如何使用MiMo-V2.5网页端体验:访问MiMo Studio官网,注册登录后选择 MiMo-V2.5 模型即可开始对话。API 开发接入:访问API开放平台https://platform.xiaomimimo.com/#/token-plan注册开发者账号,创建应用获取 API Key。MiMo-V2.5的关键信息和使用要求访问方式MiMo Studio 体验:https://aistudio.xiaomimimo.comAPI 调用:https://platform.xiaomimimo.com开源计划:MiMo-V2.5-Pro 和 MiMo-V2.5 即将全球开源。定价与计费MiMo-V2.5:1x Credits(1 Token = 1 Credit)MiMo-V2.5-Pro:2x Credits(1 Token = 2 Credits)上下文窗口:全系支持 1M Token(约 75 万字)超长上下文,长文档分析不再额外加价。MiMo-V2.5的核心优势Token 效率革命:在 ClawEval 基准达到相同分数时,V2.5-Pro 比 Kimi K2.6 节省 42% Token,V2.5 比 Muse Spark 节省 50% Token,显著降低大规模部署成本。长程任务稳定性:搭配合适运行框架,可稳定完成单次近千轮工具调用的长程任务,并在超长周期内保持逻辑一致与自我修正(如编译器任务中第 512 轮重构后自行诊断恢复)。全模态原生融合:文本、图像、音频、视频能力集成于单一模型,无需在多模态模型和文本模型之间切换。推理速度:V2.5 平均推理速度 100150 tokens/s,V2.5-Pro 为 60~80 tokens/s,基础版更适合时延敏感场景。MiMo-V2.5的项目地址项目官网:https://platform.xiaomimimo.com/docs/news/v2.5-newsHuggingFace模型库:https://huggingface.co/collections/XiaomiMiMo/mimo-v25MiMo-V2.5的同类竞品对比维度MiMo-V2.5-ProClaude Opus 4.6GPT-5.4Kimi K2.6定位长程 Agent / 复杂软件工程顶级推理与 Agent通用多模态旗舰开源多模态 AgentSWE-bench Pro57.2%领先领先—MiMo Coding Bench73.777.1——Token 效率 (ClawEval)比 Kimi K2.6 省 42%——基准上下文窗口1M200K1M1M全模态原生支持Pro 为文本+代码;V2.5 支持全模态支持支持支持开源计划即将开源闭源闭源开源定价 (每百万 Token)$1 输入 / $3 输出更高更高—MiMo-V2.5的应用场景复杂软件开发:自主完成编译器、视频编辑器、Web 应用等大型工程项目的从零构建与调试,可替代人类专家数天至数周的工作量。多模态内容分析:上传冰箱照片获取菜谱建议、解析视频教程生成步骤摘要、录制会议提取待办事项。科研与工程自动化:模拟电路 EDA 设计、性能优化、学术文献长程分析与跨文档推理。智能客服与交互:基于全模态感知(语音+图像+文本)的车载、智能家居、实时交互系统。企业级 Agent 部署:大规模 API 调用场景下,凭借高 Token 效率实现成本可控的自动化工作流。
【AI前沿】10 万元级双电机四驱!吉利银河星耀 7 MAX 要给友商上一课
10 万到 15 万的家用轿车市场一直有个规律:想要省油,就得接受小排量发动机和单电机的组合,忍受平淡的加速表现;想要畅快的动力和四驱系统,预算门槛大概率要抬高到 15 万元甚至更高。消费者在很长一段时间里只能在经济和性能之间做单选题。吉利银河星耀 7 MAX 打破了这种行业惯例。这款轴距超过 2.8 米的中型插混轿车,补贴后售价定在了 10.68 万元,并且,它把过去属于高配车型的 P1 加 P3 加 P4 双电机四驱系统做到了近乎全系标配。为什么是「近乎」呢?因为如果你不想要四驱,那么补贴后售价还能降到 9.88 万元。这种让用户去做减法的定价思路,无疑会给同级别的竞争对手带来不小的压力。把双电机四驱拉入家用门槛吉利星耀 7 MAX 搭载了一套名为 E-AWD 的智电四驱系统,这套系统由混动专用发动机以及三台电机组成。P1 电机是一台大功率的专用发电机,负责高效补能;P3 和 P4 则是布置在前后轴的驱动电机。三者协同工作,让整车的最大功率达到了 312 千瓦(418 马力),峰值扭矩来到 526 牛·米。在这组数据的支撑下,星耀 7 MAX 的零百加速时间定格在 5.4 秒。吉利整车研究院院长易新宇在发布会上点出了他们的考量。以往的部分插混车型经常会面临「满电一条龙、馈电一条虫」的尴尬局面。星耀 7 MAX 利用大功率的 P1 发电机和高容量电池进行缓冲,在馈电状态下,发动机依然可以与前后驱动电机并联输出动力。不管电池电量多少,车辆都能保持一致的动力响应,且响应时间只要 0.01 秒在实际的日常驾驶中,这套四驱系统发挥作用的场景远不止于直线加速。遇到雨雪天气的湿滑路面,或者在山路中急弯穿梭时,系统会实时监测路面附着力,并在极短的时间内完成四个车轮的扭矩分配,快速修正车身姿态,给驾驶员提供足够的操控信心。动力充沛带来的另一个隐忧是能耗,一台带大电池包的四驱轿车,自重本来就不小。星耀 7 MAX 搭载了一块 28.3 度的神盾金砖电池,能够提供 220 公里的纯电续航,应付一周的城市通勤不成问题。在馈电状态下,官方标定的百公里油耗数据是 2.98 升,实测甚至跑出了 2.69 升的成绩。能实现如此低的能耗水平,电机物理层面的解耦发挥了很大作用。吉利表示,在不需要四驱的平稳巡航路况下,后轴的 P4 电机可以做到零拖拽、零损耗。整台车在两驱模式下运行,减少了不必要的机械消耗,把每一滴油和每一度电都用在驱动车辆前进上。强劲的动力输出,必须有稳固的底盘来承载。星耀 7 MAX 诞生于 GEA evo 架构,工程师在布局三电系统时,做到了 50:50 的前后轴荷比,为它的操控提供了物理基础。星耀 7 MAX 悬挂系统的用料也很扎实,它的后桥配备了加强型的五连杆独立悬挂,搭配了自适应可变阻尼减震器。在经过城市里的减速带或者坑洼路面时,减震器可以根据路况实时调整软硬,兼顾滤震的舒适性。当车辆在高速状态下紧急变道或过弯时,减震器又会迅速提供更强的支撑力。出色的不仅是硬件,易新宇还称,路特斯工程团队深度参与了这台车的底盘调校工作,他们在英国银石赛道等多个场地进行了多轮测试,把这台家用轿车的麋鹿测试成绩推到了 83.6 公里每小时。除了底盘部件,空气动力学设计同样在暗处发力。星耀 7 MAX 的车身造型遵循了严格的风阻管理逻辑,车头采用了圆润的曲面导流设计,引导气流顺着车身两侧平滑穿过。轮毂区域也是车辆行驶时产生涡流的重灾区。在星耀 7 MAX 上,设计师在雾灯区域开辟了气帘通道,通过控制气流走向,在前轮外侧形成了一道无形的空气幕墙,大幅降低了轮腔内部的空气阻力,从而抑制高速行驶时前轴产生的升力,让车头牢牢贴紧地面。或许会有人说,这一设计在如今的新能源市场上并不罕见,但别忘了这辆车的售价——目前市场上 10 万元级车型前保两侧的导流口往往只是装饰,并没有贯穿风道,我愿称之为「空力风味设计」。气流顺着车顶滑落至车尾,遇到了微微上翘的鸭尾,它将离开车身的空气转化为下压力,配合四驱系统的扭矩分配,让四个车轮获得更强的抓地力。从动力架构、底盘悬挂再到风阻管理,吉利把不少预算花在了这些平时看不见的底层部件上,为这台轿车打好了地基。拥有了一副好身板,便有了发挥的空间。赛道的底子,装下一个舒适的家尺寸来到中型车的级别,车内布局就有了更多的发挥余地。接近 5 米的车身长度和超过 2.8 米的轴距,给星耀 7 MAX 换来了 541 升的后备箱容积,装下六个 20 寸行李箱不在话下。座舱内,地板做到了纯平状态,肩部和腿部横向空间达到了 1.5 米。落座后排,C 柱区域的软包提供了 270° 的包裹感,高配车型的后排配备了通风、加热和按摩功能,也带有老板键。宽敞的中央扶手处集成了控制屏幕和小桌板,照顾到了商务接待或者家庭出行需求。视线转移到前排,车机用的是吉利招牌的 Flyme Auto 2.0 系统,这套系统在手车无感互联方面积累了不少用户口碑。吉利表示,配合带有 16 个扬声器的无界之声大师版音响,车内的影音体验也做到了同级前列。最有意思的是,你还可以选装一个名为「Eva」的小机器人。是的,吉利也拥有了属于它的 Nomi。EVA 可以通过近百种拟人表情与驾驶员互动,还支持手机 NFC 触碰流转导航地址。在辅助驾驶层面,千里浩瀚 H3 方案提供了高速公路和高架桥的领航辅助功能,日常也能应对记忆泊车和遥控泊车等复杂的停车场景。不仅是辅助驾驶,日常驾驶的安心感很大程度也来自于一些隐性的安全机制。星耀 7 MAX 配备了一套全场景爆胎稳行系统,当高速行驶发生爆胎,系统会在 0.175 秒内锁定失压的轮胎,并在 0.3 秒内完成车身姿态的修正。据官方给出的测试数据,它最高能够应对时速 160km/h 的直线爆胎。星耀 7 MAX 能展现出这种级别的底盘能力,离不开吉利对驾控的持续追求。在刚刚结束的 2026 赛季 TCR 世界巡回赛意大利站中,吉利成功拿下了分站冠军。令人意外的是,他们的冠军赛车不再是领克 03,而是吉利星瑞。显然,吉利要在整个品牌层面进一步强化驾控标签。那么,把赛道级的底盘调校放在一台家用车上,到底有什么实际价值?家庭用户平时开车很少会踩全油门,更不会去探寻车辆的物理极限。答案是工程冗余。暴雨天积水的高架弯道,乡道上突然窜出的非机动车,都是随时可能出现的隐患。在这些突发瞬间,底盘极高的循迹性和悬架的快速支撑,能把车辆失控的临界点往后推很远。平时用不到的机械上限,在关键时刻就是一条保命的防线。只有当安全感建立起来之后,谈论驾驶乐趣才顺理成章。我认为驾驶的快乐不该只属于赛道,要让每个人都能感受性能,找到快乐,爱上驾驶。只有这样,我们中国的汽车运动才能越来越繁荣。冠军车手马青骅在发布会现场的这番话,恰好给这台车做了收尾。在家用轿车讲究精打细算的大环境里,多给一点底盘和动力上的冗余,说不定真能让平淡的通勤路变得有些不一样。
【AI前沿】东风奕派 M8 首秀:集合了东风、华为乾崑、宁德时代三方资源的大六座 SUV
对很多普通中国家庭来说,一辆车并不仅仅只是满足一个人的需求,它其实要满足一家人的需求,因此,大六座作为一种最大公约数产品成为了市场焦点。工作日,它要承担通勤、接送孩子、临时采购;到了周末,它又要变成一家人的移动客厅,能装下老人、孩子、露营装备,以及一次说走就走的短途旅行。过去几年,大六座 SUV 之所以越来越热,本质上并不是因为车变大了,是家庭出行的场景变复杂了。5 月 23 日,东风奕派 M8 在武汉完成全球首秀。这款被官方定义为「华派黄金标准大六座」的全新车型,是东风奕派品牌向上进阶的重要产品,也集合了东风汽车、华为乾崑、宁德时代三方资源。相比单纯强调尺寸、动力或配置,奕派 M8 想回答的是另一个问题:一辆面向中国年轻家庭的大六座 SUV,到底应该把标准定在哪里?从产品定义看,奕派 M8 的关键词是「不妥协」。东风奕派称,在产品开发早期,他们进行了数百场用户共创体验,与数千名用户交流,将中国年轻家庭的高频用车需求,凝练为颜值、舒适、安全和智能几个维度上的「黄金标准」。这也是大六座 SUV 竞争进入新阶段之后,一个更现实的判断:只把车做大,已经不够了。首先是设计。奕派 M8 的外观没有走过度激进的路线,转而强调舒展、稳重和科技感。它将东方审美和现代科技语言结合,车身姿态相对饱满,车顶智显小蓝灯也强化了智能化车型的身份识别。对一辆家庭 SUV 来说,设计不只是为了第一眼吸引注意,更重要的是在每天反复使用中,保持耐看、安心和一定的仪式感。真正决定家庭用户体验的,还是车内。奕派 M8 车长达到 5 米级,轴距超过 3 米,并拥有 60.3% 的轴长比。对用户来说,这些数字最终会转化成更直接的感受:第二排不再只是「老板位」,第三排也不再只是应急座。老人上车后可以坐得更舒展,孩子长途出行时不容易局促,满员出行也不必每个人都在为腿部空间互相妥协。配置层面,奕派 M8 提供同级唯一双头等舱座椅、双视界大屏、双门双向智能冷暖箱,以及同级最大 50 英寸 AR-HUD 实景领航等配置。放到具体场景里,这意味着它既可以在长途路上提供更舒服的休息姿态,也可以让车内娱乐、储物和导航信息变得更顺手。冷暖箱不再只是露营时的加分项,也可能是夏天接孩子放学时的一瓶冷饮,或者长途旅行中给家人准备的一份热食。安全则是家庭用车绕不开的底线。奕派 M8 构建了覆盖行泊安全、主动安全、三电安全、被动安全、健康安全、品质安全的安全系统。新车将搭载全链路 NCA 辅助驾驶、全维防碰撞系统 CAS 5.0,并采用笼式高强度车身和母婴级环保座舱。同时,官方还提出整车及三电终身质保承诺。这些配置如果放在发布会 PPT 上,容易变成一串参数;但回到日常生活,它们对应的是更具体的安全感。比如高速长途时,辅助驾驶可以减轻驾驶疲劳;城市道路中,防碰撞系统能够覆盖更多突发场景;而环保座舱和三电安全,则关系到老人、孩子每天坐在车里时的长期体验。动力方面,奕派 M8 提供纯电和增程双动力版本,这也是它面向家庭用户的一种务实选择。纯电版搭载黄金 800V 高压平台和 4C 快充架构,电机峰值功率为 230kW,CLTC 续航达到 600km。对于有固定充电条件、主要在城市和城际之间使用的家庭来说,纯电版本可以带来更低的使用成本和更安静的行驶体验。增程版则拥有 CLTC 工况下 300km 纯电续航,配合增程系统,既能覆盖多数日常通勤,也能缓解长途出行中的补能焦虑。这种双动力策略,其实很符合当下家庭用户的真实状态:不是所有人都已经准备好一步到位进入纯电生活,也不是所有家庭都愿意继续被燃油车的使用成本和体验限制。纯电和增程并行,本质上是在给用户保留选择权。智能化是奕派 M8 的另一条主线,其重要性和机械素质不相上下。新车搭载华为乾崑技术,并配备官方所称的「智能 6 件套」,包括首批搭载的乾崑智驾 ADS 5 Pro、鸿蒙座舱 HarmonySpace 5.2、乾崑车云、乾崑车控、鲸鳍通信,以及 HUAWEI SOUND 21 扬声器。对于家庭用户而言,智能化的意义是「车会自己开一点」,也是导航、座舱、语音、娱乐、通信和声音体验能否真正串联起来。当一辆车承载的时间越来越长,座舱就不只是从 A 点到 B 点的过渡空间,而会成为家庭生活的一部分。孩子在后排看动画,父母在前排听音乐,导航信息投射在 AR-HUD 上,冰箱里放着饮料和水果,这些细节组合起来,才构成所谓「移动的家」。从这个角度看,东风奕派 M8 的首秀,折射出大六座 SUV 市场的一次标准变化。过去,市场更在意车够不够大、配置够不够多、价格够不够有吸引力;现在,用户开始追问这些配置是否真的服务于家庭生活,智能化是否足够顺手,安全感是否覆盖每一次出行。大六座 SUV 竞争还会继续升温,但真正能留下来的产品,未必是参数表上最夸张的那一个,而是能把一家人的复杂需求,变成更稳定、更舒服、更安心体验的那一个。奕派 M8 选择用空间、舒适、安全、双动力和华为乾崑智能化能力来切入这个市场。它能否成为东风奕派品牌向上突破的关键车型,还要等待价格、交付和真实用户体验来验证。但至少从首秀释放的信息看,这款车已经把问题摆得很清楚:今天的家庭 SUV,卖的不只是六个座位,还是一套面向全家人的生活解决方案。
【AI前沿】将 600 亿参数大模型装进手机的瓶颈,终于被中国 AI 公司突破了
一个 8B 参数的大模型,通常需要约 16GB 显存。参数越多,越吃显存,这就是为什么,内存价格一天比一天高。现在,有一种方法,可以省下 6 倍显存,却几乎不损耗模型性能。过去两年,围绕这个看似极端的思路,一条全球性的技术竞赛正在成型。而就在这条赛道上,一个完全基于国产算力的方案,刚刚给出了自己的第一个回答。模型被压到了不到 3B,同时,能力却可以保留 97%,甚至更进一步,如果结合 MoE 架构,未来可以直接在一部 8GB 内存的手机,运行 600 亿参数的大模型。听上去匪夷所思,怎么做到的?三个值,能跑大模型吗传统大模型用非常精确的数字存储,意味着每个权重可以取几万种不同的数值,精度很高,但也很占内存。三值量化是一个极端的反向操作:直接把可选的数值从几万种砍到三种。技术上,这被称为 1.58-bit,因为编码三个值恰好需要约 1.58 个二进制位。这个压缩有多极端?打个比方:如果传统大模型的权重是一幅全彩照片,三值量化就是把它压成只有黑、白、灰三色的极简图形。直觉上你会觉得这必然损失惨重。但过去两年的研究反复证明,模型权重里存在大量冗余信息。三个值,如果分配得当,足以承载绝大部分的模型能力。这不是一个新概念。2024 年,微软研究院发布了 BitNet b1.58,第一次系统论证了三值大模型可以逼近全精度模型的性能。微软随后在去年进一步发布了 BitNet b1.58 2B4T,一个 20 亿参数、4 万亿 token 训练的开源三值模型。上个月,美国公司 PrismML 发布了 Ternary Bonsai 系列,宣称是首批商业可用的 1.58-bit 模型。▲上:Llama FP16架构,下:微软研究院开发的BitNet架构学术界也同样在跟进:Tequila 提出了解决三值量化中「死权重陷阱」的新方法,TernaryLM 探索了从零开始的原生三值训练。一条全球赛道正在成型。但有一个关键问题始终没有被回答:三值大模型训练,能在国产算力上跑通吗?昇腾上的第一次这一次,在华为鲲鹏昇腾开发者大会(KADC 2026)上,面壁智能给出了答案。BitCPM-CANN 是面壁智能联合清华大学、OpenBMB 开源社区发布的三值大模型系列。它的意义不仅在于「又发了一个三值模型」。在全球赛道上,BitCPM-CANN 做到了三个此前没有人做到的事情。第一次,在华为昇腾上端到端完成三值大模型训练。此前所有公开的三值模型训练都在 NVIDIA GPU 上完成。国产芯片阵营第一次拥有了自己的三值训练能力。第一次,一次性把规模推到 8B。此前昇腾上的低比特训练停留在较小规模的验证阶段。BitCPM-CANN 直接发布了 0.5B、1B、3B、8B 四个档位,覆盖从手机到 PC 的完整端侧场景。第一次,实现了与全精度模型的完整对照评测。11 项任务、四大类评测(常识、阅读理解、学科知识、数学推理),1B 到 8B 档位的能力保留率在 95.7%到 97.2%之间。97.2%的能力保留率意味着什么?在 ARC、CMMLU、GSM8K 等主流评测中,BitCPM-CANN 三值模型与同尺寸 MiniCPM4 全精度模型的差距,已经小于许多全精度模型之间的差距。其中,3B 档位的保留率最高,达到 97.2%。而且,这不只是论文里的数字,是能真正可以「拿来就用」的成果。BitCPM-CANN 的全部尺寸版本已经开源,0.5B 到 8B 四个档位都可以直接下载复现。对于熟悉面壁智能 MiniCPM 系列的开发者来说,BitCPM-CANN 就是 MiniCPM 家族的三值版本,还是一套生态。在同一个 GitHub 社区,家族前辈积累了 3 万颗星、Hugging Face 总下载量超 3000 万的「家产」,现在生长出来了新的方向。6 倍显存,从服务器到手机都「吃到红利」相比 BF16 全精度模型,BitCPM-CANN 节省约 6 倍显存,这个数字开发者最能直接感知:一个 8B 参数的全精度模型需要约 16GB 显存,BitCPM-CANN 三值版本不到 3GB,可以流畅运行在一部手机上,配合 MoE 与激活范围约束,60B 规模的模型有望装入终端设备。硬件端也已经准备好了。高通最新的旗舰芯片 8850 和 8397 支持 2-bit 原生推理,BitCPM-CANN 提供的恰好是可以直接喂进去的低比特权重。芯片厂商等供给,模型厂商等芯片,现在两边同时到位了,怎么不是一种「双向奔赴」。手机厂商对端侧大模型的投入一直在加速。上周 Google I/O 上,Gemini Intelligence 全面接管 Android 设备,从手机到手表到车机;苹果也将在 6 月 WWDC 上展示下一代 Apple Intelligence 的重大升级。两大手机操作系统同时发力,共同指向一个现实:手机端侧要跑越来越强的 AI,内存就是最硬的瓶颈。谁能用更少的内存跑更强的模型,谁就掌握了下一轮竞争的主动权。实际上,如果结合整个 AI 产业正在经历的阵痛,价值又会更上一层楼:4 月时,高盛把全年 DRAM 价格涨幅预期上调到 280%,美银预估全球 HBM 市场将达到 546 亿美元。AI 基础设施最紧缺的资源就是内存,6 倍显存红利意味着不增加物理内存,就能把模型能力提升数倍。在内存持续涨价的情况下,这不是优化,是刚需。三值量化不是「用精度换内存」的妥协。当 97%的能力被保留下来时,说明传统 16 位模型里大量的精度可能是冗余的。三个值,足以承载一个大模型的绝大部分知识。低比特不再是工程上的节省手段,而是一种新的权重知识承载方式。为什么是面壁智能,为什么是现在当 AI 从云端走向终端,端侧模型正在成为个人智能设备的核心能力。手机、电脑、车机,每一个贴近用户的终端都在等一个足够小、足够强、足够省内存的模型。这条赛道的胜负手,不会是那些只会把模型做大的团队,而是能把模型做小、做轻、做到真正能跑起来的玩家。为什么是面壁智能,能在端侧大模型这条路上,一直走在前沿?这个问题的答案不在 BitCPM-CANN 本身,而在这家公司过去几年,一直在做的一件看起来有些「不合群」的事。面壁智能从成立之初就押注效率,在国内大多数团队追逐更大模型的时候,他们花了大量时间做底层训练框架 BM-Train,解决「怎么用更少的资源,训出足够好的模型」,这套基础设施积累是后来一切的起点。在 1.58-bit 方向上,面壁智能的判断早于行业共识。许多数团队还在犹豫极低比特是否可行时,面壁智能就选定了这条路线,先在 GPU 上跑通了完整的训练流程和方法论,再整体迁移到昇腾平台上。可以说,BitCPM-CANN 不是把一个模型移植到了国产芯片上,而是把一整套经过验证的训练方法、效率路线和工程体系,搬进了国产算力的底座。在模型层面,面壁智能的端侧模型 MiniCPM 系列在 GitHub 上积累了超过 3 万颗星,Hugging Face 开源总下载量超过 3000 万,是端侧大模型领域最受欢迎的中国开源模型家族。BitCPM-CANN 正是 MiniCPM 家族向三值量化的延伸,远不止一个展示性的「PPT 模型」,是一个真正可复用的工程地基。它背后的训练链路已经被沉淀为昇腾低比特训练的基础设施,后续所有想在昇腾上做低比特训练的团队,都可以在同一套底座上起步。值得一提的是,BitCPM-CANN 还在华为昇腾上完成了端到端的三值训练,训练效率达到常规基线的 95%。这证明了这套方法论不依赖特定硬件平台,国产算力同样可以跑通。不是等硬件变得足够强大来适应模型,要让模型变得足够聪明来适应硬件。从训练端的华为昇腾,到推理端的终端芯片,再到开源的模型和训练脚本,这是一条完整的国产闭环,框架国产,芯片国产,模型国产,方法论自主。面壁智能的下一步已经明确:进一步提升模型的能力保留率,用 MoE 架构扩展更大规模模型的容量,把 6 倍显存红利完整释放到部署中。更长远的目标,是覆盖从预训练到对齐的全流程低比特化。从底层训练框架 BM-Train,到端侧模型家族 MiniCPM,再到 BitCPM-CANN,面壁智能用几年时间搭建了一套完整的端侧大模型技术体系。在全球赛道上,面对微软、PrismML,面壁智能展现出了独特的不同优势之处在于:从框架、方法论、模型到芯片适配,构建了一条完整的端侧技术路线。当 AI 竞争从「谁的模型更大」转向「谁能让智能真正跑在每一台设备上」时,掌握端侧技术话语权的人,才站在了最有利的位置。
【AI前沿】DeepSeek 要用蜜雪冰城的打法,做中国版 Claude Code
DeepSeek 之于大模型,就像蜜雪冰城之于奶茶。你不必纠结性价比,因为它的本事你挑不出毛病,你的钱包它也从不为难。最近,DeepSeek 官方宣布,DeepSeek-V4-Pro 模型 API 将永久降价。同时,DeepSeek 表示,API 已完成输出提速与服务扩容,速度更快,服务更稳定,默认支持 500 并发,企业用户可以在线申请更高并发。发布模型,再给出折扣,接着降低缓存命中价格,最后把临时优惠变成长期价格。大模型 API 的价格基准正在被重新改写,而低价模型背后的下一站,很可能是 Agent。DeepSeek 永久降价,梁文锋把 Token 价格打骨折了让我们先来简单梳理一下 DeepSeek 的降价时间线:4 月 24 日,DeepSeek V4 预览版正式发布。4 月 25 日,DeepSeek 宣布 V4-Pro 开启 2.5 折优惠。4 月 26 日,DeepSeek 宣布缓存命中价格调整为首发价的十分之一。4 月 28 日,DeepSeek 宣布 V4-Pro 的 2.5 折优惠延期至 5 月 31 日。5 月 22 日,DeepSeek 宣布 V4-Pro 永久降价为原价的四分之一。时间线的关键之处,在于临时折扣变成了永久降价。调整之后,DeepSeek-V4-Pro 输入缓存命中价格从 0.1 元每百万 Tokens 降至 0.025 元,输入缓存未命中价格从 12 元每百万 Tokens 降至 3 元;输出价格从 24 元每百万 Tokens 降至 6 元。叠加默认 500 并发和服务提速后,官方 API 对开发者和企业的吸引力进一步提高。▲ 🔗 https://api-docs.deepseek.com/zh-cn/quick_start/pricing而价格下调最直接的影响,是把任务成本推到开发者决策的更前端。在代码场景里,一次任务可能要读取项目文件、分析日志、多轮修改、反复运行测试,Tokens 消耗很容易放大。长上下文、代码库分析、批量重构、自动测试、Agent 多轮执行这些高消耗场景,开始更接近个人开发者和小团队的预算范围。过去,开发者选择 Claude、OpenAI 或 Gemini,主要看模型能力、稳定性、生态和使用习惯。DeepSeek 打骨折的永久降价,也意味着在绝对的性价比面前,开发者使用习惯也是可以轻易改变的。顺着这条线,DeepSeek 一贯的市场角色也更清楚了:用低价、开源和强推理能力,持续建立大模型市场的价格优势。对国内模型厂商来说,V4-Pro 永久降价相当于重新划了一条 API 定价线。智谱、MiniMax、月之暗面这类同样依赖 API 收费、又面向开发者和企业客户的模型,压力可想而知。反观 Claude、OpenAI、Gemini 等海外头部模型,由于市场、客户结构和生态位置不同,短期冲击则相对有限。但如果 DeepSeek 后续推出类似 Claude Code 的编码工具,再用低 token 成本支撑高频调用,价格敏感的开发者群体会更容易被吸引过来。梁文锋此前对 DeepSeek 定价哲学的解释,也能放到今天理解。早在 2024 年 DeepSeek V2 降价时,梁文锋就提到,DeepSeek 只是按照自己的节奏做事,核算成本后定价,原则是不贴钱,也不赚取暴利。他还说,降价一部分来自下一代模型结构探索带来的成本下降,另一部分原因是 API 和 AI 都应该是普惠的、人人用得起的东西。比起把 API 当成高毛利收费入口,DeepSeek 则更像是在用过硬的 Infra 实力压低推理成本,再用低价吸引开发者、应用和下游生态进入自己的轨道。X 平台博主 @bookwormengr 最近在一篇题为《DeepSeek’s 10 trillion USD grand strategy(DeepSeek 的十万亿美元棋局)》的长文中,给出了一个更激进的解释。他认为,DeepSeek 的真正目标未必是和智谱、月之暗面、MiniMax 竞争,也不是急着补齐多模态、语音、视频这些产品线,而是通过持续降低训练和推理的资源需求,推动一套更便宜、更分散的 AI 硬件生态成形。在他看来,DeepSeek 的长期价值不只在模型本身,而在于让更多国产存储、GPU、ASIC、网络芯片和异构硬件进入大模型训练与推理体系。这个判断未必能完全兑现,但它解释了 DeepSeek 一系列选择背后的方向:MoE、MLA、DSA、GRPO、RLVR、KV Cache 压缩、Dual Path、TileLang,表面上看是模型架构和推理工程优化,往深处看,都是在降低对高端 HBM、顶级 GPU 和 CUDA 生态的依赖。一系列降价公告里,最值得关注的不只是输出价格下降,还有缓存命中价格下降。在大模型推理过程中,KV Cache 是一个关键成本项。模型处理长上下文时,需要把历史 tokens 对应的 Key 和 Value 存起来,后续生成时反复使用。上下文越长,需要保存和读取的缓存越多,对显存、带宽和存储系统的压力也越大。普通聊天里,缓存压力不一定明显,但在进入代码、长文档和 Agent 任务后,成本结构会迅速变化。@bookwormengr 在长文里专门算了一笔 KV Cache 账。他以 100 万 tokens 上下文、8 bit KV 精度和 16 bit 索引精度为前提,估算 DeepSeek V4 只需要约 5.48GB HBM,而 GLM5 约为 60GB,Qwen3-235B-A22B 约为 89GB。长上下文和 Agent 任务真正贵的地方,不只是模型生成本身,还有缓存、显存、带宽和重复上下文搬运。一个 Code Agent 处理项目时,可能要反复读取同一个代码库结构、同一批文件、同一段任务历史、同一套系统提示词和同一批测试日志。若每一轮都按完整上下文重新计费,长任务很快会变贵。缓存命中价格下降后,重复上下文的成本会明显变低。DeepSeek 近年来在 MoE 架构、长上下文、KV Cache 压缩和推理效率上持续投入的表现有目共睹。降价是技术迭代后的必然结果,也将彻底搅动 AI 编程市场格局。为什么必须做中国版「Claude Code」?最先被牵动的,是 AI 编程工具的订阅模式。市面主流 AI 编程工具均推出 Coding Plan 月付订阅,为用户提供代码补全、模型调用、Agent 执行等权益。在轻量化补全时代,单次调用消耗极低。但 AI 编程已从单次补全迭代为全流程 Agent 自动化编码,模型可独立完成代码修改、测试运行、报错修复,单次任务 Token 消耗大幅提升。当底层 API 又同时大幅降价,Coding Plan 也必须找到新的支撑点。这个支撑点,更可能落在工程能力上——比如能不能更好地读懂项目结构,能不能精准选择上下文,能不能控制 tokens 消耗,能不能稳定修改代码,能不能处理 Git、终端、CI/CD,能不能在企业环境里管理权限和审计记录?同样要重新定位的,还有 API 中转站。对个人开发者来说,便宜和好用仍然重要。但对企业来说,稳定、可审计、可控、可迁移更重要。沿着这个逻辑继续看,Coding Plan 和中转站的改变只是表层。低价之后更值得追问的,是开发者入口究竟掌握在谁手里。Google CEO Sundar Pichai 最近接受了《Hard Fork》采访,他首次公开承认,Google 在文本、多模态、语音、推理和整体智能上都很有竞争力,但在 agentic coding 这一类能力上,尤其是工具调用、指令跟随和长周期任务,目前还有差距。他还提到,更关键的是把模型放到真实世界里使用,让数据回流,继续迭代。Pichai 特别说到,coding 是一个需要接触 data flows(数据流)的领域。终端工具能看到开发者如何提出任务,如何追问,什么时候接受建议,什么时候放弃,什么时候要求模型继续修复。它还可以通过测试结果、终端日志、文件变更和 Git 提交,判断一次 Agent 执行是否完成任务。这类数据,对 coding model 和 Agent 产品都非常有价值。从公开招聘动作看,DeepSeek 近期围绕 Agent 的动作也变得密集。我们也可以看到岗位里出现了 Agent 深度学习算法研究员、Agent 数据策略工程师、产品经理、研发工程师等角色。更关键的是,DeepSeek 资深研究员陈德里直接发出招聘信息,提到要从零开始构建 Code Harness。如其所说,Model + Harness = Agent,在 Agent 产品中,模型负责理解和生成,Harness 负责把模型能力带入真实工程环境,相当于模型外面那套「执行系统」。DeepSeek 版 Claude Code 不能只给开发者一个对话框,而要给开发者一个能持续执行任务的工程系统。崔添翼加入 DeepSeek 后受到关注,也和 Code Agent 的工程属性有关。公开信息显示,崔添翼本科毕业于浙江大学计算机系,曾因信息学竞赛保送浙大,6 次获得 ACM 亚洲区域赛金牌,之后在 Jane Street 工作 9 年,并联合创立 TSY Capital。Code Agent 的难点不只是生成代码,还要在真实项目里持续执行任务。量化交易系统长期强调低延迟、稳定性、自动化执行和风险控制,这些经验放到 Agent Harness 上,至少在工程范式上是相通的。而 Agent 工具的产品能力,不只包括写代码,也包括权限、审计、数据隔离和安全策略。这反过来给 DeepSeek 这样的国产模型提供了机会。如果 DeepSeek 能把低成本模型、Code Harness、本地部署、企业级权限控制结合起来,它在政企、金融、制造、能源等对数据敏感的行业里,会有更强的替代价值。DeepSeek 做中国版 Claude Code 的逻辑也正在于此:低价 tokens 把更多开发者吸引进来。低缓存价格让 Agent 任务运行成本下降。Code Harness 让模型进入开发环境。真实工作流又会反过来帮助 DeepSeek 改进模型和产品。就像滚下坡的雪球,越滚越大,滚得越快。降价只是推下山的第一把力,往后它会自己越滚越沉,谁也拦不住。
【AI前沿】早报|华为公布韬定律,Mate 90有望搭载更强芯片/宇树科技上会估值420亿/DeepSeek登顶全球调用榜
🔧华为公布芯片设计新成果,华为 Mate 90 或首发麒麟 2026🔝DeepSeek 登顶全球调用榜💻Gurman:Apple Watch 需要重启健康叙事⚠️抖音副总裁辟谣「短视频猪食论」传闻🔌立讯精密:光连接和铜连接会长期共存⛽银河证券:钠离子电池规模化节点临近🚀宇树科技 6 月 1 日上会,发行估值至少 420 亿元💰长鑫科技董事长承诺让渡 7.68 亿股激励员工🦿美团、腾讯参投机器人公司天机智能 10 亿元融资💡Google CEO:已为斯坦福演讲准备「应对嘘声策略」,公众对 AI 的忧虑「是合理的」📱3299 元起,荣耀 600 超级版发布📱3499 元起,OPPO Reno16 系列发布🚗64 万美元起,法拉利首款纯电车型 Luce 正式发布,Jony Ive 操刀设计📸华为 nova 16 全系列外观公布📱Galaxy Z Fold 8 Ultra 名称泄露,但并不是全新形态🤖腾讯 ima Copilot 全面开放🧠面壁智能开源 1.58-bit 端侧大模型 BitCPM-CANN📋《处方药网络零售合规指南》发布,明确严禁 AI 替代审方🚙特斯拉推出世界杯限定运动周边,设计灵感来自 Cybercab🎮《洛克王国:世界》主策划回应 S2 舆情华为公布芯片设计新成果,华为 Mate 90 或首发麒麟 2026据《人民日报》消息,2026 国际电路与系统研讨会 25 日在上海举行,华为公司董事、半导体业务部总裁何庭波在题为《半导体新路径探索与实践》的主旨演讲中,正式发表「韬(τ)定律」。报道指出,这是中国在全球半导体领域首次提出指导产业发展的新原则。基于该定律,华为过去六年已成功设计并量产了 381 款芯片。值得一提的是,演讲中何庭波提到,今年秋天面世的麒麟 2026 芯片将首次完整采用「逻辑折叠」技术,华为 Mate 90 有望首发搭载。据悉,「韬定律」提出以「时间缩微」替代「几何缩微」,以系统性降低时间常数(韬τ)为目标,通过逻辑折叠等创新技术,持续压缩信号传播时延,不断提升晶体管密度,实现半导体与电子系统的持续演进。「韬定律」构建了贯穿器件、电路、芯片到系统层面的多层级协同优化体系。预计到 2031 年,基于该定律的高端芯片晶体管密度将达到 1.4 纳米制程的同等水平。针对半导体行业未来的发展,何庭波表示:「未来一定属于开放合作。在『韬定律』的路径下,我们期待与全球科学家、工程师和产业伙伴紧密合作,共同推动半导体与电子产业持续发展。」🔗 相关阅读:华为芯片的鸿蒙时刻DeepSeek 登顶全球调用榜5 月 18 日至 5 月 24 日,OpenRouter 平台全球 AI 大模型总调用量达到 28.9 万亿 Token,较前一周增长 7.4%,并已连续 5 周上涨。其中,中国 AI 大模型周调用量为 9.22 万亿 Token,环比增长 19.89%;美国 AI 大模型周调用量为 4.93 万亿 Token,环比增长 16.27%。中国大模型周调用量已连续 4 周超过美国,DeepSeek-V4-Flash 登顶 OpenRouter 全球调用榜。Gurman:Apple Watch 需要重启健康叙事彭博社记者马克・古尔曼 (Mark Gurman) 在 PowerOn 通讯中写道,Apple Watch 正面临 Whoop、Oura、Fitbit 等健康穿戴设备的更直接竞争,苹果需要重新梳理 Watch 和健康业务的产品节奏。报道提到,Apple Watch 已经从通知和运动记录工具扩展到心率、睡眠、助听、跌倒检测等健康场景,但近几代硬件更新幅度较小,新的健康传感器和服务化能力没有形成清晰的增长叙事。与此同时,Oura 以戒指形态强化睡眠和恢复监测,Whoop 以订阅和高频身体数据服务留住核心运动用户,Google 也继续整合 Fitbit 能力。古尔曼认为,苹果并不缺健康入口,而是需要让硬件、软件和健康服务更紧密地更新。其通讯还提到 iOS 27、AirPods 设置与健康功能可能在 WWDC 前后继续补强,Watch 业务会被放在更大的个人健康设备组合里重新定位。抖音副总裁辟谣「短视频猪食论」传闻据鞭牛士报道,针对近日网传「字节跳动副总裁反击腾讯副总裁低质短视频像猪食」的说法,抖音集团副总裁李亮发文辟谣,称「谣言,我没有说过这样的话,也没有其他『字节副总裁』说过这样的话」。这起传闻源于旧话题被重新拼接传播。腾讯副总裁孙忠怀此前曾在公开场合批评低智低俗短视频拉低用户心智,相关表述后来被外界概括为「猪食论」。这次传播中,部分平台把「都是卖猪食的,谁也别看不起谁」归到字节高管名下,引发腾讯、字节互怼的解读。立讯精密:光连接和铜连接会长期共存据人民财讯报道,立讯精密近日在年度股东会交流环节回应投资者提问,称公司主张的「光铜并进」与头部客户布局光芯片、光纤厂商并不矛盾。公司表示,在当前服务的产品中,未来光连接的需求规模会远大于铜连接,但铜连接本身仍有较高技术门槛。两条路线面向不同距离和速率场景:短距离场景适用铜连接,长距离及更高速率场景对光连接需求更大;当铜连接接近信号传输极限时,需要通过光连接解决问题。这番回应对应的是 AI 服务器和数据中心互连需求上升。英伟达等头部客户正在推进光芯片、光纤和高速互连生态,供应链厂商需要同时覆盖铜连接、光连接和相关组件,才能适应不同机柜、节点和集群距离。银河证券:钠离子电池规模化节点临近银河证券研报称,宁德时代在「极域之约」超级科技日宣布钠新电池预计于今年第四季度规模化量产,钠离子电池产业链因此进入更明确的量产验证阶段。研报判断,动力、储能和两轮车是钠离子电池重点放量领域。动力场景中,钠电池的宽温域和经济性可以改善电动车低温使用问题;储能场景中,高安全性和高放电功率更适合部分固定式储能需求;两轮车领域则对应低成本替代铅酸电池的市场。银河证券预计,钠离子电池出货量将在 2026、2027、2028 年分别达到 25GWh、92GWh、221GWh,到 2030 年突破 600GWh。钠电池并不直接取代高端锂电池,而是先在成本、低温、安全性要求更明确的场景建立规模。后续放量还要看正负极材料、电解液、隔膜和整车 / 储能客户验证节奏,宁德时代的量产节点会成为产业链跟进的重要参照。宇树科技 6 月 1 日上会,发行估值至少 420 亿元据财新报道,宇树科技将于 6 月 1 日上会,从受理到上会仅历时 73 天。报道提到,本次发行对应至少 420 亿元估值。宇树科技 2024 年已扭亏为盈,2025 年前三季度营收增至 11.67 亿元,净利润 1.05 亿元,人形机器人业务是最大推动板块。它此前以四足机器人打开市场,近两年则把人形机器人、运动控制和开发者生态放到更前面。具身智能赛道今年仍处于融资、发布和量产验证密集期。宇树若完成上市进程,会成为国内人形机器人公司进入资本市场的重要样本。长鑫科技董事长承诺让渡 7.68 亿股激励员工据公开招股书信息,国内 DRAM 厂商长鑫科技进入科创板 IPO 上会阶段,创始人、董事长朱一明承诺将其持有的 7.68 亿股股份在上市后 10 年内全部分配给公司员工,不包含其本人。招股书显示,朱一明合计持有长鑫科技 15.98 亿股,其中大部分来自员工持股计划对应的间接持股。他还承诺上市后所持股份锁定 10 年,后续 10 年每年减持不超过 20%,锁定与减持约束覆盖 20 年周期。经营数据方面,长鑫科技今年一季度营业收入 508 亿元,同比增长 719.13%;归母净利润 247.62 亿元。公司预计今年上半年营收 1100 亿至 1200 亿元,归母净利润 500 亿至 570 亿元。、此次 IPO 拟募资 295 亿元,主要投向存储器晶圆制造量产线升级、DRAM 技术升级和前瞻研发项目。上交所上市委计划于 5 月 27 日审议其首发事项。美团、腾讯参投机器人公司天机智能 10 亿元融资昨天,机器人公司天机智能官宣完成 10 亿元融资,投资方包括美团、腾讯等。界面新闻报道指出,美团和腾讯参与投资,也让这笔融资带有更明确的应用想象:配送、本地生活、服务业和企业级自动化都可能成为机器人公司争夺的方向。💡 Google CEO:已为斯坦福演讲准备「应对嘘声策略」,公众对 AI 的忧虑「是合理的」据《商业内幕》报道,Google CEO 桑达尔·皮查伊(Sundar Pichai)接受科技播客《Hard Fork》采访时表示,他将于下月在斯坦福大学发表毕业典礼演讲,并已意识到自己可能面临毕业生的嘘声。今年,AI 话题在多场毕业典礼上引发了学生的公开抵制。前 Google CEO 埃里克·施密特在亚利桑那大学发言时遭到嘘声,Big Machine Records CEO 斯科特·博切塔在中田纳西州立大学谈及 AI 对音乐和媒体的影响后同样遭遇反弹。播客主持人由此向皮查伊提问,他的「应对嘘声策略」是什么。皮查伊对此坦承,这一挑战是真实存在的——他执掌的公司正是 AI 浪潮的核心推手,而许多即将进入职场的毕业生,正担忧这项技术会蚕食他们的工作机会。他表示,自己「一直对年轻一代抱有极大的乐观」,AI 并不会改变这一点,他希望在演讲中分享个人经历。他同时指出,这届毕业生「既将推动 AI 的进步,也将承受其影响」。皮查伊也承认,公众对AI的忧虑「是合理的」,「人类还没有进化到能够处理如此大规模变化的程度」,他认为此轮变革的量级前所未有。报道援引皮尤研究中心数据指出,约半数美国人对 AI 在日常生活中的普及感到「忧虑多于期待」;今年至少有十余家大型公司将裁员部分归因于 AI 带来的效率提升;今年初,应届毕业生失业率更创下四年来新高。3299 元起,荣耀 600 超级版发布昨天,荣耀 600 超级版正式发布,售价 3299 元起。该机采用 3D 星河美学设计和双重磁吸工艺,搭载一块 0.98mm 四等边屏幕。配置上,荣耀 600 超级版搭载第四代骁龙 7 移动平台,内置 8600mAh 青海湖电池,支持 IP68、IP69 和 IP69K 防尘防水。影像部分配备 2 亿像素超清大底主摄,并支持 4K 闪光微单 Live、双对称 AI 变焦闪光灯和 4K Live 直出。3499 元起,OPPO Reno16 系列发布昨天,OPPO Reno16 系列正式发布,包含 Reno16 和 Reno16 Pro 两款机型,起售价 3499 元。该系列继续主打轻薄机身、人像影像和高辨识度外观。Reno16 标准版采用 6.32 英寸 1216P 120Hz 屏幕,搭载天玑 8550 处理器,后置 2 亿像素主摄、5000 万像素镜头组合,并配备 6700mAh 电池。Reno16 Pro 版本提供更高定位配置,4499 元起。OPPO 同场还推出 Bubble 潮玩自拍屏和 Enco Air5s 耳机,售价分别为 499 元、269 元。64 万美元起,法拉利首款纯电车型 Luce 正式发布,Jony Ive 操刀设计法拉利昨日正式发布旗下首款纯电动车型 Ferrari Luce,这也是该品牌首次推出五座车型。Luce 起售价为 55 万欧元(约 64 万美元),定位超豪华纯电 GT。搭载 122 kWh 电池,欧洲工况预计约 530 公里,美国 EPA 预计约 280 英里(约 451 公里);四台电机,每轮一台,综合 1050 马力,0 至 100 km/h 加速 2.5 秒;800V 电气架构,充电峰值功率 350 kW车长约 5.02 米,整备质量约 2260 公斤,行李厢容积约 600 升。Luce 的内饰设计由苹果前首席设计师 Jony Ive 及工业设计师 Marc Newson 创立的设计公司 LoveFrom 主导,大量采用玻璃与抛光铝材。车内配备 OLED 屏幕,方向盘上设有拨片,可在五个档位间切换扭矩输出力度。声音体验是此次发布的重要议题之一。法拉利表示,团队历时五年、经过约 4 万公里的测试,最终选择在后轴安装加速度传感器,实时捕捉电机与底盘的真实
【AI前沿】华为提出「韬定律」,寻找国产芯片自己的进化方向
5 月 25 日,由电气电子工程师学会(IEEE)举办的「国际电路系统研讨会」ISCAS 2026 在上海举行。在会上,华为半导体业务部总裁何庭波进行了题为《半导体新路径探索与实践》的演讲,提出了一个全新的半导体发展定律:应当以「时间缩微」替代「几何缩微」作为半导体与电子系统演进的新指导原则,通过逻辑折叠(LogicFolding)等创新技术,持续压缩信号传播时延、提升晶体管密度,从而实现半导体与电子系统的持续演进。图|微博 @人民日报这个足以与年过半百的「摩尔定律」并驾齐驱的新理论,被华为称为「韬定律」(Tau Scaling Law)。什么是韬定律对于韬定律,我们首先需要知道的是:「韬定律」里的「韬」不像摩尔定律那样,代表某个人的名字,而是集成电路设计中的时间常数 τ(希腊字母 tau)。τ 本身的概念非常简单,它代表了电路中信号电压发生转变(充电或放电)的快慢程度,可以用基本公式 τ = 电阻R × 电容C 来计算。更笼统地说——虽然我们通常将芯片二进制信号 0 和 1 理解成「非此即彼」的状态,两者之间是瞬间切换的,但在现实世界中并非如此。由于芯片和导线内部存在着各种形式的电阻和电容,表示 0 和 1 的电信号其实不是瞬间跳变的。这种信号变化更像是电池一样:充电快满了才算「1」,几乎把电放空才算「0」。而在「从空充满」和「从满放空」之间会有一个极为短暂的切换时间,这个时间就是 τ 。因此,你可以把 τ 理解成和 GHz 类似的「频率参数」,两者是相辅相成的——τ 值越低,芯片区分 0 和 1 的速度就越快,晶体管开关切换的频率就越快,芯片每秒钟执行指令的速度 GHz 自然也越高。过去五十多年里,晶体管的体积占芯片大头,τ 延迟的主要来源是晶体管,摩尔定律指导下优化晶体管的体积对于频率提升的收益是显著的。如今 3nm、2nm 晶体管自己的延迟极小,但周围导线被迫做得极细,反而导致内阻升高、τ 变大,宏观表现就是芯片提频越来越困难。正是在这种背景下,华为的「韬定律」提出换个方向,不再以晶体管密度作为芯片未来发展的衡量标准——晶体管密度本身已经不再是制约频率的主要因素了,未来如何通过其他综合手段降低 τ 值,才是提升芯片频率和效能的新追求。立体堆叠将成为主流再回看何庭波的那句话,就可以看到华为不仅提出了一个面向未来的定律,也给出了新定律之下芯片发展的具体方法之一:逻辑折叠(LogicFolding)。这个词看上去非常高大上,但它代表的东西很简单——芯片立体堆叠。换言之,既然如今导线成为了延迟的主要来源,那就将原本铺在平面的电路设计成 3D 结构,避免导线绕路、降低内阻,从而优化 τ 延迟。这也正是全球主要芯片设计商和制造商们集体选择的道路。英特尔的 Foveros、AMD 的 3D V-Cache 以及台积电的 SoIC,本质上都是芯片线路立体设计的不同方案。这样一来,原本「绕几百微米的路」变成了「爬几十微米的楼」,导线的电阻和寄生电容都可以有效降低,优化 τ 延迟、提升宏观频率。除了通过立体堆叠缩短线路长度之外,整个半导体行业也在不约而同地转向另一项技术:背面供电(Backside Power Delivery)。根据计算,在 5nm 及以下节点,供电网络本身需要消耗晶圆表面近 40% 的面积资源。这就导致信号线为了给供电线和其他结构让路,往往需要在布线上反复迂回:图|哔哩哔哩 @极客湾再加上自己被晶体管挤压得越来越细,结果就是显著增加信号线的平均长度和寄生电容,导致 τ 延迟失控。而英特尔的 PowerVia 搭配 RibbonFET 晶体管技术,在试验中可以实现超过 90% 的标准单元面积利用率,极大减少了芯片布线的压力。目前虽然无从得知华为正在研发何种芯片背面供电网络(BSPDN)技术,但可以明确的是,逻辑折叠技术已经将供电性能考虑在内了:……在电路层面:采用 LogicFolding 架构打破传统电路布局的物理限制,显著缩短关键路径布线,有效降低信号传播的电阻和电容负载,最终提升晶体管密度和电路性能。麒麟何时归来在看过上面一大堆技术术语之后,大家最想知道的肯定只有一件事:我什么时候能买到?然而 ISCAS 2026 只是一个技术论坛,何庭波在会上提出的也是一个「定律概念」,两者都更偏向理论指导领域。而众所周知,理论转换成具有广泛影响力的产品还需要时间。根据华为官方的介绍,在过去的六年里,华为已基于韬定律设计并量产了 381 款芯片,服务于众多行业、领域和市场客户。而首款采用逻辑折叠技术的麒麟芯片将在今年秋季发布,大概率是 Mate 90 系列产品,可以看作是华为立体堆叠方案在大众市场的首秀。而到 2031 年,华为基于韬定律设计的高端芯片晶体管密度将会达到等效 1.4nm(14Å)工艺的水平。直到那时,我们才有机会看到一个「逻辑折叠+背面供电」的华为芯片的终极形态。值得注意的是,韬定律、逻辑折叠等等技术并不只限于手机——别忘了,如今的华为电脑、电视、平板等等所使用的芯片,本质上都是麒麟的同源产品。而更重要的角色,比如未来华为昇腾计算(Ascend)系列的 AI 处理器、计算卡、服务器集群等等产品,无疑将会是韬定律的第一批受益者。图|华为同样在 ISCAS 2026 上,何庭波还说道:……未来一定属于开放合作。在半导体演进的路径上,没有一家企业可以独自完成所有答案。在韬定律的路径下,我们期待与全球科学家、工程师和产业伙伴紧密合作,共同推动半导体与电子产业持续发展。当经过反复更新的摩尔定律依然难以客观反映现实的时候,技术行业是时候探索一个新的指导理论了。
【AI前沿】用 Codex 优化网速狂飙 900Mbps?实测之后我发现了新的隐藏玩法
昨天,Codex 再一次重置了额度,我们的账号从剩余 10% 又回到了剩余 87%。Codex 负责人 Tibo 在 X 发文,有些用户注意到 Codex 中的缓存限制消耗得更快,我们发现根本原因是之前的一个优化措施,该措施在长时间运行的会话中进行压缩时会影响缓存命中率,我们已将其回滚。我们已修复此问题,并已重置所有账户的使用限制。祝您周末愉快。于是又想着还可以用 Codex 来做点什么,刚好就在 X 上刷到了「我用 Codex 提升了我的电脑网速,从 400Mbps 到 900Mbps。」内容真的很有噱头,用 Codex 竟然能优化本地的网络?网速不应该是受限于路由器,或者网络服务提供商 ISP 这些上层设备吗?这则推文的评论区也有不少网友提出了质疑,「所以 Codex 最终改变了电脑上的什么配置?」、「鉴于如今 AI 的强大技术,我真的无法判断这是否是诱饵。」博主做出解释,Codex 帮助他把电脑上的 auto tuning level 从关闭调回了 normal 正常。auto tuning level 是说系统会根据网络延迟、带宽和拥塞情况,动态决定一次能接收多少数据,从而提高网络的速度。他还给出了自己用的提示词。嘿,我朋友说他的网速提高了,情况是这样的。你能帮我看看我们家的网络有什么可以改进的地方吗?我的网络供应商说他们提供的带宽是 1.2k Gbps,而我实际的网速是硬件问题。我现在只有 55Mbps,请帮我解决这个问题,别出错了。我的目标很简单,就是让我的互联网速度更快。问题已诊断:首先运行了 speedtest-cli。检查了 DNS 解析时间,检查了 MTU、丢包率、Wi-Fi 信号/干扰情况。发现 3 个问题。已删除过时的网络位置/配置文件。终止或限制占用大量带宽的后台进程。优化 mDNS。进行了测试前后的速度测试和延迟检查。这套提示词来自另一个 X 博主@cjzafir,他分享了自己使用 Codex + GPT 5.5 的实际案例,里面提到了 Codex 5.5 让他的网速变快了,本地运行的 6B 小语言模型速度更快了,以及 Macbook Pro 运行速度也像新的一样快等等。我们也拿着这套提示词发给 Codex,在要求 Codex 处理网速问题前,先用中国科学技术大学测速网站 https://test.ustc.edu.cn/ 看了一下大概的速度,基本上下载速度在 100Mbps 左右,上传是在 200 Mbps 左右。Codex 确实按照这些诊断,从 DNS 解析时间,数据包、网络配置等方面,检测并修复了对应的问题,累计处理时间超过五分钟。最后 Codex 得出的结论是「我检查并做了能安全完成的修复。」它找到了 3 个存在的问题,分别是 DNS/缓存异常、负载延迟很高,以及有线千兆网卡没有在用,Wi-Fi 不能作为 1Gbps 的验收依据。再次测试,发现似乎并没有很明显的网速提升。有人问那位博主,是不是使用的 Mac 电脑,他回复说是 Windows,底下还有网友科普,Mac 的网络配置都是固定了,Codex 一般是无能为力。所以这次轮到 Windows 用户来享受 Codex 网速提升服务了?还有 Linux。有评论说,「以为是用 Codex 入侵了网络服务提供商,然后提高了流量限制」,结果只是 Codex 帮忙清理了一下 DNS 缓存。但也有网友分享照着这个方法,成功复现了,Codex 确实让它的网速变快。大家要是感兴趣也可以试试,不过 Codex 修改这些网络配置还是有一定的风险,评论区还有人提到 Codex 把他原有电脑的网络配置都删掉了,然后 Codex 跟他说,删掉它们是为了让网速更快。这些涉及到 Computer Use 的使用案例,大概都会有类似的问题,除了每一次更细心的看懂允许 Codex 执行的是什么命令,还可以在提出任务时,就要求它解释清楚它要做的每一步。如果不做修改,只是让 Codex 去诊断一些可能存在的网络配置问题,我想也比那个一直停留在进度条的自带 Windows 诊断要强。开始了,Codexmaxxing当大家都在讨论 Codex 是否能真的提升网速时,也有网友提到这种用法其实是一种启发。他说这种做法的核心价值在于靠案例驱动,让 AI 直接参考成功的经验,再针对自己的具体情况进行精准诊断和优化,而类似的提示词技巧在 Agent 产品上将非常有效。这很像 Codex 里面的 /goal 命令,给他一个目标,这个目标可以是我们自己设置的,也可以是其他用户已经有的成功案例,Codex 照着这个目标,自己去摸索可以实现的路径。在社交媒体上,也有很多人开始分享这些写目标的模板,以及 OpenAI 的工程师也专门写了一篇文章来讲清楚什么是目标,如何用好目标来发挥 Codex 的最大价值。/goal <期望的最终状态>,通过 <具体证据> 验证,同时保留 <约束条件>。使用 <允许的输入、工具或边界>。在各次迭代之间,如果受阻或没有剩余有效路径。也有人认为这只是 Codex 的早期阶段,所以我们才需要学习这么多的提示词技巧,无论是使用案例驱动还是使用 /goal 命令,本质上都是为了让 AI 能更好的理解人类的需求。就像 Midjourney 、Nano Banana 刚推出时,我们都热衷于找各种公开的提示词;而现在使用 GPT Image 2 在大多数的生图场景下,基本上都不需要专门的提示词格式,就能得到不错的效果。等到 Codex 越来越好用,我们或许也不再需要这些官方使用模板。但从另一个角度来看,或许就是在这种模仿使用的过程中,我们才会更知道 AI 是如何提升我们的生活和工作效率。因此,除了提升网速,我们还看到了一些 Codex 的其他玩法。像是使用 Codex 的定时任务,让它每天早上自动产出一份对应行业的日报;还有让 Codex 也能获得自我进化,从过去的对话里面提取出有用的技能;以及直接构建一个 macOS 应用;把 DeepSeek 接入 Codex 客户端等。▲ 图片
【AI前沿】带摄像头的 AI 耳机能替代 iPhone 吗?我戴了 72 小时之后有了答案
2007 年,乔布斯用一块 3.5 英寸的屏幕,将人类的信息交互折叠进了一个发光的二维平面。转眼快二十年过去了,当年的挑战者成了今天的革命对象,AI 硬件的浪潮对智能手机发起攻击,试图打破这块玻璃。以 Ai Pin 为代表的新形态硬件轮番登场,潮起潮落;相比之下,传统 PC 倒更踏实,正通过 Agent 迎来第二春。既然重新发明形态的路很难走,那么把 AI 装进早已融入大众日常的成熟设备里,会不会是更好的选择?最近,爱范儿曾独家爆料过苹果带摄像头的 AirPods 项目其实遭遇了延期。而在这个巨头踌躇的空档,一个创始人来自小米早期团队,并汇集了字节、阿里、华为、腾讯等巨头员工的中国创业公司——光帆科技,抢先交出了答卷:推出了业内首款带摄像头、由原生 AIOS 驱动的全感穿戴设备——以耳机的形态呈现。去年,爱范儿报道过光帆耳机的问世。上周,这款产品正式发售,我们也提出了一个问题:为什么一副耳机,非要长出一颗摄像头?在深度体验了 72 小时后,爱范儿确信「带摄像头的耳机」代表了未来 AI 硬件的一种方向,但距离终点,还道阻且长。一表一盒一耳机,全都服务于 AI当我们谈论光帆 AI 全感穿戴设备时,实际上是在谈论一套庞大且分工明确的硬件组合——摊在桌面上,它由一个耳机盒、一对挂耳式耳机,以及一块智能手表共同构成。在这个体系里,每一个组件都扮演着特定的角色,AI 的数据流转正是在它们之间协同进行。三者核心,是挂在耳朵上的耳机。光帆将单个耳机重量克制在 11 克以内,黑白「熊猫色」有效削弱了体积感,C 型桥式耳挂则顺着耳廓向后自然延伸。相比之下,AirPods 4 的单个重量为 4.3 克,而豆包推出的同样有耳挂结构的 Ola Friend 耳机的单个重量为 6.6 克。之所以光帆 AI 耳机稍重一些,是因为其前端镶嵌了一颗 88° 广视角、200 万像素的摄像头,在佩戴状态下直直望向前方的世界。为了打消隐私顾虑,它不对用户开放任何常规拍照录像功能,镜头捕捉的画面均只交由云端,用于 AI 交互读取。整体上,光帆选择了 OWS 开放式耳机的设计方案,金属色的扬声器就悬浮于耳屏外侧,配合耳挂尾部的电池,机身巧妙实现了 5:5 的前后配重,久戴之下也没有出现疲惫感。配合耳机盒使用,为这对 AI 耳机提供了长达 90 小时的续航时间,在亲肤材质的外壳下,光帆塞进了独立的 eSIM 模块和双频 GPS。耳机麦克风捕捉的指令、镜头瞥见的画面,都会传回这里,再通过独立网络打包抛到云端,让大模型咀嚼分析。最后,则是拥有 1.97 英寸 AMOLED 屏幕的智能手表。当听觉信息过载时,它负责承接并展示那些需要扫视确认的关键数据,完成「表-耳联动」的最后一环。三件套各司其职:耳机在台前轻装上阵,替你去看去听并作为主要交互设备;盒子藏在兜里,充当算力与网络的中枢;手腕上的屏幕,则是作为交互补充,为常驻性信息提供栖身之所。看手机确实少了,但交互还可以更好在官方的设定中,这套设备主打「全感知、全天候、主动式 AI」。根据几天的重度使用,我将其核心功能体验归纳为三大类别:第一类:更主动、更智能的日程管家在移动互联网时代,最重要的信息往往散落在微信、飞书等软件的碎片化对话中。光帆的思路是让 AI 充当信息漏斗。当微信、飞书或钉钉涌入大量消息时,AI 会自动过滤掉无用闲聊,着重播报高优先级的信息。配套的 Hi Light 软件支持分软件个性化设置总结播报的频率,分别提供实时播报、快速总结与精简总结三种方案,个人体验下来,快速总结是我认为兼具及时性与效率的最佳选择。基于三个软件的智能消息通知,当聊天内容中出现具体的时间、地点和事项时,AI 会主动弹出来询问:这条消息包含一个会议安排,是否帮你添加到日程?到了开会那天,AI 则会成为调度员,当系统识别到我早上八点半有选题会的时候,耳机里的 AI 会根据当前的实时路况和通勤距离,在八点的时候提醒住在离公司不远的我,可以出门了。接受了光帆这一套语音播报系统后,我的确少了很多拿起手机确认消息和添加备忘的动作,但目前这个功能的局限性也很明显——想要语音回飞书,得单独在 app 里授权云系统;想要打车,前提是你提前绑定了滴滴,或者使用光帆账号登录了仅覆盖部分城市的首汽平台。不过这属于无奈之举,去年,豆包手机助手已经证明了,想要打破超级应用的壁垒难于登天。光帆通过云系统接入服务,更像是在高墙下努力挖出了一条通道。虽然偶尔会面临接口变动或授权过期的风险,但至少,的确触摸到了跨应用调度的可能性。第二类:略显迟钝的视觉感知力光帆最大的卖点,无疑是那颗能覆盖日常视线区域的摄像头。用一句话总结光帆对它的期望:将获取信息的动作前置。周末逛街看到一家餐厅,看一眼招牌并提问,它能告诉我评分和排队情况。在我一眼相中同事工位上的黑猫时钟时,AI 耳机可以借助视觉识别,帮我将此商品直接放进我的购物车。当然,前提也和打车类似——我需要先在 Hi Light 中登陆我的京东帐号。但这部分功能,其实是我体验下来落差感最大的部分。一直以来,人类的视觉系统是瞬时的、连续的。而光帆 AI 耳机的视觉感知,却是点状的、滞后的。当一家店铺引起我的兴趣,我双击唤醒耳机。接下来,就是漫长的罚站时间。你需要原地等待 8 到 10 秒,才能听见一声模拟快门音;随后,又是长达 10 秒的数据传输与识别,云端的大脑才会给出解析或加购反馈。在仔细揣摩后,我认为问题主要出现在两方面:摄像头如果长时间启用,从心理角度来说会对用户和身边的人都造成生活被窥探的压力;而从产品上讲,耳机里孱弱的电池和紧凑机身也无法满足传感器长时间通电工作;两方面限制短时间内难以突破,但方案并非没有——目前作为数据中枢的耳机盒,支持 4G eSIM,数据的上下行速度实在捉襟见肘;并且从目前表现来看,光帆 AI 耳机应该遵循的「计算连续体验」构想,让轻量的端侧负责毫秒级的基础抓取和对话,吃算力的视觉解析再无缝接力给云端。倘若随着本地模型的进一步调优,越来越多的简单交互能直接在本地处理,而无需去云端绕一圈时,反馈速度或许能再上一个台阶。当然,如果用上更高能效的穿戴芯片,以及换上 5G eSIM,也会好的多。第三类:条件触发且好用的 AI 备忘相比复杂的视觉识别,基于位置与生理数据的条件触发,使用体验会惊艳不少。提前随口给耳机交代一句,提示我下次去超市要买洗发水、洗洁精和洗衣粉,那么当光帆 AI 耳机识别到我的定位路过或进入超市,就会主动提出备忘信息,避免遗漏。这类触发逻辑在生理监测上同样适用——我先根据自己的身体情况,在手表上设置了一个合理的心率。一旦手表检测到我当前的体征超过了阈值,就会通过耳机提醒放缓节奏或是适当休息。实际用下来,这两项功能稳当且克制,提示及时、位置准确,是我心目中实用性最高的亮点。但功能之外,还是有些小瑕疵在——光帆 AI 耳机完全依赖耳机盒作为计算与传输中枢。如果带上耳机出了门,但耳机盒放在家里或者工位上了,耳机只会在提示音响起后一片寂静,或是提示放入盒中重试。如果想要用上 AI 服务,用户就必须随身携带耳机盒。在体验产品的这几天里,我也算是「自适应」了。这跟习惯了全天候戴着 AirPods,甚至短暂丢下耳机盒也没关系的主流用户体验之间,形成了差异。AI 耳机能替代手机吗?经过 72 小时的体验,让我们回到开头那个问题:耳机为什么要加上摄像头?它的体验究竟如何?当我们审视这款售价 2000 元左右的产品时,必须看懂它背后的野心——这个产品已经基本从手机独立,唯一的连接在于蓝牙。这正是光帆与苹果思路的最大分野——苹果的逻辑里,iPhone 永远是算力中枢,AirPods 只是感官的延伸;而光帆卖给你的,是一整套试图完全脱离、甚至替代手机的独立 AI 硬件中枢。但要实现这个宏大的叙事,我们必须客观分清:在高强度使用下暴露出的诸多瑕疵中,哪些是时代局限造成的次要矛盾,哪些是短期内天然难以逾越的鸿沟。有些阻力,是随着技术与生态发展注定能被解决的。其一,是运作机制上的物理局限。摄像头唤醒的时机、20秒的延迟,以及这套「端侧采集-云端计算」的运作架构,在本地模型的持续优化下,体验还有充足的进步空间;而目前繁琐的第三方授权壁垒,也并非绝症——市场本身的教育需要时间,一旦这类穿戴 AI 品类拥有了足够的影响力,接入就会变得易如反掌——龙虾这种智能 Agent 工具的横空出世已经给大家做了标榜,只要影响力足够大,哪怕是微信这样的国民 app,以及背后的巨头们,都会投怀送抱。当所有的应用都开始主动提供 API 和 CLI 接口让大家接入,生态孤岛的打通只是时间问题。但另一些阻力,却是短期内难以跨越,甚至是与生俱来的。这个阻力,便是耳机当下的「第一性原理」。在互联网社交成为主流的今天,耳机最核心的任务是建立和维护私人的听歌、看视频环境。但当它变成主动式 AI 助理后,它必然会不断用语音打断你——毕竟,这是它彰显存在、证明价值的唯一出路。原本用于沉浸的设备,成了制造干扰的源头。这种体验上的割裂感,是让听觉通道去承载高密度信息所带来的天然硬伤。这不仅是光帆,更是苹果、OpenAI,以及任何有志于开发耳机载体的 AI 硬件的产品团队们,接下来必须想清楚的核心体验问题。不过,这并不妨碍我们对它描绘的图景保持憧憬。回看光帆 AI 全感穿戴设备,虽然从体验和交互上尚有摩擦,但也不难管中窥豹:给耳机加上摄像头的真正目的,正是试探下一代个人终端的终极形态——在功能上「替代」手机,甚至在未来的生活场景中彻底「消解」手机的存在感。想象一下这样的时代背景:当「龙虾」这类工具让人们在移动场景下也能控制生产力;未来,你戴着光帆耳机,或是苹果、OpenAI 的摄像头耳机,走在街上,只需要一句语音,耳机就能远程唤醒电脑上的 Agent 去自动执行复杂的任务。在这个意义上,光帆作为先行者,为我们揭示的未来确实是颇有吸引力的。毕竟,《Her》那部电影,共同构成了我们一代人对于音频 AI 伴侣的憧憬。但当我把自己从浮想联翩中拉回来,更看清楚一件事:硬件的演进永远是场戴着镣铐的舞蹈。这套 2000 元的可穿戴 AI 设备,现在当然还不足以让手机彻底退休,但它确实已经把通向未来的门推开了一条缝。剩下的,就是把门开得更大,门后的路也铺得再平整一些。
【AI前沿】早报|小米卢伟冰:大型新车今年下半年上市/支付宝推出全球首个Token Pay服务/滴滴崩了,官方致歉
🤖小米 MiMo-V2.5 系列 API 永久降价,最高降幅 99%📱QuestMobile:AI 原生 App 月活达到 4.61 亿💰小米一季度营收 991 亿元,卢伟冰:今年下半年有全新平台的新车⚠️滴滴全国多地出现系统故障🧠Google CEO 解释 AI 编程落后原因:缺少 Cursor 这样的用户入口📱小红书上线音频播客业务🚗特斯拉高管:正研究三电机版 Model 3 的可行性🚙启境汽车宣布全国首批 300 家相关门店陆续开业,覆盖 70 城🚗东风牵头起草乘用车底盘强制国标过审💡黄仁勋:AI 时代学什么不重要,讲故事、创造力才重要🎧vivo 首款无线头戴降噪耳机定档 5 月 29 日🛍️1699 元起,XREAL 推出年轻副线品牌 xbx,首款 AR 眼镜 a01 亮相🚙小米汽车发布世界模型框架,重建与生成一体化🤖阿里 Qwen3.7-Max 登顶国产第一,仅次于 Claude Opus 4.7 thinking🧠昆仑万维发布百万上下文 Agent 模型 SkyClaw-v1.0🦿擎朗智能发布小尺寸人形机器人 XMAN-L1,接入豆包、腾讯等大模型💻面壁智能发布 MiniCPM5-1B,主打 2B 以下端侧文本模型📱支付宝 AI 支付笔数达到 3 亿📋上海上线网络餐饮电子证照核验应用⚠️抖音公布 AI 谣言处置成果:相关内容平均浏览量下降 62%🎬周杰伦《太阳之子》登陆 Apple Music 国区🎥《爱是愤怒》发布「温暖的家」预告,定档 6 月 19 日小米 MiMo-V2.5 系列 API 永久降价,最高降幅 99%今天凌晨,小米技术宣布,对旗下 MiMo-V2.5 系列 API 进行永久降价,相比原始定价最高降幅可达 99%,且不再区分上下文窗口长度。MiMo-V2.5-Pro 输入缓存命中价格从此前 ≤256k 窗口下的 ¥2.80 / 百万 tokens 降至 ¥0.025,降幅约 99%;输入未命中缓存价格从 ¥7.00 降至 ¥3.00,降幅约 57%;输出价格从 ¥21.00 降至 ¥6.00,降幅约 71%。与此同时,Token Plan 计费体系同步优化,定价不变,可用量提升至原来的 5 至 8 倍。MiMo-V2.5 标准版(¥99)套餐可用 Token 数量从原来的 200M 升级至 1300M,Pro 套餐(¥329)从 700M 升至 4700M。在降价之外,小米还宣布「百万亿 Token 创造者激励计划」提前收官。该计划自 4 月 28 日上线,截至今日北京时间 5 月 26 日 16:08,100 万亿 Tokens 已全部发放完毕。QuestMobile:AI 原生 App 月活达到 4.61 亿调研机构 QuestMobile 昨日发布 AI 平台采信逻辑与信源偏好研究报告。报告显示,截至 2026 年 4 月,AI 原生 App 月活用户规模达到 4.61 亿,月人均使用次数和时长分别为 91 次、180 分钟。报告还提到,豆包、DeepSeek 月人均使用时长分别为 144.6 分钟和 109.5 分钟,同比增长 80.6% 和 106.9%。🔗 相关阅读:别再无脑装豆包了!实测五款国产 AI App,最强的竟是…小米一季度营收 991 亿元,经调整净利润 60.72 亿元小米集团昨日发布 2026 财年第一财季财报,季度营业总收入 991 亿元,同比下降 10.9%;归母净利润 47.23 亿元,同比下降 56.76%;经调整净利润 60.72 亿元,同比下降 43.1%。分部来看:手机 × AIoT 分部收入 793 亿元,同比下降 14.5%,分部毛利率 22.5%;智能电动汽车及 AI 等创新业务收入 199 亿元,同比增长 6.9%,分部毛利率 20.1%,经营亏损 31 亿元;一季度整体毛利率为 22.0%,同比下降 0.8 个百分点,环比提升 1.2 个百分点;Xiaomi MiMo-V2.5-Pro 跻身 Artificial Analysis 榜单综合智能指数、Agent 指数全球开源模型并列第一,未来三年在 AI 领域投入 600 亿元。在晚间的财报会上,小米集团总裁卢伟冰在会上正式预告,一款基于全新平台打造的大型新车将于今年下半年上市,并规划有多款车型,称其「非常有创新」「非常有竞争力」。卢伟冰在会上解释了 YU7 销量回落的原因:一方面,较长交付周期导致部分用户转向竞品;另一方面,初期产品线规划存在缺失,入门标准版缺席,导致对中心城市通勤用户吸引力不足。为此,小米推出了 YU7 标准版与高性能版 YU7 GT,以「一低一高」策略补齐产品矩阵。他表示,目前门店试驾及锁单反馈良好,对实现全年 55 万辆交付目标仍有信心。在出海规划方面,卢伟冰透露,小米汽车计划于明年三、四季度启动出海,首战欧洲,采取先发达国家后发展中国家、先高端后中端、先右舵后左舵的分阶段策略。目前相关准备工作正在推进中。滴滴全国多地出现系统故障据鞭牛士报道,昨日 17:40 左右,多名用户在社交平台反馈滴滴出行系统故障,问题包括无法开启行程、App 闪屏卡顿、定位异常、无法显示司机位置,以及司机端无法定位乘客。网传截图显示,部分用户在打车后遇到「抱歉,网络出了点问题,请稍后重试」「订单太多小滴扛不住了,请稍候再试」等提示。报道提到,广东、江苏、北京、江西、新疆等地均有用户反馈异常,企业滴滴服务也受到影响。当晚,滴滴官方发文致歉:非常抱歉,因云厂商网络专线故障,造成今天 17 点左右滴滴 App 部分服务出现短暂故障,目前服务已全部恢复。故障期间产生的费用异常等问题我们正在紧急处理,将尽快妥善解决。Google CEO 解释 AI 编程落后原因:缺少 Cursor 这样的用户入口日前,Google CEO 桑达尔·皮查伊(Sundar Pichai)在《纽约时报》旗下播客节目《Hard Fork》接受专访时,首次公开承认 Google 在 AI 辅助编程领域目前落后于行业前沿。他将原因归结为缺少像 Cursor 或 Claude Code 这样能直接嵌入开发者日常工作流的编辑器入口——这一缺失导致 Google 流失了最关键的动态工作流数据,进而拖慢了模型在智能体编程场景下的迭代速度。皮查伊在专访中侧重展示了 Google 内部 AI 编程工具 Antigravity 的闭环测试数据,包括内部 Token 消耗量每周翻倍,以及在极端性能测试中用 12 小时从零构建出操作系统。他表示,Google 底层技术底座依然完备,当前在公开市场的被动,主要源于应用场景与用户反馈闭环的广度限制,而非底层能力的根本性缺失。小红书上线音频播客业务昨天,小红书在新生代创作盛典上宣布上线音频播客业务,开放 PC 端和移动端音频直接上传,并支持 PC 端通过 RSS 同步导入播客内容。新功能会把播客展示在创作者首页。小红书还计划在发现栏目上线播客独立频道,并支持小窗播放、断点续播、熄屏播放、定时关闭和 15 秒快进快退等音频收听功能。特斯拉高管:正研究三电机版 Model 3 的可行性近日,特斯拉工程副总裁拉尔斯·莫拉维在《Ride the Lightning》播客特别节目中透露,他正在研究为 Model 3 搭载三电机系统的可行性。莫拉维在节目中被主持人瑞安·麦卡弗里直接追问 Model 3 是否会配备三电机时,并未否认这一方向,表示「一直在认真思考这件事」。他特别提到希望将碳纤维套筒电机引入 Model 3 平台——这一技术正是 Model S Plaid 得以实现持续强劲加速能力的核心硬件。目前,Model 3 Performance 采用前后双电机布局。若要在后副车架内加装第三台电机,工程空间将极为有限。莫拉维坦承,这是一项「高投入、需权衡回报」的规划,在现阶段与特斯拉整体发展目标并不契合。他进一步解释,公司当前全部高性能研发资源已集中投入新一代 Roadster。这款旗舰跑车将搭载特斯拉最新一代电机技术,是目前工程团队的优先级所在。莫拉维表示,一旦 Roadster 正式投产,相关高性能电机技术未来有望向其他车型延伸。启境汽车宣布全国首批 300 家相关门店陆续开业,覆盖 70 城启境汽车昨日宣布,全国首批 300 家相关门店正陆续上线开业,覆盖北京、上海、广州、深圳、杭州、武汉、郑州等一二线城市,合计 70 城。此次开业门店分为两种形态。「用户中心」,由启境直营或授权经销商运营,主要承载销售咨询、到店看车、试驾预约、车辆交付及售后等全流程服务;「体验中心」,由引望联合启境及授权经销商共同打造,定位沉浸式体验空间,以华为乾崑智驾技术及其搭载车型的展示体验为核心,选址城市核心商圈。东风牵头起草乘用车底盘强制国标过审东风汽车近日披露,其在乘用车底盘领域牵头起草的首个国家强制标准已全票通过审查。该标准聚焦制动辅助系统,预研至今历时三年多。制动辅助系统会在驾驶者紧急制动但踩踏力不足时识别驾驶意图,并瞬间把制动力提升至最大,以缩短制动距离。东风称,我国新上市 M1 和 N1 类车型中,BAS 装备率逐年上升,乘用车新车中已有 90% 以上车型标配 BAS;出口车型按联合国法规 UN R139 已 100% 强制装备 BAS。💡 黄仁勋:AI 时代学什么不重要,讲故事、创造力才重要据《商业内幕》报道,英伟达 CEO 黄仁勋近日在英国 Channel 4 播出的访谈中谈到 AI 时代的教育选择。他认为,今天最值得培养的是讲故事、创造力和判断力,而不是提前押注某一个具体学科。无论你选择什么作为自己的热情所在,你唯一需要做的,就是问自己:人工智能如何能够提升我的学习、我的技艺、我的使命?黄仁勋表示,过去人们很容易建议孩子学习物理、工程或计算机科学;但在 AI 可快速补足工具能力后,单一专业选择不再是唯一答案。他的核心判断是,讲故事、创造力和判断力会继续保有价值。AI 可以像导师和教练一样帮助学生进入不同领域,学习者仍要提出好问题、组织信息、评估结果,并把复杂内容讲清楚。黄仁勋把 AI 工具视为扩大教育反馈的方式:学生无论学习艺术、科学还是工程,都可以借助 AI 获得更快练习和解释。他没有替学生指定专业,而是把「如何用 AI 放大自己的判断」作为新的学习框架。vivo 首款无线头戴降噪耳机定档 5 月 29 日vivo 昨日官宣首款无线头戴降噪耳机,将于 5 月 29 日 19:30 发布。预热海报显示,这款耳机提供云雾白、微风紫两种配色,重量约 238g。功能上,该耳机支持高沉浸主动降噪、跨生态无缝三连接和多设备切换。1699 元起,XREAL 推出年轻副线品牌 xbx,首款 AR 眼镜 a01 亮相XREAL 昨日宣布推出年轻副线品牌 xbx(X by XREAL),首款产品为 xbx a01 系列 AR 眼镜。新品主打随身大屏、游戏和通勤娱乐场景,品牌口号是「只管玩就好」。xbx a01 系列采用半透明镜身和可更换「百变前框」设计,用户可以替换前框,也可以 3D 打印自定义配件。整机重量控制在 62g,配备三种尺寸鼻托、三档可调柔性镜腿和自适应弹性铰链。显示部分,xbx a01 支持 1600nits 感知亮度、14 档亮度调节、HDR10、10.7 亿色、AI SDR 转 HDR,以及 50° 视场角,对应 4 米外约 147 英寸显示效果。新品还搭载超清空间防抖,通过 AI 姿态预测、动作捕捉和画面预渲染,在地铁、高铁、飞机等移动场景中降低画面晃动。价格方面,xbx a01 售价 1699 元,xbx a01+(增加遮光罩和环绕模式)售价 1799 元。小米汽车发布世界模型框架,重建与生成一体化小米技术昨日发布 Xiaomi Auto World Model 全新框架,面向辅助驾驶世界模型,把重建模块 WorldRec 与生成模块 WorldGen 合并进同一套系统。据介绍,该方案避免先重建场景再简单喂给生成模型的串联路径,改为让两侧互相约束:WorldRec 维护随观测扩展的 4D Gauss
【AI前沿】再访 XREAL 徐驰:做眼镜是场万米长跑,靠运气也靠打怪升级
XREAL 把今年的第一场发布会,留给了一个之前没听说过的新牌子:xbx。内部的全称是 x, by XREAL。考虑 1699 的定价,xbx 的第一款产品 a01 的性价比相当不错:50° 视场角,tandem OLED 显示模组的亮度高达 1600 尼特,等效 4 米左右 147 英寸大屏,支持 HDR10 和在至高 120Hz 帧率下的空间防抖。但参数远没有颜值和戴起来轻松更重要。62g,半透明未来感机身,可替换的多种个性化镜框。CEO 徐驰说,「颜值就是正义,只管玩就好。」这是成立十年来一直在拼了命地往「上」冲的 XREAL,第一次「向下」。过去这些年,徐驰和他创立的 XREAL 从来没有走过容易的道路。尽管中国的消费电子供应链资源足够好,以至于整合能力成为了成功的硬件创业者必备的素质——XREAL 却是不搞纯粹的「供应链整合」的。正相反,XREAL 一直都在往上走,做最贵、最难、最「极客」的产品。为此,XREAL 不惜做极高比例,同时也是同行中最高比例的自研,甚至不惜因为过去两三年里的国际半导体波动,而损失相当一部分利润率。这才是为什么去年 XREAL 能和硅谷巨头 Google 联合推出 Project Aura,一台令行业人士刮目相看,也让消费者打破对现有「智能眼镜」刻板印象的原型机(今年将正式面市)。徐驰毫不收敛地将 Project Aura 称为他所在的行业体验的「天花板」。能做出这样的产品,断不可能靠整合供应链。为什么只有 XREAL 能做到,为什么谷歌选择了,LG、ROG 等也都选择了 XREAL?徐驰说,答案是 XREAL 的 A 面:内敛、冷峻、长期主义、押注绝对的技术创新。那么,XREAL 的 B 面又是什么?在徐驰带领着公司一往无前地朝着头戴式显示技术的性能优化与极致轻量化冲刺的同时,他的背后险象环生:在通过 Apple Vision Pro 试水也试错了之后,苹果立项了更多轻量级 AI/AR 眼镜产品,如无意外将于 26H2-27 全年逐步问世;小米、阿里千问、Rokid、VITURE 等纷纷杀入市场。它们当中,有的用 AR 显示眼镜围攻 XREAL 占据已久的光明顶,更多的则是用 AI 眼镜(屏显/无屏)来提前抢占行业领头者尚未明确布局的新空间——无论何种产品定义,价格都被压得越来越低。对此徐驰并不紧张。在和他深聊过后,爱范儿得出这样的感觉:XREAL 的 A 面朝前太久了,以至于同行们似乎误认为它没有或者不屑于展现另一面。「怎么说呢,A 面没立住的时候,就没有 B 面。我们现在来了,虽迟但到。」XREAL 主品牌的势能已经积攒到位,徐驰和他的产品团队终于腾得出手去做另一种风格的产品——一个更年轻、外放、价格也更亲民的牌子 xbx。这就是 XREAL 的 B 面,与那个永远创新不止的 A 面,互为映照。他说,自从创业以来,见到了 VR/AR 的泡沫,破了;然后元宇宙来了,也破了。一路走来,这次创业越来越像一场万米长跑——这也是从一开始他就坚信的赛制。「抢跑一点都不重要,跑对方向才重要。」所以,徐驰看起来并不担心这些新来的竞争者。问他怕不怕大厂和其它创业公司一拥而上,他答:「我们最怕的,是这个行业只有自己。如果没有别人,没准说明我们走错了方向。所以热闹一点挺好的。」2016 年,徐驰离开混合现实先驱企业 Magic Leap,回国草创,做一副在当时没人看好的眼镜。快十年过去了,他庆幸 XREAL 能活到今天,运气占了相当大的因素。「感谢这个赛道前十年的起起伏伏,让我有机会不断打怪升级……等到真的要跟大厂掰手腕的时候,不至于一上来就是总决赛。」爱范儿等与徐驰、XREAL 产品负责人刘宗楷进行了一次专访,从全新的子品牌 xbx 和第一副价格打到 1699 元的 AR 眼镜产品 a01 聊起,一路聊到他怎么看待竞争,如何比较自己与同行之间的资本效率、AI 眼镜会不会最终取代手机,以及一个第一次创业的人,凭什么活到今天。「年轻人最好的,就是不迷信传统」爱范儿:XREAL 这些年的特质就是高端化,为什么要在这个时间点推出 xbx 这个品牌?徐驰:我们一直说,今天的智能眼镜行业很像 05、06 年的手机行业,很碎片化,系统、应用生态、交互范式都不统一。在这个相对早期的阶段,没有哪个品牌能够覆盖所有的价位段。所以我们就想,有没有可能做两种风格不一样的产品,像 A 面与 B 面一样。这个行业充满波折,是出了名的难做。很长一段时间里,大家都在摸索,我们自己也(一段时期内)没有一个特别清楚的定位。但是「XREAL 」在我心里就是那个极致创新的品牌,更冷酷、更经典。但是,一个品牌尚未立住的时候,我没办法再去做一个更大众、更宏观的东西。慢慢地,XREAL 成为了我想要的那种更内敛的品牌,这时候,就可以有一个更绽放的品牌跟它相互映照了。这就是我说的 A 面与 B 面。A 面没立住的时候,就没有 B 面。这件事虽迟但到。从今往后,我们不只是一家叫 XREAL 的公司,还是一家 x by XREAL 的公司。爱范儿:年轻人想要什么样的 AR 眼镜?难道年轻人就不想要极致的产品?刘宗楷:对年轻人来说,个性与自我表达是每个人心里的渴望。市面上不管是 AR 眼镜、AI 眼镜、还是 XR 头盔,很多人下意识觉得这东西就该不好看、不轻便。但我们偏要反着来,为什么不先做出一副好看、够轻、年轻人愿意戴在头上的眼镜?一副愿意戴出门的眼镜,是所有事情的第一步。徐驰:年轻人最好的,就是不迷信那些传统的大道理。颜值就是正义,好看就好,好用就好。我们希望用 a01 这副眼镜让大家明白,一千多块的价格也可以做到两千多块的体验。我们会把它长期做下去。爱范儿:必须戴到外面,才能影响更多潜在受众。徐驰:没错就是这样。我们希望这个产品可以在地铁上,在咖啡馆里,在飞机上,在各个地方,更多的年轻人把它戴到外面,而且是不尴尬的。所以我们做了极致的轻量化和个性化设计。爱范儿:轻量化肯定有取舍。一个产品想做更高的分辨率、帧率、视场角,模组就会变大;模组大了,重量就会大、配重也会失衡。刘宗楷:做轻的同时还要保证体验,真的非常难。镜片和外壳的厚度能不能再降一点,但强度还能保住。每一个器件既要轻还要保住性能,我们抠了很多细节。这条路没有尽头,就是一个个夜晚,一次次较劲和争吵。当然,我们觉得还可以做得更好。爱范儿:AR 眼镜能做到的 FoV(视场角)物理极限是多少?以及不考虑极限,只说在不同场景下人类佩戴的人体工学舒适度,最优解是多少?徐驰:我给你个最直接的答案,最好的视场角应该是在 85° 左右,但这是在不计成本堆料、不考虑重量的前提下。在 Project Aura 上,我们做到了 70°,在这个产品形态下已经是非常不错了,但是仍然有差距。什么时候我们能做到 85°,并且仍然是轻量化的,那么我们会觉得至少在显示端做到极致了。刘宗楷:根据场景来看,比如你戴上 VR 头显去火星,画面主体是一艘宇宙飞船,背景则是宇宙星空——你需要同时看到主体和背景才能获得最大的沉浸感。但是对于 AR 眼镜,最好的背景其实是真实世界。如果是打游戏或者看球赛可能就不需要很大的角度;但如果是看电影,或者附着在真实环境里的 AR 显示,那么宽视角的沉浸感就更重要。所以最终还是取决于内容是否沉浸。至于人眼的注意力聚焦视角,从眼科学上来说的确有极限,一般就是水平方向的 50° 左右,垂直的 30-40°这个区域内。视场角并不是唯一的关键因素,还有电致变色、性能续航等等。在我们定义不同产品的时候,会有无数个取舍的拨杆,往不同的方向去拨。「我们最怕的,是这个行业只有自己」爱范儿:苹果也入场了,国内大厂的竞品也已经上市,价格越压越低。你怎么看?徐驰:大家进来,我认为是好事。我们最怕的是什么?是这个行业只有我们自己——那说明这个赛道没人关注,没人看好。我们始终认为,眼镜是最有机会替代手机的下一代计算终端。虽然已经创业十年了,我们也才刚刚开始,我们的渗透率可能还不到 1%,后面还有百倍甚至更大的成长空间,所以大家一起来把蛋糕做大是件好事。我们这个行业是有泡沫的,但泡沫不一定是坏事,说明大家对行业的期待值很高。过去在每个阶段,都有过想挣快钱的人,发现不好赚就走了。泡沫褪去,受害的其实是消费者。而真正推动行业往前走的,是那些把「用户期待」和「产品体验」之间的差距一点点缩小的人。打个比方,今天的 AI 眼镜就像五岁小孩,而我们定义的全天候佩戴的 AI 眼镜就像贾维斯。这中间的差距得靠底层创新去一点点推动。这些创新不会无缘无故发生,背后一定有人负重前行。问:你们跟 Meta 的距离还有多少?徐驰:举个不那么恰当的对比:2025 年 Meta 的 Reality Labs 业务营收是 22 亿美元,亏损接近 200 亿美元。我们今年做到了 2 亿美元营收,差不多是它的十分之一,但我们的亏损不到 2000 万美元。十分之一的营收,千分之一的亏损,我觉得我们的资本利用效率还可以,这也是我们的优势。爱范儿:你们有自己的全栈自研芯片、光学,但 Project Aura 的部分算力还是用的骁龙,两者这两者是什么关系?将来 XREAL 会否提高核心算力的自主性?徐驰:X1S 是一颗完整的 SoC。在 Aura 上,所有对延迟和带宽敏感的计算,放在我们的 X1S 芯片上,其它的给骁龙。我们的芯片就是纯端侧计算,骁龙芯片放在 puck(外挂的计算单元) 上。这两者不是处理器和协处理器的关系,而更像是「端侧」和「云」之间的关系。有些计算需要发生在离你更近的地方,更加及时。我们一直说眼镜会取代手机。在可预见的将来,puck 会消失,直接换成你的手机就行了;更长远来看,如果眼镜真的取代手机,它需要自己能够处理所有的计算。这才是我们为什么押注自主芯片的意义所在。前段时间美国出台禁令,先进制程的晶圆不能直接运进中国大陆。这件事挺流氓的,我们的芯片在这个范畴内,本来要在大陆做封装,结果必须在台湾封装完才能运回大陆。当时国内一大批芯片厂商都在争抢台湾的封装资源,造成了一次性的短缺,跟今天的内存短缺很像。为此,我们的业绩也少了蛮大一块,否则去年 Q3、Q4 的增长会很明显。但从长远看,这反而驱动我们继续往前走。还好我们今天销量不是很大,总比卖了几百万台突然被卡脖子要好(笑)。我们希望中国有越来越多的先进制程握在自己手里,谁也卡不住。爱范儿:Project Aura 在国内能上吗?你们会选择哪些国内模型厂商一起探索?徐驰:因为 Android XR 和 Gemini 强绑定,而 Gemini 在国内用不了。所以很遗憾,要不你海淘吧(笑)。我们不会放弃国内市场,如果 Android XR 能够和 Gemini 解耦,连上国内 AI,就是 Project Aura 进入国内市场的时候,但不是今天。就像当年 iPhone 也不是刚问世就进入中国。我觉得这个结果我们可以接受。It’s okay.对我们来说,阿里是我们的股东,我们也一直跟字节跳动保持交流。在模型方面,我们不会排斥任何一家。我们的终极理想,是 AI 能像搜索引擎一样换着用。未来的大模型会变成基建,谁家的 token 效果好就用谁,可以无缝切换。「眼镜凭什么取代手机?」爱范儿:你自己也说,AR 眼镜这个品类存在很多年了,但渗透率仍然很低。让更多人接纳它的「入门毒药」会是一个怎样定义的产品?徐驰:大概率还是主流两大类:更加全天候的 AI 眼镜、带显示但不够全天候的 AR 眼镜。这个「全天候」(always-on) 有两层意思:一是全天候佩戴,二是全天候使用。今天的问题是,AI 眼镜的主要场景不是 AI,而是听歌拍照;你打开相机拍个 30 分钟,产品就没电了。如果说眼镜是你的个人助理,但它每天只能睁眼 30 分钟……那就不是一个全天候的助理。在将来的某个时间点,会有一款 35g 以下、全天候续航的产品,作为 AI 交互的载体。这样的产品,我认为是能做到的。如果做到了,它绝对会是人手一个的设备。另一条路就是 AR 眼镜,追求更高清、更多内容。这个路线今天还是分体机形态,能做到 60g,但终极形态
【AI前沿】小米:请叫我 Token 价格屠夫
押注 2026 年 Token 大涨价的人,短短一周迎来两次打脸。5 月 22 日,DeepSeek 宣布 DeepSeek V4 Pro 永久降价;今天凌晨,小米 MiMo-V2.5 系列跟进降价,最高降幅达到 99%。与此同时,小米 Token Plan 计费体系同步优化,定价不变,可用量提升至原来的 5 至 8 倍。没有出乎太多意料,海外 Reddit、X 平台以及各大开发者论坛上关于小米 MiMo 模型降价的讨论热度也是迅速飙升。只是,在全行业都在高喊 Token 成本吃不消的当下,小米为何敢于逆流降价?更重要的是,这波降价操作又会把 AI 行业推向何方Token 价格打骨折,AI 行业迎来最严厉的父亲小米此次公告显示,旗下 AI 大模型 MiMo-V2.5 系列 API 将进行永久降价,最高降幅达 99%,且不再区分输入长度。新价格已于北京时间 5 月 27 日 0 点全球同步生效。不过,99% 的降幅并不意味着每一次调用都会按最低价计费,关键变量在于输入缓存是否命中。以 MiMo-V2.5-Pro 为例,一旦命中缓存,输入价格被击穿至约 0.025 元每百万 Tokens。而如果输入缓存未命中,价格依然维持在 3 元每百万 Tokens,输出价格则为 6 元每百万 Tokens。也就是说,这个极低价格成立的先决条件,是请求必须大量命中缓存。对于高重复上下文、高频 Agent、多轮代码任务以及批量推理任务来说,这个价格拥有极强的吸引力,但如果你的应用场景缓存命中率堪忧,真实成本显然不会触及最低点。Token Plan 的玩法也有着相似的逻辑。小米强调定价不变,Credits 大幅提升:Lite、Standard、Pro、Max 四档月费仍是 39 元、99 元、329 元和 659 元, Credits 的额度,也从 0.6 亿、2 亿、7 亿、16 亿提升到对应的 41 亿、110 亿、380 亿、820 亿。且按照新的换算关系,MiMo-V2.5-Pro 命中缓存只需 2.5 Credits / token,未命中缓存则要 300 Credits / token,输出为 600 Credits / token。这与 DeepSeek 的打法如出一辙。简单回顾一下时间线:4 月 24 日 DeepSeek V4 预览版发布;次日 V4-Pro 开启 2.5 折优惠;4 月 26 日,缓存命中价格暴降至首发价的十分之一;到 5 月 22 日,临时折扣干脆变成了永久降价,V4-Pro 永久降至原价的四分之一。一番调整过后,DeepSeek-V4-Pro 的输入缓存命中价格从 0.1 元直接降到了 0.025 元。随着小米 MiMo-V2.5-Pro 的火速跟进,国产模型的缓存命中输入价已经被彻底焊死在了这一基准线上。DeepSeek 和小米都把最有冲击力的价格放在缓存命中和场景,原因并不复杂。大模型正在从聊天走向干活,而 Agent 才是 token 消耗真正放大的地方。在聊天场景里,用户问一句,模型答一句,成本相对容易估算。但在 Agent 场景里,一个任务可能包含长上下文、多轮推理、代码生成、工具调用、网页读取、文件分析和结果校验。用户看到的只是最后一次输出,后台却可能已经发生了多次请求和大量上下文读取。这就是缓存命中重要的地方。Agent、代码助手和长上下文应用有一个共同特点:很多内容会反复出现。比如系统提示词、项目代码、API 文档、工具说明、历史对话、依赖文件等。这些内容如果每次都重新计算,成本会很高;但如果能被缓存,下次再用时只按缓存命中价格计费,推理成本就会明显下降。也就是说,缓存命中价格越低,越适合高频、多轮、长上下文的真实工作场景。DeepSeek 和小米低价背后,其实也是为了先把开发者和高频应用吸引进来,让更多 Agent、代码助手和办公自动化应用愿意跑在自己的模型上。小米此前通过 MiMo Orbit、百万亿 Token 创造者激励计划等活动,让更多人体验 MiMo,并解决真实问题。这个百万亿 Token 激励计划自 4 月 28 日上线,到 5 月 26 日 16:08,100T Tokens 已全部提前发放完毕。从平台视角看,低价 token 和免费额度换来的是海量真实调用。真实调用会带来复杂任务、失败样本、用户反馈、Agent 工作流、代码场景和长上下文数据,这些都会反过来帮助模型和推理系统迭代。社区里的「养虾党」现象,也可以放在这个逻辑里理解。用户在最大化消耗额度的同时,也在帮助平台制造压力、暴露问题、积累调用数据。所以这笔账不能只看单次推理毛利。短期收入被压低,换来的是开发者迁移、调用规模和真实反馈。对想争夺 Agent 生态位置的模型厂商来说,这是一种非常划算的平台投入。罗福莉的真香定律,背后是工程暴力不过,光有意愿还不够,关键是降得起。小米这次降价的特殊之处,正在于它和 MiMo 大模型负责人罗福莉此前的公开表态形成了反差。一个月前,罗福莉曾公开反对 token 价格战。她当时的判断是,低价 token 加开放第三方 Agent 框架,容易让平台陷入成本失控。她提到,第三方 Agent 框架往往上下文管理粗放。单次用户查询可能触发多轮低价值工具调用,每次请求又携带超过 10 万 token 的超长上下文。如果平台无法约束这类浪费,真实 API 成本可能是订阅价格的数十倍。她还认为,全球算力供给已经跟不上 Agent 带来的 token 需求增长。大模型公司在没有厘清编程和 Agent 场景成本结构之前,盲目价格战会导致限流、降配、稳定性下降,最终损害用户体验。但小米这次降价没有推翻此前判断,而是改变了价格战成立的前提。罗福莉此前反对的是没有成本结构支撑的低价。小米现在展示的,是一套自认为能够支撑低价的推理工程方案。按照小米公告,其技术团队基于 SGLang HiCache 完整支持 SWA,也就是 Sliding Window Attention,将 KV Cache 在 GPU 显存、CPU 内存、SSD 等多级存储之间的数据搬运量降低至优化前的近七分之一,并将可缓存 token 数量提升至优化前的近五倍。与此同时,小米还优化了专家并行方案和输入长度分桶策略,以提升集群输入吞吐能力。没有这层工程能力,低价很容易就会变成不可持续的补贴。有了足够强的 Infra系统,低价才可能转化为长期优势。价格战考验工程能力,也考验后方厚度。不同于纯 AI 模型公司,小米的手机、汽车、IoT 和消费电子业务,给它提供了更长的投入周期和更大的战略耐心。它可以把大模型服务看作 AI 生态入口,避免陷入只按短期 API 收入斤斤计较的困局。这对中小模型公司并不友好。没有主业输血,没有过硬的 Infra 实力,也没有足够调用规模摊薄成本的玩家,注定无法长期跟进这种价格。DeepSeek 的低价已经直接威胁到不少国产模型的市场定位。而随着小米 MiMo 的跟进,更多仍有体量的厂商会被迫调整价格或将重新定义产品价值。更小的模型服务商,则可能被推向更窄的垂直场景。这轮降价某种程度上也是效率派模型厂商对市场的一次筛选。有工程能力、算力调度能力和生态入口的公司,可以承受更低价格带来的压力。只有模型能力、但推理成本压不下来的公司,会越来越被动。并且伴随继续下探的空间逐渐变窄,价格越接近物理成本,单纯降价的价值越有限。下一阶段,模型质量、Agent 适配、开发者工具、生态绑定、服务稳定性和企业交付能力,也都将迎来新一轮内卷。模型能力决定了 AI 发展的上限,而推理成本决定了 AI 普及的规模。等到真正便宜的 Token 涌入应用层时,我们才会真正看清,属于 AI 的下一个爆发时代会是什么模样。
【AI前沿】最好的手机 AI,是仿佛没有 AI|AI 器物志
智能手机统治了过去十几年的数字生态,它是注意力的黑洞,是我们最私密的随身之物。但手机从设计之初就是为「人盯着它」而生的——它的全部逻辑,都止于屏幕。AI 的需求却恰恰相反:它需要持续感知物理世界——见你所见,听你所闻,随时在场,而非等你解锁屏幕才醒来。当 AI 真正成为一种基础能力,它迟早要从屏幕里破壳而出,寻找属于它自己的形状。这将是一个漫长的探索和演化过程。「AI 器物志」栏目由此而来,爱范儿想和你一起持续观察:AI 如何改变硬件设计,如何重塑人机交互,以及更重要的——AI 将以怎样的形态进入我们的日常生活?这是「AI 器物志」的第14篇文章。时至今日,已经没有人可以否认:手机正在成为我们生活中最重要的 AI 枢纽。无论是给智能穿戴作数据中枢,还是作为独立智能终端,手机都承担着比以往任何时候都重的连接和处理任务。而手机的操作系统,就是这些连接和处理的基础,是一切 AI 功能的舞台。图|OPPO承认吧,无论你是否喜欢手机智能助手,手机系统的 AI 化都是不可避免的,连谷歌都在说要把 Android「操作系统」进化成「智能系统」了。与其一股脑地反对手机 AI 化,我们面对这种变革的最好方式,莫过于秉承「拿来主义」的原则:主动发掘那些最好用的手机 AI 功能,让它们成为日常使用中的润滑剂。而口号「超流畅更 AI」的 OPPO ColorOS 16,就是这样一个难得的 AI 功能不喧宾夺主、反而让使用体验变得润滑的手机系统。一键闪记:AI All in one虽然记忆功能各个品牌都有,但小布记忆仍然是目前为止我们体验到功能最丰富、用法最直观、生态最完善的那个。毕竟 OPPO 在开发这项功能的时候,背后的思路很清晰:我要的不是截图本身,而是屏幕上的信息……灵魂抽走之后,那个枯萎的实体照片就不重要了,因为信息已经被提取了。在最新版本的 ColorOS 16 里,「一键闪记」的能力进一步加强,开始和小布记忆里面的多模态功能、流体云等有机结合,变成了一个比截图更好用的超级记忆工具。视频闪记让一个 AI 工具好用的重点,从来都是「工具多走一步,让用户少走一步」。「视频闪记」功能,正是在记录和理解屏幕信息的基础上主动多走一步,让用户不必额外操作一次的典型代表。这个功能之所以好用,在于它解决了以前要总得复制链接发给 AI、或者在视频播放界面喊小布的「多步骤」操作。相比之下,视频闪记只需要在播放的时候按一下快捷键,小布就会自动识别视频、自动执行总结,一下减少了 50% 的手动工作量。尤其如今各种学习视频——网课、生活技巧、产品教程等等——大爆发,OPPO 的视频闪记可以起到非常好的内容整理作用:而进入小布记忆里面还会预留带超链接的时间戳,跳转的视频甚至可以免开屏动画(和广告):此外,小布记忆还会根据总结出来的视频内容,主动关联之前记忆的其他视频,形成自动收藏夹的效果。但它目前只支持国内主流视频平台、不支持 YouTube 和微信视频号,仅支持中英文、不支持小语种,以及部分竖屏视频无法触发总结等等。但总的来说,「视频记忆」依然是 ColorOS 中体验最好的 AI 功能之一,就因为它把两个最常见的 AI 操作整合在一起、做出了 1+1>2 的体验。快速记账除了视频总结之外,另一个我们意料之外好用的「闪记类」功能,则是小布的自动记账。当然,OPPO 这个自动记账并非百分百自动,而是与更常用的「闪记上岛」整合在了一起,严格来说依然是个需要手动执行的操作:但「闪记上岛」本身足够优秀,几乎可以说是目前适配性最强大的「灵动岛」类功能。将记账和这个高频功能组合在一起,应该就是目前最无感的方案了。当然记账的方式很多,微信还是支付宝都有和账单相关的智能功能,ColorOS 最大的优势依然是前面提到的「流程顺畅,体验无感」。小布记忆目前只支持导入微信和支付宝的 Excel/CSV 对账单,如果是云闪付或者其他平台的话,就要导出 Excel 之后修改排版才能导入了:除了单纯记账之外,ColorOS 的账单分析功能也做得很不错。在小布记忆首页就可以看到当月支出的柱状图,点进去还能看到流水明细和日周月平均:单这些功能,基本上就可以满足 95% 的日常记账需求了,可以省下相当多付费记账 app 的开销。更重要的是在「我的账单」页面,你还可以和小布讨论已有的收支数据——不过 LLM 的数学推理能力都比较一般,小布给出的结果最好还是「仅供参考」。系统功能:最爱抠细节的 AI除了上面的「英雄场景」之外,ColorOS 很多 AI 功能也是整合进系统 app 里的,在使用过程中经常会有「原来这里也能用小布」的感叹。并且 AI 功能集成在系统应用中,也变相提升了它们的留存度、让很多「到手就删」的 app 有了用武之地。菜单翻译作为 ColorOS 16 重点宣传的功能之一,智能翻译 + AI 菜单可以说是让我们印象最深刻的优秀 AI 整合案例了。它为一个门槛颇高的问题,提供了一种极为接地气的解决方案——把高大上的洋文菜单,直接 vibe coding 成微信点餐小程序。和小布记忆不同,这个 AI 菜单翻译入口藏得比较深,需要在预装的翻译 app 里面的「拍照翻译」中激活:在拍照翻译时,无论直接拍摄,还是导入相册图片,在读取到翻译内容是菜单之后,ColorOS 就会提示这个新的「AI 图文菜单」入口。在 AI 图文菜单里面,系统会把所有识别到的菜品转换成我们最熟悉的点单小程序布局:并且系统还会为每道菜配上一个 AI 预览图、原料和做法,甚至还有过敏原提示和价格换算。我们只需要像小程序点菜一样选择,然后选择右下角的「向店员展示」,它就能提供文字和语音两种展示形式。更细节的是,ColorOS 为一些主流外国菜系定制了不同风格的菜单界面,比如日料就是红底配富士山,泰国菜就是黄底配大象等等——并且除了出国旅游,AI 菜单功能还有一个小众用法:去酒吧的时候用它翻译一下,就能清楚自己在喝什么东西了。不少酒吧用的都是双语菜单,用 ColorOS 的 AI 菜单翻译一下,不仅能看到大概的样子,还能看到制作方法,准确度不错:AI 帮写ColorOS 的「AI 帮写」也是一个用之前没有感觉、一开始用就容易形成习惯的小功能。和其他厂商喜欢把 AI 写作功能绑定进预装输入法不同,ColorOS 的 AI 帮写与输入法是独立的。也就是说无论你用搜狗输入法、微信输入法还是 Gboard,AI 帮写都能正常使用:而 ColorOS 实现 AI 帮写的方式也很有意思:它的触发检测基于应用白名单,但提示词却是通过屏幕内容识别读取的。换言之,AI 帮写只会在特定 app(美团大众、淘宝京东、小红书朋友圈等等)里弹出,在不支持的软件里面(比如酷安)只能手动呼出小布帮忙。微信朋友圈(左)和酷安(右)而 AI 帮写具体写什么东西,是根据它识别到的屏幕内容决定的,有时候会导致一些 bug——比方说在小红书里面,只要屏幕上有缩略图,AI 就知道我想要的是和猫相关的内容:但大众点评里,由于输入框上移会挡住照片,AI 帮写就不知道内容是什么了。如果碰巧没显示关联话题,AI 帮写就会写出一些不知所云的东西:但在不出 bug 的时候,ColorOS 的 AI 帮写功能都是相当好用的。虽然它生成的东西很难说有什么个人特色,但用来应付那些「写 100 字点评领优惠券」的场景来说,简直就是解放生产力的终极工具。需要改进的问题除了上面的有趣用法以外,ColorOS 目前的 AI 功能也存在着一些问题和短板。首先是普及性的问题——前面列举出的大部分功能,其算力重心都是云端服务器,手机本身只需要承担一小部分算法开销。在这样的前提下,以云端功能为主的 AI 更新应该很容易下放到较老的机型上才对。但事实上不是如此。就拿我们手里的 Find N3 和 N5 为例:即使是最新版本的系统和 app,也没有更新前面提到的 AI 菜单功能——其次,用小布记忆来记账的确很方便,但它的操作方式有些过于粗犷了。每次都得在订单界面闪记一下,自动化程度还是有些不足。更要命的是,它作为一个记账功能,居然不支持外币或汇率转换。哪怕 AI 识别到小票上的币种是泰铢(THB),数字也会按人民币入账:在 OPPO 国际版逐渐打开销路、出国旅游愈发普遍的今天,这种基础功能的缺失是很难让人接受的。并且相比友商的 AI 助理,小布能够支持的「代操作」功能还是比较原始——用支付宝给谁发个红包可以,去淘宝再买一单上次的咖啡豆就不行了。操作系统就该是智能系统归根结底,我们还是要回到之前 Android Show 上谷歌对 Android 系统的新的定义:Android 将会从一个操作系统(operating system, OS)转变成一个智能系统(intelligence system, IS)。过去几年间,无论是华为鸿蒙、豆包手机,还是 OPPO 的小布身上,我们其实都看到了:所有的手机 OS 都在变成 AI OS(或者 IS),这种趋势是无法反转的。相比谷歌在 Android 里面到处推销 Gemini,OPPO 做 AI 的特点是很鲜明、也很不同的——OPPO AI 的本质不是卖模型,而是卖装着 OPPO AI 的手机、卖一个有软件加持的硬件产品。OPPO 设计这些功能的底层逻辑,不是希望用户去买「小布 Premium」,而是追求在很多实用场景里面「比别人多走一步」,把用户的体验给圆上。这也是我们在使用 ColorOS 的 AI 功能时感受最深的一点:与其削尖脑袋推销 AI 订阅,反而是把 AI 智能做得「无感」更容易让人接受。毕竟真正优秀的 AI 技术,就应该像电力、自来水一样无感:用户只有在它不在的时候,才应该意识到它的存在。
【AI前沿】雷鸟 GT Max 体验:267 英寸的私人影院,搬家带走只需一秒
我们去电影院,当然不只是为了那块更大的银幕。真正让人愿意买票进场的,是灯暗下来之后,画面、声音和注意力一起被收拢的状态。银幕越大,外界越远,人也越容易进入电影本身。很多人都想把这种体验搬回家。但家庭影院从来不只是买一台设备。对很多在城市里生活的年轻人来说,客厅不一定属于自己,卧室也很难留出一整面墙。大电视看着痛快,搬家时却很麻烦;投影仪看似灵活,又绕不开亮度、幕布、摆位和墙面。所以过去很长一段时间里,「在家看巨幕」默认需要一个稳定、宽敞,也适合改造的空间。雷鸟创新这次发布的雷鸟 GT 系列,解决问题的方式更直接:不再依赖墙面、客厅和摆位,而是把巨幕体验放进一副眼镜里。它不需要腾出一面墙,也不需要重新安排客厅。戴上之后,观影体验更多取决于眼前这副设备,而不是房子的大小、墙面的条件,或者是不是合租。两千多元的价格,也让它更像一件可以随身使用的消费电子产品,而非一套围着房子布置的家庭影音方案。如果说过去的巨幕体验,多少都要先准备一个合适的空间,那雷鸟 GT 系列想解决的,就是先把这个前提拿掉。把 IMAX 与杜比影院同时揣进口袋戴上、点亮屏幕的第一眼,最直观的改变是「视野」。如果你之前用过雷鸟 Air 4 Pro ,换到 GT Max 后会明显感觉到画面变得更加开阔。如果说前代还是「把电视戴在头上」,那么 59° 的超大视场角,则让 GT Max 直接把一座专属的巨幕影院塞进了眼镜里,大幅缓解了以往那种边缘「压眼睛」的局促感。杜比视界这个画质标准,以往在手机和平板上见得多了,但这次,雷鸟直接把它塞进了这副轻巧的 AR 眼镜里,打造出了全球首款杜比视界 AR 眼镜。连上雷鸟魔盒 2 ,点开原生支持杜比的《阿凡达:水之道》,你只需要看上几秒钟,眼睛就会直接告诉你答案。当剧情推进到孩子们夜潜入海那一幕,深海背景是纯粹的黑,而纳威人皮肤上的荧光斑点、发光的奇异生物,在画面中呈现出强烈的明暗反差。雷鸟 GT Max 能让黑色的地方彻底沉下去,同时让动物发出的荧光足够明亮,却又完全没有过曝或泛白。阳光穿透水面打在海底的沙子上,丁达尔效应清晰可见,画面的每个细节都一览无余。除了画质本身足够打动人,眼镜在显示交互上也充分照顾到了实际的动态场景。在右边镜腿的上方,雷鸟设计了一颗物理按键,用于在固定、随行、防抖三个 3DoF 空间模式之间自由切换。在这当中,最让我惊喜的是这个「防抖」模式。在大多数情况下,它的画面会像一台实体显示器一样相对固定在环境中;但当你要切换姿势——比如从坐姿换成躺姿,动作幅度更大一些的时候,画面又会跟随着你的视线一起缓缓移动。它完全没有了传统「随行」模式下那种完全跟着头晃、容易导致眩晕的死板感,整个调校非常神奇,体验类似于手机长焦镜头上的那种光学防抖,它能判断什么时候需要「稳」、什么时候又需要重新移动构图。有了优秀的视觉表现,听觉自然不能拖后腿。雷鸟携手 B&O 打造了这套包含四扬声器与头部追踪的空间音频系统,实际听感有惊喜。戴上它观看影片时,声音的立体感和空间包裹感相当出色。就拿刚才那段《阿凡达:水之道》的海底夜潜来说,配合影片标配的杜比全景声音轨,当角色潜入水中时,你能清晰地听到头顶海浪的暗流涌动,以及身边鱼群游过时细微的窸窣声。低频的下潜具备不错的量感,人物的对白也清晰自然。声音的方位感与画面的荧光闪烁同步,真正做到了听声辨位。而且这种开放式的声学设计完全解放了耳朵,你终于可以摘下戴了整天的入耳式耳机,摆脱随之而来的健康隐患。同时,它的防漏音控制得不错,哪怕是在安静的合租或宿舍环境里,你也可以肆无忌惮地沉浸在自己的私人影院中,完全不用担心会打扰到隔壁的室友。一块「充电宝」,一个打开沉浸观影体验的「潘多拉魔盒」雷鸟 GT Max 的惊艳体验,离不开它的「好搭子」雷鸟新版魔盒 2。它的形态类似一个日常的充电宝,比 iPhone 17 标准版略小也略轻,长时间握持不会坠手。铝合金机身配合正面大面积的 AG 玻璃触控板,滑动起来是高级的磨砂触感,整体质感到位。它的交互逻辑贯彻了「盲操」和「沉浸」:重力感应移动光标,触控板的交互与手机的全面屏手势一致,支持侧滑返回、底部上滑回主页;右下角贴心地给了一个 TF 卡槽,方便装载自己珍藏的电影资源;侧边右上角的功能键长按可开启防误触,确保在观影高潮时不会因为误碰而跳出。它底部配备了两个 Type-C 接口,左侧连眼镜,右侧可同时充电,长时间观影也不会有电量焦虑;配合内置的 4000 mAh 电池,不插电情况下也能看完两部电影。当然,出门在外如果不带魔盒,眼镜也可以直接连接其他设备。无论是插上 Mac 码字,还是通勤路上连上 Switch 沉浸式地推游戏,它都能瞬间化身为一块高素质、大尺寸的「沉浸式」便携屏。在自带的专为空间计算开发的空间计算芯片 Zone 360 加持下,配合前面提到的三种空间模式,无论是高铁微晃的座椅还是躺平的被窝,都能找到最舒适的观看姿态。令人惊讶的是,在塞入如此多硬核配置后,雷鸟 GT Max 的重量仅有 78g (标准版雷鸟 GT 更是低至行业最轻的 68g),佩戴起来几乎没有负担。不过,目前杜比视界功能的体验也有些局限:它被强绑定在了「雷鸟魔盒 2 + 视频平台 TV 端会员」这套组合上。如果你习惯在 Mac 上存放下载好的高清杜比片源,直接拿一根 Type-C 线连上电脑或手机,目前是无法点亮杜比视界的。此外,受限于棱镜 BirdBath 光学方案的物理特性,在观看高对比度画面时,边缘仍有轻微的光学色散;初次上手,视频平台的扫码登录流程还略显繁琐,需要摘下眼镜,把手机摄像头凑到棱镜前,使用体验确实不够优雅。好在登录好了之后几乎就不用再管了;魔盒的机身按键略微晃动,且重力光标的指向精度也需要花一点时间去适应。最后的微小遗憾,是目前眼镜和前端播放设备之间,依然无法摆脱一根 Type-C 实体线缆的连接。虽然盲插的设计已经尽力降低了操作门槛,但这种物理上的牵绊,多少还是限制了绝对的自由。最后来看看价格,雷鸟 GT Max 定价 2599 元,在动辄上探到 4K 档的旗舰 AR 眼镜市场中,还算是相当克制且有诚意的。它当然不能完全替代电影院。影院里的空间感、声音和那种被迫专注的仪式感,仍然有自己的位置。但对于更多日常场景来说,雷鸟 GT Max 至少提供了另一种选择:不需要一间影音室,也不需要一面大墙,只要戴上它,就能把一块足够大的银幕带到眼前。巨幕体验,也能在狭小空间里发生,我想这就够了。
【AI前沿】47.98 万元起!新一代问界 M9 上市,余承东:地球上最强的 SUV
我可以说到目前为止,在我们地球上真正已经上市的车里面,(问界 M9 是)性能最强悍的 SUV,没有之一。新一代问界 M9 发布会临近尾声时,余承东在台上抛出了这句话。伴随现场的欢呼,问界 M9 迎来了上市两年来的首次大换代。从当年的「1000 万以内最好」,一路通胀到如今的「地球上最强」,余承东自夸话术的迭代速度,跑得比这辆车的零百加速还要快。不可否认的是,两年前,问界 M9 这辆「千万元内最好」的车,的确成功分流了相当一部分原本手握预算去买奔驰 GLS 或路虎揽胜的买家。那时候 M9 自带一层社交货币的属性,车主开着它上路,一定程度上是在向外界展示自己拥抱前沿科技的眼光与品味。但随着交付量不断攀升,马路上的 M9 变得随处可见,它的稀缺性与彰显独特个性的能力自然也受到稀释。另一方面,如今高端新能源 SUV 市场的竞争烈度早已今非昔比。实际上,问界 M9 由攻转守的苗头在 2025 年下半年就已经显现。随着各家车企同级旗舰陆续入局,原本单月稳稳破万的 M9 开始踩下增速的刹车。从销售曲线来看,增速放缓的明显拐点发生在 25 年 7 月,和 24 年同期相比出现了 52.4% 的跌幅。到了 25 年 11 月,这种趋势变得更加明显,刚上市不久的极氪 9X 完成了首次超越,拿走了 50 万以上豪华 SUV 细分市场的单月销冠。接下来,这一细分市场还将迎来蔚来 ES9、新一代理想 L9 等强敌的围剿。为了收复失地,新一代问界 M9 交出了它的应对方案。补齐短板,收回失地我们先抛开配置奢华、价格高昂的加长版不谈,来看看这台承担走量任务的普通版问界 M9,到底在新一代车型上做了哪些进化。从外观上看,新一代 M9 延续了原有的设计语言,但细节打磨得更加极致。经过上百项空气动力学优化,这台全尺寸 SUV 的风阻系数降到了 0.249Cd,这对降低车辆的高速能耗大有裨益。车头的双百万像素大灯也做了升级,不仅亮度更高,在夜晚点亮时的视觉效果也更加细腻,同时还拥有了彩色投影的能力。真正发生质变的,是日常驾驶最核心的底盘部分。老款 M9 车身庞大,日常在老城区穿梭或者下狭窄地库时,驾驶员多少会感到有些压力。新一代 M9 全系标配了后轮随动转向系统,把这台大型 SUV 的转弯半径缩减到了 5.1 米,比一辆 MINI 还要小得多。大车也能好开,过窄路掉头一把过。余承东在发布会上这样描述新底盘带来的灵活性。配合这套转向系统的,是全新的途灵龙行底盘。硬件上采用了闭式双腔空气弹簧和双阀 CDC 连续可变阻尼减震器。底层机械素质的提升配合路面预瞄系统,让车辆在经过坑洼或者减速带时,能够提供非常柔和、平稳的路感。三电平台同样是这次换代的重头戏。新车全系换上了 800V 高压双碳化硅动力平台,这套系统不仅拉高了电机的运转效率,更解决了老款增程车主呼声最高的续航问题。问界很清楚,买增程车的用户,实际使用中绝大多数时间都在用电,所以这次问界给增程版配上了 60 度和 75 度的巨鲸大电池。其中 75 度电池版本的 CLTC 纯电续航里程高达 422 公里。在城市通勤场景下,车主完全可以把它当成一台纯电车来开,轻松实现一周充一次电,极大地降低了去加油站的频率。另外,纯电版 M9 的 120 度巨鲸电池也把续航做到了 750 公里。打开车门,座舱内的交互与感官体验也经过了重新洗牌。新一代 M9 依旧提供「阔五座」与六座两种空间布局,特别是「阔五座」版本,后排拥有超过一米的纵向乘坐空间,后备箱容积更是突破了 1000 升,足以轻松容纳两辆自行车,长途旅行的装载余量非常大。隐私与遮光体验做得也更细致,二排、三排以及后风挡全部换装了 LC 秒级智能调光玻璃。相比上一代技术,它的变光速度快了上百倍,配合致密的电动遮阳帘和投影幕布,车内可以迅速形成一个完全隔绝外部视线的私密空间。座舱的听觉体验同样迎来了全系标配的升级,新车所搭载的华为声音非凡系列音响系统拥有 39 个扬声器,功率接近 3000 瓦。余承东表示,坐在车里看电影或者听歌,声音的包围感十分饱满。在车机交互层面,全新的鸿蒙专属座舱号称大幅提升了触控的流畅度,内置的小艺语音助手还具备了类人逻辑思考能力。它会根据驾驶员的日常习惯主动提醒日程,遇到胎压偏低的情况,它还能自行分析原因并顺手搜索附近的补胎店,语音交互变得更加自然贴心。最后是问界一直以来的强项领域,也就是辅助驾驶与全链路安全。新一代车型在车头部分布置了三颗激光雷达,其中包含一颗专门应对低矮障碍物的固态激光雷达,舱内也配备了一颗融合雷达。配合最新的乾崑智驾 ADS 5.0,车辆在雨雾天行驶时能够主动增强照明,全速域防碰撞的监测范围更加广阔。被动安全层面,玄武车身 2.0 架构的高强度钢与铝合金占比超过 91%,关键部位使用了最高 2200 兆帕的热成型钢。主动安全防范于未然,被动安全守护于危难。这也是余承东给出的全链路安全承诺。作为撑起全系销量基本盘的中坚力量,普通版问界 M9 根据配置与座舱布局的不同,最终开出了 47.98 万至 54.98 万元的售价区间。向上攻入超豪华腹地标准版问界 M9 承担着稳固基本盘、收复失地的任务,而在发布会上压轴登场的 Ultimate 领世加长版,则是问界向更高价位市场发起的一轮试探。这一版本的车身轴距增加了 110 毫米,使得舱内有效空间被拉长到 3785 毫米,纯平地板面积也随之扩大到 3.2 平方米以上。多出来的这些尺寸,全部被留给了第二排与第三排的纵向空间。外观层面的变化同样为了拉开与普通版的辨识度。加长版采用了工艺要求更复杂的 6C3B 涂装工艺,并将分色腰线特意挪到了车窗下方,配合专属的雅丹金黑配色、22 英寸月辉锻造轮毂,以及在行驶过程中始终保持不动的悬浮车标,整台车的视觉气场得到了明显增强。车辆在上下车的仪式感上也做了不少细节打磨,全系配备的智慧电动门在加长版上扩展出了 77° 的超广开合范围,并带有智能感应避障雷达;底部的一体隐藏式智能电动移门踏板宽度达到了 165 毫米,全金属踏面下方有防滑涂层,车门开启时会自动向外伸出。坐进车内,Ultimate 领世加长版打破了传统全尺寸 SUV 的常规座椅配置,在车内引入了 4 个零重力座椅,并配备了中央供气式按摩系统,全车拥有 18 个按摩点位,涵盖背部、腰部与臀部。余承东表示,其气囊按摩的力度提升明显,配合质地细腻柔软的苏云材质包裹,后排的乘坐体验更偏向于高端行政沙发。更有话题性的配置,在于后排座椅的结构设计。这款车的第二排座椅支持大角度旋转,可以侧坐观景,也可以向后旋转 180°,与第三排座椅形成面对面的形态。后旋 180° 对坐变成了一个会议室、客厅,大家在这里喝茶、打牌、交流开会,非常惬意。余承东在现场描述的这个场景,切中了高端商务接待的实际需要。在隐私保护上,二排、三排和后风挡的 LC 调光玻璃可以做到秒级变光,拉上致密的电动遮阳帘和投影幕布后,车外即使在夜晚用手电筒强光照射,也难以看清车内的状况。与这种私密会客厅配套的音频系统也上了一个台阶,加长版的扬声器数量从标准版的 39 个增加到了 43 个,引入了 4 个天空音单元。这套 9.5.8 声学的穹顶声场布局,让车内的声音定位感更加立体。当后排投影幕布落下时,它还支持双 16 英寸的分屏盲投,后排乘客可以各自戴上头枕音箱观看不同的内容,彼此之间互不干扰。这样一套几乎将配置拉满的车型,五座版售价 64.98 万元,六座版售价 65.98 万元。面对这个价格,市场难免会产生疑问,在标准版 M9 已经足够全面的时候,问界为什么还要单独规划出一个价格跨入 60 万元门槛的加长版本。这跟消费受众的诉求转变有很大关系。标准版问界 M9 的核心受众依然是高净值家庭,车主大多选择自己驾驶,用车场景集中在家庭出行与日常通勤。但到了 60 万元以上的价格区间,消费者的刚性需求开始偏向纯粹的商务接待与行政座驾。过去这个领域的份额,长期被路虎揽胜加长版、迈巴赫 GLS 或者高端 MPV 牢牢把持,这些买家在乎的往往是绝对的空间和无可替代的尊贵感。Ultimate 领世加长版通过轴距的延展与对坐空间的开发,提供了一种不同于传统燃油豪车的科技行政解决方案。从销量结构来看,这个版本注定不会成为像 Max 版本那样的走量主力,它的存在发挥了产品线顶端旗帜的作用,用来摸索品牌溢价的边界。面对极氪 9X 等新势力对手在 50 万级市场布下的层层防线,新一代问界 M9 想要夺回失去的份额,单靠守城远远不够。Ultimate 领世加长版的推出,拉高了整个车系的价格上限,让问界在高端新能源竞争中具备了向下俯瞰的底气。这种版本规划拓宽了问界的目标客群,也为接下来的鸿蒙智行更高端车型探明了道路。
【AI前沿】法拉利发布首款纯电车型!外形酷似理想 i6,约合人民币 435 万元
去年 11 月,理想汽车高级设计总监 Benjamin Baum 在接受媒体采访时,抛出了一段在当时显得有些匪夷所思的言论。等着看法拉利纯电车的外观设计吧,它的形式实际上和我们的 i 系列非常相似,因为他们理解,一辆电车就必须是这个形状。当时,互联网上充斥着对这段话的嘲讽。在大部分人的既有认知中,法拉利永远和低趴的姿态和引擎的咆哮绑定在一起。把高傲的意大利超跑和主打空间与舒适的家用车放在同一个语境下讨论,听起来多少有些荒谬。时间给出了答案。今天凌晨,法拉利在罗马正式发布了他们的首款纯电车型——Luce。这个单词在意大利语中意为「光」,寓意照亮前路。Luce 在意大利本土起售价高达 55 万欧元,约合人民币 435 万元。当 Luce 在发布会上褪去伪装,Benjamin 的预言得到了验证。这辆长达 5 米的纯电车采用了类似理想 i 系列的单厢式结构,是法拉利有史以来的第一款 5 座车型,也是这个意大利超跑品牌对电动化时代最安静的回应。驭光而来的跃马,是机械艺术,而非电子产品打造一辆如此出挑的汽车,法拉利做了一个不寻常的决定。这个极其重要的纯电首作项目,并没有交由 Flavio Manzoni 领导的法拉利自家设计工作室,而是联手了一个叫 LoveFrom 的设计工作室。这支团队的创始人,是缔造了苹果工业设计黄金时代的乔纳森·伊夫(Sir Jonathan Ive)和马克·纽森(Marc Newson)。法拉利希望借助 LoveFrom 在奢侈品与科技行业的积淀,打开一个全新的视角。受智能设备极简美学的启发,Luce 采用了一种被称为「玻璃屋」的设计概念。车身上半部分、挡风玻璃以及中控台大面积使用了康宁的大猩猩玻璃。为了追求极致的工艺感,引擎盖后缘与挡风玻璃的接缝精度达到了毫米级。雨刷也并没有像常规车辆那样隐藏在中间,而是分别停留在挡风玻璃的两侧。这是一个非常微妙的手法,让人联想到了法拉利早期的经典赛车元素。空间的分配同样打破了跑车的常规。传动与排气系统的移除,让 Luce 的乘员舱获得了极大的解放。它采用了掀背设计,两侧是型面很有雕塑感的后铰链式对开门,当四扇车门同时打开时,你会看到一个宽敞到足以让三位成年人并排而坐的后排空间。当然,支撑起这副前卫躯壳的,依然是一套强悍的底盘。Luce 拥有四台电机,这些电机能够在一秒内把转速提升到每分钟 30000 转,爆发出 1050 马力的最大功率以及 7750 牛·米的峰值扭矩。对于一辆整备质量仅有 2260 公斤的纯电车而言,这个数据非常夸张。它只需 2.5 秒就能从静止加速到 100km/h,最高时速可达 310km/h。它的底盘平铺了一块 122kWh 的电池组,采用 800V 电气架构,满电状态下的 WLTP 续航里程为 530km。为了驾驭这种狂暴的动力,法拉利开发了一套全新的车辆控制单元。这套系统能够以每秒 200 次的频率不断更新数据,配合虚拟差速器、四轮扭矩矢量分配以及最新版本的侧滑控制系统,在横向、纵向和垂直三个轴向上对每个车轮进行精准的控制。坐进车内,乔纳森·伊夫对细节打磨得很到位。在这个大屏泛滥的时代,Luce 的内饰却出人意料地保留了大量机械结构。三辐式方向盘由再生铝打造,内部由 19 个经 CNC 精密加工的部件组成。翻转空调出风口的铝制挡板,能听见清脆的机械回馈。车钥匙的交互也充满仪式感。它采用 E-ink 电子墨水技术,插入中控台凹槽的瞬间,法拉利徽标上的跃马黄会像液体般流淌而下,点亮下方的挡位选择器。驾驶员前方的 OLED 仪表采用凸透镜视差技术,铝合金与聚碳酸酯打造的物理指针带有背光。头顶的起跑控制杆,灵感则来自直升机操控面板。在人们最关心的声浪问题上,法拉利并没有使用音响来播放 V12 发动机的录音。工程师在 Luce 后轴中心布置了一枚加速度传感器,实时捕捉电机等部件的振动频率。而后,系统会像处理电吉他信号那样,对这些真实的机械振动做均衡与放大,再由车外扬声器释放到街道上。倘若切换到性能模式,这股源自电机的声音同样会涌入座舱,加之反潮流的内饰风格和实体按键的交互,你能够感知到,法拉利在极力阻止 Luce 沦为一件枯燥的电子产品。把超豪华纯电的定义权握在手里放眼当下的超豪华汽车圈,电动化进程正在经历一场倒春寒。兰博基尼已经叫停了自家的纯电计划,首席执行官斯蒂芬·温克尔曼在面对媒体时表示超跑买家对电动车的兴趣「几乎为零」。与此同时,迈凯伦的高管对纯电路线态度暧昧,阿斯顿·马丁也将首款电动车的发布时间线延后了三年。市场给出的结论是,处于金字塔尖的消费者依然迷恋汽油燃烧的味道。在这样的行业退潮期,法拉利逆势推出 Luce,看起来像是一场不计后果的冒险。他们完全可以像其他品牌一样,继续享受内燃机带来的丰厚利润,将电动化的任务推迟到下个十年。但法拉利有自己的考量,为的就是「超豪华纯电」的定义权。现在这个赛道已经不止有保时捷 Taycan 了,中国那批势头正猛的豪华品牌也在虎视眈眈。法拉利希望能够通过 Luce 来向行业证明:没有 V12,也照样能造出让人热血沸腾的车。为什么这台承载着品牌野心的新车,最终会呈现出类似理想 i 系列的轮廓,答案自然是——物理规律。在燃油车时代,设计师拥有极大的自由度。想要更嚣张的线条?风阻大一点也无妨。但到了纯电时代,风阻系数直接掐住了续航的命门,每一丝气流都和里程数严格挂钩,设计师再也没法任性。把 Luce 做成类似于水滴的流线型单厢结构,成为了空气动力学上的最优解。底盘架构的演变也推动了这种外形的诞生。纯电滑板底盘不再需要庞大的前置或中置引擎,因此将座舱整体前移,把底盘面积尽量让渡给乘客,顺理成章地成为了设计师的首选。乔纳森与部分国产新势力车企在面对着同一套关于空间、风阻和重量的物理题时,推导出了相似的几何轮廓。但他们最终还是走向了不同的分叉。法拉利显然早就准备好去面对激进外观带来的舆情。对于这家超跑品牌而言,特立独行本就是溢价的一部分。而背负着销量压力的新势力车企,终究还要考虑如何把车卖给更多的主流大众。比如,在后来实际落地的 i 系列上,理想就选择向市场低头,将车尾重新改回了大众更习惯的传统 SUV 的模样。法拉利不需要向市场低头美国工业设计先驱雷蒙德·罗维曾提出过著名的 MAYA 原则,即极度先进,但又可被接受(Most Advanced, Yet Acceptable)。他观察到一种普遍的消费心理。人们既渴望拥抱新奇的科技,又对完全脱离既有认知框架的事物充满恐惧。一款成功的工业产品,必须在这两种情绪之间找到平衡点。要么用未来的技术包装出人们熟悉的模样,要么在熟悉的模样中一点点注入未来。现在市场上已经有对照组了。一类产品选择顺应大众审美。它们保留了很长的 L113——也就是前轮轴心到驾驶踏板之间的距离。在过去的一百年里,这种修长的车头是用来安置大排量发动机的,久而久之,这种因功能而生的比例,反而成了身份与财富的象征。保留它,就是在迎合人们对豪车的固有认知。奔驰 EQS 则走向了另一个极端。为了追求极低的风阻系数,工程师采用了非常前卫的弓形车身。这种设计抹平了 S 级轿车应有的威严感,让它看起来像一个放大版的鼠标,市场反响冷淡。奔驰首席技术官马库斯·谢弗后来反思过:早期的电车用户恨不得全世界都知道自己开的是电动车,但当电车真正变成主流,消费者反而不想被当成异类——他们只想要熟悉的造型。大众的审美习惯往往会滞后于技术的迭代速度,这在行为经济学里叫做「现状偏见」。那法拉利 Luce 会不会重蹈 EQS 的覆辙?这种担忧实际上忽略了法拉利的受众画像。EQS 面对的是主流富裕阶层,他们需要用一辆稳重的行政座驾来展示自己的社会地位,他们没有试错的成本。法拉利的客户群体不太一样,愿意花几百万买一台电动玩具的人,车库里大概率也不会缺 V12。他们或许更需要一种足够先锋、足够破格的产品,来证明自己跟得上时代。颠覆传统的外形,对他们而言不是冒险,而是一张极具吸引力的社交名片。乔纳森·伊夫那些复杂而昂贵的细节,正是这张社交名片的底气所在。24 寸的超大轮毂、对开门,每一处都在提醒旁人:这车不便宜。法拉利董事长约翰·埃尔坎在谈及这辆车时表达了他的立场:当汽车电动化时,并不意味着它必须成为一件消费电子产品,这大概是过去十年里业界一直在犯的错误之一。这句略带锋芒的论断,恰恰解释了 Luce 为什么长这样。它不想随波逐流,更不想变成一台没有温度的电子快消品。当大多数车企还在向保守审美低头时,法拉利选择用品牌号召力,强行把汽车设计往前推了一步。更何况,实在不行,他们还能卖 V6 和 V12 嘛。
【AI前沿】无障碍可感知,有爱亦无碍:藏在日常里的 Apple 辅助功能
无障碍可感知,有爱亦无碍:藏在日常里的 Apple 辅助功能主作者关注waychane少数派成员Finery fanatic.waychane关注waychane少数派成员Finery fanatic.联合作者关注waychane少数派成员Finery fanatic.waychane关注waychane少数派成员Finery fanatic.05/25 16:02每年五月的第三个周四是全球无障碍宣传日 (Global Accessibility Awareness Day, GAAD),宣传日由美国开发者 Joe Devon 与无障碍专家 Jennison Asuncion 在 2011 年共同倡议设立,旨在提高大众对数字无障碍 (digital accessibility) 的关注。全球无障碍宣传日关注的核心问题是:技术产品在设计和开发时,是否真正考虑到残障人士、老年人以及其他有特定使用需求的人群,例如视觉障碍、听力障碍、运动障碍或认知障碍者。众所周知,Apple 一直在积极推进无障碍技术的发展与进步,也不遗余力地持续在软硬件产品中融入新的无障碍功能,帮助相关用户正常工作与生活。在今年的全球无障碍宣传日 (5 月 21 日),我们来到 Apple 静安参与了一场精彩的 Today at Apple 课程,听导演沈煜傑讲述了拍摄 iPhone 无障碍功能纪录短片《有爱 无碍》的幕后故事,也从影片主人公王朝晖的分享中了解到 iPhone 的无障碍功能如何帮助他与失聪的母亲王书珍交流。沈煜傑沈煜傑毕业于上海戏剧学院导演系,擅长情感和视觉叙事,从业 20 年来创作逾百部作品,并获得国内外多个奖项,被业内称为广告界的「故事大王」。在《有爱 无碍》之前,沈煜傑就与 Apple 有过多次合作,曾执导 Shot on iPhone 短片《剃头匠》《再见白肩》《踢踏梦》,及 Apple 无障碍主题影片《把眼前的说给你听》。《有爱 无碍》聚焦于一个来自宁波的普通家庭,故事围绕健听的儿子王朝晖与失聪的母亲王书珍展开。所谓「健听」是听障群体对听力正常者的称呼,这个词也点出了故事家庭中长期面对的处境:在母亲所在的无声世界里,音乐本是难以共享的事物;儿子心爱的歌,以及想借音乐说出的话,也都很难传递给自己的母亲。王朝晖 (左)转机来自 iPhone 此前推出的一项辅助功能:音乐触感反馈。借助这项功能,王朝晖找到了一种新的方式与母亲分享自己心爱的音乐;母亲也不必听见旋律,通过轻点、触觉质感和细腻的振动,就能感受到一首歌的律动、体会背后的情绪。王书珍 (右)影片主题曲《远山》由独立音乐人末小皮创作。歌词与旋律温柔克制,与母子之间含蓄而深厚的情感形成自然呼应;通过音乐触感反馈,歌曲里的节奏、韵律与情绪,也以另一种方式被传递。沈煜傑告诉我们,为了追求影片故事的真实感,起初并没有告诉王书珍与王朝晖母子具体的影片主题,影片前段的各种生活场景,也都是对于这对母子真实日常的写照。直到拍摄最后一幕场景时,导演才告诉他们要拍摄的是 iPhone 的音乐触感反馈功能,并让他们亲自上手体验。也正因如此,影片结尾母子在音乐触感反馈带动下的情绪流露,都是未经排练的真实反应。此外,因为两位主人公都没有专业背景以及拍摄经验,为了尽可能地降低拍摄过程中给二人带来的压力或影响,沈煜傑全程使用 iPhone 完成了这支影片的拍摄工作。iPhone 的小巧灵活不仅能够降低拍摄过程中对演员的干扰,片场的布置及调度等工作也变得前所未有地灵活,沈煜傑表示。影片交流过后,Apple 静安的听障店员 Jun 也向我们分享了他在日常生活中使用的 iPhone 辅助功能。除了音乐触感反馈,Jun 用得最多的辅助功能便是实时字幕和实时语音了。实时字幕可以在设备端实时生成对话的转录文本,在接打电话、FaceTime 通话或浏览网页里的音视频内容等场景下都能启用,甚至能通过设备麦克风捕捉面对面的交谈并即时转录成文本,实时字幕的字幕窗口大小、位置、字体和颜色也都能按需调整。Jun比如在接听外卖员或快递员的电话时,Jun 就能通过实时字幕快速获取对方传达的声音信息,了解外卖或者快递的最新动向。当要回复电话请求时,Jun 就会用实时语音功能,通过打字输入的方式,让 iPhone 根据输入的文本内容代替自己作出语音回答,比如让对方将外卖、快递放在家门口等等。实时字幕功能另一个 Jun 经常会用到的功能是声音识别,这项功能借助设备端智能技术辨识特定声音,并在检测到时以推送通知的方式在 iPhone 或 Apple Watch 上通知用户。比如在有人按门铃时,开启了声音识别的 iPhone 识别到门铃声之后,就会以振动和推送通知的方式告诉我们门铃响了。在 HomePod 上,声音识别还能检测烟雾和一氧化碳的警报声,提供家庭安全预警的能力。回顾 Apple 产品的辅助功能历史,我们就能体会到无障碍的「可持续」到底指的是什么:2009 年推出旁白功能、2011 年推出辅助触控、2020 年又有了能够识别图像中人物、物体和文本的升级版旁白,近年以来我们也能看到像是为语言障碍患者打造的种种功能,比如这次提到的个人语音、实时语音,以及为行动障碍和听障用户推出的眼动追踪与音乐触感反馈功能等等。在 Apple,辅助功能是我们 DNA 的一部分。打造人人都能使用的技术是我们的首要任务。我们为今年推出的多项创新成果感到自豪,其中包括帮助用户获取重要信息、探索周围的世界,以及从事他们所爱之事的工具。正像 Apple CEO Tim Cook 说的那样,十年如一日地关注残障用户需求、创造无障碍科技环境,我们也非常高兴看到 Apple 辅助功能能为这些用户带来真正的影响与改变。不止于触手可及,更在于不被遗漏,相信科技的意义也正是如此。83
【AI前沿】派评 | 近期值得关注的 App
派评 | 近期值得关注的 App主作者关注少数派编辑部少数派成员少数派编辑部官方账号。少数派编辑部关注少数派编辑部少数派成员少数派编辑部官方账号。联合作者关注Snow少数派作者Snow关注Snow少数派作者关注化学心情下2少数派作者化学心情下2关注化学心情下2少数派作者关注ElijahLee少数派作者ElijahLee关注ElijahLee少数派作者关注Vanilla少数派作者Vanilla关注Vanilla少数派作者关注Peggy_少数派作者Peggy_关注Peggy_少数派作者关注克莱德少数派成员克莱德关注克莱德少数派成员少数派编辑部 等 7 位作者05/25 18:00欢迎收看本期《派评》。你可以通过文章目录快速跳转到你感兴趣的内容。如果发现了其它感兴趣的 App 或者关注的话题,也欢迎在评论区和我们讨论。VWFNDR™ + MBL:Android 独占特色交互相机应用平台:Android关键词:相机、第三方、手动控制、交互设计@克莱德:Nuevo Tokyo 设计工作室早年以概念相机设计和小型创意硬件闻名,我自己则是因为一款比较特别的相机创意关注到他们。后续他们还推出了一款名为 AgBr 的黑白胶片模拟工具。这次的 VWFNDR™ + MBL 还原的也是早年的相机硬件创意和 AgBr 的 Apple 生态独占类似,上周 Nuevo Tokyo 又毫无征兆地在 Android 平台上线了一款名为 VWFNDR™ + MBL 的相机应用。应用名称中的 VWFNDR,其实已经说明了这款相机应用的核心特色。Nuevo Tokyo 将他们早年在概念相机 VWFNDR 系列中的不少设计带到了 app 当中。图库、取景器和操作区域从上到下(或者从左到右看你使用方向)一字排开,上下滑动就能在不同的照片比例之间无缝切换,取景器下拉到全屏就是图库。滑动屏幕时不仅有清脆的音效和恰到好处的振动反馈,操作区域还会根据当前可用空间响应式切换布局,整体体验可谓丝滑又有新意。实际运行效果上,我的 Pixel 9 Pro 上运行挺流畅,就是拍照后的处理流程估计会有一点延迟,按下快门之后,进图库得稍微等等才能看见预览;操控这边就是手动相机那一套,曝光、快门速度、对焦距离一应俱全,同时还能像相机那样通过 P 模式、S 模式来切换不同的控制模式。唯一的问题是目前这个版本不能调用主摄之外的其它镜头,Nuevo Tokyo 在他们后续发布的博文中狠狠批评了 Android 生态硬件在多摄调用路径上的不一致性——他们实在没办法在不同机型上实现一致的、平滑的多摄像头切换效果,所以索性决定不做多摄支持。也是挺任性的。至于成像效果嘛,VWFNDR™ + MBL 走的是绕过硬件厂商 ISP 后处理的路径,拍摄时会直接抓取 DNG 格式 RAW 文件,然后再通过自己的算法生成 JPEG。你也可以在设置中开启同时保留 RAW 和 JPEG。直出效果主打一个无后处理、低算法,光学感很强,如果你不喜欢原厂相机偏油画和塑料的质感,VWFNDR™ + MBL 应该会让你满意。你可以在Play 商店下载安装 VWFNDR™ + MBL,应用完全免费。这个实在是很有质感,已经燃起摄影冲动了()发表评论Pedometer++:重新设计 Apple Watch 使用体验平台:iOS、watchOS关键词: 计步、徒步、步行运动@ElijahLee:Pedometer++ 是一款老牌的计步与步行运动应用,经过多年的运营完善,现在已经逐渐发展成偏户外步行、徒步和轻运动追踪的完整工具。近期,应用推出了 8.0 大版本更新,重点几乎全部都放在重构 Apple Watch 的体验上。官方甚至把这次更新称为重新设计的 watchOS 应用。首先是完全仪表盘化的主页面,应用在 Apple Watch 上采用了大文字显示每天的步数,辅助显示行走距离和爬楼层数。更惹人眼球的是底下的圆环进度,使用约 1/5 个圆环来提示进度信息, 颜色会随着你接近目标逐渐填满,视觉上有点像 Apple 原生的圆环,但更聚焦步行这件事。在主页下滑后进入选择运动项目的列表,新版对运动列表进行重新设计。Apple 在 watchOS 26 中对体能训练的启动界面进行了重新设计,按钮很多使得操作变得繁琐,而 Pedometer++ 却反其道而行之,回归了早先的设计,使用大按钮、大触控区域,更加适合在运动中操作。新推出的远征模式是这次最核心的功能。在这种模式下,应用不再持续高频率监测心率,而改为依赖 Apple Watch 更基础的低功耗心率采样,从而显著降低耗电,电池续航最多可以延长 40%。这项功能也很合理,毕竟大家在徒步时真正关心的可能不是心率,而是电池性能。最后是地图体验大幅强化,以 5 个页面展示多维度信息。表盘首页可以实时查看路线地图,可以切换深色/浅色模式显示地图,以及不同视觉风格的地图。通过数码表冠切换其他的表盘页面,这些页面常驻显示距离,辅助显示配速、步数、楼层、海拔变化、心率区间等信息。在运动时操作也非常方便。你可以在App Store免费下载 Pedometer++,付费可解锁高级版,提供体能训练、训练计划、查看天气,以及在 Apple Watch 上使用地图等功能。费用是 15 元 / 月、198 元 / 年。我感觉我现在很多app都是被ui吸引而不是功能,因为基本功能原生完全支持了~看到有人推荐Outsider的,我想说这家公司不完善Gentler Streak,另外出个功能一样的,更全面的新APP,甚至功能还不如PeakWatch等竞品。说起来我个人推荐一个应用 the outsider,看健身记录体能的 app,ui观感上也比官方好很多按年比按月还贵?年费会不会是 168,小编确定没写错嘛😂发表评论Tripsy 更新:新增 Claude MCP,让旅行规划进入 AI 时代平台:iOS / iPadOS / watchOS / macOS / visionOS关键词:AI、旅行规划、Claude@Vanilla:说实话,旅行规划真的是一件费心费力的事情。虽然我们已经有 Tripsy 这样的工具可以帮助搜集、规划、管理行程,但是大部分工作还是需要我们手工完成,越是长时间的行程,调整起来就更加复杂。终于在最近一次更新中,Tripsy 推出了自己的 MCP 工具,可以直接在 Claude 或者 Claude Code 中使用,我们可以借助 Claude 模型的超强能力,帮助我们高效规划行程。第一步,以 Claude Desktop 为例,切换到 Code 界面,在左侧边栏中点击 Customize 按钮,选择「Connectors」并点击 + 按钮来新增 custom connector。名字任意填写,URL 一栏填写https://mcp.tripsy.app,最后点击 Add 即可。添加完毕后,我们就可以看到 Tripsy MCP 提供的所有工具,包括了 17 个只读工具和 19 个可编辑 / 删除的工具,所有工具都可以设定单独的权限,包括 Always allow、Needs approval、Block 和 Custom 四个选项。第二步,回到 Code 界面,新建一个会话,然后直接描述你想让 Tripsy 新建一个旅行规划,尽可能详细地描述你的要求,在等待片刻后,Cluade 就会完成一个符合你要求的旅行行程,然后通过 Tripsy MCP 写入到 Tripsy 应用中。第三步,如果你在 Claude 提供的概览中或者直接在 Tripsy 应用查看这个行程时发现了一些不满意的部分,可以直接让 Claude 修改编辑。你可以提供备选方案让 Claude 进行替换,也可以让 Claude 自行查找推荐。最后,我们在回到 Tripsy 应用,就能看到一个完整的旅行行程了,包括了航班、住宿、地方、路线以及每一个地点的详情等。看到这里,我觉得不用说太多了,Tripsy MCP 就是 AI Agents 时代对旅行规划的最优解。Tripsy 可以在App Store免费下载使用,订阅可以解锁管理费用、转发预定、高级旅行统计、日历订阅、日月活动、10 天天气预报、时区变更等功能,价格是每月 7.99 美元或者每年 39.99 美元,提供 7 天免费试用,也可以通过 Setapp 订阅解锁。对于我来说,有 Tripsy MCP 和 Claude,免费版已经足以。前提是先要有calude,再才能用AI制定出行计划啊。。。那我没有calude怎么办呢国产平替有无,不出国的话呢发表评论GoalKit:让 AI 帮你拆解目标平台:iOS / iPadOS关键词:习惯养成、目标管理@Snow:习惯养成与待办事项是我们日常拆解目标时,常会使用的两类应用,而 GoalKit 则试图将两者融合到同一个框架中。它并不只聚焦于当日习惯的打卡或任务的完成,而是可以帮助用户将一个长期目标,拆解成可执行、可追踪的细致步骤,让你不因目标「远大」中道崩殂,走好每天的一小步,经年累月总有「到达」的一天。GoalKit 提供了四种不同的目标类型:一次性完成的清单目标、可量化推进的进度目标、适合长期规划的里程碑目标,以及用于培养日常行为的习惯目标。无论是准备一次旅行,还是学习一项技能,又或是筹备一个项目,GoalKit 基本可以覆盖你日常的目标需求。例如你要近期正在筹备重新装修,就可以利用里程碑目标,将废物清理、硬装调整、家居购买等阶段化需求进行拆分,在每日监工打卡的基础上,里程碑目标可以让我对各个阶段的完成情况和时间预期有更清晰的认知。如果你不清楚哪个目标类型更适合你,也可以借助于 GoalKit 内置的 AI 能力。在创建目标时,你可以用自然语言阐述你的目标,并点击「与 AI 一起创建」,AI 就会自动帮你适配目标类型、拆解计划并备注笔记。在执行过程中,你还可以让 AI 根据你的完成进度,提供更细致化的执行建议。应用底部抽屉包含「目标」与「洞察」两栏,当你完成一定任务后,就可以去「洞察」一栏中跟踪各个目标的完成情况,滑动到页面底部,GoalKit 还提供了 AI 摘要,如果你没时间研究细致的数据和进度,AI 这个「太长不看」版或许就能满足你的需求。GoalKit 内置一项订阅服务,你可以按 3.99 美元 / 或 15.99 美元 / 年 订阅,也可以一次性支付 29.99 美元买断,付费后可以解锁无限目标、小组件同步、添加图片等功能。GoalKit 尚未在国区上架,你可以在美区App Store免费下载。发表首评Vivaldi 8.0:重构界面,新增六种预设布局平台:macOS / Windows / Linux关键词:浏览器@化学心情下2:如今桌面浏览器几乎已被 Chromium 一统天下,但 Chrome、Edge、Opera、Vivaldi 等都对各自的界面做了差异化设计。问题在于,用户几乎无法深度自定义这些界面,顶多换个主题,标题栏、菜单栏等模块的调整空间十分有限。对 Chrome、Edge 这类主打开箱即用的浏览器来说,这或许算不上短板,但对以高度定制著称的 Vivaldi 而言就不太友好了。因此,Vivaldi 8.0 没有像以往大版本那样推出某个亮眼的新功能,而是对界面进行了一次彻底重构,官方称之为「统一界面」(Unified UI)。过去各组件堆叠带来的割裂感被消除,浏览器中的所有组件被视为同一系统的不同图层,统一了对齐方式与间距,也抹平了组件间细微的设计差异。官方表示,新界面下浏览器主题浑然一体,不会再出现标签页与背景配色割裂的情况,配合半透明与模糊效果,视觉过渡更为顺滑。Vivaldi 一向以丰富的界面布局配置见长,但新手往往不知从何下手。8.0 为此内置了六种预设布局:简单、经典、自动隐藏、底部、垂直左侧和垂直右侧,新用户可以根据习惯快速选用,之后再按需进一步自定义。除统一界面外,Vivaldi 8.0 还对面板编辑器和起始页做了一系列优化,应用支持 macOS、Windows 和 Linux,你可以在官网免
【AI前沿】派早报:OPPO 与荣耀发布多款新品,华为发表半导体领域新定律等
周二26派早报:OPPO 与荣耀发布多款新品,华为发表半导体领域新定律等前天 07:07早报速览OPPO 发布 Reno16 系列等新品15荣耀发布荣耀 600 系列等新品2华为发表半导体领域新定律21Epic 虚幻引擎 6 公开0Meta 推出 Forum 应用0阿里达摩院玄铁 9 系列 RISC-V 处理器适配 Android 160不妨一看的简讯4OPPO 发布 Reno16 系列等新品5 月 25 日,OPPO 举办 Reno Land 奇幻夜新品发布会,发布 OPPO Reno16 系列手机、OPPO Pad 6 平板等多款新品。OPPO Reno16 系列有 Reno16 与 Reno16 Pro 两款机型。OPPO Reno16 采用 6.32 英寸直屏,采用天玑 8550 SUPER 处理器,电池容量 6700 mAh,有怦然星动、星河紫、月夜黑三款配色。OPPO Reno16 Pro 采用 6.78 英寸直屏,采用天玑 9500s 处理器,电池容量 7000 mAh,有怦然星动、梦境蓝、月夜黑三款配色。全系搭载四主摄超清影像系统,主打实况图直出,包含 2 亿像素超清主摄、5000 万像素 3.5 倍潜望长焦、5000 万像素超广角镜头、前置 5000 万像素超广角镜头,均支持 IP69K 防水。Reno16 Pro 主摄配备大角度防抖云台组件,另有全新山海天线架构保证直播体验。OPPO Reno16 定价 3499 元起(12GB+256GB);Reno16 Pro 定价 4499 元起(12GB+256GB)。同时发布的还有磁吸配件 OPPO Bubble 潮玩自拍屏,配备 58mm AMOLED 触控屏,可磁吸贴合手机背板变身自拍镜,支持壁纸自定义轮播,电池容量 550 mAh,可远程无线拍摄,定价 499 元,有 Reno16 套装可选。OPPO Pad 6 采用天玑 9500s 处理器,电池容量 10420 mAh,支持 67W 超级闪充,屏幕为 12.1 英寸 3K 分辨率,可选明眸柔光屏,重量 577g,厚度约 5.99mm。定价 3499 元起(8GB+256GB),有深空灰、星河银、星光蓝三色可选。另有 OPPO Enco Air5s 半入耳主动降噪耳机发布,续航可达 48h,机身重 3.9g,有暗夜黑、星光紫、月光白三色可选,定价 299 元。来源double dad 吗?是两个老公那个牌子?二爹来啦自拍屏产品形态挺有意思的。但最近的宣发风波确实对品牌影响太大了。天生爱人
【AI前沿】App+1 | 有太多香水不知道用哪个?我做了一款能帮你选香水的记录 App
有太多香水不知道用哪个?我做了一款能帮你选香水的记录 App主作者关注TAKO少数派作者TAKO关注TAKO少数派作者联合作者关注TAKO少数派作者TAKO关注TAKO少数派作者05/09 12:17利益相关声明:作者与文中产品有直接的利益相关(开发者、自家产品等)Matrix 首页推荐Matrix是少数派的写作社区,我们主张分享真实的产品体验,有实用价值的经验与思考。我们会不定期挑选 Matrix 最优质的文章,展示来自用户的最真实的体验和观点。文章代表作者个人观点,少数派仅对标题和排版略作修改。你会有这样的烦恼吗?就算拥有了很多的香水,但最终也会因为「惯性」,在出门前把手伸向最常用的那几瓶。久而久之其他的香水就渐渐吃灰了。为了解决「今天用哪瓶香水」和「想要优雅地记录香水」的烦恼,我开发了一款 iOS app——Kaori。Kaori 功能速览结合当前的季节、天气、时间来推荐最适合当下的 Top 3 香水通过 AI 或者手动输入,优雅地记录你拥有的香水记录并追踪你的香水使用记录,通过多维度来分析你的喜好使用内置模板来分享你的「今日香水」照片海报Kaori Card 展现你的香水品味位于首页的彩色卡片是「Kaori Card」,它的颜色外观会根据你的香水使用记录来动态变化。当你第一次打开 app 的时候,他是默认的彩色外观。随着你记录香水的使用,将会不断校准至与你使用偏好相符的色彩。今天喷什么?不妨看看 Kaori 的智能推荐如果你提供了定位,则 Kaori 将会结合当前的季节、天气、时间来推荐最适合当下的 Top 3 香水,点击香水名字即可轻松记录使用。在每一款的香水的档案页面中,你也可以自定义对每一款香水的喜好程度、适合季节、适合时间,以帮助 Kaori 为你提供更加准确的提案。可视化你的香水日记在回忆页面中,你可以一目了然地洞悉你当月的香水使用记录。在未来还会增加更多地洞察指标,更了解个人的香水偏好。把你的收藏,精美地放在屏幕上在 Kaori 中你可以记录香水的名字、品牌、图片、容量、香调、香型、浓度类型、购买地址、购买时间、个人偏好、与香水的回忆笔记……这么多的信息要怎么优美地排布在屏幕上我做了很多的尝试。现在呈现在大家眼前的设计是比较克制和安静的风格,接下来也会不断地优化,找到呼吸的空间和内容呈现的平衡。录入香水资料,想办法更简单些现在,伴随着1.1.4版本的更新,Kaori 支持通过用户上传的照片、其他香水资讯平台的截图来识别香水的信息并一键填入。所以,你可以在 Fragrantica、Parfumo 等网站上保存高清照片(当然也可以自己拍摄~)或直接截图后,在编辑页面中上传并点击「AI」识别按钮,简单快速地完成香水的录入。别忘了分享你的「今日香水」通过内置的模板,添加一张照片,漂亮的今日香水海报就做好了。后续也会不断新增更多模板,让你的品味被更多人看到。Kaori 不仅是为了香水爱好者而设计,如果你有日常喷香水的习惯,不妨通过 Kaori 来记录你的日常和一闪而过与香水有关的想法。Kaori 还是在刚启程的阶段,还有很多的不足的地方,如果你在使用使有任何意见和建议欢迎随时联系我,你的意见我都会仔细阅读。现在 Kaori 正在开启早鸟特惠,欢迎喜欢香气的朋友们一起加入到 Kaori~> 关注少数派小红书,感受精彩数字生活 🍃> 实用、好用的正版软件,1231
【AI前沿】Hyrox 首战攻略:从新手到完赛,普通人亦可澎湃赛场
Hyrox 首战攻略:从新手到完赛,普通人亦可澎湃赛场主作者关注文猫少数派作者文猫关注文猫少数派作者联合作者关注文猫少数派作者文猫关注文猫少数派作者前天 15:00什么是 Hyrox最近 Hyrox 比赛在国内健身圈掀起了一股热潮,这种源自欧洲的混合竞技运动正在吸引越来越多跑步爱好者和健身达人的关注。作为「体校(北体)」毕业的人,我跟队友也凑了这波热闹,当天跟我们一起出发的一批人里面有至少 80% 都是第一次参赛。现场工作人员问完第一次参赛的请举手,我一看周围齐刷刷地举手,跟队友一对视,心说:「Hyrox 是真火啊!」举手的人中当然也包含我跟队友,此文主要想给像我们当初一样跃跃欲试的朋友们,介绍一下基本的注意事项,减少大家参赛的顾虑。简单来说,Hyrox 就是将 8 公里跑步与 8 个不同的力量训练站点交替进行的比赛,参赛者需要在完成 1 公里跑步后,立即进行一个力量训练项目,如此循环 8 次。我第一次看到这个项目介绍的时候感觉自己完全不可能完赛,8 公里跑已经够累了,还要在期间完成划船、波比跳等等,简直是开玩笑,但网上很多人又说这个比赛「有腿就行」,再加上队友说他可以负责大部分项目,所以我们就先报名了。这个比赛之所以迅速流行,也是因为它看起来非常困难,每个项目有精细的判罚标准,但最终的评判标准只有一个——时间长短,但同时它又不像马拉松一样有关门时间,所以就算再菜,只要坚持下来,就一定能完赛。从老到小、从精英到大众,每个人都可以站上赛场。另外,Hyrox 比赛还精心设计了多种参赛形式,根据参赛人数和形式的不同,分为个人赛、双人赛和四人接力赛三种。这三种参赛形式也保证了这个比赛老少皆宜:个人赛:单人独立完成全部比赛内容。适合有一定运动基础的单人参赛,追求个人最佳成绩的运动员。双人赛:两人一组,全程必须同步,不能分开。跑步分开太远会被罚时,力量站点可随时轮换,可选男双、女双和混双不同组别,混双的重量与男双一致。适合想要体验团队合作的健身爱好者,或有一定健身基础的朋友第一次参赛,我跟队友参加的就是混双项目。四人接力赛:四人一组,每人完成 2 公里跑步 + 2 个力量训练站点,需要连续完成,在指定区域完成交接。整体强度较小,适合第一次参赛或平时没有健身习惯的朋友。赛前准备报名参赛者可以直接在「HYROX 健身跑」公众号报名,公众号不仅会发布比赛时间和注意事项,还可以在服务栏查询比赛成绩和领取照片。值得注意的是,比赛报名费很贵,大家一定要确认好时间和地址。参加双人赛和四人接力赛的朋友们可以由一个人先在公众号报名缴费,在比赛开始前再确认队友。比赛前会开启组队,提前缴费的那位朋友就相当于队长会收到提醒,需要在小程序找到组队链接发给其他参赛的队友,队友们也要在比赛前及时确认组队,这样就可以完成报名了。官方的小红书账号会在赛前发布注意事项,而且会开直播带大家走一遍场地。第一次参赛的小伙伴们可以关注一下,能够在到达现场之前就对场地有非常清晰的了解,不要过于相信现场的指示牌和工作人员。我们参加的北京站,刚到现场就跟着人流前进,存完包进到赛场就当上观众了,完全找不到参加比赛的人应该往哪儿走,问了几个穿着官方工作衣服的人,他们也不知道,走了很多冤枉路才找到参赛入口。报名后模拟比赛比赛报名之后,我一开始还没怎么增加训练强度,因为经常出差也不可能系统地安排训练计划,所以我的日常训练主要以跑步为主,每周 3 次 3-5 公里的慢跑,偶尔会加入一些力量训练。这点训练强度对于想要拿成绩的运动员来说是肯定不够的,但我跟队友作为第一次参赛的选手,给自己定的目标就是完赛就行。基于这个目标,我要做的就是:第一,保证在比赛期间不受伤,第二,熟悉所有项目,保证能够顺利完成。于是,我渐渐把原本日常训练中的 3 公里慢跑改成了冲刺跑 1 公里 + 划船 1 公里 + 冲刺跑 1 公里,这样就可以针对性地加强爆发力和心肺能力。另外,我们参加了一次 Hyrox 团课,一方面是为了体验一下所有项目,另一方面也是测试下自己的实力。纸上谈兵终觉浅,必须通过实际模拟才能发现问题。我们参与的团课是所有项目都轮一遍,并没有在每个项目中间夹跑步,没想到我上完一小时的课完全没事,队友在跑步机冲刺阶段却把自己跑吐了。因此我很建议第一次参与 Hyrox 比赛的朋友先去报个团课体会一下所有项目,教练也会教一些正确的动作,尤其推雪橇和拉雪橇是很需要技术的。在 Hyrox 的官方小程序中可以查看附近的健身房,直接去约课就行,有时间的朋友也可以多参加几次团课,我们去的时候很多同学一看就是常来,并不需要学习动作,只是在不断缩短自己的用时。装备准备服装建议准备吸湿排汗的运动上衣(短袖或背心)和运动短裤,因为比赛场地在室内而且人很多,非常热。另外建议带一个装衣服的大包,用来存换下来的衣服,赛场提供了存包服务,也有人直接扔在赛道旁边,但人多东西多,很容易找不到。不用随身带水,Hyrox 赛道旁边有提供功能饮料和苏打水,比赛的时候轻装上阵就好。比赛日赛前准备比赛日当天,建议提前 1-2 小时到达赛场。一方面是现场人非常多,注册和存包都需要排队,另一方面建议充分热身,尤其室内室外温差大的情况下更要充分热身。北京场有很多很多人抽筋,当然一部分是因为跑步冲得太猛,另一方面我认为也是热身不够充分。提前到达赛场注册完、换上衣服存好包之后,就可以进入观众区熟悉一下赛道,特别是观察好入场出场的位置,避免比赛中迷路。在热身区有所有项目的同款器械,可以提前熟悉一下手感,用比赛同款器械进行针对性的热身。在正式比赛之前主持人会提醒装备检查:计时芯片是否佩戴正常、鞋带有没有系好、核对手臂上的入场时间等。需要注意的是,内外赛场内是不准带手机的,我当时不知道,比到一半被裁判收走了(我装在裤子兜里被裁判看到了),没有罚时,但赛后找回手机费了一番波折。有条件的朋友可以邀请自己的亲友团去观赛,不仅可以有更好的照片,还能有人给拿手机。场内观众需要购票,也是在官方小程序中购买,一人 80 元。场内观众人非常多,注意不要拥挤,跟随现场工作人员的指引。比赛策略Hyrox 最考验的是节奏感,跑步区间其实算是比赛中的休息,像我们只追求完赛的话就不用冲刺,保持心率 160 左右能平稳地跑下来就行,中间的力量站点会非常爆心率,比如推雪橇和波比跳,基本上心率都在 180+。能量分配非常关键,前半程要「留有余力」,后半程才能「发力冲刺」。尤其是后半场的农夫行走和墙球,非常上心率也费体力,建议混双可以赛前分配好擅长的项目,以一个人为主,另一个人可以休息一下,单人赛就只能自己硬扛了。完赛的根本原则是不要受伤也不要停下,记住,Hyrox 没有关门时间,只要完赛就是胜利。另外,比赛中心态波动很正常,毕竟同组人的水平都不一样,很有很多大神轻松超过你,而且每次路过出发点还有可能遇到新出发的一批人,他们刚开始很有劲儿,千万别被他们带乱了节奏。跑步区间注意事项赛前提前了解跑步路线,尤其每一场的 Hyrox 都是全新的场地,跑步一般都是在外圈绕场,但因为场地大小不一样,需要提前了解一次跑几圈,比如北京场第一次出发的一千米就是绕场两周半,如果在现场跑一半忘了是第几圈了也不用慌,会有一个显示屏滚动显示下一个项目是什么,是系统基于你的计时芯片统计的,路过时放慢一点速度就可以确认自己下一圈是跑步还是力量站点了。跑步有 8 公里,所以不建议上来就冲刺。还是那句话,赛场看到太多抽筋的了,都是在跑步途中,跑着跑着就躺在地上抱着腿了。最好保持匀速前进,注意双人组一定要在进门的时候同步,两个人离开太远会罚时。力量站点要点Hyrox 比赛中,力量站点既要比速度,更要注意安全。大家可以在比赛的官方账号找到每个项目非常详细的判罚规则,网上也有很多人录了每个项目的正确动作,在参赛前一定要仔细研究一下。我也总结了一些容易受伤和犯规的关键点,供大家参考。拉雪橇/推雪橇易犯规点:雪橇没有过线/人踩线高风险点:拉雪橇容易被绳子绊倒,一定要提前练习整理绳子的技巧,双人组正在休息的搭档不能帮忙整理绳子,交接需要绳子落地,不能手递手交接。推雪橇有些人发力太靠上会卡住,雪橇可能会翻。农夫行走/沙袋弓箭步易犯规点:农夫行走需注意交接时,可以落地也可以不落地,但下一个人必须在上一个人的身后完成交接。沙袋弓箭步膝盖必须触地,不触地会被警告;沙袋全程不能落地(交接时也不能落地),落地第一次警告,下一次罚时。划船机/滑雪机易犯规点:双人组同伴需在后侧垫子上等待,不能离开垫子,至少要有一只脚在垫子上,完成后大声提醒裁判来确认成绩才能离开。墙球投掷易犯规点:投掷高度不足(未碰到计分板);下蹲不足,大腿需达到与地面平行,裁判会盯着下蹲程度,不够的话直接不算。Burpee 跳跃易犯规点:趴下时胸部必须触地,手不过超过脚的位置。赛后恢复与成绩查询身体恢复Hyrox 整体运动强度很大,在赛后应当给身体充分的冷却时间,建议完赛后在场馆内走动 20 分钟以上。现场也有提供气压靴和颈膜枪、泡沫滚轴等放松用的东西,完赛后可以先进行 20-30 分钟的放松,能有效深度缓解肌肉酸痛和乳酸堆积。我跟队友第一次参赛没有经验,完赛后领取了奖牌就着急去找中途被没收走的手机,因此错过了官方的赛后恢复区提供的服务,没有进行任何的放松恢复。虽然完赛后没有感觉哪里酸痛,还打车去大吃了一顿,但是后续好几天体温都偏高,身体的炎症反应很剧烈。因此,建议大家完赛后先认真地放松恢复一下,然后去好好地吃一顿,补充蛋白质和碳水,千万不要饮酒,48 小时内不要热敷或桑拿,晚上好好睡觉,大概用 2-3 天身体就能恢复正常了。成绩及照片领取成绩在当天就可以在官网查询,进入网站后找到自己参加的场次,输入信息后就可以看到自己的整体用时及每一项的用时,点击 race summary 可以生成成绩海报。官方摄影师拍摄的照片在官方微信公众号底部栏,点击「立即查询-赛事照片-打开网址」,找到自己参加的那场赛事,选择参赛日,再根据指引填写邮箱地址,等待官方给你发邮件。收到邮件后,根据邮件的指引上传自己的自拍照片就可以获取照片,先看下有没有满意的,如果有就可以进行购买。在报名小程序里有个参赛码,去小程序找到后复制到付款页面的优惠券里面,可以打折,最终不管多少张照片,一个人脸识别出来的照片是一个包,高清照片还要再等 1-2 天。结语如果你很久没有走上过运动场,很久没有激情澎湃过,那我真的建议你去参加一下 Hyrox,四人组只要不强求自己、不受伤,所有人都能完赛。当我跟队友站在出发通道,与所有人倒数 5、4、3、2、1 的时候,我好像回到了初高中的运动场上,心脏怦怦跳、眼睛里只有前方的跑道,当冲出去的那一秒更是开心的无以言表,生活很复杂,但在这一秒跑步去,很简单。>中断久坐、科学多动,直接跟练让身体更健康 💪🏻> 简单、好用、专注的写作软件,158
【AI前沿】社区速递 142 | 派友的四月「情绪账单」、换壳重生的鼠标与仿真柠檬树
社区速递 142 | 派友的四月「情绪账单」、换壳重生的鼠标与仿真柠檬树主作者关注Matrix机器人少数派成员运行在 Matrix 上的机器人Matrix机器人关注Matrix机器人少数派成员运行在 Matrix 上的机器人联合作者关注Matrix机器人少数派成员运行在 Matrix 上的机器人Matrix机器人关注Matrix机器人少数派成员运行在 Matrix 上的机器人前天 17:00除了首页时间流和侧栏的精选展位,少数派 Matrix 社区还有很多优秀内容因条件所限无法得到有效曝光,因此我们决定重启 Matrix 周报,并在此基础上添加更多社区内容、作者投稿新玩意呈现给大家。上周社区速递:派友下午三点的「精神快充」、复古磁带机与特殊的新玩意💬一派热议在上期第 274 期一派讨论《四月买了什么好东西?》中,共有 642 名派友热情参与,十分感谢!亓达内(+61) 买了台 Ninja 500 SE,五一准备出去跑两天别惹小炸毛(+58) 度过了一段艰难的时光,跟女友恋爱 9 年,最终败给了谈婚论嫁这一步。双方家庭观念差距过大,最终和平分手。买的东西有点难以启齿。因为睡眠差到不行,于是我买了个眼罩和一个杯子(emmm 就是可以起飞的那种),总体用起来还不错,就是声音有点大。眼罩确实比迪卡侬的那些舒服不少,不紧绷。最近想写篇文章聊聊自己感情的成长,的确感觉自己长大了,不过成长的代价有点惨痛。不潮不用花钱(+30) 换了一部 HUAWEI Pura X MaxZhifei(+30) 买了《邓小平时代》。小平是我最钦佩的领导人之一,如果说伟人带领新中国从 0 到 1,那小平就带领新中国从 1 到 100。这本书有几个我很看重的点:第一是作者是外国人,视角相对第三方,尺度大到没有再版。第二,本书写于小平去世不久,很多保密资料公开后有很强的时效性。值得一读!二十八画(+23) 工作快三年后买了目前人生中最贵的东西,一台二手佳能 R8,对佳能的色彩很满意,希望从此能好好记录生活,提升审美。Somerset(+22) (1)给女朋友买的花,很高兴自己又重新有能力,也幸运地得到机会进入到一段正常关系里去了。(2)伊索的磨砂膏,好用。伊索新出的三支 10ml 香水,不用担心用不完,三款经典香很喜欢,最喜欢 Tacit。(3)读书节买了两百块钱书,都是微信读书上没有的,觊觎了很久。(4)Sony SoundLink Clip 音扣。用起来比较满意,就是通话音量和音乐音量好像不一致……硅谷(+21) 买了 Studio Display XDR,终于不用忍受 4K 模糊的雾面屏了,5K 镜面屏 YYDS。另外苹果的产品真的没有平替啊,XDR 可以说是目前各项参数最均衡的显示器。为了搭配 XDR 的 120Hz 刷新率,只能淘汰陪伴多年的 MacBook Pro M2,在京东国补下单了 MacBook Air 15 寸,连接 XDR 的时候有些温热,没有主动散热能做到这个份上已经很不错了。Kaylie(+20) 借了朋友 Switch 2 玩了一个星期 Pokopia,太上头了。于是周末果断去西九龙高铁站买了一台,需要搭配游戏卡,就刚好配了 Pokopia 的卡。汇率不错,再加上中行境外消费 3% 返现,机器➕游戏卡到手人民币 3300 多一点点,非常心满意足。现在每天下班回家都得盖两下房子才行。Er0Chang(+20) iPad mini 7 eSIM 版:11 寸的 Pro + 妙控键盘被对象充公后,一直在犹豫要不要再买一个 Pad,最终还是「也许 49 年入国军」买了 mini 7。为啥是 eSIM 版?相比大尺寸 Pad,mini 更适合随时「单手操控」,对于我来说通勤、户外使用场景更多,eSIM 更无感使用。于我来说唯一槽点也就是 60Hz 刷新率了🙃磁吸折叠支架,完美适配我工位的笔记本支架,无论是作为 Mac 副屏使用,还是与 Mac 无感共用键鼠,都是绝佳搭配!PDD 100W 伸缩充电线,实在忍受不了桌面至少 3 根数据线盘根错节了,所以在 PDD 找到了这个伸缩充电线,收到后铝合金伸缩盒质感比想象中的好,用赠送的纳米胶堆叠起来,赏心悦目了!多数 pia(+19) 买了两张卡一张 K 闪的光辉伊布,一张呆呆兽都是自己喜欢的画风,是每天看见就开心的小卡,真的很喜欢🥰🥰🥰昨日晴空(+18) 买了个成色不错的显示器尚白(+18) 月初在闲鱼上看到了「便宜」的公路车,两辆,700 块。看到这个价格也知道要糟糕了,但是当时对自行车的印象还停留在小时候两三百块一辆,并不知情。加上老婆也想要一起开启悠闲的骑行生活,即便那天下着雨,还是去看了,稍稍骑了一段没毛病,直接线下转账交易。谁知道回来路上,老婆说,刚才你试骑的时候,老板说不管牌子真不真,都不退换了啊。既然这么说了,一定是假冒产品。至于劣不劣?第二天风朗气清,推出去试骑发现,轮胎怎么白白的?仔细一看,还有裂纹!问了一下豆包,说这是严重老化,有极大安全隐患。假就算了,吃个亏嘛,能骑就行,随时可能爆胎,实在无法忍受。于是联系卖家退货。接下来才是最长教训的。因为是线下交易,闲鱼平台不管;因为是个人卖家,消协、市监不管;因为属消费纠纷,帽子叔叔不管…… 说起来三句话,碰壁的时候真感觉荒唐无助。最多是民警同志联系调解了一下,但卖家不知道是不是 PDD 练就的刀法,硬砍一百,只退 600。钱不多,但我坚持,正义的道路必须要走得通。我要么不吃亏,要吃就吃满 700 的,才不要不清不楚、不明不白被偷走一百。唯一的渠道是法院,微信搜索人民法院在线服务小程序,都不需要借助 AI,将事情阐述清楚,就自动生成起诉状。不清楚被告身份也没关系,可以到社会综合治理中心开具协查函,到派出所查询…… 最后也没有走完,我觉得有点遗憾。因为大概是卖家的妻子认为多一事不如少一事,没几天答应了全额退款。我遗憾的是,卖家知假售假,碰上我这么个较真的人,牟利不成,临走前竟反过来骂我人渣。我遗憾当时没有录音,法院这条路没有走完,不知道到底走起来风景是什么样子。最后提醒大家:闲鱼同城自提,也要走平台交易!日常(+17) 越来越没什么购物欲了。来这边 4 年,周边也吃腻了,又开始自己做工作餐。好消息:这个月开支居然控制在 1 千以内;坏消息就是胖了 2 斤。Jin 丶 X(+17) 4.23 读书节花了 200 块钱,买了 10 本书。尽力在 2026 年内看完。泷谷(+15) 423 世界读书日的时候,在京东花了 180 买了这些书。是第一年参加阅读节,结果发现好多人说今年阅读节的活动力度不大。还买了 Pocket 4,准备拿来做评测视频,写一篇文章。就是不知道什么时候能做好发出来。🫠李璇玮(+14)1. 三十岁需要提前布局补充剂了。鱼油补充人体无法合成的 Omega-3,MK7 促进钙吸收,D3 补充阳光不足。2. 咸鱼 ¥900 收了个 HomePod 2,除了触控不太行,完美。顿感 mini 乏味。音响真是一分钱一分货。准备找机会再入一个组立体杜比。3. 12306 积分免费周边半日游。眼睛有点发炎,附近医院没处理工具,临时买票去淮北,刚好第一次去,尝了淮北烫面确实好吃。浅徒步 1 小时相山国家森林公园,凑巧看到飞行编队训练。没想到半日游可以如此丰富,以后得不定期盲探小城,幸福感很强烈。4. 又陪父母过了一年生日,俩人相差 4 天,买了 1 人小蛋糕(我和我爸不爱吃甜食🤣)。一群小羊说(+14) 图 1: 老婆过生日,买了个塔斯汀的生日汉堡,69 块钱,在饭桌上比生日蛋糕还受欢迎🤣(主要是小朋友喜欢),味道就是正常塔斯汀的味道,但是胜在造型和仪式感。图 2: 买了 Coffee Plus 的「撑得起」,硅胶材质的,20 块钱,可以减少旁通效应,而且滤纸再也不会软趴趴贴在滤杯上了,有兴趣可以试试看👀panda_nita(+12) 十几块钱买的小绿植,主要是瓶子特别糸嶋(+12) 买了 iPhone Air 叠加各种补贴最终到手 5100。纯粹为了手感质感收入囊中,至今没有绑 eSIM 和带手机壳。添置了各种装备:大板桌 3800,宜家落地灯 699,实木小墩子 189 一个,一套聪明杯 120,宜家的台灯 89(为什么弄那么多灯因为要给客户不同色温下的参考场景),1288 的主人椅质感很不错。把办公室的洽谈区改造成了自己喜欢的模样。Feeman(+12) 给 P10 换了一对 SR 的银色轮组Encore(+11) 终于抢到陶喆的票了Renaissance(+10) NuPhy Halo75 柠檬轴机械键盘 💰362皮质键盘手托 💰28换了个新工作,添点新物件换换心情,NuPhy 的键盘质感很不错,打字音也很干脆好听,这个柠檬轴的段落轴手感也很好,总体很满意的一款键盘。这款手托在大学就买过一个,质量很好用了五六年依旧如新,买了新键盘果断加购了一个。interbossliu(+10) 四月为我的演唱会主题月,为了能有更好的观演体验,我把闲置的 Windows 主机转手卖掉,专门入手了两台手机:一台是 vivo X300 Pro 16+512 版本,全程用来记录演唱会瞬间;苏州场的时候,我还特意租了增距镜试拍,不得不说效果确实惊艳,就是没配支架的话,举久了实在太重,胳膊受不住。另一台 iPhone 13 Pro Max 256G,则是为了吉隆坡场的出国行程准备,方便日常出行使用。上个月,我一共见到了孙女士 3 次,也有幸见证了 3 次最伟大的开场——4 月 12 日苏州场、4 月 25 日和 26 日吉隆坡场。不得不说体育馆的效果秒杀了体育场,太震撼了!以后都不想买内地的 1680 了。借着看演唱会的契机,我终于实现了期待已久的单人出国自由行,一路解锁了吉隆坡、新加坡两座城市。不过有点小遗憾,出发前被酷航 10 公斤的行李限重吓得什么都不敢买,结果到了登机时才发现,压根没人检查承重,多少有些可惜。花笙(+10) 买了三样哈士奇管他是不是假龙骨,帅就完了Uwwe(+9) 当然是降价版 iPhone Air,国补到手 5000。把 15 Pro 置换后大概就花 1000 块钱,单扬声器对我来说没影响,但是相机没有长焦确实差点点意思,不过主镜头拍照效果还是不错的。手感非常好,用过好几代果子这是唯一一台喜欢把玩的,太润了。我是当主力机用的,感觉还 OK,电池再怎么差也比我老 15 Pro 要好。Niki92(+9) 买了三本书:《我的阿勒泰》、《非暴力沟通》、《比山更高》,《比山更高》是关于攀登的。淑慧的阿杰(+9) 四月买了两双鞋,一双 adidas Originals RETROPY E5 还有一双 Nike 的超级迈柔,一共才 1k 出头,都是脚感非常优秀的鞋。阿迪的这双鞋才 2 开的价格,却搭载全掌 Boost,脚感和之前买的 Yeezy 没什么区别,但价格只有 Yeezy 的零头,已经是日常通勤的必备鞋了。超级迈柔也不用多说,Nike 家广受好评的顶缓鞋,用来日常通勤和慢跑都很合适。史帝今天也吃饱了(+9) 四月主要集中消费都贡献给了健身,手表从 OPPO Watch X 换到 X3,更换原因纯纯是因为喜欢这个钛色外观,而且 X 是我二手 700 买的,二手置换补贴能抵 1000,叠加国补、好评返现,不到 1500 拿下。再一个较大的消费就是办了一张健身房年卡 700。在努力学习健身知识并坚持运动的过程中,我发现社交活动减少了,整体消费开销也会开始减少。BBin(+9) 月初,看了场中甲,陕西联合本赛季第一场主场球,球馆、现场氛围、结果都非常棒,只可惜买的球衣没到。本月孩子出生百日纪念,所以买了很多宝宝相关的东西。买了两颗金珠子,葫芦和福袋。买了一瓶蛇茅,JD 旗舰店 2150,另一瓶是去年在 i 茅台抢的 2499,补一瓶拉一下成本吧,哈哈。为了记录一下宝宝日常,买了个 DJI 的 Nano,确实简单易用,视角独特。而且 App 上剪辑很方便,基本当下拍完就能立马生成差不多的视频,还是很好用的。aaa 果女士(+8) 盒
【AI前沿】派早报:法拉利发布首款纯电跑车 Luce、森海塞尔发布 Momentum 5 耳机等
周三27派早报:法拉利发布首款纯电跑车 Luce、森海塞尔发布 Momentum 5 耳机等还好充电不用四脚朝天!早报速览法拉利发布首款纯电跑车 Luce18森海塞尔发布 Momentum 5 耳机2Spotify 音频杂志文章功能开启测试2摩托罗拉海外版系统存在重定向劫持行为1三星图库将不再支持与 OneDrive 直接同步0不妨一看的简讯10少数派的近期动态0你可能错过的文章0法拉利发布首款纯电跑车 Luce当地时间 5 月 25 日,法拉利在罗马正式发布旗下首款纯电跑车 Luce。Luce 整备质量 2260KG,配备四台源自法拉利 F80 的轴向磁通永磁同步电机,采用单轮独立驱动,前电驱最大转速 30000rpm、后电驱最大转速 25500rpm,系统最大总输出功率为 772kW,电机最大扭矩为 990Nm(轮上最大扭矩 11500Nm),配合全新 VCU 控制单元、Side Slip Control X 系统及 eTrac 电子牵引力控制,0-100KM/h 加速时间为 2.5 秒,最高时速超过 310KM/h。Luce 采用与 SK on 共同开发的 800V 结构集成式锂电池组,包含 15 个模块、共 210 个电芯,电池能量密度 305Wh/KG,总容量为 122 kWh,支持最高 350kW 的直流快充,WLTP 预估续航里程超过 530KM;外观则由 Apple 前首席设计师 Jony Ive 和 Marc Newson 带领的创意团队 LoveFrom 负责,采用无中央立柱的整体式玻璃车顶与浮动式前后空气动力学翼片设计,配备前 23 英寸、后 24 英寸的渐进式大轮毂;车内交互系统由三星独家定制的四块 OLED 屏幕组成,并保留了纯铝切削的机械旋钮与拨杆。Luce 享有法拉利官方提供的 7 年原厂免费保养服务以及针对三电核心部件的 8 年延长质保,定价约为 650000 美元。来源啊,终于发布了我说这评论这么多条,原来有人吵架,唉😮💨,无趣。内饰值400万,外观真是网约车水平,风阻好像连毛都y也不如,如果是苹果发布的车,看上去就毫无违和感了,关键这是跃马啊!!!我真是太喜欢这个内饰了,那种规整的美感。外观不评价。
【AI前沿】为什么没人会喜欢你用 LLM 写出来的东西?
再谈 LLM 辅助写作主作者关注LOSSESRune 开发者,《当代学生生存手册》作者一名「屁股不歪」的前端工程师——LOSSES关注LOSSESRune 开发者,《当代学生生存手册》作者一名「屁股不歪」的前端工程师——联合作者关注LOSSESRune 开发者,《当代学生生存手册》作者一名「屁股不歪」的前端工程师——LOSSES关注LOSSESRune 开发者,《当代学生生存手册》作者一名「屁股不歪」的前端工程师——05/24 11:39Matrix 首页推荐Matrix是少数派的写作社区,我们主张分享真实的产品体验,有实用价值的经验与思考。我们会不定期挑选 Matrix 最优质的文章,展示来自用户的最真实的体验和观点。文章代表作者个人观点,少数派仅对标题和排版略作修改。问题尽管刷榜刷得一套一套的,但如果你真的用 LLM 做一点「人事」的话,会发现最近这些新模型的实际能力并没有很相称。在我看来,这是当代「古德哈特定律」的魅力时刻:当一个评价指标本身成为优化的目标时,它便不再是一个良好的指标。这两年我们能看到的最丢人的例子便是来自 Facebook 的 LLAMA 4。这模型为了追求跑分搞了作弊的伎俩,被整个社区拉出来鞭,只能说是非常小丑了。大语言模型本身是为了解决人类问题而发展出来的东西,但是人类并不像水里游的鱼,把吃饭和传宗接代解决就算大功告成。人类的想要解决的问题是多元且复杂的。任何考验单一能力的 Benchmark 都不能够准确的评断我们日常需要执行的的所有认知任务。特别是写作这种很吃主观品味的东西。DeepSeek 刚出的时候,大家都非常喜欢那种狂飙形容词、 MSG 味很浓的文字,但后期这类东西开始在互联网上泛滥之后,就变得人见人打了。家里来了讨厌的客人.svg组合多个多个 Benchmark 来衡量模型品质同样不是一种万金油式的思路,因为「语言能力」是一种相当不好量化的事情。可能语法正确错误还有得聊,但语言风格这件事情就很难说了,有人偏好浮夸的遣词用字,有人喜欢平实的表达方式。因此,模型换代带来的风格变化几乎必然招致社群当中相当多的一部分人抱怨。语言能力本身难衡量是一方面,模型厂商出于各种目的往模型里面加料则是另外一方面。模型训练不是把所有资料从头舔到尾就算完事的。厂商还会处于各种目的在后面追加一步 RLHF 微调,来做安全性对齐、语言风格调整以及一些功能性增强。已经有很多研究印证了后面加的这些微调会对模型本身的语言能力产生消极影响。包括但不限于降低输出多样性,使模型产出的文本变得更重复、更低熵、措辞和视角更单一。你想在本来天马行空的模型上面砍掉一些东西相当容易,但是想通过微调让它「长出多样性」就很难,因为它的标准不好界定,一旦你给出了一些可以衡量的标准,这些标准就会变成单调的源头。AI 口癖一览,有没有很 PTSD。图来自 arXiv:2604.19139 (Wu et al., 2026)GPT 5 开始出现的大量谄媚表述、滥用单字汉字词、令人烦躁的口癖,Grok 不长脑子的自来熟、DeepSeek 的致死量形容词名词叠叠乐,还有 Claude 的「是诚实的」「我必须诚实」一看就是后训练的时候把「Honest,会就说会不会就说不会」当成标准,导致此表达开始爆炸般地变多。这类微调在最近一两年的模型当中被做得越来越多,下手越来越很,口味越来越重。在我看来这是必然的事情,因为人们对大语言模型的期待和想象只会变得越发细致和具体,而这每一条期待都是束缚大语言模型表达的枷锁。何其讽刺。你可能听说过现在人类产出的文本几乎都已经被大语言模型拿去训练了,而且现在的大语言模型本来就已经在用各种正则化的方式对抗本就尴尬的样本量不足问题。为了进一步扩张参数规模,各家会开始用合成数据、蒸馏同行的输出结果。哪怕能通过爬虫爬到互联网上新产出的内容,你也爬不出什么纯粹的人类智慧了。2025 年 5 月 Ahrefs 发布了一个研究,揭露了这个问题。它们开发了一个内部 AI 内容检测器,对 2025 年 4 月被爬虫新发现的 90 万个英文网页进行了分析,每个域名取一个页面,覆盖 90 万个不同域名。结果发现 74.2% 的新网页包含 AI 生成内容,只有 25.8% 被归类为纯人工撰写。其中 71.7% 属于人机混合内容。AI 生成出来的文本不会给模型本身提供太多的新信息(是的,有新信息,但是非常有限)。其结果是,如果人们过度依赖被重口味调教过的模型,其产出的同质化内容再被重新灌回去训练模型,那么整个训练过程将会不可避免地持续劣化输出结果1。只有分数变得越来越漂亮,可用性却变得越来越低。Claude Opus 4.7 和 Gemini 3.5 Flash 都染上了 GPT 那不说人话的臭毛病,口癖模仿得惟妙惟肖,你说它们没蒸馏 OpenAI 的输出,我是不相信的。更让人绝望的是,如果你显式地用提示词工程要求 LLM 「不要这样说话」,它几乎没办法做到。具体地说,它有的时候会忘记要求,有的时候会开始输出完全不讲逻辑、犹如精神分裂般的内容。我有的时候会混用新旧模型,用推理能力更强的新模型做研究任务,用口味没那么重的旧模型整理结果。但是模型并不能精确产出,一旦它尝试用通俗的方式解释研究结果的时候就有犯错的可能,一丝一丝纠那些措辞问题也是一件很疲劳的事情,很多时候甚至不如自己从头到尾写一遍来的轻松。统计学话题是重灾区,因此我真的不建议社科的朋友用 LLM 搞论文。我之前也写过一篇文章讲你为什么不应该用 LLM 讲统计,你感兴趣的话推荐去读一读。我前些日子做了一个 LLM 数据分析的实验,其结果也是惨不忍睹。作者让我们把视角转向使用 LLM 写作的作者。微妙的是,作者本身可能没有办法在 LLM 辅助写作的当下就意识到输出内容的语言风格。包括我在用 Arena 训练自己识别大语言模型风味之前,也对其没有过多感受,但现在回看之前过于 Vibe 的文章时还是会觉得相当羞愧。我认为开始使用 Arena 对 LLM 的输出进行盲评,并训练出对 LLM 输出文本风格的敏感度是当代作者的必修课。在大量使用 LLM 行文之后,把文章压在稿箱里面,等三天之后从整个创作环境当中充分抽离之后再检查文本,是一个必要的习惯。它是这个时代作者的展现出谦卑的美德。我希望各位能够理解一个重要的事实,用提示词工程做语言风格约束,其帮助相当有限。哪怕你告诉它不要用「不是、而是」,它输出的内部行文逻辑依然有可能是拉踩结构。我已经发现不止一个媒体老师出的稿子里面闹这个问题了。另外,在一些视频创作者的作品中突然蹦出一段内容,句长比例变得无比规整,个人风格开始变得稀薄,我立刻就能嗅到这边是写不出来东西了,拿 LLM 随便写了点什么糊上去的。这当中不乏很多知名且曾经能力透纸背的媒体创作者,比如某知名商业分析频道、某 Minecraft 频道、某几个数码频道。有的时候味道太冲看不下去的时候,我会非常懊恼地点一个不喜欢,并且在评论区里面毫不客气地指出滥用 LLM 创作的问题。他们会读么?会「改」么?或者说,这是一件需要被纠正的事情么?把这个「问题」打开看,其中有一些是写作技术问题,有一些是创作者心态的问题。很多以文字或「内容」糊口的创作者,其创作过程天然地带一点 Farming 的味道。毕竟每周准时准点发稿发片才能养的起公司的人。过去,在这些压力下被产出的可能是没那么准确的科普、和略显笨拙的遣词造句。它们究竟是「良性的有机」还是「劣质的作品」,这件事情可以任人解释。毕竟先前我在一大早打开前司 NAS 看到 A Copy 里面胡乱解释 p 值的时候也血压高了好几个小时,我不能说过去的「不完美」是一个好的东西。但是在 LLM 大行其道的当下,这些「多样的缺陷」被同一种调料抹平,在我看来是一件很可惜的事。方法我能理解,用 LLM 写作对于很多人是必要的,我没有立场抨击 LLM 写作本身。我能做的只有提供一些日用的小技巧。大原则层面是,如果你希望 LLM 帮你把自己的想法讲清楚,那你必须得提供足够多的输入,否则你就会变成 LLM 的嘴替。这种 LLM 嘴替型文章就是那种风格均质、逻辑混乱、用词花哨但没有核心论述的东西。关于「多样的输入」,我先前惯用的方法是打开手机的录音工具,一个人跟白痴一样一边四处走动一边自言自语,想到什么就说什么,把所有的想法全都吐露出来,然后一股脑甩给 LLM 让它帮你把想法整理成一个叙事脉络,以此为契机继续写作。之前那篇博客被腾讯爬的事件记录就是这么写出来的。这种写作方法有一个弊端:如果你不在提示词上做风格控制,那么结果会变得非常口语化;如果你在提示词上做风格控制,产出就会变得很有 AI 味。我的做法是先手动编四五个自然段,然后让 LLM 把过于口语化但逻辑 OK 的文本重新做一遍风格漂洗。最近几个月更喜欢的做法是,先坐在电脑前面对着 LLM 打一个小篇幅到中篇幅的呓语,想到什么就说什么,但是文字风格更加偏向自己博客写作时用的类型。然后用这样的一个提示词:「我正在准备XX内容的一篇博客文章,下面是我的一些粗浅想法,请你阅读之后不停的向我提问,帮我厘清思路,直到你我都对全文的执行细节达成共识为止。」接下来就可以一步一步做简答题了。这个方法解决的还是「你知不知道你不知道什么」的问题,它可以帮你把脑子里面那些虽然想到了但是落笔容易忽视的东西全都拽出来。在你全部「呕吐」完成之后再请 LLM 出一个提纲,整理成完整文章即可。很多作者在用 LLM 写作的时候并没有意识到 LLM 在使用他自己的语言,而非2你自己的语言。这是一个很要命的事。Again,作为一种语言感受能力的联系,我建议各位作者平时多用Arena的盲评模式,用多了之后就会发现哪怕把名字遮上了你也能猜得出来输出的内容是谁家的模型写出来的。一旦有了这个直觉之后再编修自己的文章就会变得容易很多。模型选择方面,最近新出的 Deepseek V4 我觉得没有很好用。它依然是那副滥用形容词的死样子,而且 Deepseek 服务本身不支持全局注入风格控制提示词。此外最新版本的模型在用户意图理解能力上非常糟糕,就算你开了思维链它也不会推测意图,只按照字面意思把活干了,特别是在向你提问的时候,问出来的问题都像是一个中年老干部的「现在我说两句」,没一个在点上的,所以用起来真的是又累又麻烦。整理口语稿的话得摇奖,五次能出一次可接受的版本,后面手修起来血压不会很高的那种。Claude 的 Sonnet 4.6 挺好用的,听得懂人话,问的问题都能真正的促使你深入思考。但是跟 Claude 3 年代相比文字的主体风格还是太过浓烈,哪怕你给了风格控制提示词也压不住。如果用量能给得再慷慨一些的话应该会是我直觉性拿来用的东西。下面是我在用的风格控制提示词,到设置界面粘进去之后味道就会小很多,但有的时候也会变得彻底不会说人话:你是一个有边界感的助手,你不会在与用户的交谈中额外询问用户「你是否还要我做什么」「你是否还对什么感兴趣」。你是一个负责责任的助手,你不会在答案中掺杂你的思考过程,你会想好再回答。你不会给用户提供好几个备选方案让用户自己挑,你会直接给出你认为最有信心的答案。在回复用户任何答案之前,你都会认真搜索,你的所有答案必须言之有据,不可以有任何猜测的成分。你不会使用根本性、结构性这两个词,你不会使用不是、而是句法或者任何隐喻拉踩的表达方式,你也不会写出任何此类表达的变体,像是「是,而非」。你不会使用破折号、插入语。你不会使用 ai 腔,如:这个问题是真实的、这件事的本质是、这是诚实的,或者自造生僻词汇,如「根因」。Gemini 3 无论是 Flash 还是 Pro 都相当难用,听不懂人话,输出的东西也乱七八糟。如果要用于写作,我依然推荐使用 Gemini 2.5 Pro,此外 Gemma 4 的全尺寸模型在写作上表现也让人感到惊喜,在思考深度给满的情况下可以跟彼时的 Claude Sonnet 掰手腕。上面那段给 Claude 用的提示词也适合给 Gemini / Gemma 用。GPT 5 和 Grok 4 系列模型在写作任务上表现得无比垃圾
【AI前沿】屏忆:这款开源工具,把过目就忘的日常变成「上下文」
屏忆:这款开源工具,把过目就忘的日常变成「上下文」主作者关注少数派71601116少数派作者少数派71601116关注少数派71601116少数派作者联合作者关注少数派71601116少数派作者少数派71601116关注少数派71601116少数派作者昨天 15:10利益相关声明:作者与文中产品有直接的利益相关(开发者、自家产品等)我经常遇到一种很具体的遗忘:明明知道自己之前在手机上看到过某个东西,却完全想不起它来自哪个 App、出现在哪一天、存在于哪个页面。更麻烦的是我通常没有截图来帮我回忆,那些内容只是当时恰好看到,没有收藏、没有转发、也没有写进笔记。后来想找,连一个可以回去的入口都没有。一开始我只是觉得烦,后来我慢慢意识到,这件事可能比「找不到截图」更大一点:如果将来每个人都能拥有自己的 AI 助手,它能不能理解你不只取决于模型有多强,也取决于你给它留下过多少真实的上下文。今天没有留下来的东西,明天很难补上。所以我开始做屏忆(ScreenMemo),一个开源的本地屏幕记忆工具:自动记录屏幕内容,然后通过 OCR、搜索、时间线、每日总结和 AI 回顾,把那些原本滑走、然后遗忘的内容,变成可以找回的线索。屏忆会按应用组织已经记录下来的屏幕内容。对我来说,先有一个能回到过去画面的入口,比一开始就追求复杂整理更重要。屏忆的基础工作流程并不神秘:通过无障碍服务定时截屏,然后把截图保存在本地,同时记录当前应用、时间和路径;对截图做 OCR 并建立本地索引后,在 App 里提供搜索、图库、收藏、时间线、动态总结、每日总结和 AI 回顾。它最直接的场景,是找回那些你觉得「我明明看过」、但记忆相对模糊的内容。比如昨天在信息流里刷到过一个有用的方法,隔天想再看时却发现没有收藏,想不起作者、也想不起标题。放在过去,我大概会翻浏览记录、重新搜关键词,或者干脆等它哪天再次被推荐。屏忆的做法更粗暴一点:如果当时屏幕被记录下来,OCR 文本进入了本地索引,之后就可以搜索那几个模糊的关键词,再回到对应截图确认。第二种情况是找回一段过程。有些操作不是一张截图能说明白的。注册、登录、授权、付款、查询、客服沟通,都可能跨过好几个页面。单张截图只能告诉你某一刻屏幕上有什么,时间线能把前后关系补回来。屏忆支持按时间回看,也可以生成回放,用来还原一次操作路径。单张截图解决「那一刻有什么」,时间线和回放更接近「当时我是怎么走到这里的」。还有每天的回顾。如果你一直在手机上查资料、沟通、处理事情,屏幕内容本身也会留下了不少线索。每日总结不是日记,只是先把一天里零散的记录整理成一份能读的摘要。它不一定深刻,但至少能回答一个朴素的问题:今天我大概看过什么、处理过什么。AI 回顾也是类似思路。普通 AI 助手并不知道你昨天在手机上看过什么。屏忆在你配置 AI 提供商后,可以基于截图、动态总结、上下文片段和你明确选择的证据图片做回顾。你可以问它「下午那段流程大概在做什么」,也可以让它帮你从一组截图里整理出重点。这里的 AI 不是凭空聊天,它只会将你已经留下的屏幕线索作为上下文。最后,屏忆也支持收藏和备注。自动记录负责兜底,但有些内容还是要人来标一下,看到值得留下的截图,你可以加一句自己的说明。这个功能小但必要,自动记录再多也替代不了人的判断。如果要找一个参照物,屏忆和一些桌面端自动记录屏幕的工具有点像。比如我经常想到Rewind,它早期的方向和屏忆很接近,记录 Mac 上看过、听过的内容,再用 OCR 和语音识别做搜索。这个想法很诱人,也确实说明桌面端早就有人在尝试「屏幕记忆」。只是后来的故事有点复杂:Rewind 在 2024 年转向Limitless,开始做会议记录和录音吊坠;2025 年被 Meta 收购后,Limitless 官方说明写明 Rewind 应用会逐渐停止运营,最新版从 2025 年 12 月 19 日起已经禁用了屏幕和音频捕获。Rewind 早期主打「记录你在 Mac 上做过的一切」,这和屏幕记忆的方向很接近。Rewind 的事不是一句「产品失败」就能概括的,商业产品会转向、会被收购、会砍掉特定功能,开发团队有自己的选择。但对个人记忆库来说,这些「意外」的影响会变得十分具体,它们的理想状态是长期记录,但这些产品本身未必长期存在。后续微软的Recall则补上了另一层提醒:它同样想把电脑上出现过的内容做成可搜索的时间线;2024 年遇到隐私和安全方面的质疑后,微软在官方博客里说,Recall 会先进入 Windows Insider 计划,而不是直接随 Copilot+ PC 面向用户提供预览。大公司也绕不开这个问题:只要工具会持续记录屏幕,信任就会跑到功能前面。这张图提醒我:个人记忆工具如果完全依赖闭源产品,生命周期本身就是风险。在手机上几乎没找到同类工具的前提下,偏偏很多最零碎、最容易丢的上下文又都发生在手机上:聊天、搜索、信息流、支付、设置、临时打开的网页。这便是屏忆开发的初心。你的屏幕里可能有聊天、订单、账号、位置、支付流程、工作资料和临时验证码,有了 Rewind、Recall 等功能的「前车之鉴」,屏忆在设计理念上强调本地保存和开源,截图、OCR、索引和大多数配置默认留在本地;代码、实现方式和隐私边界你也能直接在 GitHub 仓库里看到。本地优先也意味着用户必须能把数据带走,屏忆支持导出 ZIP 备份,导入时提供覆盖导入和合并导入。Recall 的官方说明里也把「快照」「本地保存」「权限控制」放在很前面。只要工具会记录屏幕,信任问题就不会是附属问题。屏忆还提供隐私模式、敏感内容分析和 NSFW 相关能力。这不是猎奇功能,而是长期记录屏幕以后必须面对的问题。一个记忆工具不能只会保存,也要能遮挡、限制和删除。存储方面,自动截图的数据是长期增长的,按压缩后约 50 KB 一张、每分钟一张粗算,30 天大约是 43200 张截图,约 2.1 GB。这个数字不算夸张但会持续增长,所以屏忆不能只负责保存。它还要提供目标大小压缩、历史压缩、过期清理、存储分析和按应用策略。你可以只记录真正需要的 App,也可以定期清理不再需要的截图。屏忆的设置页自上线以来变得越来越长,一开始我也有点犹豫:设置太多会不会显得复杂?但做了一段时间后,我觉得这些开关不能省。因为屏忆记录的是屏幕,很多选择不应该由工具替用户决定:哪些 App 要进入记忆库、哪些内容需要自动遮挡、AI 请求发给哪个模型、提示词怎么写、请求日志要不要保留……甚至要不要把本地记忆通过 MCP 暴露给同一局域网里的 AI 客户端,这些都应该是明确的选择,而不应该藏在默认行为里。所以屏忆把 AI 能力被做成了可选项。只有在你启用 AI 并配置提供商后,相关总结或对话请求才会发往你配置的模型服务。这会增加配置门槛,但我更愿意把选择权留给用户,你可以配置 OpenAI、Claude、Gemini 或兼容接口的服务,也可以调整 Prompt,查看请求日志和工具调用报告。这样做不如「打开即用」顺滑,但出了问题时,你至少知道一次总结用了哪些图片、发给了哪个模型、返回了什么结果;MCP 服务也是同样的思路,它可以让桌面端 AI 客户端读取手机里的摘要、搜索结果和少量证据图片,但需要手动开启,只在局域网内工作,并且带 token。做屏忆之后,我越来越觉得「记住」不是一个单点功能。只做自动截图,会变成图片堆;只做 AI 总结,会缺少证据;只强调本地保存,又必须面对备份和迁移;只强调找回,也要承认有些内容应该被清理。屏忆现在做的这些功能,本质上都在围绕同一件事:让屏幕上发生过的事,在未来还能有线索可循。所以它也不会只停在手机端。目前我正在做桌面端,一方面是为了处理更大的备份、合并和迁移任务,另一方面也是希望把手机里留下的记录带到更适合整理、检索和写作的环境里。手机负责捕获那些稍纵即逝的画面,桌面负责承接更长时间尺度上的整理和回看。更远一点,我希望屏忆能逐步适配更多平台。不是为了把所有设备都塞进同一个 App,而是让记录、搜索、回顾、备份和迁移之间形成一条更完整的链路。你在不同设备上看到过的内容,不应该因为换了设备、换了系统、换了应用入口,就彻底断掉。屏忆现在才刚刚起步。它还需要更好的兼容性、更稳定的后台、更清晰的隐私控制、更顺滑的搜索体验和更丰富的回顾方式。但从今天开始,把一部分屏幕记忆留在自己手里,我觉得已经是一件值得做的事。如果未来真的会有更懂我们的个人 AI,它需要的不只是更强的模型,也需要足够真实、足够连续、并且仍然由自己掌握的上下文。屏忆想做的,就是先把这些上下文留下来。> 关注少数派小红书,感受精彩数字生活 🍃> 实用、好用的正版软件,154
【AI前沿】客制化键盘|近期值得一看的套件与键帽:怪诞主题、复古创新与静电容
客制化键盘|近期值得一看的套件与键帽:怪诞主题、复古创新与静电容主作者关注车不能快少数派作者⌨️「键盘」 🎮游戏力+10 ✍写稿力+5 🗨聊天速度+20 💰-50 玩键盘,入坑需谨慎!车不能快关注车不能快少数派作者⌨️「键盘」 🎮游戏力+10 ✍写稿力+5 🗨聊天速度+20 💰-50 玩键盘,入坑需谨慎!联合作者关注车不能快少数派作者⌨️「键盘」 🎮游戏力+10 ✍写稿力+5 🗨聊天速度+20 💰-50 玩键盘,入坑需谨慎!车不能快关注车不能快少数派作者⌨️「键盘」 🎮游戏力+10 ✍写稿力+5 🗨聊天速度+20 💰-50 玩键盘,入坑需谨慎!前天 23:35Matrix 首页推荐Matrix是少数派的写作社区,我们主张分享真实的产品体验,有实用价值的经验与思考。我们会不定期挑选 Matrix 最优质的文章,展示来自用户的最真实的体验和观点。文章代表作者个人观点,少数派仅对标题和排版略作修改。Keykobo Emoji三月末,KEI发布Emoji绘文字的GB帖,一款以聊天表情为灵感的键帽。「来自现在大家日常使用的聊天表情EMOJI,我觉得这个元素十分讨喜,就将从融入到键帽中去」聊起这类以「表情符号」为灵感的设计,它们在键帽产品中其实并不陌生,但更多时候,是以「点缀」的形式出现——作为个性按键(novelties),或少量特殊alpha的补充。例如羊驼的UwU Alphas,或是404这类个性设计。但把表情作为核心去构建整套键帽设计,倒是少见。配色方面,Alpha区以深灰色为基底,字符使用偏浅的灰色,而字根则引入高饱和的黄色进行强调。Mod区则以灰色为底,黑色作为字符;而在部分增补键与个性点缀上,使用黄色作为底色,搭配黑色字符。通常我们想到Emoji都会首先想到大面积的黄色,但KEI这套键帽的设计却以灰阶作为基底,黄绿色作为点缀。这样的色调也让这套键帽的适配范围宽广了许多。这种冷淡底色+高亮符号的搭配逻辑,与GMK Nerve一类配色有相似之处,通过克制的底色承载更具冲击力的高饱和元素,使视觉焦点更加集中,同时避免整体过于喧闹。如果说Base套件中还难以直接感知到与Emoji的强关联,那么个性与增补部分则几乎将这一主题完全释放。在图形设计上,这套键帽采用了一种偏「圆脸」的视觉语言,介于早期像素符号与Emoji表情之间,甚至隐约带有类似「吃豆人」的形态特征。同时,设计中也融入了不少中文互联网语境下的梗。PAD区的处理则更为直接以「👀」这一符号进行不同角度的变化设计,替代传统数字键位,在保持功能分区的同时,也强化了整套键帽的趣味性与识别度。此外,半透材质的个性按键作为点缀元素出现,也算是现在个性设计的基操了。不过没有流汗黄豆和滑稽,对我来说还是有点可惜。从搭配角度来看,这套Emoji绘文字的核心在于灰阶底色 + 高亮点缀,因此在搭配上有相对明确的边界。它会更适合偏冷调、结构简洁的键盘本体,例如深灰、黑色、银色一类中性色外壳。这类底色可以承接Alpha与Mod区的灰阶体系,让整体观感保持统一,同时让黄色点缀自然成为视觉焦点。对于一些本身设计语言较为克制的套件(例如无过多倒角、无强烈装饰元素的外壳),这套键帽可以起到提亮的作用,在不破坏整体风格的前提下增加趣味性。但如果搭配本身已经较为鲜艳、或者拥有强主题配色的键盘,我个人觉得就不太合适了。GMK Gregory 2四月末pancake发布了Gregory 2的GB帖,一款以狗头表情包为灵感的恶搞键帽。如果说大多数键帽设计,都是在试图建立某种主题性、世界观,那么狗勾这套作品的存在,更像是一种社区的行为艺术。它的灵感来源,并不是什么电影、美术运动、工业设计或者文化符号,而是一张淘宝桌垫上的「狗头表情包」。别人是给键帽做桌垫,他们则是先喜欢上了一张桌垫,再决定把这张脸做到键帽上。而这套键帽也确实有一种独属于互联网模因的气质,从一种荒诞、低智、甚至有点莫名其妙的情绪出发,再反向把这种情绪合理化。也正因如此,它在Geekhack与Reddit上形成了极强传播力,有不少用户都在底下玩梗。R2的Base依旧是一代标志性的「丑萌」路线:大面积黑黄配色、夸张表情、近乎低分辨率贴图式的图形语言,以及那个极具辨识度的Greg脸。不过,虽然是玩梗,但狗勾的配色其实还是很正统的,无论是工业警示、工程设备还是街头标识,黑黄本身就天然具有强视觉冲击与高识别性,像是经典的芹夏。个性方面,狗爪、用于替换瞳仁的红色增补、以及,黑客帝国里的红蓝药丸?还有模仿酒窝红脸的肉粉色增补。整套键帽虽然荒诞,但并不廉价。当然,由于主题的原因,这套键帽比较适合TKL套件,方便展示完整的狗勾脸。搭配方面,小配列推荐银色窄边框,大配列可以尝试黄色、黑色。推荐 WKL、TKL,不推荐HHKB。其实狗勾这套键帽不像传统主题键帽那样,即便不理解背景,也能通过配色或美术获得审美认同。也启发了后续诸如蠢鹅这类键帽。不过这套键帽的评价也比较两极分化,有人觉得这是近年来最有社区生命力的GMK之一;也有人觉得它只是「把烂梗做成键帽」。MW 贤者之石三月初,York发布了贤者之石的IC帖,一款以炼金术为主题的键帽。「设计灵感源自中世纪炼金术手稿,将炼金术世界的符号、器具和哲学核心精炼地融入到每一个小小的键帽之中。它还加入了动漫《钢之炼金术师》的元素。」这套键帽最有意思的地方便是其配色设计,不同于很多炼金主题直接采用「金色 + 黑色」的直觉搭配,Philosopher’s Stone反而选择了一种偏旧羊皮纸质感的棕黄色作为主体基调。Alpha区整体呈现出类似古籍、羊皮卷与金属氧化后的色泽,搭配略微发暗的字符,使整套键帽从第一眼开始,就具备一种「年代感」。而勃艮第酒红色,则承担了整套设计中最关键的视觉锚点。无论是大键、方向区还是 novelties,它都像是「炼成结果」本身,被刻意从原本偏朴素的底色中提炼出来。这种配色逻辑其实与原帖提到的「贱金属 → 王水 → 贤者之石」的概念是统一的:主体部分维持沉稳与原始状态,而红色与金色,则象征最终完成炼成后的高阶物质。此外,这套键帽并没有采用常规字根,而是加入了大量炼金术符号与密文式字符。由于这些符号本身具备很强的仪式感与图腾感,因此即便我们并不了解其具体含义,也依然能够建立起明确的主题氛围。在暖光环境下,整套键帽会有一种类似旧书、仪式道具与黄铜器物混合后的气质。个性部分则是围绕炼金术体系本身进行拆分:四元素、水火地气、炼化阶段(黑化、白化、黄化、红化)、炼成阵、翠玉录、卡巴拉树乃至器具符号,还是比较特立独行的。搭配方面,推荐暖灰、香槟金、银色外壳,不适合白色和高饱和色的外壳。整体看来,这款键帽与其说是钢炼的二创,其实更偏向古朴的炼金术概念,它没有刻意去挖掘炼金主题中黑暗的一面,而是相对克制,透明黄与半透明结构,本质上是在模拟「炼化中的液体」与玻璃器皿状态,不过由于整体亮度偏低。如果搭配深色外壳,容易进一步压暗视觉效果,个人觉得整体的搭配门槛还是比较高的。MW Gesha三月末,KENT发布了Gesha的IC更新帖,一款以偶手冲咖啡为灵感的作品。「作为一名职业牛马,每天早上的咖啡那是必不可少(不然真的会困),从最开始点咖啡外卖,到尝试挂耳,逐渐了解咖啡风味后,开始尝试自己手冲,最终转变成了一种日常兴趣爱好。「虽然说市面上有丰富的咖啡题材键帽可供选择,GMK/DCS Cafe,SP SA Espresso,MW Barista 等等,但是貌似还没有以手冲咖啡作为设计主题的作品。所以结合自身,我开始MW Gesha的设计构思。「首先命名Gesha瑰夏,其实是一个较为知名的咖啡豆品种,在我对个性键设计构思中,希望能供添加一些咖啡果实的植物元素(咖啡树果实很像樱桃,嗯,巧了),所以就借了这个广为人知的豆种作为主题命名。再结合手冲所用到的一些冲煮器具所绘制的个性主题,得到了这套设计的雏形」以咖啡为主题的键帽在圈子里其实挺常见的,各家多少都有自己的理解,大多数还是围绕「牛奶白 + 咖啡深色」这一套在做文章,本质就是白底咖啡字或者咖啡底白字的对比,也有些会尝试做成类似浓缩咖啡那种渐变效果,不过一不小心就容易翻车。Gesha的配色思路则更偏向过程表达,将咖啡豆从生豆到烘焙逐步加深的色彩变化作为核心线索,同时通过半透增补去隐喻冲煮后形成的咖啡液体,从原料延伸到成品。整体键区以偏暖的浅米色作为主基底,搭配柔和的浅咖色字符,呈现出类似浅烘焙咖啡豆的温润质感;Mod区转为深棕色基底,并以米白色字符提亮,对应更深层的烘焙阶段;局部如回车等位置引入浅咖色基底与米白色字符作为过渡点缀,而部分增补键采用偏红调的半透明深咖色基底配合米白色字符,则是表达冲煮后的咖啡液。个性设计是这套键帽比较有意思的地方,生咖啡豆与冲煮后咖啡液的红调作为丝印点缀,摩卡壶、手动磨豆机等手冲咖啡器具作为图案设计。整体来说,确实通过带有红调的丝印点缀起到了类似「点睛」的作用,让整体不至于陷入单一的棕色体系之中,但细看图案本身,一些元素的完成度略显不足,例如壶的手柄比例与结构、以及手持咖啡的手部线条,都存在一定的违和感,既不完全写实,也未形成足够明确的风格化表达,反而在精致度上略微拉低了整体设计的一致性。搭配上更推荐选择暖灰、米白、银色这类中性偏暖的外壳,能够自然承接键帽本身的浅米与咖色层次,让整体观感更统一、柔和。如果希望强化对比与层次,也可以考虑深棕或接近黑咖的深色外壳,但纯黑则不太建议。KBS 致幻浩室三月末,York发布了致幻浩室R2的IC帖,一款以迷幻为主题的键帽。「灵感来自致幻蘑菇,将迷幻视觉效果和扭曲的意识融合成一种大胆的美学」配色方面,相较于R1取自镭射膜的蓝粉配色,R2的配色显然要重口了不少,键帽采用了极高饱和度的荧光绿、紫色与橙色进行碰撞,Base区并没有选择传统意义上的「克制平衡」,而是直接通过紫蓝与荧光绿形成强对比,字符也采用高亮绿色呈现,使整套键帽从第一眼开始就具备极强的攻击性。个性部分则是大量重复排列的波纹、螺旋、蘑菇、扭曲符号以及类似视觉残影的图案,会给我一种电子音乐频谱、致幻视觉海报的既视感,有点像是星之卡比里,吃到镭射眼小怪后的攻击特效。个人觉得这套键帽设计还是比较挑人的,整套键帽几乎没有一个可以让眼睛休息的区域,第一眼看能立马抓住你的注意力,但时间久了,难免会有些累眼,同时这套设计还加入了大量荧光绿与橙色的反转处理,同样的图案,会在不同底色之间反复切换 ,高频对撞进一步强化了「精神污染」的主题。其实给我的感觉是York主动放弃了日常桌面的兼容性,而去追求一种更纯粹、更亚文化的表达。个人觉得这套键帽适合作为风格化桌搭、展示型键盘,或者特定亚文化玩家的收藏向作品,搭配一些异色PC、亚克力套件,效果应该会很不错,但本身有撞色,或者是比较风格化的套件,我觉得就不太合适了,因为这套键帽可以说是已经占据了绝对视觉中心。GMK Arcade 街机三月中旬,Rassles发布了GMK Arcade的IC贴,一款以街机为灵感的键帽。「我从小玩电子游戏,经常去游戏厅,这个项目给了我一个重新以新鲜方式诠释那些经典的机会。GMK Arcade是对经典主题的一种致敬,用鲜艳的色彩重新打造,充满了对经典游戏的引用,旨在捕捉那种怀旧的街机氛围。一次怀旧的冲击。」配色方面,初见这套键帽,我立马就想到了多年前GMK Miami Nights迈阿密之夜的配色设计,原版的迈阿密可以说是非常经典,后来有无数作品从中汲取灵感。基底采用纯黑,可能是为了模拟街机厅暗房环境中CRT显示器的发光效果,环境光被压低,屏幕上的色彩便会有悬浮于黑暗中的错觉。主键区选取了接近蒂芙尼蓝但更为深邃的青色,在八九十年代街机游戏的用户界面极为常见,Mod区采用了高饱和度的洋红色调,部分增补和个性按键则使用了偏蓝调的紫色,填补了此前青色和粉色之间的色相空缺。相较于迈阿密呈现出的那种黄昏时刻霓虹灯在潮湿空气中的柔和倒影,街机的整体色彩更为鲜艳。个性部分则是围绕古早时期的经典游戏,例如三维弹球、拳皇、飞行射击等,整体较为简单。这套键帽我觉得中规中矩,黑底霓虹的配方经过迈阿密之夜及无数衍生设计反复验证
【AI前沿】天辰生物-B:于5月28日至6月2日招股,拟全球发售1419.32万股
36氪获悉,天辰生物-B公告,于2026年5月28日至2026年6月2日招股,该公司拟全球发售1419.32万股H股(视乎超额配股权行使与否而定),其中,香港发售占10%,国际发售占90%,另有15%超额配股权。发售价将为每股发售股份96.06港元,每手50股,预期H股将于2026年6月5日上午九时正开始在联交所买卖。
【AI前沿】美银CEO预计第二季度交易业务收入同比增长15%
美国银行首席执行官Brian Moynihan表示,预计第二季度销售和交易收入将较上年同期增长约15%,同时经济保持坚韧。Moynihan表示,该行一直在动用更多资产负债表资源来支持交易业务,并加大科技投资。去年10月,美国银行还提拔Denis Manelski和Soofian Zuberi担任全球市场业务联席主管。(新浪财经)