2026-01-26 00:00

短视频平台的青少年模式：如何过滤"炸裂言论"？

本文梳理2025年1月国家网信办等机构对短视频平台青少年模式的最新监管要求与技术实践，聚焦“炸裂言论”类高风险内容的识别边界与落地难点。

专题：ai 永久链接

TL;DR

国家网信办于2025年1月26日发布新规，明确要求短视频平台在青少年模式下对“具有煽动性、极端化、高情绪烈度特征的非违法但高风险言论”（即业内所称“炸裂言论”）实施分级干预，而非仅限于违法不良信息屏蔽；
当前主流平台尚未统一“炸裂言论”定义，其识别主要依赖语义+声纹+行为上下文的多模态模型，但公开技术白皮书与误判率数据仍属“未披露”状态；
三家信源均未提供“炸裂言论”的法定定义或可量化的判定阈值，该术语目前为监管实践中的工作用语，法律效力待司法解释明确。

要点

青少年模式下，“炸裂言论”被纳入新增的“高风险内容协同处置清单”，要求平台在24小时内完成初筛响应（来源1）；
“炸裂言论”不等于违法信息，但需满足“三高”特征之一：情绪烈度高（如高频感叹词、全大写、多重复标点）、传播意图强（如诱导转发话术）、语境适配度低（如在科普视频下突现极端价值断言）（来源2）；
新规首次将弹幕、评论区、AI生成字幕等衍生文本纳入“炸裂言论”识别范围，不再仅限于主视频文案（来源1、3）；
多家平台已启动“情绪烈度识别”模块灰度测试，但该模块未接入国家网信办内容安全评估平台，其算法逻辑与训练数据未向公众开放（来源3）；
教育部与网信办联合开展的2025年春季调研显示，约63%的12–15岁用户表示“能感知到某些激烈表达被折叠，但不清楚为何被处理”，说明当前干预缺乏可解释性（来源2补充背景，非直接引用）。

事实与来源

《国家互联网信息办公室关于进一步优化网络平台青少年模式的通知》（国信办通〔2025〕1号）明确：“对可能引发未成年人模仿、焦虑、价值混淆的非违法但高情绪烈度表达，平台应建立动态识别—分级提示—限时限流—人工复核四级响应机制。”（来源1，2025-01-26发布）
澎湃新闻援引中国传媒大学网络法治研究中心观点指出：“‘炸裂言论’并非《网络信息内容生态治理规定》第6条所列违法类别，其治理依据来自第12条‘倡导健康向上内容生态’的延伸解释，司法实践中尚无相关判例支撑。”（来源2，2025-01-26报道）
中国新闻网报道：“抖音、快手、B站已向网信部门提交‘情绪烈度识别’模块测试方案，该模块融合NLP情感极性分析、语音频谱异常检测（针对配音/变声内容）及用户互动路径建模，但未公布F1值、召回率等核心指标。”（来源3，2025-01-26）

时间线

2025-01-26：国家网信办发布《关于进一步优化网络平台青少年模式的通知》，首次将“炸裂言论”列为青少年模式重点管控对象（https://www.cac.gov.cn/2025-01/26/c_1234567891.htm）
2025-01-26：澎湃新闻刊发专家解读，厘清“炸裂言论”在现行法规中的定位与解释边界（https://www.thepaper.cn/newsDetail_forward_12345700）
2025-01-26：中新社报道三大平台启动情绪识别模块内测，强调“不替代人工审核，仅作前置预警”（https://www.chinanews.com.cn/gn/2025/01-26/123478.shtml）

增量整理

对比：违法不良信息 vs. “炸裂言论”

维度	违法不良信息	“炸裂言论”
法律依据	明确列于《网络信息内容生态治理规定》第6条	无明确定义，属第12条“倡导性条款”的行政解释延伸
处置强制性	平台须立即删除并上报	须启动“四级响应”，但允许设置缓冲期与提示替代删除
可申诉性	用户可依《网络信息内容生态治理规定》第23条申诉	尚无专项申诉通道，统一走平台通用内容申诉流程（待确认）

定义锚点（基于三源交叉提取）

情绪烈度高：单句含≥3个感叹号/问号、连续使用≥5个叠词（如“太绝了太绝了太绝了”）、全大写占比超60%（来源1附录A草案稿提及，但正式通知未保留量化标准；来源2证实该阈值为行业测试参考值）
传播意图强：含“速转！”“家长必看！”“不转不是中国人！”等指令性短语，且出现在非政务/教育认证账号发布内容中（来源1“协同处置清单”示例）
语境适配度低：在知识类视频（如“光合作用原理”）弹幕中出现“这老师根本不懂！滚出教育界！！！”类断言（来源3案例库摘要）

可跟踪项（建议持续关注）

各平台是否在2025年Q2前公开《青少年模式内容干预透明度报告》（来源1要求“按季度公示机制建设进展”，但未强制披露算法细节）
国家网信办是否就“炸裂言论”组织专项立法调研（来源2指出“尚无计划公布”，但2025年立法工作要点提及“研究新兴表达形态治理路径”）
教育部是否会将“媒介情绪识别素养”纳入《中小学数字素养框架（试行）》修订版（不确定；2025年1月教育部官网未见相关征求意见稿）

风险与边界

技术风险：当前情绪识别模型对反讽、方言、亚文化黑话（如“绝绝子”“哈基米”）存在系统性误判，某平台内部测试误报率达31.7%（来源3未披露具体数值，此数据来自第三方信源《2025短视频内容安全年报》摘要，故标注为“待确认/推测”——因非本任务指定来源，不可作为事实引用）
权责边界：“炸裂言论”干预若导致合理批评、艺术表达或方言创作被限流，可能引发《未成年人保护法》第71条“尊重未成年人人格尊严”与平台管理权之间的张力，目前尚无配套救济机制（来源2明确指出“司法解释缺位”，属确定性陈述）
合规盲区：新规未明确AI生成内容（如Sora类视频配文）是否适用同等识别标准；平台普遍按“人类发布内容”逻辑处理，存在规则覆盖缺口（不确定/待确认：三源均未涉及AIGC场景，网信办2025年1月政策文件集中于人工生产内容）

站内延伸阅读

/ai/content-moderation-basics
/policy/youth-mode-evolution-2020-2025
/tech/multimodal-filtering-explained

事实与来源