一图读懂 | 网易易盾解密「AI生成识别」底层技术-新闻中心

近日，中智凯灵主办的第七届 AiDD AI+研发数字化峰会 在北京完美收官。本届峰会，以“拥抱AI，重塑研发”为主题，邀请来自全球的技术专家、专家学者、科研人员展开深度对话，共同探讨AI驱动的未来变革。

随着人工智能技术在各个领域的深度渗透，AI安全正成为全球关注的焦点。为应对AI时代的潜在风险，探讨安全与伦理治理的方式策略演变，本届AiDD峰会特别开设了「大模型安全与对齐」主题论坛，网易易盾担任本次论坛的出品单位。

在「大模型安全与对齐」主题论坛上，网易易盾AI算法负责人李雨珂深入解读了AIGC时代数字内容风控的核心技术，其中一项能力成为本次会议关注焦点。

作为网易易盾最新发布的重点能力——AI生成识别检测，其技术深度与应用广度备受瞩目。雨珂博士现场揭秘了底层实现原理及应用效果，其标注检测模型采用“显性标识识别+隐性标识识别”双通道，全面覆盖图片、文档、点播视频、点播音频等主流内容形态，实现从生成到传播的全链路合规管控，覆盖三大核心场景：

人脸伪造识别，聚焦人脸局部特征判断是否换脸，支持图像与视频检测；
AIGC生成图识别，通过整体特征分析辨别AI生成图像，适配图像与视频场景；
声纹伪造识别，针对机器语音转换、合成的音频进行检测，覆盖音频及视频中的音频内容。

技术上，依托垂直领域文本大模型、VL大模型、细粒度标签大模型、OCR大模型等基座，通过样本泛化生成、跨模态对齐等技术，目前易盾已将安全模型训练时长压缩至天级别，单标签精度显著提升，以应对日益复杂的网络环境。性能上，核心API准确率达99.8%，年过滤数据超1万亿次，精细化分类达300+，既能满足生成内容标识的法规要求，又能有效预防AI诈骗、保护隐私与版权。

关于我们