
在「大模型安全与对齐」主题论坛上,网易易盾AI算法负责人李雨珂深入解读了AIGC时代数字内容风控的核心技术,其中一项能力成为本次会议关注焦点。
作为网易易盾最新发布的重点能力——AI生成识别检测,其技术深度与应用广度备受瞩目。雨珂博士现场揭秘了底层实现原理及应用效果,其标注检测模型采用“显性标识识别+隐性标识识别”双通道,全面覆盖图片、文档、点播视频、点播音频等主流内容形态,实现从生成到传播的全链路合规管控,覆盖三大核心场景:
-
人脸伪造识别,聚焦人脸局部特征判断是否换脸,支持图像与视频检测;
-
AIGC生成图识别,通过整体特征分析辨别AI生成图像,适配图像与视频场景;
-
声纹伪造识别,针对机器语音转换、合成的音频进行检测,覆盖音频及视频中的音频内容。

技术上,依托垂直领域文本大模型、VL大模型、细粒度标签大模型、OCR大模型等基座,通过样本泛化生成、跨模态对齐等技术,目前易盾已将安全模型训练时长压缩至天级别,单标签精度显著提升,以应对日益复杂的网络环境。性能上,核心API准确率达99.8%,年过滤数据超1万亿次,精细化分类达300+,既能满足生成内容标识的法规要求,又能有效预防AI诈骗、保护隐私与版权。
关于我们

免费下载干货资料






IM即时通讯
实时对话智能体
智能硬件开发套件
音视频通话
短信
信令
直播
点播
互动白板
七鱼AI客服
客服类Agent
在线客服
科学策略中心
智能外呼
营销类Agent
问卷调研
文本检测
图片检测
音频检测
视频检测
智能审核平台
风控引擎
行为式验证码
实名核验
人脸核验
隐私合规检测
网易知数
有数BI
大数据基础平台
数据开发治理平台
指标平台
数据中台
研发智能化
智能页面生成
平台私有化定制
企业级RAG知识库
自主智能体
智能协作中枢
AI应用搭建