随着人工智能技术在各个领域的深度渗透,AI安全正成为全球关注的焦点。为应对AI时代的潜在风险,探讨安全与伦理治理的方式策略演变,本届AiDD峰会特别开设了「大模型安全与对齐」主题论坛。
网易易盾受邀出席本届大会,其中易盾总经理朱浩齐担任「大模型安全与对齐」论坛出品人;易盾AI算法负责人李雨珂将在现场带来主题分享——《构建大模型时代的数字内容风控体系》。
此次网易易盾出品「大模型安全与对齐」论坛,希望汇聚行业前沿智慧,与参会嘉宾共同探讨大模型安全与对齐的核心问题,推动行业形成更具操作性的安全策略与治理框架,为 AI 技术的安全、健康发展贡献重要力量,合力实现AI可信,共建创新与安全融合共生的AI未来。
本次「大模型安全与对齐」论坛嘉宾阵容如下:
邢 颖
北京邮电大学 副教授
分享主题:AI驱动的安全知识图谱自动构建与推理
聚焦安全知识图谱在漏洞挖掘与图谱优化中的应用。基于知识图谱开展漏洞挖掘研究,以CCleaner、SolarWinds等供应链攻击事件为背景,构建技术框架,应用于ATT&CK威胁建模等多场景;借助扩散模型优化知识图谱,通过去噪提升漏洞检测准确性;介绍知识图谱自动构建技术,利用大语言模型实现漏洞知识图谱自动化构建,提升效率、降低专业门槛,为开源软件供应链安全提供解决方案。
李雨珂
网易易盾 AI算法负责人
分享主题:构建大模型时代的数字内容风控体系
基于真实业务场景下的对抗性经验解析AIGC和大模型场景下的安全防御体系设计,重点剖析高可控数据生成的基础防御模型训练、融基于模态特征的对齐敏捷风险检测、基于领域大模型的动态弹性防护等创新技术模块,并展示了对抗训练体系、搭建推理算力引擎等优化关键工程实践。围绕“持续对抗-免疫强化-弹性响应”的思路,为AIGC时代数字内容治理提供可落地的算法与工程解决方案。
李文瑾
绿盟科技 天元实验室 负责人
分享主题:LLM Agent安全攻防战:从架构风险到应用实战剖析
随着LLM Agent在产业应用的快速落地,其复杂的工作流架构正面临严峻的安全挑战。本议题将系统分析LLM Agent的技术风险,结合真实场景下的LLM Copilot实际案例,展示Prompt注入攻击如何通过Agent工作流实现攻击利用。最后探讨智能化时代下Agent安全的未来趋势,为构建可信Agent系统提供可落地的安全实践参考。
关于我们
免费下载干货资料
IM即时通讯
实时对话智能体
智能硬件开发套件
音视频通话
短信
信令
直播
点播
互动白板
七鱼AI客服
客服类Agent
在线客服
科学策略中心
智能外呼
营销类Agent
问卷调研
文本检测
图片检测
音频检测
视频检测
智能审核平台
风控引擎
行为式验证码
实名核验
人脸核验
隐私合规检测
网易知数
有数BI
大数据基础平台
数据开发治理平台
指标平台
数据中台
研发智能化
智能页面生成
平台私有化定制
企业级RAG知识库
自主智能体
智能协作中枢
AI应用搭建