提示词泄露 - cmdragon's Blog

国际安全研究人员成功绕过DeepSeek V3大语言模型的安全防护机制，完整提取其核心系统提示词，揭示了大模型底层安全架构的脆弱性。泄露的提示词包含超过1500字符的行为规范，涵盖伦理准则、内容审查和任务处理三大模块。研究人员采用创新的“多 …