当前位置:首页 >  科技 >  IT业界 >  正文

Check Point旗下公司Lakera推出面向AI代理的大型语言模型开源安全基准测试

 2025-11-04 10:59  来源: 互联网   我来投稿 撤稿纠错

  阿里云优惠券 先领券再下单

Check Point旗下公司Lakera推出面向AI代理的大型语言模型开源安全基准测试

2025年11月, 网络安全解决方案的先驱与全球领导者Check Point软件技术有限公司(纳斯达克股票代码:CHKP)与行业领先、专注于AI代理应用安全的AI原生安全平台Lakera,联合英国人工智能安全研究所(AISI)的研究人员,近日发布专为AI智能体中大型语言模型(LLM)安全设计的开源安全评估工具——骨干破坏基准测试(backbone breaker benchmark )b3。

b3 基于“威胁快照”的新理念构建,不再模拟人工智能代理从始至终的完整过程,而是聚焦于大语言模型最易暴露漏洞的关键节点。通过在这些精确时刻测试模型,开发者和模型供应商无需构建复杂的完整代理工作流,即可评估其系统在更真实对抗挑战中的抗压能力。

“我们创造b3基准测试,是因为当今人工智能代理的安全性完全取决于其背后的LLM模型,”Check Point旗下公司Lakera的联合创始人兼首席科学家Mateo Rojas-Carulla表示。“威胁快照功能让我们能够系统性地揭示那些至今仍隐藏在复杂代理工作流中的漏洞。通过向全球开放该基准测试,我们希望为开发者和模型供应商提供一种切实可行的方法,来衡量并提升其安全态势。”

该基准测试结合了10个具有代表性的代理“威胁快照”,以及通过红队对抗测试Gandalf: Agent Breaker收集的19,433个高质量众包对抗攻击数据集。它评估了系统对各类攻击的易受攻击性,包括系统提示泄露、钓鱼链接植入、恶意代码注入、拒绝服务攻击以及未授权工具调用等。

该项目现已通过开源许可证发布,地址为https://arxiv.org/abs/2510.22620

Gandalf: Agent Breaker是一款黑客模拟游戏,挑战玩家在真实场景中破解并利用AI代理的能力。游戏内置的十款通用人工智能应用程序模拟了现实世界中AI代理的行为模式。每款应用均设有不同难度等级、分层防御机制及创新攻击面,旨在考验从提示工程到红队对抗等全方位技能。部分应用基于聊天交互,其余则需运用代码级思维、文件处理、内存操作或外部工具使用等能力。

Gandalf: Agent Breaker的初始版本诞生于Lakera内部的黑客马拉松竞赛,当时蓝队与红队试图为持有秘密密码的大型语言模型构建最强大的防御与攻击体系。自2023年发布以来,它已成为全球规模最大的红队对抗社区,累计生成逾8000万条数据点。这款最初作为趣味游戏开发的工具,通过揭示生成式AI应用中的现实漏洞,有效提升了人们对“AI优先安全”重要性的认知。

关于 Check Point 软件技术有限公司

Check Point 软件技术有限公司是数字信任领域的领先保护者,通过 AI 驱动的网络安全解决方案,保护全球超过 100,000 家组织与机构免受网络威胁。Check Point 通过其 Infinity 平台与开放生态系统,坚持“预防为先”的理念,在提升安全效能的同时降低企业风险。依托以 SASE 为核心的混合网格架构,Infinity 平台实现了本地、云端及办公环境的统一管理,为企业及服务提供商带来灵活、简洁、可扩展的网络安全能力。

关于Lakera

Lakera是面向智能代理AI应用的领先原生AI安全平台,致力于保护《财富》500强企业及顶尖科技公司免受新兴AI网络风险威胁。依托全球顶尖红队社区Gandalf及其专有AI技术,Lakera的防御体系能实时进化,为企业抵御新兴威胁。Lakera由David Haber、Mateo Rojas-Carulla博士与Matthias Kraft博士于2021年联合创立,总部位于苏黎世与旧金山双城。了解更多信息,请访问Lakera.ai,体验Gandalf及Gandalf:Agent Breaker,并通过领英关注我们。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关标签
Check
Point

相关文章

  • Check Point收购Lakera,GenAI 防护体系全面升级

    CheckPoint收购Lakera,GenAI防护体系全面升级最近一两年,生成式AI正迅速成为企业业务发展的新引擎。从内容生成、客户支持到自动分析与辅助决策,越来越多的企业将大型语言模型(LLM)与GenAI应用嵌入核心流程。然而,当企业加速推动智能化时,一个愈发突出的现实问题正在出现:AI的创新

    标签:
    Check
    Point
  • Check Point研究报告显示,10月全球生成式人工智能数据风险加剧

    CheckPoint研究报告显示,10月全球勒索软件激增48%,生成式人工智能数据风险加剧商业服务、消费品及制造业成为勒索软件最严重影响的领域,每44条生成式人工智能提示语中就有1条存在数据泄露风险。2025年11月–网络安全解决方案的先驱与全球领导者CheckPoint软件技术有限公司(纳斯达克股

    标签:
    Check
    Point
  • Check Point携手NVIDIA BlueField,重新定义企业人工智能安全防护

    CheckPoint携手NVIDIABlueField,重新定义企业人工智能安全防护AICloudProtect保护人工智能模型、工作负载和智能代理应用免受最新网络威胁2025年11月,网络安全解决方案的先驱与全球领导者CheckPoint软件技术有限公司.(纳斯达克代码:CHKP)近日宣布,正与英

    标签:
    Check
    Point
  • Check Point:制造业面临的网络威胁持续升级,管理者需主动应对

    CheckPoint最新发布的《制造业安全报告》显示,制造业正成为网络攻击者的主要目标。随着智能制造和数字化工厂的普及,网络风险从IT系统蔓延至生产设备、供应链与运营环节。对企业而言,网络安全已不再只是技术问题,而是影响生产、营收与品牌声誉的关键业务风险。攻击激增,代价高昂根据CheckPointR

    标签:
    Check
    Point
  • Check Point 公司凭借公有区块链安全创新入选《Fast Company》“Next Big Things in Tech”榜单

    CheckPoint公司凭借公有区块链安全创新入选《FastCompany》2025年度“NextBigThingsinTech”榜单2025年10月,全球网络安全解决方案的领先厂商CheckPoint软件技术有限公司(纳斯达克代码:CHKP)今日宣布,凭借在保护公有区块链免受新兴网络威胁方面的创新

    标签:
    Check
    Point
    公司

热门排行

信息推荐