专栏中心

EEPW首页 > 专栏 > PromptBench:大型语言模型的对抗性基准测试

PromptBench:大型语言模型的对抗性基准测试

发布人:数据派THU 时间:2023-07-12 来源:工程师 发布文章
PromptBench是微软研究人员设计的一个用于测量大型语言模型(llm)对对抗性提示鲁棒性的基准测试。这个的工具是理解LLM的重要一步,随着这些模型在各种应用中越来越普遍,这个主题也变得越来越重要。


图片


研究及其方法论


PromptBench采用多种对抗性文本攻击,研究人员生成了4000多个对抗性提示,然后通过8个任务和13个数据集对其进行评估。这种全面的方法确保了潜在漏洞的广泛覆盖,并提供了对LLM性能的可靠评估。图片


研究结果及影响


这项研究的结果表明,当代LLM很容易受到对抗性提示的影响。这个漏洞是一个需要解决的关键问题,以确保llm在实际应用程序中的可靠性和健壮性。作为数据科学家,我们必须意识到这些漏洞,并努力开发能够抵御此类对抗性攻击的模型。
论文还提供了快速减轻这些漏洞的建议。这些建议对于任何使用大模型的人来说都是非常宝贵的,并且可以指导开发更健壮的模型。

开源代码


研究人员已经公开了研究中使用的代码、提示和方法。我们必须继续调查,在它们研究的基础上进行更深入的研究,共同努力推进模型的改进,已经包括的模型如下:

  • google/flan-t5-large
  • databricks/dolly-v1–6b
  • llama-13b
  • vicuna-13
  • cerebras/Cerebras-GPT-13B
  • EleutherAI/gpt-neox-20b
  • google/flan-ul2
  • chatgpt


论文和研究地址:https://arxiv.org/pdf/2306.04528.pdf
https://github.com/microsoft/promptbench


专栏文章内容及配图由作者撰写发布,仅供工程师学习之用,如有侵权或者其他违规问题,请联系本站处理。 联系我们

关键词: AI

相关推荐

基于Microchip MCU的AI/ML培训教程2

视频 2025-11-12

基于Microchip MCU的AI/ML培训教程1

视频 2025-11-12

CSR8670CSR8675智能语音Alexa蓝牙方案开发

资源下载 2017-12-14

前Qwen负责人林俊旸创业,目标融资规模为数亿美元

2026-05-14

被动元件新周期:AI时代高端化、服务器化重构MLCC产业格局

EEPW2018年3月刊(工业物联网)

尼吉康的事业介绍

视频 2025-07-25

EEPW2018年6月刊(5G)

资源下载 2018-06-11

PowiGaN for AI Data Centers: Unmatched Power Density and Reliability

视频 2025-12-19

AI聊天机器人能像医生一样推理吗?

重新构想AI电源:塑造AI加速的未来(第三部分)

AI/HPC新世代 COUPE光互连扮要角

网络与存储 2026-05-15

电子元件培训教材

联发科加速AI在地化应用布局

智能计算 2026-05-19

研华科技与Axelera AI深化战略合作 加速推动基于Europa平台的边缘AI创新

存储器转型AI战略资源 台厂受惠

网络与存储 2026-05-19

国家“算力网”:像用水用电一样用AI

2026-05-18

基于Microchip MCU的AI/ML培训教程3

视频 2025-11-12

思科凭借通用商用芯片与光模块赢得 AI 领域客户

更多 培训课堂
更多 焦点
更多 视频

技术专区