博客专栏

EEPW首页 > 博客 > PromptBench:大型语言模型的对抗性基准测试

PromptBench:大型语言模型的对抗性基准测试

发布人：数据派THU 时间：2023-07-12 来源：工程师

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

发布文章

PromptBench是微软研究人员设计的一个用于测量大型语言模型(llm)对对抗性提示鲁棒性的基准测试。这个的工具是理解LLM的重要一步，随着这些模型在各种应用中越来越普遍，这个主题也变得越来越重要。

研究及其方法论

PromptBench采用多种对抗性文本攻击，研究人员生成了4000多个对抗性提示，然后通过8个任务和13个数据集对其进行评估。这种全面的方法确保了潜在漏洞的广泛覆盖，并提供了对LLM性能的可靠评估。

研究结果及影响

这项研究的结果表明，当代LLM很容易受到对抗性提示的影响。这个漏洞是一个需要解决的关键问题，以确保llm在实际应用程序中的可靠性和健壮性。作为数据科学家，我们必须意识到这些漏洞，并努力开发能够抵御此类对抗性攻击的模型。
论文还提供了快速减轻这些漏洞的建议。这些建议对于任何使用大模型的人来说都是非常宝贵的，并且可以指导开发更健壮的模型。

开源代码

研究人员已经公开了研究中使用的代码、提示和方法。我们必须继续调查，在它们研究的基础上进行更深入的研究，共同努力推进模型的改进，已经包括的模型如下：

google/flan-t5-large
databricks/dolly-v1–6b
llama-13b
vicuna-13
cerebras/Cerebras-GPT-13B
EleutherAI/gpt-neox-20b
google/flan-ul2
chatgpt

论文和研究地址：https://arxiv.org/pdf/2306.04528.pdf
https://github.com/microsoft/promptbench

*博客内容为网友个人发布，仅代表博主个人观点，如有侵权请联系工作人员删除。

<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a7a83b30&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a3d98779&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=abca108c&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a1775170&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a449048b&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

关键词： AI

相关推荐

人工智能是如何帮助阻止造假者的？

谢丫丫 | 2018-08-14

Nvidia的CEO谈AI的未来：“我们将需要三台电脑... 一台来创建AI... 一台来模拟AI... 一台来运行AI”

智能计算 AI | 2024-07-31

苹果承认：AI模型使用谷歌定制芯片训练

智能计算苹果 AI 谷歌定制芯片 | 2024-07-30

海联达（Aigale）Ai-HD1 无线全高清套件拆解

zhuwei0710 | 2013-04-28

EEPW2018年3月刊(工业物联网)

资源下载工业物联网 AI | 2018-03-12

如何快速搭建手写体识别演示系统

视频 digikey AI 手写体识别 | 2022-07-29

万家乐JSYZ5-AI燃气热水器电路图

设计方案电路图热水器燃气 JSYZ5-AI 万家乐 | 2013-01-17

苹果表示其AI模型是在谷歌的定制芯片上训练的

智能计算 AI | 2024-07-30

WTC-AI型太阳能热水器电路图

设计方案电子电路图，WTC-AI 太阳能热水器电路热水器 | 2012-07-30

深圳加快打造 AI 先锋城市，今年将建成 4000PFLOPS 算力智算中心

智能计算 AI 智能计算深圳 | 2024-07-30

EEPW2018年6月刊(5G)

资源下载 5G AI | 2018-06-11

加大调整力度，教育部支持高校布局集成电路、AI 等专业

智能计算教育 AI 集成电路 | 2024-07-25

2021春晚黑科技，火爆全网的\"打工牛\"是什么来头？

视频 AI 机器人 | 2021-02-26

WTC-AI太阳能热水器电路图

设计方案 WTC-AI 太阳能热水器电路图 | 2012-07-24

瑞萨电子AI单元解决方案成功提高GE医疗（日本）日野工厂的生产力

winni945 | 2018-09-12

电子元件培训教材

资源下载 NBA 电子元件识别电阻识别电容识别 AI MI SMT DIP 静电防护 | 2008-09-20

攻击成功率从 3% 到接近 100%，利用空格键可绕过 Meta AI 模型安全系统

智能计算 Meta AI | 2024-07-31

大嘴业话-AI目前市场分析

视频人工智能，AI，ChatGPT，互联网技术 | 2023-04-25

iCAN-4017 AI功能模块

资源下载周立功单片机功能模块 iCAN-4017 AI | 2007-03-30

继上次海联达Ai-ap100拆机之电源改造

zhuwei0710 | 2013-04-03

CSR8670CSR8675智能语音Alexa蓝牙方案开发

资源下载 AI 智能语音 | 2017-12-14

“破局AI开发，释放边缘算力开发者访谈”，干货满满！

视频 intel AI OpenVINO | 2021-06-10

释说芯语16：硬科技：构建企业未来之路（附PPT）

jackwang | 2018-10-22

摩根士丹利：仅 GB200 AI 服务器业务，就为英伟达创造 2100 亿美元年收入

智能计算 GB200 AI 英伟达 GPU | 2024-07-26

iPhone 16将不会预装AI功能？计划通过iOS 18.1发布

iPhone AI iOS | 2024-07-30

AI+机器视觉成趋势，图文详解N大应用场景

智能计算安森美 AI 机器视觉 | 2024-07-31

AI驱动的嵌入式声音和振动识别

视频 ADI AI 嵌入式 OtoSense | 2018-10-23

国际奥委会：最大限度发挥 AI 工具影响力，体育人才选拔方式有望得到革新

智能计算 AI 奥运会体育 | 2024-07-26

焦点

推荐视频

更多>>

技术专区

关闭