色婷婷综合在线,在线日韩欧美一区二区三区,欧美日韩中文字幕在线,一区国产视频,极品嫩模,h美女漫画网站,亚洲wuma

您的位置:首頁>熱點(diǎn)推薦 >

AI打敗AI!谷歌科學(xué)家用GPT-4 擊敗AI防篡改系統(tǒng)

2023-08-01 18:10:23    來源:站長之家


(資料圖)

編程客棧()8月1日 消息:Google 科學(xué)家進(jìn)行一項(xiàng)實(shí)驗(yàn)研究,他們使用 OpenAI 的 GPT-4聊天機(jī)器人來攻破其他機(jī)器學(xué)習(xí)模型的安全防護(hù)措施。這項(xiàng)實(shí)驗(yàn)證明了聊天機(jī)器人作為研究助手的價(jià)值。

具體來說,谷歌 Deep Mind 的研究科學(xué)家 Nicholas Carlini在一篇題為“AI-Guardian 的 LLM 輔助開發(fā)”的論文中,探討了如何通過指導(dǎo) GPT-4設(shè)計(jì)攻擊方法并撰寫攻擊原理的文本,以欺騙 AI-Guardian 的防御機(jī)制。AI-Guardian 是一種防御對模型的攻擊的系統(tǒng),旨在檢測可能被篡改的圖像以欺騙分類器。

GPT-4會(huì)發(fā)出用于調(diào)整圖像的腳本(和解釋)來欺騙分類器——例如,讓它認(rèn)為某人拿著槍的照片是某人拿著無害蘋果的照片——而不會(huì)引發(fā) AI-Guardian 的懷疑。AI-Guardian 旨在檢測圖像何時(shí)可能被操縱以欺騙分類器,而 GPT-4的任務(wù)是逃避該檢測。

通過 GPT-4的幫助,攻擊者能夠成功地破解 AI-Guardian 的防御,使其從98% 的穩(wěn)健性降低到僅8%。然而,AI-Guardian 的開發(fā)者指出,這種攻擊方法可能在改進(jìn)的版本中失效。

據(jù)了解,GPT-4作為研究助手的價(jià)值在于它能夠快速生成代碼,并且不會(huì)分心或疲勞,始終可用于完成指定的任務(wù)。然而,依賴 GPT-4并不完全解除人類合作者的責(zé)任,因?yàn)樗匀恍枰祟愄峁┱_的提示并修復(fù)生成的代碼中的錯(cuò)誤。

雖然 GPT-4還存在一些限制,但隨著大型語言模型的改進(jìn),它們將為計(jì)算機(jī)科學(xué)家提供更多時(shí)間來開展有趣的研究問題。

論文地址:https://arxiv.orandroidg/abs/2307.js15008

關(guān)鍵詞:

相關(guān)閱讀