色婷婷综合在线,在线日韩欧美一区二区三区,欧美日韩中文字幕在线,一区国产视频,极品嫩模,h美女漫画网站,亚洲wuma

<xmp id="s46ao"><noscript id="s46ao"></noscript>

<kbd id="s46ao"><noscript id="s46ao"></noscript></kbd>

您的位置：首頁(yè)>熱點(diǎn)推薦 >

AI打敗AI！谷歌科學(xué)家用GPT-4 擊敗AI防篡改系統(tǒng)

2023-08-01 18:10:23 來(lái)源：站長(zhǎng)之家

(資料圖)

編程客棧（）8月1日消息:Google 科學(xué)家進(jìn)行一項(xiàng)實(shí)驗(yàn)研究，他們使用 OpenAI 的 GPT-4聊天機(jī)器人來(lái)攻破其他機(jī)器學(xué)習(xí)模型的安全防護(hù)措施。這項(xiàng)實(shí)驗(yàn)證明了聊天機(jī)器人作為研究助手的價(jià)值。

具體來(lái)說(shuō)，谷歌 Deep Mind 的研究科學(xué)家 Nicholas Carlini在一篇題為“AI-Guardian 的 LLM 輔助開發(fā)”的論文中，探討了如何通過(guò)指導(dǎo) GPT-4設(shè)計(jì)攻擊方法并撰寫攻擊原理的文本，以欺騙 AI-Guardian 的防御機(jī)制。AI-Guardian 是一種防御對(duì)模型的攻擊的系統(tǒng)，旨在檢測(cè)可能被篡改的圖像以欺騙分類器。

GPT-4會(huì)發(fā)出用于調(diào)整圖像的腳本（和解釋）來(lái)欺騙分類器——例如，讓它認(rèn)為某人拿著槍的照片是某人拿著無(wú)害蘋果的照片——而不會(huì)引發(fā) AI-Guardian 的懷疑。AI-Guardian 旨在檢測(cè)圖像何時(shí)可能被操縱以欺騙分類器，而 GPT-4的任務(wù)是逃避該檢測(cè)。

通過(guò) GPT-4的幫助，攻擊者能夠成功地破解 AI-Guardian 的防御，使其從98% 的穩(wěn)健性降低到僅8%。然而，AI-Guardian 的開發(fā)者指出，這種攻擊方法可能在改進(jìn)的版本中失效。

據(jù)了解，GPT-4作為研究助手的價(jià)值在于它能夠快速生成代碼，并且不會(huì)分心或疲勞，始終可用于完成指定的任務(wù)。然而，依賴 GPT-4并不完全解除人類合作者的責(zé)任，因?yàn)樗匀恍枰祟愄峁┱_的提示并修復(fù)生成的代碼中的錯(cuò)誤。

雖然 GPT-4還存在一些限制，但隨著大型語(yǔ)言模型的改進(jìn)，它們將為計(jì)算機(jī)科學(xué)家提供更多時(shí)間來(lái)開展有趣的研究問(wèn)題。

論文地址:https://arxiv.orandroidg/abs/2307.js15008

關(guān)鍵詞：

相關(guān)閱讀

熱點(diǎn)文章

AI打敗AI！谷歌科學(xué)家用GPT-4 擊敗AI防篡改系統(tǒng)

探尋不同城市美食故事，《中國(guó)有滋味》定檔8月4日

凌雄科技發(fā)布2022年度ESG報(bào)告

未來(lái)的汽車什么樣？零跑搶先邁出一步

新車探秘丨哪吒AYA 將于8月3日上市，海鷗繽果還能頂住嗎？

顧家家居(603816.SH)：累計(jì)耗資7499.96萬(wàn)元回購(gòu)0.24%股份

殘疾夫妻烈日下四處乞討東營(yíng)救助送其回家

產(chǎn)業(yè)觀察：這朵“云”為自動(dòng)駕駛量產(chǎn)提質(zhì)加速

<blockquote id="amok6"></blockquote>