色婷婷综合在线,在线日韩欧美一区二区三区,欧美日韩中文字幕在线,一区国产视频,极品嫩模,h美女漫画网站,亚洲wuma

您的位置:首頁>熱點推薦 >

AI打敗AI!谷歌科學家用GPT-4 擊敗AI防篡改系統(tǒng)

2023-08-01 18:10:23    來源:站長之家


(資料圖)

編程客棧()8月1日 消息:Google 科學家進行一項實驗研究,他們使用 OpenAI 的 GPT-4聊天機器人來攻破其他機器學習模型的安全防護措施。這項實驗證明了聊天機器人作為研究助手的價值。

具體來說,谷歌 Deep Mind 的研究科學家 Nicholas Carlini在一篇題為“AI-Guardian 的 LLM 輔助開發(fā)”的論文中,探討了如何通過指導 GPT-4設計攻擊方法并撰寫攻擊原理的文本,以欺騙 AI-Guardian 的防御機制。AI-Guardian 是一種防御對模型的攻擊的系統(tǒng),旨在檢測可能被篡改的圖像以欺騙分類器。

GPT-4會發(fā)出用于調(diào)整圖像的腳本(和解釋)來欺騙分類器——例如,讓它認為某人拿著槍的照片是某人拿著無害蘋果的照片——而不會引發(fā) AI-Guardian 的懷疑。AI-Guardian 旨在檢測圖像何時可能被操縱以欺騙分類器,而 GPT-4的任務是逃避該檢測。

通過 GPT-4的幫助,攻擊者能夠成功地破解 AI-Guardian 的防御,使其從98% 的穩(wěn)健性降低到僅8%。然而,AI-Guardian 的開發(fā)者指出,這種攻擊方法可能在改進的版本中失效。

據(jù)了解,GPT-4作為研究助手的價值在于它能夠快速生成代碼,并且不會分心或疲勞,始終可用于完成指定的任務。然而,依賴 GPT-4并不完全解除人類合作者的責任,因為它仍然需要人類提供正確的提示并修復生成的代碼中的錯誤。

雖然 GPT-4還存在一些限制,但隨著大型語言模型的改進,它們將為計算機科學家提供更多時間來開展有趣的研究問題。

論文地址:https://arxiv.orandroidg/abs/2307.js15008

關鍵詞:

相關閱讀

衡南县| 高唐县| 房山区| 阳春市| 土默特右旗| 平阳县| 正阳县| 伽师县| 江都市| 梓潼县| 开平市| 江口县| 乌拉特后旗| 增城市| 宁安市| 张家口市| 盘锦市| 辽宁省| 屏南县| 疏勒县| 沈阳市| 石柱| 疏附县| 揭西县| 亚东县| 青州市| 平湖市| 抚顺市| 黄山市| 二连浩特市| 抚远县| 当涂县| 贺兰县| 吉林市| 平利县| 阳山县| 延津县| 余干县| 盐源县| 衡东县| 临武县|