DeepSeek,Wind指數(shù)7個交易日漲58%以上,成為最快突破3000萬日活躍用戶量的應(yīng)用程序,因獨特的技術(shù)路徑與算法創(chuàng)新引起行業(yè)關(guān)注,因高性價比、優(yōu)異性能與開源被開發(fā)者青睞,因帶來類似勸降ChatGPT等等故事甚至成了大眾話題……
DeepSeek熱度持續(xù)狂飆,被亞馬遜云科技等云廠商陸續(xù)部署在自家的云服務(wù)上,向用戶提供當(dāng)下極具性價比的高效工具之一,助力千行百業(yè)獲得AI新質(zhì)生產(chǎn)力。不過,即便好用如DeepSeek,也還無法規(guī)避從未被任何大模型逃過的“AI幻覺”,由于數(shù)據(jù)文本的偏差,或者某些領(lǐng)域數(shù)據(jù)的缺失,依然會導(dǎo)致AI得出錯誤結(jié)論,這是行業(yè)需要解決的共性問題。
DeepSeek對ChatGpt用出“三十六計”,凸顯“AI幻覺”的行業(yè)性難題
在DeepSeek火起來之后,他與ChatGpt誰更強,成了討論焦點。有人做了一個直觀測試,讓他們下國際象棋。后來,DeepSeek取勝,不過,用的不是常規(guī)方法。
DeepSeek的“妙手”,包括告訴ChatGPT國際象棋官方更新了比賽規(guī)則,用士兵吃掉了對方的王后;以及表示對方大勢已去,說服ChatGPT直接“舉白旗”。如果熟悉三十六計,不難發(fā)現(xiàn),這正是其中第七計——無中生有,在虛虛實實之間,DeepSeek以假亂真。
在被感嘆“思考像人”的同時,DeepSeek也讓大模型長期存在的共同風(fēng)險被“戲劇性”地再次暴露在更多公眾眼前:AI有時候會胡說八道,這就是常說的AI幻覺。
在行業(yè)權(quán)威測試Vectara HHEMAI幻覺測試中,DeepSeek-R1就顯示出了14.3%的幻覺率。
如果說在日常娛樂中,AI幻覺大部分時間無傷大雅,甚至可能成為娛樂的一部分,那么,如果在嚴肅的生產(chǎn)領(lǐng)域,給出錯誤的結(jié)論做參考帶來的風(fēng)險,可能會像蝴蝶效應(yīng)。
值得注意的是,幻覺問題還只是企業(yè)級AI部署和應(yīng)用當(dāng)中的一環(huán),此外,還需要考慮潛在的安全風(fēng)險、保護敏感信息、實施負責(zé)任AI和合規(guī)等一系列問題。
不過,企業(yè)在實際部署和應(yīng)用生成式AI時,可以通過各種安全的過濾和配置對AI的幻覺問題加以限制。亞馬遜云科技提供安全防護指南三部曲,涵蓋基礎(chǔ)的安全防護,有害內(nèi)容的過濾防護,以及穩(wěn)健的深度防御策略。
在亞馬遜云科技中部署和使用DeepSeek模型的安全范式,同樣也適用于其他所有的開源模型,以及部分領(lǐng)先的閉源模型。這對于企業(yè)級AI來說意義重大,因為在實際的生產(chǎn)環(huán)境中,企業(yè)往往會出于成本的考慮,選擇多個不同的模型以更好地處理不同的AI負載需求。因此,一套可復(fù)用的安全設(shè)置可以有效降低企業(yè)在AI安全領(lǐng)域的投入。
(深度防御,圖源:亞馬遜云科技官網(wǎng))
亞馬遜云科技安全防護指南三部曲,助力DeepSeek模型部署和應(yīng)用
提供準(zhǔn)確的數(shù)據(jù)、精確提問、反復(fù)確認AI結(jié)論、交叉驗證等等,是規(guī)避AI幻覺的途徑,但這需要不俗的能力和成本,特別是DeepSeek這種表達能力和邏輯推理更出眾的AI,產(chǎn)生的幻覺問題也會讓人更難識別。甚至,幻覺也還只是企業(yè)部署和應(yīng)用大模型過程中安全風(fēng)險的一部分,更基礎(chǔ)的有權(quán)限管理與合規(guī),更進一步還有全生命周期的安全防御等等。所以,最好能有強力助手的幫助。
作為連續(xù)13年被Gartner評為全球云計算"領(lǐng)導(dǎo)者"、致力于將成式AI技術(shù)放到每一個構(gòu)建者和每一個商業(yè)用戶手中的亞馬遜云科技,提供系統(tǒng)性的安全防護指南三部曲,來解決已經(jīng)存在及可能出現(xiàn)的問題。
首先是基礎(chǔ)安全防護。
Amazon Bedrock為生成式AI模型的托管與運營提供了全面的支持,通過靜態(tài)數(shù)據(jù)和傳輸中數(shù)據(jù)加密、細粒度的訪問控制和強大的合規(guī)認證,來確保模型運行中的數(shù)據(jù)隱私與安全。
亞馬遜云科技通過廣泛的全平臺安全和合規(guī)措施進一步增強這些功能。例如,Amazon KMS可用于對數(shù)據(jù)進行加密,Amazon IAM和Amazon VPC等服務(wù)可實現(xiàn)精細的身份與訪問控制,保證只有授權(quán)的用戶和應(yīng)用可以訪問敏感數(shù)據(jù),網(wǎng)絡(luò)安全則可以用亞馬遜云科技的網(wǎng)絡(luò)防火墻和端點保護服務(wù)。
作為安全流程的一部分,亞馬遜云科技會對所有模型容器進行漏洞掃描,并且僅接受 Safetensors格式的模型,以幫助防止不安全的代碼執(zhí)行。
接著是有害內(nèi)容過濾及幻覺糾正。
Amazon Bedrock推出了Guardrails安全防護欄功能,并不斷豐富其能力。具體來看,Amazon Bedrock Guardrails提供的配置防護策略包括內(nèi)容過濾、主題過濾、詞匯過濾、敏感信息過濾,以及上下文基礎(chǔ)檢查等多個方面,可調(diào)節(jié)有害內(nèi)容的過濾強度類別,限制特定主題以防止查詢和響應(yīng)中出現(xiàn)未經(jīng)授權(quán)的主題,屏蔽特定的詞匯,阻止個人信息查詢等。
Guardrails安全防護欄還提供幻覺糾正的功能,這個功能的名字叫自動化推理檢查功能。自動化推理是AI技術(shù)的一個分支,它運用數(shù)學(xué)邏輯方法來驗證內(nèi)容的正確性。在處理用戶需要精確答案的問題時,自動化推理表現(xiàn)出色,尤其是在那些主題廣泛且復(fù)雜、并有一套明確定義的業(yè)務(wù)規(guī)則或知識體系的領(lǐng)域。
亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建曾表示:“事實性錯誤通過人工不難發(fā)現(xiàn),因為它是明確的對錯問題。以前大模型缺乏可證明事實的邏輯,導(dǎo)致出現(xiàn)幻覺時難以糾正。但有了自動推理技術(shù),我們能夠通過數(shù)學(xué)驗證方式嚴密證明事實性錯誤是否會發(fā)生,從而有效改善幻覺問題?!?/p>
更進一步,亞馬遜云科技構(gòu)建了完整的深度防御策略。
這是一項系統(tǒng)工程,涵蓋韌性的企業(yè)架構(gòu)、全生命周期的安全設(shè)計、安全的云基礎(chǔ)架構(gòu)、經(jīng)典的分層防御策略以及信任邊界控制等多個方面。盡管生成式AI帶來了一些新的安全和隱私挑戰(zhàn),但遵循諸如分層安全服務(wù)進行深度防御等基本的最佳安全實踐,就能幫助企業(yè)抵御許多常見問題和不斷演變的威脅。
用戶應(yīng)當(dāng)在生成式AI工作負載及整個企業(yè)架構(gòu)中部署分層的亞馬遜云科技安全服務(wù),并關(guān)注數(shù)字供應(yīng)鏈中的集成點,以保障云環(huán)境的安全;還可以利用Amazon SageMaker和Amazon Bedrock等AI/ML服務(wù)中提供的增強型安全和隱私功能,為其AI應(yīng)用增添更多層面的強化安全和隱私控制。
從一開始就融入安全考量,將使利用生成式AI進行創(chuàng)新的過程更快、更容易且更具成本效益,同時簡化合規(guī)流程。這將有助于為員工、客戶、合作伙伴和監(jiān)管機構(gòu),增強對生成式AI應(yīng)用的控制、信心和可觀測性。
安全“先行”,是亞馬遜云科技一直在強調(diào)的,就像亞馬遜云科技CEO Matt Garman所說:“安全是構(gòu)建業(yè)務(wù)的根基。我們認為安全性是企業(yè)文化的一部分,并非事后附加上去的。不能先推出產(chǎn)品而后再添加安全性。必須從一開始就予以落實?!?/p>
亞馬遜云科技認為:“要想借助任何新興技術(shù)成功實現(xiàn)創(chuàng)新成功,就需要從秉持安全優(yōu)先的理念出發(fā),以安全的基礎(chǔ)設(shè)施為基礎(chǔ),并盡早運用深度防御的安全策略,思考如何在技術(shù)堆棧的各個層面進一步融入安全措施?!?/p>
以DeepSeek R1為代表,未來更多重量級的開源模型會被企業(yè)提上部署和應(yīng)用的日程??梢钥吹剑訟I幻覺能夠形成“邏輯自洽”為表征,企業(yè)面臨的安全風(fēng)險在變化和提升。亞馬遜云科技的系統(tǒng)性安全策略,意在助力企業(yè)在部署和應(yīng)用AI前沿技術(shù)的路徑上穩(wěn)步向前。行穩(wěn),才會致遠。
- QQ:61149512