最新一期《自然》雜誌發表的一篇論文稱,谷歌深度思維團隊開發了一種能為大語言模型生成文本添加水印的工具,可提高對合成內容的鑒別和追溯能力。
大語言模型(LLM)是廣泛使用的人工智慧(AI)工具,能為聊天機器人、文章寫作和其他目的生成文本。不過,人們很難識別並追溯AI生成文本的來源,使信息的可靠性受到質疑。水印被認為能解決這一問題,但生産系統對質量和計算效率的嚴格要求阻礙了其規模化應用。
深度思維團隊此次利用一種全新採樣算法,開發出一個給AI生成文本添加水印的系統——SynthID-Text。該工具通過採樣算法對LLM的詞彙選擇進行巧妙偏移,插入一個能被相關檢測軟體識別的簽名。這既可以通過一種“扭曲”路徑實現(能提高水印質量但會輕微影響輸出質量),也可以通過另一種能保留文本質量的“非扭曲”路徑實現。
深度思維已在多個公開模型上評估了這些水印的可檢測性,結果顯示,SynthID-Text的可檢測性優於當前其他方法。
他們還用Gemini LLM的近2000萬次在線對話,評估了這些文本的質量,最終認為非扭曲水印形式不會降低文本質量。此外,使用SynthID-Text對LLM運行所需算力的影響可忽略不計,從而減少了應用上的障礙。
該研究證明,為生成式文本添加水印是可行的,其可提高AI使用的責任和透明度。