人工智慧演算法可實現高精度檢測Deepfake視頻

1179 人參與      分類 : 科學  

人工智慧在世界上為人類做出了巨大貢獻。從減少污染到通過自動駕駛汽車使道路更安全到通過醫療大數據分析實現更好的醫療保健,人工智慧仍然具有巨大的潛力。不幸的是,就像世界上的任何技術一樣,那些意圖不高的人也可以使用AI。

人工智慧演算法可實現高精度檢測Deepfake視頻

Kaur等人提出的基於AI的技術。可以在幾秒鐘內檢測到Deepfake視頻。

Deepfake換臉技術

某些基於AI的技術稱為「 deepfake 」(「深度學習」和「偽造」的組合)就是這種情況,該技術使用深度神經網路輕鬆創建虛假視頻,其中一個人的臉疊加在另一個。這些工具易於使用,即使對於沒有編程或視頻編輯背景的人也是如此。該技術可用於製作幾乎任何人(包括名人,政客和企業公眾人物)的有損視頻。在這個前所未有的聯繫和即時交流的時代,新聞可能會在數小時之內傳播開來,這種視頻可能會對視頻中的內容以及相關社區的社會和文化心理造成極大的傷害。

「 Deepfake」在那裡。但是,如果可以自動檢測到這些視頻,則可以減輕危害。還有什麼比使用AI本身更好的方法呢?

儘管確實存在基於AI的Deepfake視頻檢測方法,但印度Thapar工程技術學院和印度Indraprastha信息技術學院的研究人員已經開發了一種新演算法,具有更高的準確性和精度。他們的工作可能是對付我們今天面臨的多種信息傳播中的一個里程碑。

廣義上講,他們的方法包括一個分類器,該分類器確定輸入視頻是真實視頻還是(深度)偽造視頻。與所有基於AI的應用程序一樣,為使做出準確的決策成為可能,必須首先訓練其演算法。為此,研究人員首先創建了一個包含200個相貌相似的政客對視頻的視頻數據集。其中100個是真實的,其他100個是使用deepfake生成的。這些視頻的一部分幀被標記並作為訓練數據提供給演算法;其餘的則用作驗證數據集,以測試程序是否可以正確捕獲人臉交換的視頻。

Deepfake檢測方法

該演算法本身可以分為兩個級別。在第一級,視頻幀經過一些光圖像處理,例如重新縮放,縮放和水平翻轉,作為後續階段的準備。第二級包括兩個主要組件:卷積神經網路(CNN)和長短期記憶(LSTM)階段。

CNN是一種特殊的神經網路,可以從連續的視頻幀中自動提取特徵。CNN僅知道提取哪些特徵以及如何定義它們。LSTM是一種遞歸神經網路,對於處理時間序列數據(在這種情況下,是連續的視頻幀)尤其有用。通過比較原始視頻和Deepfake視頻,LSTM網路可以輕鬆地檢測到後者的幀中的不一致之處。該演算法僅使用大約兩秒鐘的視頻資料即可識別它們。

測試了此新方法的性能,並將其與其他現有的基於AI的最新技術檢測Deepfake視頻的性能進行了比較。從本研究整理的視頻數據集中檢索到的總共181,608個真實和Deepfake幀,該方法實現了更高的準確性(98.21%)和精度(99.62%),總訓練時間更短。

這項研究突出了AI的福音和禍根。儘管AI可以用來損害聲譽和傳播錯誤信息,但它也可以用來防止信息傳播。