【QA】What is the Deepfake?
概述:Deepfake是一項Based on GANs生成對抗網路的技術,它可以生成很多以假亂真令人信以為真的各種換臉影片,這也就產生所謂的"AI道德問題甚至法律問題",我們認為AI應該是要促進社會進步還有科技發展的,並不是拿來做這種政治操作戰,甚至是拿別人的臉到成人影片上。
回答列表
-
2021/10/30 上午 10:11Kevin Luo贊同數:0不贊同數:0留言數:0
**Deepfake 到底是怎麼實現的?** AI 技術如何檢測一段影音的真偽?當Deepfake 與反Deepfake 雙方產生對立時,哪一方會在這場競爭中取得勝利?要回答這些問題,我們需要先了解Deepfake 背後的工作機制和原理。 **生成式對抗網路(GANs)** Deepfake技術建立在一種名為生成對抗網路(GANs)的技術基礎之上。顧名思義,GANs 是由一對互相對抗(博弈)的網路組成的深度學習神經網路。 其中的一個網路名為生成式網路,負責嘗試生成一些看起來很是真實世界的東西,例如以數百萬張貓咪的圖片為基礎,合成一張虛構的貓的圖片。另一個網路名為鑑別式網路,它會把生成式網路所合成的貓的圖片,與真實的貓的圖片進行比較,鑑定生成式網路的輸出是真是假。這就是一個Generator和Discriminator之間的拔河。 **如何通俗理解GAN?** GAN自從2014年被IanGoodfellow提出以來,掀起了一股研究熱潮。 GAN由生成器和鑑別器組成,生成器負責生成樣本,鑑別器負責鑑別生成器生成的樣本是否為真。生成器要盡可能迷惑鑑別器,而鑑別器要盡可能區分生成器生成的樣本和真實樣本。 最經典的一個例子是,在GAN的原文中,作者把生成器比喻成印假鈔的犯罪者,鑑別器為警察。犯罪者努力讓鈔票看起來逼真,警察則不斷提升對於假鈔的辨識能力。兩者互相抗衡,隨著時間的進行,兩者都會越來越強。最終達成生成器生成的圖像讓鑑別器完全無法判別出真偽。 **GAN的形式化表達:** 下面我們要對於GAN做一個形式化的,更加具體的定義。通常情況下,不論是生成器或是鑑別器,我們都可以用神經網路來實現。那麼,我們可以把通俗化的定義用下面這個模型來表示: 如何通俗理解GAN? GAN自從2014年被IanGoodfellow提出以來,掀起了一股研究熱潮。 GAN由生成器和鑑別器組成,生成器負責生成樣本,鑑別器負責鑑別生成器生成的樣本是否為真。生成器要盡可能迷惑鑑別器,而鑑別器要盡可能區分生成器生成的樣本和真實樣本。 最經典的一個例子是,在GAN的原文中,作者把生成器比喻成印假鈔的犯罪者,鑑別器為警察。犯罪者努力讓鈔票看起來逼真,警察則不斷提升對於假鈔的辨識能力。兩者互相抗衡,隨著時間的進行,兩者都會越來越強。最終達成生成器生成的圖像讓鑑別器完全無法判別出真偽。 GAN的形式化表達: 下面我們要對於GAN做一個形式化的,更加具體的定義。通常情況下,不論是生成器或是鑑別器,我們都可以用神經網路來實現。那麼,我們可以把通俗化的定義用下面這個模型來表示: ![螢幕擷取畫面 2021-10-27 102537.png](http://kwassistfile.cupoy.com/0000017CBFB7F8F1000000176375706F795F72656C656173655155455354/1634872319416/large) 上述模型左邊是生成器G,其輸入為z , 對於原始的GAN, z是由高斯分布隨機採樣得到的noise 。 這些noise samples “z” 通過生成器G得到了生成的假樣本。 生成的假樣本與真實樣本放在一起,被隨機抽取送入鑑別器D,由鑑別器去區別輸入的樣本是生成的假樣本還是真實的樣本。整個過程簡單明瞭, 生成對抗網路中的"生成對抗"主要就是體現G和D的對抗。 GAN的目表函數是什麼? 對於上述的神經網路模型,如果想要學習其參數,首先需要一個目標函數。 GAN的目標函數定義如下: ![1_Oh5Y8Rb3FrKkyYOSVGTnVw.png](http://kwassistfile.cupoy.com/0000017CBFB7F8F1000000176375706F795F72656C656173655155455354/1634872319417/large) 正如最開始我們瞭解的警察與造假者案例,定義最優化問題的方法就可以由以下兩部分組成。首先我們需要定義一個判別器 D 以判別樣本是不是從 P_data(x) 分佈中取出來的,因此有: ![0_fzjbA_pUTiobG7G8.png](http://kwassistfile.cupoy.com/0000017CBFB7F8F1000000176375706F795F72656C656173655155455354/1634872319418/large) 其中 E 指代取期望。這一項是根據「正類」(即辨別出 x 屬於真實資料 data)的對數損失函式而構建的。最大化這一項相當於令判別器 D 在 x 服從於 data 的概率密度時能準確地預測 D(x)=1,即: ![0_RjFXmXtyoSaCzxVf (1).png](http://kwassistfile.cupoy.com/0000017CBFB7F8F1000000176375706F795F72656C656173655155455354/1634872319419/large) 另外一項是企圖欺騙判別器的生成器 G。該項根據「負類」的對數損失函式而構建,即: ![0_JN0reWuWFZYFLeFE.png](http://kwassistfile.cupoy.com/0000017CBFB7F8F1000000176375706F795F72656C656173655155455354/1634872319425/large) 因為 x<1 的對數為負,那麼如果最大化該項的值,則需要令均值 D(G(z))≈0,因此 G 並沒有欺騙 D。為了結合這兩個概念,判別器的目標為最大化: ![0_aw3kmazaUctAGyVj.png](http://kwassistfile.cupoy.com/0000017CBFB7F8F1000000176375706F795F72656C656173655155455354/1634872319421/large) 給定生成器 G,其代表了判別器 D 正確地識別了真實和偽造資料點。給定一個生成器 G,上式所得出來的最優判別器可以表示為 (下文用 D_G表示)。定義價值函式為: ![0_710djxpM7HDcA_rM.png](http://kwassistfile.cupoy.com/0000017CBFB7F8F1000000176375706F795F72656C656173655155455354/1634872319422/large) 然後我們可以將最優化問題表述為: ![0_3es8m97WFOYdIxCX.png](http://kwassistfile.cupoy.com/0000017CBFB7F8F1000000176375706F795F72656C656173655155455354/1634872319423/large) 現在 G 的目標已經相反了,當 D=D_G時,最優的 G 為最小化前面的等式。在論文中,作者更喜歡求解最優化價值函的 G 和 D 以求解極小極大博弈: ![1_Oh5Y8Rb3FrKkyYOSVGTnVw.png](http://kwassistfile.cupoy.com/0000017CBFB7F8F1000000176375706F795F72656C656173655155455354/1634872319426/large) 對於 D 而言要儘量使公式最大化(識別能力強),而對於 G 又想使之最小(生成的資料接近實際資料)。整個訓練是一個迭代過程。其實極小極大化博弈可以分開理解,即在給定 G 的情況下先最大化 V(D,G) 而取 D,然後固定 D,並最小化 V(D,G) 而得到 G。其中,給定 G,最大化 V(D,G) 評估了 P_G 和 P_data 之間的差異或距離。 最後,我們可以將最優化問題表達為: ![0_O-9zL-Rh0mJOIx8h (1).png](http://kwassistfile.cupoy.com/0000017CBFB7F8F1000000176375706F795F72656C656173655155455354/1634872319424/large) 以上給出了 GAN 概念和優化過程的形式化表達。通過這些表達,我們可以理解整個生成對抗網路的基本過程與優化方法 **那麼,以GANs 技術為基礎的Deepfake 影片會被識破嗎?** 目前大多數Deepfake 影片其實都可以被演算法檢測到,有時甚至人眼就可以辨別出來,原因在於,這些影片在製作時使用的演算法還不夠完善,而且沒有足夠的算力做支撐。 為了以AI制AI,Facebook 和Google 都曾發起過Deepfake 影片鑑別挑戰賽。不過,嚴苛的防偽檢測器消耗的算力非常大,如果一個網站每天都會收到數百萬段使用者上傳的影片,那麼防偽檢測器的有效性就將大打折扣。 長遠來看,阻止Deepfake 的最大難點其實在於GANs 的內在機制─ 生成式網路和鑑別式網路會在一次次「博弈」之後一起進步。舉個例子,我們構建了一個生成式網路,這時有人構建了一個鑑別式網路,它能夠檢測出網路所生成的結果是「假」的,那麼我們就可以把愚弄新的判別式網路做為目標,重新訓練我們的生成式網路,這樣就會激發判別式網路重新進行訓練⋯⋯這個循環發展到最後將成為一場軍備競賽,比的是哪一方能夠用更強的算力訓練出更好的模型。 Reference: GAN网络开山论文(2014):Generative Adversarial Nets_makabaka的博客-CSDN博客 Generative Adversarial Nets (nips.cc) Google AI Blog: Contributing Data to Deepfake Detection Research (googleblog.com)
-
2021/10/31 下午 09:48廖健傑贊同數:0不贊同數:0留言數:0
https://github.com/iperov/DeepFaceLab