秋霞人成在线观看免费视频,欧美毛片一区二区三区福利,国产乱辈通伦影片在线播放亚洲,无码人妻精品中文字幕免费,无码人妻精品中文字幕免费

中自數(shù)字移動(dòng)傳媒

您的位置:首頁(yè) >> 綜合新聞 >> 三角獸首席科學(xué)家王寶勛:熱度之下的對(duì)話生成

三角獸首席科學(xué)家王寶勛:熱度之下的對(duì)話生成

已有59673次閱讀2017-08-15標(biāo)簽:
 從 EMNLP 入選論文《Neural Response Generation via GAN with an Approximate Embedding Layer》出發(fā),就自動(dòng)對(duì)話領(lǐng)域的特點(diǎn)到發(fā)展方向和亟待解決的問(wèn)題,我們與三角獸首席科學(xué)家王寶勛聊了聊。

三角獸首席科學(xué)家王寶勛

限于閑聊的、無(wú)信息需求的對(duì)話生成是自動(dòng)對(duì)話領(lǐng)域一個(gè)比較前沿的學(xué)術(shù)方向。在應(yīng)用方面,生成式聊天相比于前一代的基于信息檢索的(IR-based)架構(gòu)也有一些天然的優(yōu)勢(shì):它不需要維護(hù)大規(guī)模問(wèn)答庫(kù),也不需要排序、篩選等子模塊,這種更加一體化的構(gòu)架,在部署上也很有實(shí)際意義。

然而,生成式聊天也有自己的弱點(diǎn):因?yàn)槟P屯ǔR韵嚓P(guān)性為核心構(gòu)建損失函數(shù),所以非常容易生成嚴(yán)重趨同的答案,這種現(xiàn)象被稱(chēng)為「安全回答」問(wèn)題(safe response)。一句「我也這么認(rèn)為�!勾_實(shí)可以回復(fù)許多問(wèn)題,但是這樣「雞肋」的回答難免讓用戶失去繼續(xù)聊下去的興趣。因此,生成式對(duì)話系統(tǒng)在獲得大范圍應(yīng)用前,一定要解決安全回答問(wèn)題。

三角獸與哈工大合作的這篇論文(GAN-AEL)就旨在通過(guò)生成對(duì)抗網(wǎng)絡(luò)解決這個(gè)問(wèn)題,讓生成器考慮「相關(guān)性」問(wèn)題,同時(shí),引入具有對(duì)抗屬性的判別器,把「多樣性」也納入考量之中。實(shí)現(xiàn)這個(gè)思路的障礙來(lái)自生成對(duì)抗網(wǎng)絡(luò)和自然語(yǔ)言本身的特性。生成對(duì)抗網(wǎng)絡(luò)成功用于圖像領(lǐng)域有賴(lài)于圖像信號(hào)的連續(xù)特點(diǎn),然而文本信號(hào)是離散的,離散意味著不可導(dǎo)、意味著判別器的信息無(wú)法順利通過(guò)反向傳播到達(dá)生成器。因此,作者提出了一種新的結(jié)構(gòu):近似嵌入層(Approximate Embedding Layer, AEL)來(lái)獲得判別器和生成器中間的連續(xù)性。

論文:數(shù)據(jù)需求特點(diǎn)與模型結(jié)構(gòu)選擇

在數(shù)據(jù)需求方面,生成式對(duì)話系統(tǒng)相比于信息檢索式的對(duì)話系統(tǒng),乃至于神經(jīng)機(jī)器翻譯系統(tǒng),有哪些不同呢?對(duì)此,王寶勛表示,首先相比于信息檢索式架構(gòu),生成模型在訓(xùn)練階段對(duì)數(shù)據(jù)量有較高需求,然而一旦學(xué)習(xí)結(jié)束,在理想狀態(tài)下就可以直接端到端地生成答案,不需要再對(duì)數(shù)據(jù)進(jìn)行維護(hù)。而相比于機(jī)器翻譯,雖然對(duì)話數(shù)據(jù)比翻譯常見(jiàn),可以從論壇、貼吧等眾多途徑獲得,但是數(shù)據(jù)質(zhì)量遠(yuǎn)遠(yuǎn)不如翻譯數(shù)據(jù)。以本文所提出的模型為例,相比于神經(jīng)機(jī)器翻譯,在數(shù)據(jù)體量上要求較低而在質(zhì)量上要求較高。數(shù)量上要求低,是因?yàn)閷?duì)抗的過(guò)程在不停地生成數(shù)據(jù),這一輪和下一輪生成的樣本可以被看成是不同的樣本。質(zhì)量上要求高,是因?yàn)槟P偷哪繕?biāo)是避免安全回答,因此從一開(kāi)始就要對(duì)數(shù)據(jù)進(jìn)行嚴(yán)格的預(yù)處理,避免數(shù)據(jù)集中出現(xiàn)安全回答。

在模型結(jié)構(gòu)上,生成器選擇了基于 GRU 的編碼器-解碼器結(jié)構(gòu),判別器選擇了 CNN。GRU 雖然不像 LSTM 那么明確地有不同門(mén)負(fù)責(zé)不同任務(wù),但從實(shí)踐效果來(lái)看,兩個(gè)模型效果相差不多,因此最終選擇參數(shù)較少的 GRU。選擇 CNN 則和近似嵌入層(Approximate Embedding Layer, AEL)的引入有關(guān)。這一層在做句子表示時(shí),雖說(shuō)有近似,但還是以詞的嵌入(embedding)向量串聯(lián)的形式來(lái)表示一個(gè)句子。在這之上,可以做一些其他的表示,甚至可以直接加在一起。但是根據(jù)以往的經(jīng)驗(yàn),分類(lèi)器還是用一個(gè)不太深的 CNN 比較好。雖然沒(méi)有純理論的推導(dǎo),但經(jīng)驗(yàn)上表明,對(duì)于對(duì)抗學(xué)習(xí)這種架構(gòu)來(lái)說(shuō),判別器不能太強(qiáng)。如果判別器過(guò)強(qiáng),一下子就把兩類(lèi)樣本分開(kāi),說(shuō)明生成的樣本對(duì)判別器來(lái)說(shuō)沒(méi)什么太大挑戰(zhàn),判別器也無(wú)法給生成器提出什么建議,導(dǎo)致誤差傳導(dǎo)、生成器底層更新的頻率和幅度都會(huì)小一些。因此生成器和判別器在學(xué)習(xí)速度上還是要相匹配的。

對(duì)話生成研究:一對(duì)多問(wèn)題,缺失的評(píng)價(jià)標(biāo)準(zhǔn)和多輪的挑戰(zhàn)

「人機(jī)對(duì)話之前都是自然語(yǔ)言處理領(lǐng)域稍微小眾的一個(gè)方向,但是今年的 ACL 收錄了超過(guò)十篇做對(duì)話的論文,這個(gè)數(shù)字是前所未有的」。研究方向的熱度隨著人工智能整體的熱度而急速攀升,即使是走在最前沿的研究者也對(duì)此感到驚訝。處在這樣的一個(gè)時(shí)間節(jié)點(diǎn),王寶勛眼里的對(duì)話生成領(lǐng)域是什么樣子?研究的挑戰(zhàn)在何處,不同的處理方式的特點(diǎn)是什么,又如何對(duì)成果進(jìn)行客觀評(píng)價(jià)?

在開(kāi)放域閑聊對(duì)話中,一個(gè)問(wèn)題對(duì)應(yīng)多個(gè)可能答案的情況很常見(jiàn)。王寶勛解釋道,一對(duì)多現(xiàn)象會(huì)對(duì)模型產(chǎn)生一些挑戰(zhàn)是因?yàn)樗鼤?huì)引入語(yǔ)義上的不確定性。相比之下,機(jī)器翻譯雖然也存在一對(duì)多現(xiàn)象,但是多種翻譯在語(yǔ)義上基本上是平行的。在問(wèn)答或者聊天任務(wù)上,沒(méi)有辦法保證每一個(gè)答案在語(yǔ)義上的一致性,這種語(yǔ)義上的漂移會(huì)對(duì)機(jī)器學(xué)習(xí)模型產(chǎn)生很大挑戰(zhàn)。

統(tǒng)一的評(píng)價(jià)標(biāo)準(zhǔn)的缺失也很讓研究者頭疼。機(jī)器翻譯中的 BLEU、迷惑度(perplexity),乃至文本摘要任務(wù)的評(píng)價(jià)標(biāo)準(zhǔn)都會(huì)被聊天系統(tǒng)借用�!敢胍粋(gè)行業(yè)通行的標(biāo)準(zhǔn)很有必要」,王寶勛肯定地說(shuō)。但和問(wèn)答、翻譯、文摘等幾個(gè)領(lǐng)域一樣,如何將主觀性的東西進(jìn)行量化,始終是一個(gè)難題。如果強(qiáng)行引入太多標(biāo)簽,則勢(shì)必形成不了上規(guī)模的應(yīng)用。什么樣的評(píng)價(jià)標(biāo)準(zhǔn)才是一個(gè)好的標(biāo)準(zhǔn)?GAN-AEL 在「相關(guān)性」之外引入了「多樣性」。除此之外,「延展性」也很重要。延展性評(píng)價(jià)一個(gè)回答能否引發(fā)更多輪數(shù)的對(duì)話,評(píng)價(jià)用戶看到回答之后是否有興趣繼續(xù)聊下去。當(dāng)然了,延展性非常難直接衡量。一個(gè)「曲線救國(guó)」的辦法是在系統(tǒng)上線之后,看用戶的 cps(conversation per session)。王寶勛還補(bǔ)充道,比起評(píng)價(jià)標(biāo)準(zhǔn)缺失,或許更亟待解決的問(wèn)題是高質(zhì)量評(píng)測(cè)集和訓(xùn)練集的缺乏,常用的幾個(gè)數(shù)據(jù)集在質(zhì)量方面參差不齊。

最后,能讓用戶「多聊幾句」的回答才是好回答,而系統(tǒng)從「給用戶一個(gè)回復(fù)」到「多聊幾句」,存在一個(gè)指數(shù)級(jí)的難度提高。多輪對(duì)話要更多考慮情境、考慮和前文的關(guān)聯(lián)。它和前文哪句話關(guān)聯(lián)?多大范圍關(guān)聯(lián)?有潛在關(guān)聯(lián)怎么辦?都是需要考慮的問(wèn)題。然而,多輪對(duì)話始終是對(duì)話系統(tǒng)繞不開(kāi)的一個(gè)題目。一方面,任務(wù)型對(duì)話通常都有多輪的需求,因?yàn)樵谝惠喴詢?nèi)收集到完成任務(wù)所需的所有信息是非常困難的。例如,用戶說(shuō)「我要訂飯店」,別的什么都沒(méi)說(shuō),那機(jī)器人總要追問(wèn),「你要定在哪里?幾點(diǎn)?多少人?」。主流的對(duì)話系統(tǒng)都會(huì)通過(guò)對(duì)話狀態(tài)跟蹤(dialog state tracking)模塊來(lái)記錄狀態(tài)的轉(zhuǎn)移,以配合策略(policy)模塊。而另一方面,王寶勛也看好聊天在多輪對(duì)話上的發(fā)展。「一段時(shí)間以后,我們也會(huì)看到一個(gè)相對(duì)讓人滿意的多輪聊天的機(jī)制。這個(gè)事情不會(huì)太遠(yuǎn),我對(duì)多輪對(duì)話相對(duì)比較樂(lè)觀」,他如是說(shuō)。

對(duì)話生成應(yīng)用:分類(lèi)法與用戶教育

三角獸的對(duì)話系統(tǒng),有「開(kāi)放域聊天、任務(wù)驅(qū)動(dòng)的多輪對(duì)話、智能問(wèn)答」三個(gè)方向,這是否也是對(duì)話系統(tǒng)的常見(jiàn)類(lèi)別呢?除此之外還有什么分類(lèi)法呢?王寶勛解釋道,三角獸的分法是按功能做的分類(lèi)。以前,對(duì)話系統(tǒng)(dialog system)專(zhuān)門(mén)指代需要完成任務(wù)的問(wèn)答。現(xiàn)在大家對(duì)這個(gè)問(wèn)題重新認(rèn)識(shí)了,認(rèn)為對(duì)話系統(tǒng)除了完成指定任務(wù)之外,也可以有聊天功能。用戶在沒(méi)有特定需求的時(shí)候,也可以來(lái)和機(jī)器人聊聊天。除此之外,還有按領(lǐng)域做細(xì)分的方法。任務(wù)型聊天經(jīng)常這樣分類(lèi),因?yàn)橛啿偷南到y(tǒng)和買(mǎi)飛機(jī)票的系統(tǒng)在對(duì)話邏輯上就有一些不同。聊天也是這樣,泛泛的開(kāi)放域聊天是一種情況,就二次元?jiǎng)勇M(jìn)行深入的對(duì)話又是另一種情況。

然而比起分類(lèi)法,公眾其實(shí)更關(guān)注對(duì)話系統(tǒng)的表現(xiàn)形式:機(jī)器人。這種關(guān)注源自諸多誤解,也帶來(lái)了很多擔(dān)憂。例如,日前 Facebook 由于純文本多輪對(duì)話引擎 Bot Engine 的用戶體驗(yàn)不好而選擇退出,結(jié)果被媒體解讀為「人工智能失控,人類(lèi)只能選擇拔電源」。業(yè)界人士應(yīng)該如何向公眾解釋聊天機(jī)器人的能力與局限?王寶勛認(rèn)同,公眾對(duì)人工智能這個(gè)整體的了解存在一定偏差,而大眾對(duì)于聊天機(jī)器人這種新形式需要一個(gè)接受的過(guò)程、使用習(xí)慣的改變的過(guò)程。王寶勛將聊天機(jī)器人的功能定位為「可以在一些特定領(lǐng)域里幫助人類(lèi)完成一些比較常見(jiàn)的工作」。比如說(shuō),在開(kāi)車(chē)的過(guò)程中不借助手去觸控,而是通過(guò)與智能工具溝通完成啟動(dòng)導(dǎo)航的操作;在做飯的時(shí)候,手在忙,那么就可以通過(guò)智能音箱完成操作。同時(shí),它可以完成一些情感上的溝通,在人們工作閑暇的時(shí)候,調(diào)侃它,甚至現(xiàn)在常說(shuō)的「調(diào)戲」它,是一個(gè)很有趣打發(fā)時(shí)間的方式。王博士也希望大家可以少一些對(duì)機(jī)器人的擔(dān)心:「第一,它不會(huì)竊取你什么,第二,語(yǔ)言的形成不是一個(gè)簡(jiǎn)單的數(shù)學(xué)模型可以概括的,所以大可不必?fù)?dān)心它變得過(guò)于強(qiáng)大�!�

深度學(xué)習(xí):熱度依舊、思路紛紜、可解釋性「曲徑通幽」

去年年底,王博士受邀擔(dān)任了 ACL 2017 的審稿人�!干疃葘W(xué)習(xí)依然那么的火熱,然而深度學(xué)習(xí)本身的簡(jiǎn)單應(yīng)用已經(jīng)不足以征服審稿人了。」他總結(jié)了入選論文一定要滿足的三點(diǎn)要求:第一,這個(gè)方向、問(wèn)題本身是成立的、有用的,不能生造一個(gè)系統(tǒng)里面用不到的問(wèn)題。第二,作者本人對(duì)這個(gè)問(wèn)題有足夠的理解,而不是簡(jiǎn)單套用個(gè)模型。第三,模型本身,在結(jié)構(gòu)或者思路上有足夠的創(chuàng)新點(diǎn)�?偠灾�,在深度學(xué)習(xí)方向上寫(xiě)論文已經(jīng)不像大家想象得那么簡(jiǎn)單了。

而對(duì)不同思路的探討也呈白熱化。同樣是對(duì)話生成,增強(qiáng)學(xué)習(xí)和生成對(duì)抗網(wǎng)絡(luò)就有不同的側(cè)重點(diǎn)。增強(qiáng)學(xué)習(xí)的方法需要人為定義獎(jiǎng)勵(lì)(reward),這個(gè)過(guò)程需要很多先驗(yàn)的知識(shí)。而生成對(duì)抗網(wǎng)絡(luò)的判別器是數(shù)據(jù)驅(qū)動(dòng)的,什么樣的回復(fù)比較好是通過(guò)數(shù)據(jù)定義的,過(guò)程中并沒(méi)有加入太多人的先驗(yàn)知識(shí),因此對(duì)數(shù)據(jù)的擬合可能更合理一些。有趣的是,也有通過(guò)強(qiáng)化學(xué)習(xí)來(lái)實(shí)現(xiàn)生成對(duì)抗網(wǎng)絡(luò)判別器和生成器交互的方法。

「更多引入先驗(yàn)知識(shí)」和「更多依賴(lài)數(shù)據(jù)驅(qū)動(dòng)」似乎是兩種大相徑庭的思路。例如,在神經(jīng)機(jī)器翻譯領(lǐng)域,一些學(xué)者(比如谷歌的一些論文)傾向于將盡可能多的數(shù)據(jù)交給神經(jīng)網(wǎng)絡(luò),讓模型自己習(xí)得語(yǔ)法知識(shí);同時(shí)有的學(xué)者傾向于盡可能多地人工引入語(yǔ)法和句法信息。然而王寶勛認(rèn)為,這兩種思路都還在連接主義的框架內(nèi),只不過(guò)代表了兩種不同的思維習(xí)慣,或者說(shuō)處理問(wèn)題的習(xí)慣。比如谷歌從很多年以前就一直喜歡強(qiáng)數(shù)據(jù)驅(qū)動(dòng)的辦法。而包括李航老師在內(nèi)的諸多國(guó)內(nèi)學(xué)者最近也在呼吁大家更多去考慮將符號(hào)學(xué)、符號(hào)主義引入大規(guī)模機(jī)器學(xué)習(xí)、深度學(xué)習(xí)或其他學(xué)習(xí)模式。王寶勛認(rèn)為,如果有合理的引入或溝通方法,符號(hào)主義,包括規(guī)則、語(yǔ)法等等知識(shí),其實(shí)是很有必要去和現(xiàn)在的機(jī)器學(xué)習(xí)做一些融合。「因?yàn)榉彩虏粦?yīng)過(guò)于絕對(duì),再?gòu)?qiáng)調(diào)大數(shù)據(jù)的效果也應(yīng)該看到它的局限性。之前幾十年的經(jīng)驗(yàn)如果能和深度學(xué)習(xí)模型合理融合在一起,甚至可以說(shuō)是下一個(gè)階段的再實(shí)現(xiàn)一個(gè)跨越的基礎(chǔ)�!�

雖然深度學(xué)習(xí)的火熱程度逐年遞增,其可解釋性差的問(wèn)題、參數(shù)調(diào)整一直靠實(shí)踐倒推的現(xiàn)象一直存在,并且仍然缺乏理論解釋。王寶勛表示,相比于應(yīng)用型的論文,理論方向的論文雖然很少,但也有優(yōu)秀的工作出現(xiàn)。例如在調(diào)參方面,今年發(fā)表的 WGAN 的作者花了相當(dāng)長(zhǎng)的篇幅進(jìn)行了數(shù)學(xué)證明,然后提出了 4 條調(diào)參的建議,經(jīng)過(guò)驗(yàn)證,都很有效。

最后,王寶勛也提出了一些關(guān)于給予神經(jīng)網(wǎng)絡(luò)以可解釋性的思考�!敢宰匀徽Z(yǔ)言處理任務(wù)為例,LSTM 就是通過(guò)對(duì)原始 RNN 添加各種門(mén)(gate)與記憶單元(memory cell)而獲得了對(duì)長(zhǎng)距離依賴(lài)的較好描述能力。那么這里的原始 RNN 可以當(dāng)成一個(gè)黑箱,而這些『門(mén)』是人們可以通過(guò)物理方法進(jìn)行直觀理解的模塊�!簩�(duì)序列建模的基礎(chǔ)上,添加記憶單元,配合以幾個(gè)門(mén),就可以捕捉長(zhǎng)距離依賴(lài)信息』,這本身是不是就對(duì)神經(jīng)網(wǎng)絡(luò)做了一定的解釋呢?」

「如果我們?cè)谏窠?jīng)網(wǎng)絡(luò)的基礎(chǔ)模塊之上添加一些額外的可解釋的模塊,模型的效果變好了,我們也從這個(gè)過(guò)程中獲得了一些可解釋性。雖然我們沒(méi)有拆開(kāi)黑箱,但是通過(guò)把神經(jīng)網(wǎng)絡(luò)和可解釋模塊二者進(jìn)行勾連從而獲得更好的效果這個(gè)事實(shí),我們是不是對(duì)黑箱的『形狀』做出了一個(gè)描述呢?」

分享到:

[ 新聞搜索 ]  [ ]  [ 告訴好友 ]  [ 打印本文 ]  [ 關(guān)閉窗口 ]  [ 返回頂部 ]

移動(dòng)互聯(lián)

2010年,中國(guó)移動(dòng)互聯(lián)網(wǎng)用戶規(guī)模達(dá)到3.03億人2011年,中國(guó)移動(dòng)互聯(lián)網(wǎng)行業(yè)進(jìn)入了更加快速發(fā)展的一年,無(wú)論是用戶規(guī)模還是手機(jī)應(yīng)用下載次數(shù)都有了快速的增長(zhǎng)。在移動(dòng)互聯(lián)網(wǎng)發(fā)展的大的趨勢(shì)下,中自傳媒已經(jīng)開(kāi)始進(jìn)行區(qū)別于傳統(tǒng)互聯(lián)網(wǎng)的運(yùn)營(yíng)模式探索,伴隨著產(chǎn)業(yè)鏈和產(chǎn)業(yè)格局的變化提供創(chuàng)新的服務(wù)

更多>>推薦視頻

工業(yè)轉(zhuǎn)型升級(jí)-中國(guó)電器工業(yè)協(xié)會(huì)電力電子分會(huì) 秘書(shū)長(zhǎng) 肖向鋒

工業(yè)轉(zhuǎn)型升級(jí)-中國(guó)電器工業(yè)協(xié)會(huì)

在本次2012北京國(guó)際工業(yè)自動(dòng)化展上,我們將全面剖析在新...
中國(guó)高壓變頻器產(chǎn)業(yè)發(fā)展之路——走過(guò)十三年 李玉琢

中國(guó)高壓變頻器產(chǎn)業(yè)發(fā)展之路——

中國(guó)高壓變頻器產(chǎn)業(yè)發(fā)展之路走過(guò)十三年 李玉琢
從企業(yè)家角度 談行業(yè)的未來(lái)發(fā)展——匯川技術(shù)股份有限公司

從企業(yè)家角度 談行業(yè)的未來(lái)發(fā)展

從企業(yè)家角度 談行業(yè)的未來(lái)發(fā)展匯川技術(shù)股份有限公司
現(xiàn)代能源變換的核心技術(shù)——電力電子 李崇堅(jiān)

現(xiàn)代能源變換的核心技術(shù)——電力

中國(guó)電工技術(shù)學(xué)會(huì)常務(wù)理事---李崇堅(jiān),電力電子是先進(jìn)能源...
打造專(zhuān)業(yè)電力電子元器件品牌 助力變頻器產(chǎn)業(yè)發(fā)展

打造專(zhuān)業(yè)電力電子元器件品牌 助

聯(lián)合主辦單位深圳市智勝新電子有限公司領(lǐng)導(dǎo)嘉賓致辭 7月...