<ol id="vutbz"><small id="vutbz"><dfn id="vutbz"></dfn></small></ol>

產(chǎn)品系列

行業(yè)應(yīng)用

技術(shù)支持

關(guān)于創(chuàng)澤

創(chuàng)澤機(jī)器人

CHUANGZE ROBOT

當(dāng)前位置：首頁(yè) > 新聞資訊 > 機(jī)器人知識(shí) > 微信提出推薦中的深度反饋網(wǎng)絡(luò)，在“看一看”數(shù)據(jù)集上達(dá)到SOTA

微信提出推薦中的深度反饋網(wǎng)絡(luò)，在“看一看”數(shù)據(jù)集上達(dá)到SOTA

來(lái)源：AI科技大本營(yíng) 編輯：創(chuàng)澤時(shí)間：2020/5/22 主題：其他 [加盟]

在推薦系統(tǒng)中，用戶(hù)的顯式反饋、隱式反饋、正反饋和負(fù)反饋都能夠反映用戶(hù)對(duì)于被推薦物品的偏好。這些反饋信息在推薦系統(tǒng)中十分有用。然而，現(xiàn)在的大規(guī)模深度推薦模型往往以點(diǎn)擊為目標(biāo)，只看重以用戶(hù)點(diǎn)擊行為為代表的隱式正反饋，而忽略了其它有效的用戶(hù)反饋信息。

作者在本文中關(guān)注用戶(hù)多種顯式/隱式和正/負(fù)反饋信息，學(xué)習(xí)用戶(hù)的無(wú)偏興趣偏好。具體地，作者提出了一個(gè)Deep Feedback Network (DFN)模型，綜合使用了用戶(hù)的隱式正反饋（點(diǎn)擊行為）、隱式負(fù)反饋（曝光但未點(diǎn)擊的行為）以及顯式負(fù)反饋（點(diǎn)擊不感興趣按鈕行為）等信息。

DFN模型使用了internal feedback interaction component抓住用戶(hù)行為序列中的細(xì)粒度的行為級(jí)別的交互，然后通過(guò)external feedback interaction component，使用精確但稀少的隱式正反饋和顯式負(fù)反饋?zhàn)鳛楸O(jiān)督，從噪音較多的隱式負(fù)反饋中進(jìn)一步抽取用戶(hù)的正負(fù)反饋信息。在實(shí)驗(yàn)中，作者基于微信看一看的數(shù)據(jù)，進(jìn)行了豐富的離線和在線實(shí)驗(yàn)，模型與baseline相比均取得顯著提升。

1、模型背景與簡(jiǎn)介

推薦系統(tǒng)在日常生活中被廣泛使用，為用戶(hù)獲取信息與娛樂(lè)提供便利。推薦系統(tǒng)算法往往基于用戶(hù)與系統(tǒng)的交互，這些交互行為可以大致分為以下兩類(lèi)：顯式反饋與隱式反饋。顯式反饋從用戶(hù)對(duì)于物品的直接態(tài)度中獲取，例如評(píng)論中的一星到五星，或者微信看一看系統(tǒng)中的“不感興趣”按鈕。這類(lèi)反饋能夠直接表達(dá)用戶(hù)的正向以及負(fù)向偏好，但是這類(lèi)反饋的數(shù)量往往不多。隱式反饋從用戶(hù)的行為中間接獲得，例如用戶(hù)的點(diǎn)擊/不點(diǎn)擊行為。這些信息在推薦系統(tǒng)中往往是海量的，但是這些信息有著較多噪聲（用戶(hù)點(diǎn)擊的并不一定是他真正喜歡的）。另外，隱式反饋通常是以正反饋的形式出現(xiàn)，推薦中的隱式負(fù)反饋存在巨大噪聲（未展現(xiàn)信息或者未點(diǎn)擊信息并不一定意味著用戶(hù)不喜歡這些內(nèi)容）。

在近期的深度推薦系統(tǒng)中，CTR導(dǎo)向的目標(biāo)受到極大關(guān)注。因此，模型不可避免地只關(guān)注和目標(biāo)緊密相關(guān)的用戶(hù)點(diǎn)擊行為，忽略了其它用戶(hù)行為中蘊(yùn)含的豐富信息。僅考慮CTR導(dǎo)向目標(biāo)的推薦模型往往會(huì)遇到以下兩個(gè)問(wèn)題：（1）CTR導(dǎo)向目標(biāo)只關(guān)注用戶(hù)喜歡什么，沒(méi)有關(guān)注用戶(hù)不喜歡什么。這樣，模型的推薦結(jié)果容易同質(zhì)化和趨熱化，損害用戶(hù)體驗(yàn)。因此，負(fù)反饋信息是必要的。（2）用戶(hù)除了被動(dòng)地接受系統(tǒng)推薦的物品，有時(shí)也需要能夠主動(dòng)和即時(shí)的反饋機(jī)制。用戶(hù)希望能夠高效和準(zhǔn)確地告知系統(tǒng)自己喜歡或者不喜歡什么。另外，用戶(hù)的顯式和隱式反饋之間也會(huì)存在割裂（用戶(hù)點(diǎn)擊的并不一定是他真正喜歡的）。因此，顯式反饋也是必要的。顯式信息和隱式信息能夠作為彼此的補(bǔ)充，相輔相成。已有工作通過(guò)使用用戶(hù)的未點(diǎn)擊/未曝光行為作為用戶(hù)的隱式負(fù)反饋，這樣會(huì)引入極大的噪聲。另外一些工作嘗試使用用戶(hù)的顯式負(fù)反饋信息。這些信息固然精確，但是也往往比較稀疏。

為了解決這些問(wèn)題，綜合使用用戶(hù)多種顯式/隱式和正/負(fù)反饋信息學(xué)習(xí)更好的無(wú)偏用戶(hù)表示，作者提出了一個(gè)Deep Feedback Network (DFN)模型。圖1中給出了在微信看一看場(chǎng)景中的三種用戶(hù)反饋。DFN通過(guò)internal feedback interaction component抓住用戶(hù)行為序列中的細(xì)粒度行為級(jí)別的交互，然后通過(guò)external feedback interaction component，使用精確但稀少的隱式正反饋和顯式負(fù)反饋?zhàn)鳛楸O(jiān)督，從噪音較多的隱式負(fù)反饋中進(jìn)一步抽取用戶(hù)的正負(fù)反饋信息。這些反饋特征會(huì)和其他用戶(hù)/物品特征混合，并行使用FM、Deep和Wide層進(jìn)行特征交互，最后進(jìn)行CTR預(yù)估。

作者基于微信看一看推薦系統(tǒng)，設(shè)計(jì)了離線和線上實(shí)驗(yàn)，在多個(gè)指標(biāo)上具有顯著提升。這篇工作的主要貢獻(xiàn)如下：

1、作者第一次融合隱式正反饋（點(diǎn)擊行為）、隱式負(fù)反饋（曝光但未點(diǎn)擊的行為）、顯式負(fù)反饋（點(diǎn)擊不感興趣按鈕行為）和它們之間的交互信息進(jìn)行用戶(hù)行為建模；

2、作者提出了一個(gè)全新的Deep Feedback Network (DFN)模型，能夠?qū)W習(xí)到用戶(hù)無(wú)偏的興趣偏好；

3、模型在離線和在線任務(wù)上都得到了顯著提升，具有工業(yè)級(jí)實(shí)用價(jià)值。論文中也提出了一個(gè)feed流中的顯式負(fù)反饋預(yù)測(cè)任務(wù)。

2、模型結(jié)構(gòu)

DFN模型主要分為三個(gè)階段：首先，deep feedback interaction module以用戶(hù)的多種反饋行為作為輸入，輸出用戶(hù)的反饋特征。然后，F(xiàn)eature Interaction Module進(jìn)一步考慮用戶(hù)的其它特征和物品特征，使用FM、Deep和Wide層進(jìn)行特征交互。最后，輸出層使用CTR作為訓(xùn)練目標(biāo)。圖2給出了DFN的整體結(jié)構(gòu)。

deep feedback interaction module是模型的主要?jiǎng)?chuàng)新點(diǎn)。它包括了兩個(gè)組成部分：Internal Feedback Interaction Component和External Feedback Interaction Component。圖3給出了deep feedback interaction module的結(jié)構(gòu)。

首先，在Internal Feedback Interaction Component中，用戶(hù)的隱式正反饋、隱式負(fù)反饋和顯式負(fù)反饋序列和target item一起，通過(guò)一個(gè)transformer層，得到了在各個(gè)序列內(nèi)部細(xì)粒度的item-level的交互信息，然后經(jīng)過(guò)average層得到三種反饋的特征表示，其中隱式正反饋特征中蘊(yùn)含高質(zhì)量的用戶(hù)正向偏好，顯式負(fù)反饋特征中蘊(yùn)含高質(zhì)量的用戶(hù)負(fù)向偏好。

第二步，在External Feedback Interaction Component中，隱式負(fù)反饋序列往往是三種行為中最多的行為，但也是噪聲最大的行為。作者把高質(zhì)量的和target item交互后的隱式正反饋特征和顯式負(fù)反饋特征看作一種高質(zhì)量指導(dǎo)，從用戶(hù)未點(diǎn)擊序列中挖掘用戶(hù)或許喜歡/不喜歡的物品，補(bǔ)充用戶(hù)的正向負(fù)向偏好。作者使用了一個(gè)attention層得到了兩種用戶(hù)弱正向/負(fù)向反饋特征。這兩種弱反饋特征和第一步的三種反饋特征拼接后成為最終的用戶(hù)反饋特征。

第三步，在Feature Interaction Module中，作者使用了FM、Wide和Deep層，對(duì)用戶(hù)其它特征、物品特征和用戶(hù)反饋特征等進(jìn)行低階/高階特征交互。這一個(gè)模塊是為了充分利用各種特征輔助推薦，使得模型在真實(shí)工業(yè)級(jí)任務(wù)上達(dá)到最好的效果。使用Wide層主要是為了給潛在的特征工程留下接口。

最后，作者基于CTR loss進(jìn)行訓(xùn)練。除去傳統(tǒng)的正例和未點(diǎn)擊負(fù)例，作者還增加了一項(xiàng)預(yù)測(cè)用戶(hù)負(fù)反饋點(diǎn)擊的loss。由于在實(shí)際推薦系統(tǒng)中，用戶(hù)給出主動(dòng)顯式負(fù)反饋的次數(shù)極少，顯式負(fù)反饋中的負(fù)向信息也極其強(qiáng)烈，所以作者單獨(dú)在loss中強(qiáng)調(diào)了這一項(xiàng)，并且給予了較大的訓(xùn)練權(quán)值。

3、實(shí)驗(yàn)結(jié)果

離線和線上實(shí)驗(yàn)均在微信看一看上進(jìn)行，離線數(shù)據(jù)集包含千萬(wàn)級(jí)用戶(hù)在百萬(wàn)級(jí)物品上的億級(jí)行為。模型離線CTR預(yù)估結(jié)果如圖4：

4、總結(jié)

在本文中，作者初步研究了推薦系統(tǒng)中的多種顯式/隱式和正/負(fù)反饋之間的協(xié)同合作機(jī)制。DFN模型能夠基于多種反饋信息即時(shí)學(xué)習(xí)到用戶(hù)的無(wú)偏的正負(fù)向興趣，在點(diǎn)擊預(yù)估和不感興趣預(yù)估等多個(gè)任務(wù)上均有提升效果。直觀而有效的模型也使得DFN能成功在工業(yè)級(jí)推薦系統(tǒng)中得到部署和驗(yàn)證。我們預(yù)測(cè)用戶(hù)的顯式反饋，特別是顯式負(fù)反饋的信息將會(huì)未來(lái)推薦系統(tǒng)中起到更加重要的作用，在發(fā)掘推薦系統(tǒng)可解釋性同時(shí)提升用戶(hù)體驗(yàn)。

“觸控一體化”的新型機(jī)械手指尖研究

機(jī)械手面臨的難點(diǎn)在于如何在柔性物體上施加可控的擠壓力，以及在非穩(wěn)定狀況下確保精確、穩(wěn)健的抓握與柔性指端操控

戴瓊海院士：搭建腦科學(xué)與人工智能的橋梁

腦科學(xué)的發(fā)展將推動(dòng)人工智能科學(xué)從感知人工智能到認(rèn)知人工智能的跨越

如何加快解決數(shù)據(jù)產(chǎn)權(quán)問(wèn)題

數(shù)據(jù)所有權(quán)方面，1原始數(shù)據(jù)屬于個(gè)人，2企業(yè)享有衍生數(shù)據(jù)所有權(quán)，3政府享有政府?dāng)?shù)據(jù)的歸屬權(quán)

圖像檢索入門(mén)、特征和案例

圖像檢索是計(jì)算機(jī)視覺(jué)中基礎(chǔ)的應(yīng)用，可分為文字搜圖和以圖搜圖。借助于卷積神經(jīng)網(wǎng)絡(luò)CNN強(qiáng)大的建模能力，圖像檢索的精度越發(fā)提高

《視覺(jué)SLAM十四講》作者高翔：非結(jié)構(gòu)化道路激光SLAM中的挑戰(zhàn)

SLAM階段：解決從原始傳感器數(shù)據(jù)開(kāi)始，構(gòu)建某種基礎(chǔ)地圖的過(guò)程,標(biāo)注階段：在SLAM結(jié)果基礎(chǔ)上進(jìn)行人為標(biāo)注，實(shí)現(xiàn)更精細(xì)的交通規(guī)則控制

SLAM與V-SLAM特征對(duì)比

基于激光雷達(dá)的SLAM（激光SLAM）和基于視覺(jué)的SLAM（V-SLAM）。激光SLAM目前發(fā)展比較成熟、應(yīng)用廣泛，未來(lái)多傳感器融合的SLAM 技術(shù)將逐漸成為技術(shù)趨勢(shì)，取長(zhǎng)補(bǔ)短，更好地實(shí)現(xiàn)定位導(dǎo)航。

國(guó)內(nèi)外舵機(jī)參數(shù)性能價(jià)格比較

舵機(jī)是步態(tài)服務(wù)機(jī)器人的核心零部件和成本構(gòu)成，是包含電機(jī)、傳感器、控制器、減速器等單元的機(jī)電一體化元器件

AI在COVID-19診斷成像中的應(yīng)用

人工智能技術(shù)支持的圖像采集可以顯著幫助掃描過(guò)程實(shí)現(xiàn)自動(dòng)化，還可以重塑工作流程，最大限度地減少與患者的接觸，為成像技術(shù)人員提供最佳保護(hù)

不完美場(chǎng)景下的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法

騰訊優(yōu)圖實(shí)驗(yàn)室高級(jí)研究員Louis在分享了自適應(yīng)缺陷數(shù)據(jù)，業(yè)務(wù)場(chǎng)景下的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法

深度學(xué)習(xí)的可解釋性研究（一）— 讓模型具備說(shuō)人話的能力

為決策樹(shù)模型是一個(gè)具有比較好的可解釋性的模型，以決策樹(shù)為代表的規(guī)則模型在可解釋性研究方面起到了非常關(guān)鍵的作用

深度學(xué)習(xí)的可解釋性研究（二）——不如打開(kāi)箱子看一看

神經(jīng)網(wǎng)絡(luò)模型本身其實(shí)并不是一個(gè)黑箱，其黑箱性在于我們沒(méi)辦法用人類(lèi)可以理解的方式理解模型的具體含義和行為

深度學(xué)習(xí)的可解釋性研究（三）——是誰(shuí)在撩動(dòng)琴弦

神經(jīng)網(wǎng)絡(luò)的敏感性分析方法可以分為變量敏感性分析、樣本敏感性分析兩種，變量敏感性分析用來(lái)檢驗(yàn)輸入屬性變量對(duì)模型的影響程度，樣本敏感性分析用來(lái)研究具體樣本對(duì)模型的重要程度

資料獲取

機(jī)器人知識(shí)

== 最新資訊 ==

ChatGPT：又一個(gè)“人形機(jī)器人”主題

ChatGPT快速流行，重構(gòu) AI 商業(yè)

中國(guó)機(jī)器視覺(jué)產(chǎn)業(yè)方面的政策

中國(guó)機(jī)器視覺(jué)產(chǎn)業(yè)聚焦于中國(guó)東部沿海地區(qū)(

從CHAT-GPT到生成式AI：人工智能

工信部等十七部門(mén)印發(fā)《機(jī)器人+應(yīng)用行動(dòng)實(shí)

全球人工智能企業(yè)市值/估值 TOP20

創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司第十一期上

諧波減速器和RV減速器比較

機(jī)器人減速器：諧波減速器和RV減速器

人形機(jī)器人技術(shù)難點(diǎn) 高精尖技術(shù)的綜合

機(jī)器人大規(guī)模商用面臨的痛點(diǎn)有四個(gè)方面

青島市機(jī)器人產(chǎn)業(yè)概況：機(jī)器人企業(yè)多布局在

六大機(jī)器人產(chǎn)業(yè)集群的特點(diǎn)

機(jī)械臂-高度非線性強(qiáng)耦合的復(fù)雜系統(tǒng)

== 機(jī)器人推薦 ==

迎賓講解服務(wù)機(jī)器人

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

智能消毒機(jī)器人

機(jī)器人開(kāi)發(fā)平臺(tái)

機(jī)器人開(kāi)發(fā)平臺(tái)

機(jī)器人招商 Disinfection Robot 機(jī)器人公司機(jī)器人應(yīng)用智能醫(yī)療物聯(lián)網(wǎng) 機(jī)器人排名機(jī)器人企業(yè) 機(jī)器人政策教育機(jī)器人迎賓機(jī)器人機(jī)器人開(kāi)發(fā) 獨(dú)角獸消毒機(jī)器人品牌消毒機(jī)器人合理用藥地圖

版權(quán)所有 創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司 中國(guó)運(yùn)營(yíng)中心：北京清華科技園九號(hào)樓5層中國(guó)生產(chǎn)中心：山東日照太原路71號(hào)
銷(xiāo)售1：4006-935-088 銷(xiāo)售2：4006-937-088 客服電話： 4008-128-728

<fieldset id="stqdc"><small id="stqdc"></small></fieldset>

<samp id="stqdc"><acronym id="stqdc"></acronym></samp>

<samp id="stqdc"><label id="stqdc"></label></samp>

<fieldset id="stqdc"></fieldset>

<fieldset id="stqdc"><optgroup id="stqdc"></optgroup></fieldset>

<samp id="stqdc"><label id="stqdc"><u id="stqdc"></u></label></samp>