• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    業(yè)界 正文
    發(fā)私信給嘉嘉
    發(fā)送

    0

    ICLR 2022 cosFormer:重新思考注意力機制中的Softmax

    本文作者: 嘉嘉 2022-03-24 16:26 專題:ICLR 2019
    導語:Transformer在自然語言處理、計算機視覺和音頻處理方面取得了巨大成功。

    導讀:Transformer在自然語言處理、計算機視覺和音頻處理方面取得了巨大成功。作為其核心組成部分之一,Softmax Attention模塊能夠捕捉長距離的依賴關(guān)系,但由于Softmax算子關(guān)于序列長度的二次空間和時間復雜性,使其很難擴展。針對這點,研究者提出利用核方法以及稀疏注意力機制的方法來近似Softmax算子,從而降低時間空間復雜度。但是,由于誤差的存在,效果往往不盡如人意。

    我們(商湯多模態(tài)研究組)認為,近似操作本身存在的誤差使得其效果很難超越Softmax Attention。我們的觀點是,與其近似Softmax,不如設(shè)計一種方式代替Softmax,并且同時降低時間空間復雜度。因此,本文提出了名為cosFormer的方法,在時間空間復雜度關(guān)于序列長度為線性復雜度的同時,其性能接近或者超越Softmax Attention,并在LRA benchmark上取得SOTA結(jié)果。我們的設(shè)計核心理念基于兩點,首先是注意力矩陣的非負性,其次是對局部注意力的放大(非極大值抑制)。

    本文主要介紹已收錄于ICLR 2022的一篇文章 cosFormer : Rethinking Softmax in Attention。

    ICLR 2022 cosFormer:重新思考注意力機制中的Softmax 

    論文地址:https://arxiv.org/abs/2202.08791

    部分開源代碼:https://github.com/OpenNLPLab/cosFormer

    ICLR 2022 cosFormer:重新思考注意力機制中的Softmax 

    圖片表示各種transformer在LRA benchmark上的表現(xiàn),其中y軸表示性能,x軸表示速度,圓圈大小表示內(nèi)存,我們提出的cosFormer取得了明顯的優(yōu)勢。

    一、背景

    ICLR 2022 cosFormer:重新思考注意力機制中的Softmax 

    3、Softmax的兩大性質(zhì)

    我們經(jīng)過分析以及實驗,歸納出Softmax Attention中比較重要的性質(zhì),這兩個性質(zhì)可以指導我們的模型設(shè)計:

    1. 注意力矩陣的非負性

    2. 局部注意力的放大(非極大值抑制)

    ICLR 2022 cosFormer:重新思考注意力機制中的Softmax 

    所以我們的方法需要在加了reweighting操作后也更加集中在對角線附近。注意并非所有的有類似權(quán)重的函數(shù)均適用,這個reweighting的函數(shù)需要跟前面的QK一樣可以拆分成兩個矩陣的乘法的形式。

    至此,就可以引入我們的cosFormer了。

    二、cosFormer

    1、方法

    我們的方法基于線性Attention,首先給出符號定義:

    ICLR 2022 cosFormer:重新思考注意力機制中的Softmax 

    ICLR 2022 cosFormer:重新思考注意力機制中的Softmax

    2、實驗結(jié)果

    我們在單向模型,雙向模型以及LRA benchmark上測試了我們的方法,均取得了非常不錯的效果。

    單向語言模型,指標表示困惑度(越低越好): ICLR 2022 cosFormer:重新思考注意力機制中的Softmax

    論文地址:https://arxiv.org/abs/2202.08791

    雷峰網(wǎng)(公眾號:雷峰網(wǎng))

    分享:
    相關(guān)文章
    當月熱門文章
    最新文章
    請?zhí)顚懮暾埲速Y料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
    立即設(shè)置 以后再說
    主站蜘蛛池模板: 国产乱子伦精品免费无码专区| 日本一区二区国产| 无码成人1000部免费视频| 国产免费播放一区二区三区| 午夜福利视频自拍偷拍| 国产亚洲欧洲av综合一区二区三区| 久久久久香蕉国产线看观看伊| 精品人妻中文字幕色站| 国产永久AV福利在线观看| 制服丝袜另类专区制服| 亚洲精品动漫一区二区三| 91探花视频在线观看| 日韩欧美的偷拍?一区二区| 亚洲日本精品va中文字幕| 91极品美女高潮叫床在线观看 | 亚洲人妻系列中文字幕 | 欧亚AⅤ| 91资源在线观看| 婷婷四房综合激情五月在线| 国内精品久久久久影院日本| jizz亚洲人| jizz国产免费观看| 国产小屁孩cao大人| 久久精品6国产免费| a毛片免费在线观看| 亚洲嫩模一区二区三区| 蜜臂久久99精品久久久久宅男| 日本伊人色综合网| 丰满尤物白嫩啪啪少妇| 中文无码日韩欧免费视频| 中文字幕有码高清日韩| 加勒比无码一区二区三区| 国产精品久久久久AV福利动漫| 亚洲人视频在线观看| 国产95在线 | 欧美| 鲁一鲁一鲁一鲁一澡| 簧片无码| 无码一区二区三区| 无码AV一区| 国产福利一区二区在线观看| 亚洲成人夜色|