• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    人工智能開發者 正文
    發私信給汪思穎
    發送

    0

    IJCAI 2018廣告算法大賽落下帷幕,Top 3 方案出爐

    本文作者: 汪思穎 2018-06-18 16:19 專題:IJCAI 2018
    導語:如何處理第七天的轉化率異常是需要解決的一大痛點。針對此問題,他們根據對數據的分析、特征的構建、以及對實際場景的思考,提出了四種訓練集劃分。

    雷鋒網 AI 研習社消息,IJCAI-18 阿里媽媽搜索廣告轉化預測比賽近日落下帷幕,本次比賽為阿里媽媽與 IJCAI2018、天池平臺聯合舉辦,總獎池 37000 美元,共吸引到 5204 支隊伍參賽。

    此次比賽提供了廣告點擊相關的用戶(user)、廣告商品(ad)、檢索詞(query)、上下文內容(context)、商店(shop)等信息,參賽選手需要在這些條件下預測廣告產生購買行為的概率(pCVR),形式化定義為:

    pCVR=P(conversion=1 | query, user, ad, context, shop)

    主辦方希望在考慮到用戶行為偏好、商品長尾分布、熱點事件營銷等一系列因素的前提下,利用海量交易數據準確高效地預測用戶購買意向。此次比賽設置了如下兩類挑戰:

    • 日常的轉化率預估

    • 特殊日期的轉化率預估

    目前,比賽結果已經出爐。雷鋒網看到,來自京東尚科,天池代號為「plants」的選手獲得冠軍,IJCAI-17 冠軍團隊獲得者周耀、郭鵬博以及李智獲得季軍,浙江工業大學陳波成、中南大學羅賓理和天津大學吳昊組成的「躺分隊」獲得第三名,作為前三名中唯一一支學生團隊,他們的比賽方案也已經出爐。

    在方案中,他們主要討論了異常日期處理問題,主要思路如下:

    難點與挑戰

    這次比賽的難點有二,一是如何在正常流量數據中,找到適合表達促銷/突變的特征;二是如何在模型選擇上,找到盡快落地于工業界的輕量級框架。

    分析數據 

    訓練數據為 8 月 31 日- 9 月 7 日上午,需要預測 9 月 7 日下午的用戶點擊率,8 月 31 日-9 月 5 日轉化率穩定,但 6 日下降,7 日猛增,推測 7 日為大促節日。

    對于異常日期處理而言,僅僅考慮前六天的轉化率和第七天的高轉化率是不太適合的,如何處理第七天的轉化率異常是這道題需要解決的一大痛點。

    四種訓練集劃分

    針對此問題,他們根據對數據的分析、特征的構建、以及對實際場景的思考,提出了四種訓練集劃分:

    1. 全量統計特征提取第七天特征——all-to-7 

    2. 全量數據的抽樣統計——sample 

    3. 單獨第七天的特征提取——only7 

    4. 全量數據——all

    構造四種訓練集劃分的目的如下: 

    1)構造出訓練集中的差異性,方便模型融合 

    2)在每組訓練集中,對高維特征進行選擇,選擇后進行特征分組

    特征工程:

    首先執行如下三步操作:

    1. 上述基礎特征分列

    2. 去掉取值變化小的列

    3. 去掉缺失值過多的列

    IJCAI 2018廣告算法大賽落下帷幕,Top 3 方案出爐

    分析過程如下:

    IJCAI 2018廣告算法大賽落下帷幕,Top 3 方案出爐

    特征工程總覽如下:

    IJCAI 2018廣告算法大賽落下帷幕,Top 3 方案出爐

    特征選擇

    特征選擇的方法有如下2點:

    1)羅賓理同學在GitHub的開源代碼,參照糖尿病精準醫療大賽的特征選擇,地址如下:

    https://github.com/luoda888/tianchi-diabetes-top12/blob/master/README.md

    以及利用貪心、模擬退火算法,構造出多組特征,適用于組內模型融合。 

    2)利用 Std/Mean 訓練集測試集分布一致的思想,進行特征選擇,保證線上線下特征的一致性。

    模型選擇及融合

    分組后對不同的模型進行訓練,構造組內特征的差異性,模型的差異性 。

    他們選擇的方法有 Xgboost/Lightgbm/GBDT+LR/Catboost/NN 模型 

    在 NN 模型里,使用對多個模型求 Average 的方法,使用的模型如下: 

    • DeepFM/DeepFFM (原始 ID 特征放入交叉層) 與 Lightgbm 線下差距 0.0001 (千分點) 

    • AFFM/AFM (對原始 ID 特征加入 Attention) 與 Lightgbm 線下差距 0.00001 (萬分點) 

    • FNN/FFNN/NFM (將特征工程后放入網絡結構) 與 Lightgbm 線下差距 0.0001 (千分點) 

    將上述模型按對該組訓練集的數據敏感性訓練后加權,得到該組 NN 的結果 Ans_nn。每組特征都可以放入上述五個模型中,即組內選擇出的特征數 n 乘以組內模型數 m 即為該組模型的數量 = n*m。根據模型間的相關性,分配不同的權重進行加權融合,得到該組的答案 Ans_k。

    接下來,在組間訓練集中,對每組的 Ans_k 進行加權融合得到 Ans_final,然后利用前六天的上下午,每小時均值的變化趨勢,線下預測出線上可能的均值,為 0.036287135,最后對 Ans_final 做 Logit 逆變換。

    模型融合框架如下:

    IJCAI 2018廣告算法大賽落下帷幕,Top 3 方案出爐

    對比賽的總結有如下三點:

    1)對促銷時期應考慮變化特征

    2)合理的特征提取框架是致勝之道

    3)多模型的融合提升精度較多

    方案詳情:https://github.com/luoda888/2018-IJCAI-top3

    比賽官網:https://tianchi.aliyun.com/competition/introduction.htm?spm=5176.11163580.0.0.4f5564f0sOZqnA&raceId=231647

    雷鋒網 AI 研習社編輯整理。

    雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

    IJCAI 2018廣告算法大賽落下帷幕,Top 3 方案出爐

    分享:
    相關文章

    編輯

    關注AI學術,例如論文
    當月熱門文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說
    主站蜘蛛池模板: 色爱综合另类图片av| 亚洲国产精品中文字幕日韩 | 无码人妻精品一区二区三| 乱60一70归性欧老妇| 国产98在线| 亚洲最大成人av在线| 男人的天堂av一二三区| 国产高清精品在线一区二区 | 1024在线看国产亚洲欧美| 无码人妻精品丰满熟妇区| 东京热一精品无码av| 国产V视频| 日韩精品一卡| 91成人精品啪在线观看国产| 极品人妻videosss人妻| 国产精品一区在线蜜臀| 国产JIZzJIzz视频全部免费| 久久人人久久人人| 国产日韩精品在线视频| 免费99精品国产人妻自在现线| 福利一区二区不卡国产| 国产精品ⅴ无码大片在线看| 亚洲日韩AV一区二区三区四区| 久久精品一区二区三区资源网| 久久亚洲精品成人av无| 中文字幕亚洲一区| 老鸭窝在线视频| 三级全黄的全黄三级三级播放| 成人免费亚洲av在线| 女同精品女同系列在线观看| 视色网| 亚洲?日韩?中文?无码?制服| 成人片99久久精品国产桃花岛| 岳乳丰满一区二区三区| 疯狂做受xxxx高潮欧美日本| 天海翼无码在线| 美日韩在线视频一区二区三区 | 九九热在线精品视频99| 国产真人无遮挡免费视频| 午夜无码AV| 亚洲熟妇色XXXXX欧美老妇Y|