午夜精品久久久久久久99老熟妇,天堂中文www官网,未满十八18勿进黄网站,太粗太深了太紧太爽了,天天爽夜夜爽夜夜爽

CDA數(shù)據(jù)分析師

CDA數(shù)據(jù)分析師

考試報(bào)名
考試報(bào)名
考試內(nèi)容
考試大綱
在線客服
返回頂部

風(fēng)控這件事,一半是技術(shù),一半是藝術(shù)

2022-03-25

作者:小伍哥

來源:小伍哥聊風(fēng)控

大家好,我是小伍哥,今天跟大家聊個(gè)比較深入點(diǎn)的話題,技術(shù)好就能做好風(fēng)控么?

風(fēng)控算法或風(fēng)控策略,確實(shí)需要很深、很廣泛的技術(shù)儲(chǔ)備,但是也需要很高的應(yīng)用藝術(shù)和想象力。風(fēng)控不像其他業(yè)務(wù)技術(shù)或算法,算法的出現(xiàn)本身就有了比較確定性的場(chǎng)景了,比如推薦,直接套用就行,但是很多算法在風(fēng)控領(lǐng)域應(yīng)用的時(shí)候,場(chǎng)景需要自己去挖掘和發(fā)現(xiàn)。

怎么抽象場(chǎng)景,怎么使用算法,就是一個(gè)藝術(shù)活了。下面用一個(gè)圖異常檢測(cè)算法的一個(gè)點(diǎn)舉例說明。算法鏈接OddBall-圖異常點(diǎn)檢測(cè)

這篇文章,我相信很多讀者看到是圖算法,基本就放棄,認(rèn)為需要要自己寫很復(fù)雜的算法才能部署和實(shí)現(xiàn),其實(shí)對(duì)這個(gè)算法充分理解后,簡(jiǎn)單的統(tǒng)計(jì)就能用了,難點(diǎn)在于對(duì)算法的理解,以及對(duì)業(yè)務(wù)中場(chǎng)景的抽象,我們看看這個(gè)算法的一個(gè)點(diǎn)。

算法如下:DominantPair(主導(dǎo)邊)這個(gè)類型的風(fēng)險(xiǎn),Dominant heavy links指“主導(dǎo)的邊”,Ego-Net中存在某條邊權(quán)重異常大,如下圖所示。

風(fēng)控這件事,一半是技術(shù),一半是藝術(shù)

度量方法:主特征值~總權(quán)重,大多數(shù)節(jié)點(diǎn)Ego-net對(duì)應(yīng)帶權(quán)鄰接矩陣中主特征值(principal eigenvalue,即最大特征值)~總邊權(quán)重也服從冪律分布,其中系數(shù) λ 表示Ego-net中邊權(quán)均勻分布, λ 接近1表示存在DominantPair的情況,衡量的公式如下:

風(fēng)控這件事,一半是技術(shù),一半是藝術(shù)

我們來簡(jiǎn)化下這個(gè)算法思想:其實(shí)一句話,就是一個(gè)點(diǎn)有很多個(gè)鄰居,某個(gè)鄰居權(quán)重占所有鄰居總權(quán)重的比例特別大

再來個(gè)更具體的例子:一個(gè)商家一個(gè)月賣了10000個(gè)訂單,100個(gè)消費(fèi)者,其中一個(gè)消費(fèi)者買了9900單,那這個(gè)消費(fèi)者占比9000/10000=90%,形成了主導(dǎo)邊,那這個(gè)商家可能就存在異常。我們其實(shí)只要統(tǒng)計(jì)商家的總訂單,以及每個(gè)商家-消費(fèi)者維度的訂單聚合,然后相除就解決了,這就是個(gè)簡(jiǎn)單的SQL計(jì)算問題,完全不用什么復(fù)雜的寫算法。

風(fēng)控這件事,一半是技術(shù),一半是藝術(shù)

當(dāng)然,這里的訂單數(shù)可以換成金額

訂單換成點(diǎn)擊:可以監(jiān)控惡意流量什么的

訂單換成領(lǐng)券:可以監(jiān)控羊毛黨什么的

·········

商家和消費(fèi)者也可以換成其他的角色,根據(jù)自己的平臺(tái)設(shè)計(jì)這種監(jiān)控指標(biāo),我覺得能發(fā)現(xiàn)傳統(tǒng)發(fā)現(xiàn)不了的異常,因?yàn)楹苌儆腥诉@么思考過。

那消費(fèi)者-換地址關(guān)系呢?情況就變了,權(quán)重大反而是正常的,小反而不正常,可能是黃牛什么的,因?yàn)檎H说玫刂?,相?duì)比較集中,就那個(gè)幾個(gè)固定的。

風(fēng)控這件事,一半是技術(shù),一半是藝術(shù)

那消費(fèi)者-充值手機(jī)呢?也是同樣的,權(quán)重大反而是正常的,小反而不正常,可能是銷贓款或者洗錢什么的。因?yàn)檎H耍o自己手機(jī)充值,或者加幾個(gè)家里人和同學(xué)什么的,有些賬戶給幾千幾萬(wàn)人充值,那可能就異常了。

風(fēng)控這件事,一半是技術(shù),一半是藝術(shù)

那這個(gè)是不是可以再抽象一點(diǎn),比如消費(fèi)者-購(gòu)物類目關(guān)系網(wǎng)絡(luò),按道理,每個(gè)人的購(gòu)物,基本均勻分布在不同的類目,有吃穿的也有用的,如果發(fā)現(xiàn)一個(gè)用戶,大量購(gòu)買集中在某些偏門的類目,那是不是有可能這個(gè)用戶或者被購(gòu)買的商家有異常?是不是要買制毒的原材料?是不是在圖謀什么?或者在交易什么?

風(fēng)控這件事,一半是技術(shù),一半是藝術(shù)

每個(gè)公司的業(yè)務(wù)不一樣,但是很多思路,都是可以順著這個(gè)算法的結(jié)構(gòu)去思考的,需要充分理解算法,充分理解業(yè)務(wù),充分的想象力。

我們看到了異常檢測(cè),看到了圖,但是要更加深入的去看到業(yè)務(wù)與之匹配的地方,多維度的思考,聯(lián)想,并進(jìn)行應(yīng)用,才能讓算法產(chǎn)生價(jià)值,所以,風(fēng)控,不僅是技術(shù)問題,也是藝術(shù)。

風(fēng)控挖掘的樂趣,大抵也在此了。

完 謝謝觀看

完 謝謝觀看