分类问题用机器学习的方法建模解决,下面是可以想到的特征:
(1)渠道特征:渠道、渠道次日留存率、渠道流量以及各种比率特征
(2) 环境特征:设备(一般伪造假用户的工作坊以低端机为主)、系统(刷量工作坊一般系统更新较慢)、 wifi使用情况、 使用时间、来源地区、ip是否进过黑名单
(3) 用户行为特征:访问时长、访问页面、使用间隔、次日留存、 活跃时间、页面跳转行为(假用户的行为要么过于一致,要么过于随机)、页面使用行为(正常用户对图片的点击也是有分布的,假用户的行为容易过于随机)
(4) 异常特征:设备号异常(频繁重置idfa)、 ip异常(异地访问) 、行为异常(突然大量点击广 告、点赞)、 数据包不完整等。