1.数据说明

赛题数据由约62万条训练集、20万条测试集数据组成,共包含13个字段。其中uuid为样本唯一标识,eid为访问行为ID,udmap为行为属性,其中的key1到key9表示不同的行为属性,如项目名、项目id等相关字段,common_ts为应用访问记录发生时间(毫秒时间戳),其余字段x1至x8为用户相关的属性,为匿名处理字段。target字段为预测目标,即是否为新增用户。

2.评估指标

本次竞赛的评价标准采用f1_score,分数越高,效果越好。

阅读全文 »

“Inductive learning” and “Transductive learning”

“Inductive learning”意为归纳学习,“Transductive learning”意为直推学习

对于GCN而言我们认为其是:直推学习,也就是说当测试集出现了训练集未学习过的节点时即图结构发生了变化时,网络需要重新训练。

对于GAT而言:归纳学习;也就是训练阶段见不到的数据(在图书剧中可以指新的节点,也可以指新的图) 直接进行预测而不需要重新训练。

阅读全文 »
0%