信也科技发布大规模图数据集助力金融领域异常检测

核心提示  近日,信也科技正式公开发布了大规模图数据集DGraph,DGraph由信也科技与浙江大学联合研发,旨在服务图神经网络、图挖掘、社交网络、异常检测等方向的研究人员,为之提供真实场景的大规模应用数据,帮助推动整个图领域的发展。  场景真实:

近日,新亚科技正式发布了由新亚科技和浙江大学联合研发的大规模图数据集DGraph。它旨在为图神经网络、图挖掘、社会网络、异常检测等领域的研究人员提供服务。,并为他们提供真实场景的大规模应用数据,帮助推动整个图形领域的发展。

场景现实:

DGraph的源数据来自新野科技真实的金融业务场景,由新野科技对外开放,分享给对图形领域感兴趣的研究人员。其构造逻辑接近行业应用,为数据集的用户提供了探索如何将图模型扩展到金融领域的机会。DGraph一方面可以作为验证关联图模型性能的标准数据,另一方面可以用于开展用户画像、网络分析等研究工作。

结构动力学:

DGraph作为一个没有权利的有向动态图,包含超过370万个节点和430万条动态边,支持大规模图模型的研究和评估。用户关系从跨越27个月的业务场景中采样,网络结构会随时间演化,为当前的动态图模型和挖掘研究提供了动态数据支持。

巨大的规模:

DGraph包含了200多万个“后台节点”,即没有被分类或分析,但实际存在并对业务逻辑产生间接影响的节点。这些节点在维持网络连通性方面发挥着重要作用,可以支持研究人员探索背景节点的性质。如下图所示,DGraph中的节点代表新野科技服务的用户,有向边代表用户关系。每个节点包含脱敏的属性特征和一个表明是否是金融诈骗用户的标签。

ICT相关负责人还表示:“目前,DGraph网站已经吸引了一批来自清华大学、中国科学技术大学、上海交通大学、同济大学等国内外知名高校的研究人员。”其中,清华大学计算机系知识工程实验室基于他们最新的图学习框架CogDL,为DGraph数据集提供了各种图算法的基线。

DGraph并不是新亚科技与浙江大学的第一次合作。早在2020年,信亚科技与浙江大学的合作论文就被国际顶级学术期刊IEEE TKDE正式收录,随后与浙江大学共建人工智能实验室。未来,新野科技将始终专注科技,潜心科研,进一步深化与高校的科研合作,不断创新突破新领域,努力实现“科技,让金融更美好”的使命。

声明:市场有风险,选择要慎重!本文仅供参考,非卖品。

 
友情链接
鄂ICP备19019357号-22