科技人才是国家科技创新和经济发展的首要动力,也是实现中华民族伟大复兴的关键因素。如何发现、培养、留住、吸引和使用人才,是在当今日益激烈的国际竞争中取得优势的重要课题。
北京是世界著名的历史文化古都和现代化国际大都市。同时,北京也是全国顶尖人才聚集的最高点。在过去的三十年里,北京作为经济和政治中心,聚集了来自全国乃至世界各地的高素质学者,不断推动北京综合实力和核心竞争力的增长。
今天学术君就带领大家通过AI+大数据,详细了解北京的人才现状和实力。
从北京市智力人才地图来看,北京市人才的整体分布和发展状况遥遥领先于全国其他重点城市。
图1:北京市智慧人才地图具体来看,北京云计算、人工智能、大数据、物联网四大领域高层次人才总量为2995人,远超其他一线城市。
其中,云计算领域高层次人才数量最多,为878人;人工智能领域高层次人才845人;大数据领域聚集的高层次人才数量为679人;物联网领域高层次人才593人。
此外,从图1可以看出,北京重点领域高层次人才92%集中在海淀区。从所属高校/院校来看,清华大学、北京大学、北京邮电大学占据北京人才院校前三的位置。
分领域来看,在人工智能领域,北京的人才健康指数为92.8,位居全国第一。
图2:北京市人工智能领域人才指数其中,与其他城市相比,北京在产业创新研究和产业创新影响力方面更为突出。从分布区域来看,人工智能领域人才主要集中在海淀区,清华大学和北京大学在该领域人才数量最多,成果数量最多;“机器学习”、“无监督学习”、“语音识别”等关键词是本市该领域的研究热点。
在大数据领域,北京的人才健康指数为95.2,位居全国第一。
图3:北京市大数据领域人才指数其中,从区域分布来看,北京大数据领域人才主要集中在海淀区和朝阳区;在大数据领域人才机构排名中,清华、北大也领先多家机构;“异构信息网络”、“数据流”、“数据立方体”等关键词揭示了北京大数据领域的研究热点。
在云计算领域,北京的人才健康指数为90.2,位居全国第一。
图4:北京市云计算领域人才指数其中,在区域影响力的比较中,北京在产业创新方面的影响力较为突出,而基础科研方面的影响力相对较弱;从区域分布来看,北京云计算领域人才主要集中在海淀区;在大数据领域人才机构排名中,清华大学在该领域人才数量最多,成果数量最多;“P2P分布式”、“虚拟桌面”、“企业混合云”这几个词是本市这一领域的研究热点。
在物联网领域,北京的人才健康指数为91.3,位居全国第一。
图5:北京市物联网领域人才指数其中,在区域影响力比较中,北京在产业创新影响力和产业创新力上更为突出;从区域分布来看,人才主要集中在海淀区和朝阳区;在该领域人才院校排名中,清华大学、北京大学、北京邮电大学名列前茅;“无线通信”、“商业智能”、“传感器”这几个词是本市这一领域的研究热点。
人才地图的智慧
“智慧人才图谱”是智普AI借助科技信息大数据挖掘与服务系统平台AMiner构建的超大规模多研究领域知识图谱,是基于场景为学者提供智能匹配服务的智慧人才系统。
利用系统化的数据挖掘和社会网络分析技术,从海量文献和互联网信息中获取信息,进行语义提取和隐性关联挖掘,构建全球各领域学者人才网络,为学者、机构、企业等提供人才搜索、论文搜索、学者社会网络关系识别、能力图谱等多样化功能。
而且智能人才系统提供基于大规模知识图谱的人才语义检索,智能理解用户查询的语义信息,从学科领域、人才姓名、研究兴趣、就业单位等多个维度,快速准确地自动搜索系统提供的专家智库。,精准定位用户正在寻找的专家型人才,并提供多维度人才语义属性的快速筛选和智能排序。
图6:多精度人才语义画像除了自供电的语义检索,该产品还为用户提供专家/智库的集合,以及浏览打开的智库,帮助用户从不同的功能门户快速找到目标专家。
人才系统的亮点包括:
以大数据技术为核心,构建超大规模多研究领域知识图谱,为学者提供基于场景的智能匹配服务;基于各地区、各研究领域的人才指标,对人才结构、发展目标进行多维度的分析预测,提供人才数据的可视化展示,实现学者“按图索骥”。采用SaaS模式的微服务架构,能够快速响应和部署业务需求的变化,实现对业务拓展的及时支持。
如上图,智能人才地图可以给出北京人工智能、大数据、云计算、物联网等热点领域的各种信息。呈现的数据点对点组合,不仅包括该领域人才趋势、城市人才分布和北京人才机构排名,还包括全国该领域人才分布和发展情况,以及北京与全国其他省会城市的影响力对比。
图7:智慧人才地图“人才健康指数”和“人才分布图”功能介绍
图8:智能人才地图“本地人才核心区域/行业”和“人才动态”功能介绍
图9:智能人才地图“人才情况分析”功能介绍
此外,科技信息大数据挖掘与服务系统平台AMiner也结合人工智能的学术知识图谱,深度挖掘了目前北京各领域学者的职业信息。感兴趣的读者可以访问AMiner平台查看一下。
智能系统算法分析
那么,如此详细、直观的人才地图是如何制作出来的呢?
智慧AI人才图谱RD团队表示,智慧人才系统依托清华大学的高质量大规模知识图谱、深度隐含关联挖掘算法、认知图谱等核心技术,服务地方科技产业发展,展现符合地方发展方向的地方、全国、全球人才分布情况和人才流动趋势。可以为本地人才的搜寻、测评、引进和使用提供基于大数据的智能支持,构建全球人才定位系统,实现人才工作按图走。在算法的使用上,智能人才地图主要使用了人才指数算法和两种城市人才分析方法。
人才指数算法:这个算法模型是机器学习和专家经验的集成模型。内层根据学术型人才评价指标的特点,采用LR、SVM、深度神经网络等机器学习算法。以AMiner人工标注的大量不同领域、多层次学术机构的优质学者数据库作为模型训练数据。在此基础上,外层封装专家知识的经验模型,结合城市人才评分模型。
为了达到最佳的计算效果,模型的训练采用了启发式规则和模型自学习的联合算法,优化目标值也是从大量提纯的学者数据中通过统计分析得到的。
这种算法模型结合了大数据分析和专家的先验知识,从而实现合理、准确的评分。
计算城市人才指数得分的过程是将城市的人才指数特征输入到模型中,你会得到分层分类和具体得分。这个分数可以理解为与高水平学术群体的差距。
城市人才分析方法:根据需求领域的不同类型,分别采用以下两种方法:
针对更专业的领域方向以及与其他领域的交叉,使用学者标注算法进行人才分析;用两种算法来标注学者的领域分析:a. AMiner的领域知识图谱:提取学者发表论文中的实体和关系的信息,然后用构建的领域知识图谱来标注学者的领域。b .领域标签系统:这是一个以深度学习为核心算法的多标签标签系统。该算法的网络结构简单:首先对学者的几篇代表性论文进行bert发散,然后通过多个局部注意层和全局注意层融合提取特征,最后基于这些语义特征向量预测标签,即学者的领域标注。2.针对相对独立的学科领域,利用AMiner会议期刊数据库进行人才筛选分析;流程如下:专家标注期刊/会议→期刊/会议影响力排名→学者筛选→学者学术水平排名。参考:Zhipu.ai智能人才地图file/tupian/20220803/p