首页 > 新闻 > 社会 > 正文

智慧人才系统算法解析

文章来源:
字体:
发布时间:2020-10-28 20:00:45

智慧人才系统算法解析


那么,这么详细、可视化的人才地图,是怎么做出来的呢?


智谱AI人才地图的研发团队表示,该智慧人才系统依托清华大学高质量大规模知识图谱、深度隐含关联挖掘算法和认知图谱等核心技术,服务地方科技产业发展,展示符合地方发展方向的本地、全国和全球人才分布态势、人才流动趋势,可以为地方人才引进工作中的寻、评、引、用提供基于大数据的智能化支持,构建全球人才 Global Positioning System,实现人才工作的按图索骥。


在算法使用上,智慧人才地图主要使用了人才指数算法和两种城市人才分析方法。



人才指数算法:
该算法模型是一种机器学习+专家经验的集成模型,内层根据学术人才评价指标特点分别采用使用 LR,SVM,深度神经网络等机器学习算法。利用 AMiner 人工标注的不同领域、多层次学术机构的大量高质量学者数据库作为模型训练数据。在此基础上,外层封装专家知识的经验模型,组合而成城市人才评分模型。


为使该算法达到最优计算效果,该模型的训练采用了启发式规则+模型自主学习的联合算法,优化目标值也是从大量经过提纯的学者数据中,经过统计分析得到的。


这样得到的算法模型,结合了大数据分析和专家先验知识,从而达到合理精准评分。


而计算城市人才指数得分的过程,就是将人才该城市的人才指标特征(顶尖学者发文数之和,学者数,h之和,引用数之和等),输入到模型中,会得到所属的层级分类和具体得分,这个得分可以理解为和高等级的学术团体之间的差距。



城市人才分析方法:
针对需求领域类型的不同分别采用以下 2 种方法:
1.针对较为专业的领域方向,且和其他领域交叉较多,采用学者标注算法进行人才分析;使用2类算法对学者进行领域分析标注:


a. AMiner 学科知识图谱:对学者的发表论文中的实体,关系等信息进行抽取(其中实体抽取方法使用 BERT+CRF 和规则,关系抽取采用多种方式结合:包括规则和远程监督),再利用已构建的学科知识图谱推理对学者进行领域标注。


b. 领域标注系统:这是一个以深度学习为核心算法的多标签标注系统,算法网络结构简单说明:先用 bert 对学者多篇代表性论文进行 Emmbedding,再使用多个的局部 Attention 层和全局 Attention 层进行特征的融合和提取,最后基于这些语义特征向量进行标签预测,即对学者进行领域的标注。


2.针对于相对独立的学科领域采用 AMiner 会议期刊库(包含大约 4 万个期刊会议)进行人才筛选分析;流程如下:专家标注期刊/会议→期刊/会议影响力排序→学者筛选→学者学术水平排序。