BDA数据分析职业技能等级规范
———————————————————————————————————
CMRA & 中经数(北京)数据应用技术研究院
前 言................................................................................. 2
1 范围................................................................................ 3
2 术语和定义.......................................................................... 3
3 职业技能等级划分与要求.............................................................. 3
4 职业能力要求........................................................................ 5
5 培训要求........................................................................... 10
6 鉴定要求........................................................................... 10
7 证书管理........................................................................... 11
本标准按照GB/T 1.1-2009给出的规则起草。
本标准由中经数(北京)数据应用技术研究院提出并归口。
本标准起草单位:中国信息协会市场研究业分会,台湾人工智慧发展学会,山东省大数据研究会,中经数(北京)数据应用技术研究院,中国联通智慧足迹数据科技有限公司,河北经贸大学,天津商业大学,天津财经大学,陕西乐观数据科技有限责任公司。
本标准主要起草人:王磊,李春林,张良,翁瑞光,安建业,扈琼玲,姜澍,张岩,石玉峰,王键,杨春河,云霞。
本标准为首次发布。
声明:本标准的知识产权归属于中经数(北京)数据应用技术研究院,未经研究院同意,不得印刷、销售。任何组织、个人使用本标准开展认证、检测等活动应经研究院批准授权。
BDA数据分析职业技能等级规范
本标准规定了BDA数据分析职业技能的术语和定义、职业技能等级划分与要求、职业能力要求、培训要求和鉴定要求。
本标准适用于BDA数据分析职业技能等级认证的考核与评估,数据分析从业人员的聘用和培训等。
数据分析 Data Analysis
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析研究和概括总结,提取有用信息和形成结论的过程。在实用中,数据分析可帮助人们做出判断,其研究结论可以用于决策支持。因此数据分析也是决策支持中的重要环节。常用的分析方法有假设检验、多元分析、时序分析、调查分析等。
数据挖掘 Data Mining
数据挖掘是一个利用各种分析方法,从大量数据中提取隐含和潜在的、对决策有用的信息和知识的过程。数据挖掘的主要流程包括:问题与数据理解、数据准备、模型建立、模型评估、结论发布与应用。
数据洞察 Data Insight
数据洞察是利用数据分析或数据挖掘得到的知识,结合问题背景领域的知识理解,告诉人们如何选择,或者怎样的选择会导致怎样的结果,包括决策运营、预测机会等。数据洞察是对分析结论的升华,具有很强的指向性。
BDA数据分析职业技能划分为五个等级:
——员级;
——初级;
——中级;
——准高级;
——高级。
主要职责是办公自动化、数据收集基本技能。
主要职责是办公自动化、数据收集基本技能;具备基本的数据处理、分析和展示能力。
主要职责是具备数据处理、分析和展示能力;具备基本的网络数据收集、数据挖掘能力,具备和大型数据库管理人员、大数据框架工程师团队协同工作的能力。
主要职责是具备网络数据收集、数据挖掘能力;具备大规模数据处理、分析和展示能力;具备协助高级数据分析师工作的能力。
主要职责是具备网络数据收集技能、数据挖掘能力;具备大规模数据处理、分析和展示能力;具备承担大数据项目设计和实施能力。
中职毕业(含在校生),经培训考核成绩合格。
专科以上学历(含在校生),或从事相关工作,经考核成绩合格。
本科以上学历(含在校生),或取得初级证书且从事相关工作1年以上,经考核成绩合格。
硕士以上学历(含在校生),或取得中级证书且连续从事相关工作2年以上(含2年),经考核成绩合格。
博士学历,或硕士学历且取得准高级证书后连续从事相关工作3年以上(含3年),或连续从事相关工作5年以上且具有项目管理经验,经答辩成绩合格。
数据管理员职业能力要求,见表1。
表1 数据管理员职业能力要求
|
职业 功能 |
工作内容 |
技能要求 |
相关知识 |
|
基本 素养 |
职业道德与安全意识 |
1.能遵守职业道德 2.能遵守涉及的数据安全和保密要求及规定 |
1.了解职业道德的知识和应用 2.了解数据安全和保密要求的知识及规定 |
|
办公 自动 化 |
数据与结论的可视化展示 |
1.能运用Excel软件管理数据 2.能运用PPT美化和展示分析结论 3.能熟练运用办公软件进行文档编辑排版等工作 |
1.掌握办公软件(word、excel、ppt等)的相关知识及应用 |
|
数据 管理 |
数据收集 |
1.能收集互联网上的数据 2.能通过调查活动收集数据 |
1.掌握互联网上公开数据的来源和采集方法 2.了解调查数据采集的基本要求和流程 |
|
数据处理 |
1.能预处理结构化数据 2.能完成数据抽取、清理转换、格式化数据 |
1.了解数据的基本结构 2.了解数据预处理的相关方法及应用 3.理解数据集成、数据审核、数据清理和数据转换方法 |
初级职业能力要求,见表2。
表2 初级职业能力要求
|
职业 功能 |
工作内容 |
技能要求 |
相关知识 |
|
基本 素养 |
职业道德与安全意识 |
1.能遵守职业道德 2.能遵守涉及的数据安全和保密要求及规定 |
1.了解职业道德的知识和应用 2.了解数据安全和保密要求的知识及规定 |
|
数据 管理 |
数据收集 |
1.能收集互联网上的数据 2.能收集外部的公开或非公开数据 3.能收集内部的数据 4.能通过调查活动收集数据 |
1.掌握互联网上公开数据的来源和采集方式 2.理解抽样调查及社会调查方法的基本知识及应用 3.掌握非公开数据和内部数据的采集方法 |
|
数据处理 |
1.能处理结构化与非结构化数据 2.能完成数据抽取、清理转换、格式化数据 3.能运用常用的数据库存取数据 |
1.理解数据集成、数据审核、数据清理和数据转换的基本方法 2.理解均值插补、回归插补、相似值插补等常用缺失值插补方法 3.了解数据结构及数据库的基本原理 4.了解分布式文件系统数据存取机理 |
|
|
分析 |
数据分析 |
1.能根据业务问题选择数据分析方法 2.能运用各类数据分析方法进行数据分析 |
1.掌握统计学基础、数据分析方法基础 2.运用描述性分析、推断性分析、方差分析、线性回归分析等方法分析数据 |
|
数据分析工具的应用 |
1.能运用R、Excel、SPSS、SAS等某一数据分析工具 |
1.掌握基于R、Excel、SPSS、SAS等某一数据分析软件掌握数据分析的相关方法及应用 |
|
|
可视 化设 计与 报告 写作 |
数据可视化展示 |
1.能通过程序语言或工具展示数据情况 2.能选择合适图型展示复杂数据 3.能运用Excel软件展示数据结论 4.能运用PPT美化和展示分析结论 |
1.掌握数据分析软件的可视化功能及应用 2.掌握办公软件(word、excel、ppt等)的相关知识及应用 |
|
撰写报告 |
1.能根据分析结论提出合理建议和撰写报告 2.能熟练运用办公自动化软件编辑报告文档 |
1.掌握数据分析报告的撰写要求 2.掌握调查分析报告的撰写要求 |
4.3 中级职业能力
中级职业能力要求,见表3。
表3 中级职业能力要求
|
职业 功能 |
工作内容 |
技能要求 |
相关知识 |
|
基本 素养 |
职业道德与安全意识 |
1.能遵守职业道德 2.能遵守涉及的数据安全和保密要求及规定 |
1.了解职业道德的知识和应用 2.了解数据安全和保密要求的知识及规定 |
|
业务 分析 |
定义业务问题 |
1.能将业务目标转化为数据分析目标 2.能分析业务对应产品的分类和服务模式 3.能分析业务运营模式及系列结构 4.能分析相当业务计算机管理系统 |
1.了解项目分析的知识和方法 2.了解相关业务领域基本知识 |
|
数据 管理 |
数据库 管理 |
1.能分析和评估不同场景的数据库应用 2.能搭建企业常用数据库 3.能对多数据库操作管理 4.能优化数据库 |
1.了解多款数据库的特性及优缺点 2.了解Hadoop生态圈上的Hbase、Hive、Impala的基本功能 3.了解数据库的索引机制、查询优化机制、存储机制,表分区应用等 4.掌握数据库的创建与管理、视图、索引以及备份与恢复等方法 |
|
数据 预处理 |
1.能制定不同来源数据收集方案 2.能拼接不同来源不同类型的数据 3.能处理丢失或损坏的数据 4.能从海量数据中搜集并提取信息 5.能完成数据抽取、清理转换、重构整合和格式化数据 |
1.了解大数据的基本理论与应用 2.掌握数据集成、数据审核、数据清理和数据转换的基本方法 3.掌握均值插补法、回归插补法、相似值插补方法等常用缺失值插补方法, 4.了解EM插补法、多重插补法和基于模型的插补方法 |
|
|
数据挖掘与统计机器学习 |
数据挖掘 分析 |
1.能分析数据特征 2.能运用数据挖掘分析方法 3.能分析和处理海量数据 4.能熟练的进行多维度分析 5.能实现特定数据挖掘功能 |
1.掌握数据挖掘相关知识 2.理解统计建模相关知识 3.运用分布分析、对比分析、统计量分析、周期性分析、贡献度分析、相关性分析等方法 4.运用因子分析、聚类分析、判别分析、对应分析、多元回归分析、Logistic回归分析、时间序列分析、结构方程模型等分析方法 5.掌握决策树、关联分析、神经网络等分析方法 6.理解开源的算法代码 |
|
模型训练 与应用 |
1.能创建训练集、验证集和测试集 2.能评估模型性能 3.能运用建立好的模型预测业务问题 4.能实现特定模型功能 |
||
|
可视化分析 |
撰写报告 与可视化数据 |
1.能使用可视化分析的相关工具及相关软件 2.能理解和掌握可视化分析的算法模型 3.能应用开源软件进行可视化分析项目 4.能按要求撰写数据分析报告 |
1.掌握数据分析报告的撰写要求 2.掌握调查分析报告的撰写要求 3.掌握python等数据分析工具可视化功能及应用 |
准高级职业能力要求,见表4。
表4 准高级职业能力要求
|
职业 功能 |
工作内容 |
技能要求 |
相关知识 |
|
基本 素养 |
职业道德与安全意识 |
1.能遵守职业道德 2.能遵守涉及的数据安全和保密要求及规定 |
1.了解职业道德的知识和应用 2.了解数据安全和保密要求的知识及规定 |
|
业务 分析 |
定义业务问题 |
1.能将业务目标转化为数据分析目标 2.能分析业务对应产品的分类和服务模式 3.能分析业务运营模式及系列结构 4.能分析相当业务计算机管理系统 |
1.了解项目分析的知识和方法 2.了解相关业务领域基本知识 |
|
数据库管理 |
数据库架构设计与特性评估 |
1.能分析评估不同数据库的特性和优缺点 2.能协助工程师完成数据库架构设计 3.能协助ETL工程师工作 |
1.理解在不同场景下数据库的构建、运维和评估技术 2.了解大规模并行处理、分布式文件系统、分布式数据库、分布式计算等大数据平台的构建和运维技术 3.理解流计算等分析技术 4.理解数据库运作原理和工具实现方式 |
|
大数据管理与设计 |
1.能进行数据分析和建模 2.能协助实践BI全过程 3.能协助开发大数据分析处理系统 |
||
|
统计机器学习与深度学习 |
模型与算法的计设、测试和验证 |
1.模型选择与评估 2.运用建立好的模型预测业务问题 3.能灵活对特定的业务场景进行统计学方法和机器学习方法 4.能理解图像或语音或文本分析和挖掘方法 |
1.掌握特征提取、异常诊断、模型评估技术和决策树、关联分析、支持向量机、神经网络、贝叶斯网络等分析方法 2.理解图像分析,或语音分析,或文本分析方法 3.理解无监督学习、有监督学习、模式识别、卷积神经网络等分析方法 4.理解图像或语音或文本分析的内部机理 |
|
可视化分析 |
通过源代码或工具软件实现可视化分析 |
1.能使用可视化分析相关开源软件栈和工具 2.能协助开发分布式可视化分析系统 |
1.掌握python等数据分析工具可视化功能及应用 2.了解开源的算法代码编 |
4.5 高级职业能力
高级职业能力要求,见表5。
表5 高级职业能力要求
|
职业 功能 |
工作内容 |
技能要求 |
相关知识 |
|
基本 素养 |
职业道德与安全意识 |
1.能遵守职业道德 2.能遵守涉及的数据安全和保密要求及规定 |
1.了解职业道德的知识和应用 2.了解数据安全和保密要求的知识及规定 |
|
业务 分析 |
规划业务问题 |
1.能深入了解业务问题 2.能拆解问题进行结构化 3.能把问题模块进行细分 4.能够找出可行的数据分析和建模方式 5.能够带领团队整合管理企业的数据资产 |
1.了解项目分析的知识和方法 2.了解相关行业领域知识 3.了解业务规划相关知识 4.熟悉国家有关大数据产业发展方针、政策和法规 |
|
大数 据管 理 |
数据库架构设计与特性评估 |
1.能分析评估不同数据库的特性和优缺点 2.能指导对数据库架构设计 3.能指导ETL工程师业务工作 |
1.掌握在不同场景下数据库的构建、运维和评估技术 2.掌握大规模并行处理、空间数据库、分布式文件系统、分布式数据库、分布式计算等大数据平台的构建和运维技术 3.基本掌握流计算等分析技术 4.理解数据库运作原理和工具实现方式 |
|
大数据管理与设计 |
1.能进行数据分析和建模 2.能实践BI全过程 3.能指导开发大数据分析处理系统。 |
||
|
统计机器学习与深度学习 |
模型与算法的计设、测试和验证 |
1.能承接算法项目 2.能完成算法设计 3.能选择与评估模型 4.运用建立好的模型预测业务问题 5.能灵活对特定的业务场景进行统计学方法和机器学习方法及算法设计 6.实现图像或语音或文本分析设计 7.能指导团队成员深度学习相关技术以及系统的研发 |
1.运用特征提取、异常诊断、模型评估技术和决策树、关联分析、支持向量机、神经网络、贝叶斯网络等分析方法 2.掌握图像分析,或语音分析,或文本分析方法 3.掌握无监督学习、有监督学习、模式识别等分析方法 4.理解图像或语音或文本分析的内部机理 |
|
可视化分析 |
通过源代码或工具软件实现可视化分析 |
1.能精通可视化分析相关开源软件栈和工具 2.能指导开发分布式可视化分析系统 |
1.掌握python等数据分析工具可视化功能及应用 2.掌握开源的算法代码编写经验 |
|
团队沟通协同与汇报 |
团队技术沟通 与用户需求沟通 |
1.能够与大型数据库管理人员协同工作 2.能够与大数据框架工程师协同工作 3.根据用户数据创造不同特性的产品和系统 4.推动业务落地实现数据分析建议 5.计划、领导、组织、实施大数据项目工作 |
1.具备项目管理经验 |
5.1.1 全日制学校教育,根据其培养目标和教学计划确定期限。
5.1.2 晋级培训的培训期限要求如下:
a) 员级24标准学时;
b) 初级48标准学时;
c) 中级60标准学时;
d) 准高级80标准学时。
5.2.1 培训初、中级数据分析师的教师应具有BDA数据分析师中级以上职业证书或中级以上专业技术职务任职资格。
5.2.2 培训准高级数据分析师的教师应具有BDA数据分析师高级职业证书或相应专业高级专业技术职务任职资格。
理论培训应具有可容纳30名以上学员的教室,实际操作培训应有相应的设备、工具、安全设施等较为完善的场地。
从事或准备从事数据分析相关工作的人员。
6.2 鉴定机构
BDA数据分析师由中经数(北京)数据应用技术研究院统一鉴定。鉴定合格者按照等级规范统一核发相应等级的《BDA数据分析师证书》,此证书全国通用。
6.3.1 初级和中级分析师考核采用理论知识考试和技能操作方式,并递交实践报告。
6.3.2 理论知识考试采取闭卷笔试方式,技能操作考核采用实际操作方式。
6.3.3 理论知识考试和技能操作考核均实行百分制,成绩均达到60分(含60分)以上者为合格。
6.3.4 高级数据分析师采用报告综合评审和答辩方式。
6.4.1 理论知识考试考评人员与考生配比为1:30,每标准教室不少于2名考评员。
6.4.2 技能操作考核考评人员与考生配比为1:30,且不少于2名考评员。
6.4.3 高级数据分析师综合评审和答辩考评人员不少于3人。
6.5.1 理论知识考试150分钟,技能操作考核150分钟,答辩20分钟。
6.5.2 高级数据分析师的答辩时间为45分钟,其中包含自我陈述15分钟、答辩30分钟。
理论知识考试在标准教室进行,技能操作考核在具有相关的设备、工具和安全设备等较为完善的场地进行。
7.1 证书分类
《BDA数据分析师证书》分为以下类型:
a) 《数据管理员证书》;
b) 《初级数据分析师证书》;
c) 《中级数据分析师证书》;
d) 《准高级数据分析师证书》;
e) 《高级数据分析师证书》。
7.2 发证管理
《BDA数据分析师证书》由中经数(北京)数据应用技术研究院统一颁发,实行统一编号登记管理,考生在相应考试机构领取。
7.3 作废管理
7.3.1 若证书有手写或拼印,则作废。
7.3.2 若持证人利用证书发生触犯国家法律法规等违法乱纪行为,一经查实,发证机构有权声明作废该证书。
7.4 证书查真
持证人和用人单位可在BDA数据分析师官网(www.n-bda.org)和微信公众号随时公开查真。
————————————————————————