4006-900-901

数字化人才建设体系:商业数据挖掘分析方法

参加对象:数据分析专员、数据分析师 学员岗位:数据分析岗位(工作任务或场景:工作中需要对数据进行算法分析的专业数据分析场景)
课程费用:电话咨询
授课天数:10~12天
授课形式:内训
联系电话:4006-900-901 / 17821361800(小威)

微信咨询&报名

课程背景  COURSE BACKGROUND

商业数据挖掘分析是通过算法对大量商业数据进行探索并最终找出隐藏于数据背后的高价值信息及知识的方法。数据挖掘分析方法是一种商业决策支持过程,它可以高度自动化地对企业商业数据进行分析,做出归纳性推理,从中挖掘出潜在模式规律,最终帮助决策者做出正确经营决策。

近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是企业存在大量可广泛应用的有效数据,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛应用于企业生产经营中的各个方面,包括但不限于生产管理、质量控制、市场分析、营销管理、运营管理、财务管理、人力管理等……学习该课程可以系统培养数据分析人员的数据挖掘分析能力,帮助企业从数据中:

      ● 发现数据背后深层业务问题

      ● 找到突破业务增长瓶颈的突破口

      ● 找到业务行为模式的最优解

      ● 洞察市场先机以及经营风险,预测未来经营走势

课程收益  PROGRAM BENEFITS

掌握数据挖掘分析工具Python的使用方法;

掌握Python数据清洗方法;

掌握统计分析方法;

掌握多种算法模型的使用方法;

掌握商业数据挖掘分析实战方法。

课程大纲  COURSE OUTLINE

Python语言基础:帮助学员掌握Python语言的基础编程方法,掌握应用Python进行数据加载、数据整理、数据清洗、数据可视化等方法,本节内容为后续内容奠定工具应用基础;

1.    Python编程基础(Python安装启动、数据类型、控制流操作、函数、面向对象编程、文件操作)

2.    Python加在数据(向量\矩阵\数组、加在样本数据集、加在数据文件数据、查询SQL数据库)

3.    Python数据整理(创建及浏览数据帧、处理缺失值、数据替换、连接及合并数据帧、数据分组聚合、更改数据类型等)

4.    Python数据清洗(Numpy应用方法、Pandas应用方法)

5.    Python数据可视化(Matplotlib绘图、Pandas绘图、Pyecharts交互式图表绘制)

6.    综合案例应用

 

时间序列分析:时间序列分析是一种重要的定量预测分析方法,本节将帮助学员系统掌握时间序列分析方法;

1.    Pandas时间序列处理

2.    时间序列特征

3.    时间序列模型应用(ARMAARMAARIMA

4.    时间序列建模

5.    综合案例应用

 

机器学习与数据挖掘基础:本节内容将为大家介绍机器学习与数据挖掘的基础理论知识,并针对有监督学习算法以及无监督学习算法进行展开介绍;

1.    机器学习与数据挖掘理论基础(数据挖掘概要,数据挖掘方法论,机器学习基本思想、常用算法分类、主要解决的问题,机器学习流程,模型评价指标,算法库等)

2.    有监督学习算法入门(KNN基本原理,函数详解,KNN数据结构实现,KNN算法实例)

3.    无监督学习算法入门(聚类分析入门,K-Means快速聚类基本原理,K-Means快速聚类手动实现,K-Means模型评估指标及稳定性讨论,轮廓系数)

 

机器学习与数据挖掘进阶:本节将为大家进一步介绍机器学习与数据挖掘的进阶算法以及应用案例;

1.    常用有监督学习算法(线性回归(线性回归模型的推导和求解,梯度下降法,带正则项的线性回归),逻辑回归(逻辑回归的引入,sigmoid函数,模型的求解,多分类问题),贝叶斯(朴素贝叶斯,贝叶斯网络),SVM支持向量机分类和支持向量机回归(线性SVM,硬边距与软边距,非线性SVM,核函数的理解)

2.    有监督学习算法进阶(决策树模型(C4.5C5.0CART树,决策树的可视化),集成学习基础(集成学习思想,分类,boostingbagging联系与区别),集成算法之Bagging类算法(Bagging、随机森林等),集成算法之Boosting类算法(AdaboostingGBDT梯度提升树、XgBoost等)

3.    无监督学习算法进阶(聚类分析:DBSCAN密度聚类、层次聚类等,数据降维方法(PCA主成分分析和SVD奇异值分解)

4.    特征工程与高级数据预处理(特征工程的目的与重要性,特征预处理(无量纲化,分析,编码,统计编号,特征组合),特征构造(时间和时间序列特征构造,空间特征构造,用户行为特征构造,文本特征构造,图像特征构造),特征选择(特征选择标准,方法分类),特征转换与特征学习)

 

文本分析:文本数据中包含大量有用信息,使用文本分析方法可以有效提取这部分信息为商业决策提供帮助。本节内容将帮助学员系统掌握应用Python进行文本分析的方法;

1.    文本分析概述(文本数据与文本挖掘,自然语言处理的流派,文本挖掘常见商业应用,自然语言处理的层次,流程与挑战)

2.    获取文本数据(语料和语料库,常见语料库,语料库的获取,文本的爬取

3.    文本向量化(离散化表示方法(词集模型,词袋模型,TF-IDF,分布式表示方法(word2vecglove))

4.    文本分类与聚类(百度数据聚类,新闻分类,情感分类)

5.    基于深度学习的文本分析(深度学习在文本分析中的应用,基于LSTM的情感分析,基于深度学习的新闻分类)

 

图像处理与分析:除了文本数据之外,图像数据同样蕴藏了大量有价值的信息与知识,本节将帮助学员系统掌握图像数据的处理与分析方法;

1.    图像处理基本概念(位图,灰度,通道,深度,色相,色调,图像分辨率,颜色模型(RGB,HSI,HSV))

2.    基于OpenCV的图像处理(OpenCV基本介绍,图像和视频的获取,图像裁剪、通道获取边界填充,图像计算,调亮图片,改变图像大小图像融合,阈值处理,图像滤波,图像运算,图像金字塔)

3.    图像特征的理解与计算(颜色特征,形状特征,LBP特征,HAAR特征,HOG特征)

4.    基于卷积神经网络的图像处理(卷积神经网络的模型搭建和训练,常见卷积神经网络结构分析)

5.    基于卷积神经网络的图像分类实战(基于卷积神经网络的人脸识别实战)

 

综合应用案例(大纲只列举部分典型案例,可以根据企业实际需求进行选择或定制):本节通过多个实战案例将前边相关知识进行串联、巩固与提高,帮助学员将所学应用到实际商业场景下,掌握商业数据挖掘分析的全流程方法;

      1.    电商案例分析(统计描述性,宏观市场和微观市场分析,波士顿矩阵分析)

2.    航空客户价值分析(RFM分析,客户画像,聚类分析,精准营销)

3.    保险行业用户画像,精准营销(决策树应用)

4.    航班动态延误预测(随机森林,集成学习应用)

5.    基于不同场景之下共享单车投放量的精准预测(岭回归,lasso回归)

6.    京东用户商品购买预测(xgboost集成学习)

7.    电商销售商品数据分析(关联规则应用)

8.    门户网站新闻分类分析(贝叶斯应用)

9.    手写数字识别案例(逻辑回归,knn应用)

10.  人脸识别与分类案例(SVM应用)

11.  图像分类(CNN应用)

12.  电商文本情感分析(LSTM应用)

13.  数字化人力资源之员工流失风险预警(逻辑回归应用)

14.  基于用于欺诈检测的综合财务数据集预测金融支付服务中的欺诈行为(集成学习应用)

15.  信用评分卡案例


     例: 讲解获取外部数据

     例: 讲解应用文本分析对网站注册用户特征需求进行分析

我们的服务  OUR SERVICES
服务流程

业务范畴
量身定制化的经典内训课程
人力资源
劳动法
培训发展
职业技能
市场营销
经营股权
战略管理
行政商务
财务管理
研发管理
生产管理
物流管理
采购管理
职业素养
通用管理
独具特色的系统解决方案
人力资源
劳动法
企业文化
战略经营
组织变革
股权激励
领导力
技术研发
财务管理
生产管理
联系我们   CONTACT US

联系电话:4006-900-901

微信咨询:威才客服

企业邮箱:shwczx@shwczx.com




1.点击下面按钮复制微信号

13812819979

点击复制微信号

上海威才企业管理咨询有限公司