做企业培训,当然要找对好讲师!合作联系

刘晖:大数据分析(全面)系统课程

刘晖老师刘晖 注册讲师 33查看

课程概要

培训时长 : 40天

课程价格 : 扫码添加微信咨询

课程分类 : 数据分析

课程编号 : 17575

面议联系老师

适用对象

数据分析师、技术经理、产品经理、产品助理等;将承担数据分析师职责的业务人员或信息化人员; 希望加强数据分析能力的软件开发

课程介绍

(1)培训背景

随着互联网、云计算、大数据、物联网、人工智能等科技的快速发展,经济发展已经进入全球化时代,企业的命运与国际经济环境紧密联系,如美国的经济危机会波及到全球各个国家与地区和企业,国家和企业已经不是孤立的存在。在经济全球化时代商业环境极其复杂,不仅要考虑国内、国外经济环境,同时还要考虑不同国家的国家政策,不同民族的民族文化,不同宗教的宗教信仰等,更加加深入了商业环境的复杂程度。在极其复杂的国际商业环境中,作为大型企业领导者仅凭经验与智慧无法全面了解与掌控企业、了解国际化的商业环境,因此很难做出正确的企业战略决策,甚至更无法做到企业精细化管理,更不可能做到高效运营,那么,如何突破因商业环境复杂度而导致的企业失控呢?并在复杂的商业竞争环境中脱颖而出并获得最大利润呢?答案是掌握企业数据和掌握国际化数据,并建立高效的数据分析体系,探索数据、挖掘数据高效准确的获取国际化的经济环境状况,洞察市场趋势提前做出有利于企业的战略决策,提高企业竞争力,规避市场风险,数据分析则是提升企业管理水平,实现上述目标的一种行之有效的方法。国际化的竞争就是信息的国际化竞争。

随着大数据、人工智能的快速发展,数据的价值越发突显,并为海量的高并发的数据分析提供了新的工具与可行性,较以往的传统数据分析工具更为有效,甚至传统数据分析工具做不到的,大数据、人工智能都能做到。因此不仅仅企业,社会各个方面也因大数据的价值而提高了对数据的关注程度,也加大了数据分析的投入力度。无论是企业管理、战略决策、精准营销、精细化管理等都无处不体现着数据分析的重要性。

数据如此重要,如何建设一个高效的数据分析体系呢?至少要具备以下两个条件:一是在宏观层面上正确理解数据分析;二是丰富的IT系统建设经验、分布式技术和较强的数据技术能力。第一点尤为重要,因为一旦在思想和认识层面对数据分析体系理解有误,那么即使精通于各种技术方案,所建立起来的也只是一堆技术架构的粗糙堆砌,虽然也能达到部分数据分析的效果,但必定会事倍功半。构建数据分析体系包括四个层面:一是数据基础平台;二是数据报表与可视化;三是精细化业务分析;四是战略分析与决策。如下图为数据分析体系结构图。

大数据体系构建

那么在数据基础平台建设层面,均采用大数据平台,如Hadoop、Spark等大数据平台,其好处是开源、可控,无需从零开始搭建平台节约成本;也避免了因大数据的多样性、隐私性等特点导致供应无法深入挖掘数据的问题。为什么要自建数据分析平台呢?不能采购吗?答案是不能采购,只能自建!因为数据挖掘一个持续的过程,日常企业经常过程产生的数据、市场数据都是需要分析的,是一个持续不断的工作,不是编写几个算法了事的,所以如果从供应商采购必然会导致分析工作不够深入与不够专业,数据的价值是隐藏在数据中的,需要不断的持续的挖掘才能找的,不是算法和分析工具能做到的。因此企业需要自建数据分析平台,而不采购分析工具。

Hadoop、Spark生态系统是大数据技术事实标准,是大数据思想、理念、机制的具体实现,是整个大数据技术中公认的核心框架和具有极强的使用价值与研究价值。Hadoop 系统是一款开源软件,能够处理海量的各种结构(包括结构化、非结构化、半结构化)的数据。

Hadoop是分布式集群框架,可以管理成百上千台x86服务器集群。基于 Hadoop 的解决方案能够帮助企业应对多种大数据挑战,包括:

  1. 分析海量(PB 级或者更多)的数据

Hadoop 能够分析所有数据,使得分析更准确,预测更精确;

  1. 从多个数据类型的组合中获得新的洞察力

将来自多个数据源的不同类型的数据进行结合分析,发现新的数据关系和洞察力;

  1. 存储大量的数据

由于它不依赖于高端硬件,且是可扩展的,所以使存储大量数据变得经济有效;

  1. 数据发现(data discovery)和研究的沙箱

Hadoop 提供了一个地方,数据科学家可在此发现新的数据关系和相互依赖性。

 

工业和信息化部电信研究院于2014年5月发布的“大数据白皮书”中指出:

“2012 年美国联邦政府就在全球率先推出“大数据行动计划(Big data initiative)”,重点在基础技术研究和公共部门应用上加大投入。在该计划支持下,加州大学伯克利分校开发了完整的大数据开源软件平台“伯克利数据分析软件栈(Berkeley Data Analytics Stack),其中的内存计算软件Spark的性能比Hadoop 提高近百倍,对产业界大数据技术走向产生巨大影响

                                          ----来源:工业和信息化部电信研究院

 

S9~GWDRI[C7VX(O{4OSS9Y1

 

Spark是成为替代MapReduce架构的大数据分析技术,Spark的大数据生态体系包括流处理、图技术、机器学习等各个方面,并且已经成为Apache顶级项目,可以预计的是2014年下半年到2015年在社区和商业应用上会有爆发式的增长。

US9R2XIE39V0U`OTT9S}A7I

 

国内外一些大型互联网公司已经部署了Spark,并且它的高性能已经得到实践的证明。国外Yahoo已在多个项目中部署Spark,尤其在信息推荐的项目中得到深入的应用;国内的淘宝、爱奇异、优酷土豆、网易、baidu、腾讯等大型互联网企业已经将Spark应用于自己的生产系统中。国内外的应用开始越来越广泛。Spark正在逐渐走向成熟,并在这个领域扮演更加重要的角色。

 

(2)培训目标

本次数据分析技术培训课程,整个课程体系设计完备,思路清晰,学员通过本次课程的系统性学习可以掌握如下技能:

  1. 了解数据分析基本概念及产业链,数据分析与大数据等内容;
  2. 学会数据的产生、导入与预处理。掌握大数据生成与导入,数据分析流程与建模思想,数据清洗与数据加工等内容;
  3. 掌握数据分析与挖掘基础。学习常见数据分析方法与数据挖掘概述,描述型数据分析,常见数据分析与挖掘算法(Kmeans、购物篮、决策树、朴素贝叶斯等)等内容。
  4. 学习数据分析工具R语言的数据分析实战。学习R语言入门基础,描述性统计分析, 用R语言做数据挖掘实战等内容。
  5. 介绍大数据工具之Hadoop。深入理解Hadoop原理及组件介绍,Hadoop数据分析入门等内容。
  6. 介绍大数据工具之Spark。深入剖析Spark基本概念,Spark开发与数据分析等内容。
  7. 编写Pyspark集群调度与数据处理程序。使用Python调度spark集群并进行数据处理等内容。
  8. 学习大数据可视化技术。包括数据可视化技术概述及培训关键点概述,数据挖掘与可视化工具介绍(SAS、Project、Excel、SPSS、Tableau等),可视化案例分享等内容。
  9. 学习Python与数据分析实战。包括Python语言入门,Python网络编程、爬虫与机器学习,Python数据分析案例分享,基于spark集群的python数据分析实战等内容。

 

通过以上的系统学习,学员会建立完整的数据知识体系,使学员正确认识大数据,掌握大数据思维方法,为工作、生活和学习打下坚实的基础,为持续成长提供原动力。下图为本次课程结束后学员获取的完整数据知识体系如下图。

完整数据知识体系

(3)教学计划

本系列课程总共由9门课程组成:

教学设计

NO.

课程名称

课程天数

基础与概述

1

数据分析概述

1天

2

数据的产生、导入与预处理

5天

数据分析与数据挖掘核心技术讲解及案例实操

3

数据分析与挖掘基础

6天

4

R语言数据分析实战

6天

大数据技术讲解与编程实操

5

大数据工具介绍之Hadoop

2天

6

大数据工具介绍之Spark

3天

7

Pyspark集群调度与数据处理

2天

大数据可视化

8

大数据可视化

2天

Python与数据分析实战

9

Python与数据分析实战

13天

 

         第1-2门课属于基础与概述,包括数据分析基本概念及产业链,数据分析与大数据等内容。大数据生成与导入,数据分析流程与建模思想,数据清洗与数据加工等内容。

         第3-4门课程数据分析与数据挖掘核心技术讲解及案例实操,包括常见数据分析方法与数据挖掘概述,描述型数据分析,常见数据分析与挖掘算法(Kmeans、购物篮、决策树、朴素贝叶斯等)等内容。R语言入门基础,描述性统计分析, 用R语言做数据挖掘实战等内容。。

         第5-7门课程主要大数据技术讲解与编程实操,包括Hadoop原理及组件介绍,Hadoop数据分析入门等内容。Spark基本概念,Spark开发与数据分析等内容。使用Python调度spark集群并进行数据处理等内容。

         第8门是大数据可视化。包括数据可视化技术概述及培训关键点概述,数据挖掘与可视化工具介绍(SAS、Project、Excel、SPSS、Tableau等),可视化案例分享等内容。

         第9门是Python与数据分析实战。包括Python语言入门,Python网络编程、爬虫与机器学习,Python数据分析案例分享,基于spark集群的python数据分析实战等内容。

 

(4)具体课程方案(含课程大纲)

课程1:数据分析概述-1天

【匹配关键知识点】

数据分析基本概念及产业链,数据分析与大数据等内容。

【课程时间】

1天(6小时/天)

【课程简介】

本课程介绍大数据体系构建数据平台,重点内容包括数据平台基础理论、数据集成、数据维度等知识点;本课程让学员掌握基于大数据生态的数据分析知识、大数据生态体系技术选型,能够应用建模技术、大数据技术构建数据平台。

随着大数据时代的快速到来,以及大数据在生产生活中迅速应用,数据分析、数据建模、数据挖掘、机器学习等重要性越发突出,本课程是针对大数据时代的特点,尹老师总结多年数据分析经验,而精心设计的课程,课程内容涵盖了数据领域的数据处理、统计分析、数据挖掘、机器学习等内容的应用范围、发展前景剖析。

【课程收益】

1、数据分析基本概念及产业链等内容;

2、数据分析与大数据等内容;

【课程特点】

数据分析基本概念及产业链,数据分析与大数据等内容

【课程对象】

     数据分析师、技术经理、产品经理、产品助理等

     将承担数据分析师职责的业务人员或信息化人员

     希望加强数据分析能力的软件开发人员

     系统集成企业售前工程师、售前顾问及方案制作人员

【学员基础】

     具有2年以IT部门工作经验,将负责数据分析等相关任务的技术人员

【课程大纲】(1天*6小时)

时间

内容

案例实践与练习

Day1

数据分析概述

  1. 数据知识体系
  2. 数据仓库诞生的历史背景
  3. 大数据时代数据仓库的演变
  4. 大数据是一套全新的思维体系
  5. 纵向、横向扩容
  6. 全量分析
  7. 大数据是一套全新的技术体系
  8. 大数据思维与传统软件思维的区别
  9. 大数据的数据仓库与传统数据仓库的区别
  10. 硬件成本、软件技术积累
  11. 数据知识体系
  12. 数据采集
  13. 数据ETL
  14. 数据挖掘
  15. 数据可视化
  16. 商务智能
  17. 业务创新应用
  18. 大数据生态体系介绍
  19. 大数据支撑----云计算
  20. 大数据核心----海量数据
  21. 大数据灵魂----大数据技术
  22. 大数据价值----大数据商业思维
  23. 大数据企业应用障碍分析

案例练习:通过大数据企业应用障碍分析案例的剖析数据分析过程,体会数据分析的难点和要点。

 

研讨:大数据企业应用障碍分析

 

课程2:数据的产生、导入与预处理-5天

【匹配关键知识点】

大数据生成与导入,数据分析流程与建模思想,数据清洗与数据加工等内容。

【课程时间】

5天(6小时/天)

 

【课程简介】

随着大数据时代的快速到来,以及大数据在生产生活中迅速应用,大数据领域如雨后春笋般的出现大量的新技术,如Hadoop、Spark等技术,其中Python语言已经成为大数据技术中最为重要的一部分,被越来越多的企业所使用。Python语言的功能涵盖了大数据领域的数据处理、统计分析、数据挖掘、机器学习、人工智能、大数据应用开发等各种不同类型的计算操作,应用范围广泛、前景非常广阔。本课程是尹老师多年工作经验的总结和归纳,从实际业务案例为入口,使学员从理论层到实操层面系统的学习数据处理技术,使学员深入理解Python语言等数据分析工具。通过本课程的学习,学员即可以正确的分析企业的数据,为管理者、决策层提供数据支撑。

【课程收益】

1、大数据生成与导入;

2、数据分析流程与建模思想;

3、数据清洗与数据加工。

【课程特点】

大数据生成与导入,数据分析流程与建模思想,数据清洗与数据加工等内容。

【课程对象】

     数据分析师、技术经理、产品经理、产品助理等

     将承担数据分析师职责的业务人员或信息化人员

     希望加强数据分析能力的软件开发人员

     系统集成企业售前工程师、售前顾问及方案制作人员

【学员基础】

     具有2年以IT部门工作经验,将负责数据分析等相关任务的技术人员

【课程大纲】(5天*6小时)

时间

内容

案例实践与练习

Day1

数据的产生、导入与预处理

  1. 数据知识体系
    1. 数据采集
    2. 数据ETL
    3. 数据挖掘
    4. 数据可视化
    5. 商务智能
    6. 业务创新应用
  2. 数据分析挖掘的过程
  3. 建立数据库的方法
  4. 企业对数据分析挖掘的错误认识
  5. ETL的设计
  6. ETL的实施
  7. 数据源
  8. 数据采集
  9. 随机抽样
  10. 数据去重
  11. 数据缺失值处理
  12. 检验数据逻辑错误
  13. 离群点检测
  14. 数据转换
  15. 数据分组
  16. 课堂实操:数据整理的编程和应用

案例练习:通过数据整理的编程和应用案例的剖析数据分析过程,体会数据分析的难点和要点。

 

研讨:数据整理的编程和应用

Day2

数据清洗与数据加工

  1. ROLAP与多维数据库
  2. OLAP与OLTP的区别
  3. 多维数据库与数据仓库的关系
  4. OLAP模型搭建(多维模型)
  5. 确定维度、量度与事实的关系
  6. OLAP的应用场景
  7. 决策支持技术
  8. 企业OLAP模型设计案例剖析
  9. 数据模型设计原则与模型搭建
  10. 星型架构与雪花型架构
  11. 事实表与维度表的设计
  12. 逻辑设计与物理设计
  13. 数据模型设计的常用方法
  14. 数据模型设计技巧总结
  15. 数据模型分片
  16. 数据模型索引
  17. 数据模型粒度
  18. 数据模型案例分析

 

案例练习:通过案例的剖析数据分析过程,体会数据分析的难点和要点。

 

研讨:数据模型案例分析

Day3

大数据生成与导入

  1. 大数据基础理论介绍
  2. 大数据的生成与导入
  3. 大数据技术
  4. CAP理论
  5. BASE思想
  6. 消息机制
  7. 分布式协调器
  8. 心跳机制
  9. 日志结构文件系统
  10. RWN理论
  11. 跨操作系统调度资源
  12. 大数据企业实践
  13. 电商遇到的问题
  14. 大型互联网企业遇到的问题
  15. 大数据主要解决的问题
  16. 实例分享:淘宝双十一
  17. 实例分享:腾讯QQ
  18. 实例分享:百度文库
  19. 实例分享:打车大战
  20. 大数据的作用
  21. Pig 设计的目标
  22. Pig Latine介绍
  23. Pig关键性技术
  24. Pig的实用案例
  25. Hive简介
  26. Hive的组件与体系架构
  27. Hive架构
  28. Hive vs RDBMS
  29. Hive的高可用部署方案
  30. Hive Data Types
  31. Hive安装模式
  32. Hive安装部署
  33. Hive Shell
  34. Hive API开发演示
  35. Hive中UDF和UDAF
  36. Hive数据分析
  37. Sqoop简介
  38. Sqoop架构
  39. Sqoop安装
  40. Sqoop Shell
  41. Flume简介及使用
  42. Flume架构
  43. Flume数据源类型
  44. Flume收集数据2种主要工作模式
  45. 电商客户日志分析
  46. 大型国企大数据应用
  47. 大数据架构案例分享及实战演练

案例练习:通过淘宝双十一案例的剖析数据分析过程,体会数据分析的难点和要点。

 

研讨:淘宝双十一

Day4

数据分析流程

  1. 数据分析基本概念
  2. 数据分析算法
  3. 数据分析工具
  4. 数据分析流程
  5. 数据分析范畴
  6. 数据挖掘基本概念
  7. 数据挖掘模型
  8. 数据挖掘模型评估
  9. 数据挖掘目标
  10. 数据挖掘数据质量
  11. 数据挖掘的9大定律
  12. 数据挖掘发展趋势

案例研讨:通过数据挖掘案例的剖析数据分析过程,体会数据分析的难点和要点。

 

研讨:数据挖掘

Day5

数据分析流程与建模思想

  1. 定义挖掘目标
  2. 数据取样
  3. 数据探索
  4. 数据预处理
  5. 挖掘建模
  6. 建立模型
  7. 业务理解
  8. 模型拟合
  9. 训练集
  10. 测试集
  11. 模型评价
  12. 企业实践案例分享

案例练习:通过企业实践案例的剖析数据分析过程,体会数据分析的难点和要点。

 

研讨:企业实践案例分享

Day5

数据的统计学知识和模型

  1. 回归分析
  2. 贝叶斯算法
  3. 聚类算法
  4. SVM
  5. 决策树算法
  6. 关联规则算法
  7. 时间序列算法
  8. 神经网络
  9. 深度学习
  10. 人工智能
  11. 其他挖掘算法
  12. 以上数据模型的应用案例剖析

案例练习:通过数据模型的应用案例剖析案例的剖析数据分析过程,体会数据分析的难点和要点。

 

研讨:数据模型的应用案例剖析

 

课程3:数据分析与挖掘基础-6天

【匹配关键知识点】

常见数据分析方法与数据挖掘概述,描述型数据分析,常见数据分析与挖掘算法(Kmeans、购物篮、决策树、朴素贝叶斯等)等内容。

【课程时间】

6天(6小时/天)

【课程简介】

随着大数据时代的快速到来,以及大数据在生产生活中迅速应用,数据分析、数据建模、数据挖掘、机器学习、神经网络、深度学习、人工智能等重要性越发突出,本课程是针对大数据时代的特点,尹老师总结多年数据分析经验,而精心设计的课程,课程内容涵盖了数据领域的数据处理、统计分析、数据挖掘、机器学习、神经网络、深度学习、人工智能等内容,以及人工智能的应用范围、发展前景剖析。

【课程收益】

1、常见数据分析方法与数据挖掘概述;

2、描述型数据分析;

3、常见数据分析与挖掘算法(Kmeans、购物篮、决策树、朴素贝叶斯等)等。

【课程特点】

常见数据分析方法与数据挖掘概述,描述型数据分析,常见数据分析与挖掘算法(Kmeans、购物篮、决策树、朴素贝叶斯等)等内容。

【课程对象】

     数据分析师、技术经理、产品经理、产品助理等

     将承担数据分析师职责的业务人员或信息化人员

     希望加强数据分析能力的软件开发人员

     系统集成企业售前工程师、售前顾问及方案制作人员

【学员基础】

     具有2年以IT部门工作经验,将负责数据分析等相关任务的技术人员

【课程大纲】(6天*6小时)

时间

内容

案例实践与练习

Day1

常见数据分析方法与数据挖掘概述

  1. 数据分析与建模的概念
  2. 数据分析与建模过程
  3. 数据分析模型开发过程
  4. 数据建模概述
  5. 机器学习概念
  6. 机器学习算法剖析
  7. 算法库分类
  8. 算法库
  9. 深度学习
  10. 神经网络
  11. 人工智能
  12. 商业智能

 

案例练习:通过案例的剖析数据分析过程,体会数据分析的难点和要点。

 

研讨:数据分析的过程

Day2

描述型数据分析

  1. 统计学基本概念
  2. 统计数据的计量尺度
  3. 常用基本统计量
  4. 集中趋势的描述指标
  5. 离散趋势的描述指标
  6. 中心极限定理
  7. 大数定律
  8. 数据的分布
  9. 正态分布的特征
  10. 偏度和峰度
  11. 检测数据集的分布
  12. 数据的分布拟合检验与正态性检验
  13. 抽样标准
  14. 假设检验
  15. T检验
  16. 置信区间

 

案例练习:通过案例的剖析数据分析过程,体会数据分析的难点和要点。

 

研讨:描述性数据分析

Day3

常见数据分析与挖掘算法

  1. 数据挖掘的基本任务
  2. 数据挖掘建模过程
    1. 定义挖掘目标
    2. 数据取样
    3. 数据探索
    4. 数据预处理
    5. 挖掘建模
    6. 建立模型
    7. 业务理解
    8. 模型拟合
    9. 训练集
    10. 测试集
    11. 模型评价
  3. 常用的数学预测模型
    1. 线性回归
    2. 回归(预测)与分类
    3. 决策树与随机森林
    4. 聚类分析(kmeans)
    5. 关联规则
    6. 时序模式
    7. 离群点检测
    8. 深度学习
    9. 人工智能
    10. 神经网络
  4. 案例:如何从数据中挖掘出有价值的信息

案例研讨:通过案例的剖析数据分析过程,体会数据分析的难点和要点。

 

研讨:常用数据分析方法与算法

Day4

朴素贝叶斯与回归分析

  1. 主成分分析和因子分析(深入剖析主成分分析及因子分析)
  2. 主成分分析
  3. 总体主成分
  4. 样本主成分
  5. 主成分分析模型
  6. 案例:主成分分析模型实现
  7. 课堂实操:主成分分析模型实现

 

  1. 方差分析(深入剖析方差分析方法及实现)
  2. 单因素方差分析
  3. 单因素方差分析模型
  4. 因素效应的显著性检验
  5. 因素各水平均值的估计与比较
  6. 两因素等重复试验下的方差分析
  7. 统计模型
  8. 交互效应及因素效应的显著性检验
  9. 无交互效应时各因素均值的估计与比较
  10. 有交互效应时因素各水平组合上的均值估计与比较
  11. 两因素非重复试验下的方差分析
  12. 金融案例:方差分析实现
  13. 课堂实操:方差分析实现

 

 

  1. Bayes统计分析(深入剖析Bayes统计分析)
  2. Baves统计模型
  3. Bayes统计分析的基本思想
  4. Bayes统计模型
  5. Bayes统计推断原则
  6. 先验分布的Bayes假设与不变先验分布
  7. 共轭先验分布
  8. 先验分布中超参数的确定
  9. Baves统计推断
  10. 参数的Bayes点估计
  11. Bayes区间估计
  12. Bayes假设检验
  13. 案例:实现Bayes统计分析建模
  14. 课堂实操:实现Bayes统计分析建模

 

 

  1. 数学建模(深入剖析数学建模)
  2. 数学建模
  3. 数学预测模型
  4. 模型评估
  5. 模型参数优化

 

  1. 回归分析与分类分析原理与应用(深入剖析数据的回归分析与分类分析的原理以及应用)
  2. 回归与分类
  3. 回归分析概念
  4. 线性回归模型及其参数估计
  5. 一元线性回归
  6. 一元线性回归模型
  7. 一元线性回归模型求解参数
  8. 损失函数
  9. 求偏导
  10. 回归方程的显著性检验
  11. 残差分析
  12. 误差项的正态性检验
  13. 残差图分析
  14. 统计推断与预测
  15. 回归模型的选取
  16. 穷举法
  17. 逐步回归法
  18. 岭回归分析
  19. 一元线性回归
  20. 金融案例:一元线性回归模型检验
  21. 多元线性回归概述
  22. 多元线性回归模型
  23. 金融案例:多元线性回归实现航空业信用打分和评级模型

 

 

  1. Logistic回归分析(剖析Logistic回归与其它回归分析方法)
  2. Logistic回归介绍
  3. Logistic函数
  4. Logistic回归模型
  5. 案例:SPSS Logistic回归实现
  6. 课堂实操: Logistic回归实现航空业欺诈预测模型
  7. 课堂实操: Logistic回归实现航空业风险分析模型

 

  1. 非线性回归原理及应用(剖析非线性回归原理及应用实践)
  2. 非线性回归
  3. 双曲线函数
  4. 幂函数
  5. 指数函数
  6. 对数函数
  7. S型曲线
  8. 案例:非线性回归实现
  9. 课堂实操:非线性回归实现航空业经营分析和绩效分析模型

案例练习:通过案例的剖析数据分析过程,体会数据分析的难点和要点。

 

研讨:主成分分析模型实现

Day5

聚类分析与关联规则挖掘

 

  1. 数据建模常用距离(深入剖析数据建模过程中常用的距离模型)
  2. 数据挖掘常用距离
  3. 欧氏距离
  4. 曼哈顿距离
  5. 切比雪夫距离
  6. 闵可夫斯基距离
  7. 标准化欧氏距离
  8. 马氏距离
  9. 夹角余弦
  10. 汉明距离
  11. 杰卡德距离 & 杰卡德相似系数
  12. 相关系数 & 相关距离
  13. 信息熵

 

  1. 聚类分析与建模实现(深入剖析聚类分析以及通过SPSS聚类算法模型分析数据)
  2. 聚类分析
  3. 聚类算法
  4. 样品间相近性的度量
  5. 快速聚类法
  6. 快速聚类法的步骤
  7. 用Lm距离进行快速聚类
  8. 谱系聚类法
  9. 类间距离及其递推公式
  10. 谱系聚类法的步骤
  11. 变量聚类
  12. 案例:SPSS聚类实现及绘图
  13. 案例:Kmeans应用案例剖析
  14. 课堂实操:编写程序实现Kmeans应用案例剖析

 

  1. 关联规则分析与实现(深入剖析关联规则分析以及通过SPSS关联规则算法模型分析数据)
  2. 关联规则
  3. 支持度与置信度
  4. 关联规则挖掘的过程
  5. Apriori算法
  6. 关联规则案例
  7. 支持度与置信度计算
  8. 案例:SPSS实现关联规则
  9. 课堂实操:SPSS实现航空业数据关联规则分析

案例练习:通过编写程序实现Kmeans应用案例的剖析数据分析过程,体会数据分析的难点和要点。

 

研讨:编写程序实现Kmeans应用案例剖析

Day6

决策树与随机森林

 

  1. 决策树分析与实现(深入剖析决策树分析以及通过SPSS决策树模型分析数据)
  2. 决策树分析
  3. 决策树
  4. 决策树构成要素
  5. 决策树算法原理
  6. 决策树法的决策过程
  7. 决策树算法
  8. 案例:实现决策树分析
  9. 课堂实操:实现航空业客户细分模型
  10. 随机森林

 

 

  1. 数据建模时序模式分析与实现(深入剖析时序模式分析)
  2. 时序模式
  3. 时间序列分析
  4. 时间序列分析
  5. 时间序列
  6. 序列分析的三个阶段
  7. 课堂实操:实现航空业客户流失模型

案例练习:通过实现航空业客户细分模型案例的剖析数据分析过程,体会数据分析的难点和要点。

 

研讨:实现航空业客户细分模型

 

课程4:R语言数据分析实战-6天

【匹配关键知识点】

R语言入门基础,描述性统计分析, 用R语言做数据挖掘实战等内容。

【课程时间】

6天(6小时/天)

 

【课程简介】

R语言由新西兰奥克兰大学ross ihaka和robert gentleman 开发。R语言是自由软件,具有非常强大的统计分析和作图功能,而且具有非常丰富的网上资源,目前R软件有3000多种贡献包,几乎可以实现所有的统计方法,目前大部分的顶级统计学家和计量经济学家都使用R语言,而且越来越多的数据分析实务人员也开始使用R语言。学习R软件正成为一种趋势。

R语言具有简单易学,功能强大,体积小(仅30M),完全免费,可自由开发等特点,且R语言和S语言语法基本相同,绝大部分程序是互相兼容的。

R软件最优美的地方是它能够修改很多前人编写的包的代码做各种你所需的事情,实际你是站在巨人的肩膀上。

【课程收益】

1、R语言入门基础;

2、描述性统计分析;

3、用R语言做数据挖掘实战等内容;

【课程特点】

R语言入门基础,描述性统计分析, 用R语言做数据挖掘实战等内容。

【课程对象】

     数据分析师、技术经理、产品经理、产品助理等

     将承担数据分析师职责的业务人员或信息化人员

     希望加强数据分析能力的软件开发人员

     系统集成企业售前工程师、售前顾问及方案制作人员

【学员基础】

     具有2年以IT部门工作经验,将负责数据分析等相关任务的技术人员

【课程大纲】(6天*6小时)

时间

内容

案例实践与练习

Day1

R语言入门基础

 

  1. R语言简介(介绍R语言工具)
  2. R语言历史与趋势剖析
  3. 安装R语言
  4. RStudio使用
  5. 工作空间的设置
  6. R程序包的载入与使用
  7. R资源网上查找方法介绍

 

  1. R语言语法介绍(R语言基础语法介绍)
  2. R语言的数据类型介绍
  3. R语言的数据结构介绍
  4. 数据的读入和输出
  5. R语言连接RDBMS数据库介绍
  6. 数据库的读/写
  7. R和SQL的交互
  8. 循环语句
  9. 条件语句
  10. 遍历
  11. 常用函数
  12. 常用算法
  13. 定性变量
  14. 离散变量
  15. 连续变量
  16. 多元变量
  17. 对向量、矩阵和列表进行运算
  18. 提取和插入元素
  19. 日期和时间数据的操作处理
  20. 编写自定义函数解决复杂问题
  21. 编程技巧
  22. 编程案例介绍

案例练习:通过案例的剖析数据分析过程,体会数据分析的难点和要点。

 

研讨:R语言编程

Day2

R语言绘图功能

 

  1. R语言的绘图功能介绍(R语言的探索性分析与数据可视化)
  2. 绘图函数
  3. 图形增强函数
  4. 图形互动函数
  5. 高级绘图命令
  6. 散点图
  7. 柱状图
  8. 直方图
  9. R语言数据预处理(R语言的数据的读取、清洗和转换)
  10. 数据预处理
  11. 日期和时间的处理
  12. 因子变量的操作
  13. 下标数据整理技术
  14. 字符串操作
  15. 数据子集的筛选
  16. 识别重复数据和缺失值处理
  17. 函数映射数据转换整理技术
  18. 变量的重新编码
  19. plyr、reshape2等包整理数据

案例练习:通过案例的剖析数据分析过程,体会数据分析的难点和要点。

 

研讨:R语言绘图

Day3

R语言与外部数据交互

 

  1. 数据的读入和输出(R语言的数据的读取、加载和写出)
  2. 数据的读入和写出
  3. read.table
  4. scan
  5. 内置数据集的读取
  6. R语言连接RDBMS数据库介绍
  7. R语言RDBMS数据库操作
  8. 实操:R和MySQL的交互
  9. 实操:R和Oracle的交互
  10. 数据库的读/写
  11. R和SQL的交互
  12. 实操:R和Excel的交互
  13. R语言大数据操作
  14. 实操:R编写Spark程序

 

案例研讨:通过案例的剖析数据分析过程,体会数据分析的难点和要点。

 

研讨:R语言与RDBMS交互

Day4

描述性统计分析

 

  1. R语言统计模拟与随机抽样(R语言的算法介绍)
  2. 随机数生成
  3. 蒙特卡洛模拟
  4. 中心极限定理的模拟
  5. 线性模型剖析
  6. 线性模型诊断方法
  7. 多元选择模型剖析
  8. 随机抽样
  9. 案例:蒙特卡罗模拟的应用

 

  1. 描述统计分析与离群点检测(掌握R语言用法和基本数据分析、数据描述统计分析)
  2. 基本数据分析(随机数的生成和统计模拟)
  3. 单变量数据分析与作图
  4. 双变量数据分析与作图(二维表分析,并列箱线图,相关系数)
  5. 多变量数据分析与作图(多变量相关系数矩阵)
  6. 离群点检测
  7. 案例1:汽车数据描述统计分析
  8. 案例2:财政收入与税收描述统计分析

 

案例练习:通过案例的剖析数据分析过程,体会数据分析的难点和要点。

 

研讨:描述性统计分析

Day5

用R语言做数据挖掘实战

 

  1. 基本数据分析(数据分析和数据挖掘基础介绍)
  2. 中心极限定理
  3. 大数定律
  4. 正态分布的特征
  5. 偏度和峰度
  6. 检测数据集的分布
  7. 概率分布
  8. 随机数生成
  9. 随机抽样
  10. 蒙特卡洛模拟
  11. 用蒙特卡罗方法计算圆周率π
  12. 案例:蒙特卡罗模拟的应用
  13. 实操:R语言实现蒙特卡罗求圆周率

 

 

  1. 回归与分类(掌握回归算法与实际建模分析应用,回归与分类剖析,R语言实现及预测应用)
  2. 回归分析
  3. 回归分析概念
  4. 线性模型剖析
  5. 一元线性回归
  6. 一元线性回归模型
  7. 一元线性回归模型求解参数
  8. 损失函数
  9. 求偏导
  10. 线性模型评估方法
  11. 实操:R语言一元线性回归
  12. 实操:R语言一元线性回归模型检验

 

  1. 多元线性回归(多元线性回归剖析,R语言实现及预测应用)
  2. 多元选择模型剖析
  3. 多元线性回归思想
  4. 实操:R语言实现多元线性回归

 

  1. 非线性回归(非线性回归剖析,R语言实现及预测应用)
  2. 双曲线函数
  3. 幂函数
  4. 指数函数
  5. 对数函数
  6. S 型曲线
  7. 实操:R语言非线性回归
  8. 逐步回归分析
  9. 岭回归分析

 

  1. Logistic回归(Logistic回归剖析,R语言实现及预测应用)
  2. Logistic函数
  3. 绘制Logistic曲线
  4. Logistic回归介绍
  5. 案例:用户离网预测
  6. 案例:中国税收收入增长案例分析
  7. 案例:新教学方法的效果
  8. 案例:信用卡违约预测

案例练习:通过用户离网预测案例的剖析数据分析过程,体会数据分析的难点和要点。

 

研讨:用户离网预测

Day6

用R语言文本数据挖掘实战

 

  1. 文本挖掘应用(介绍文本数据挖掘的实际应用场景)
  2. 文本结构分析
  3. 文章分类
  4. 文章摘要
  5. 文章聚类
  6. 相似文章推荐
  7. NLP自然语言处理
  8. 命名实体识别
  9. 案例分析

 

  1. 文本数据挖掘过程(介绍文本数据挖掘的流程)
  2. 文本预处理
  3. 文本挖掘
  4. 模式与表示
  5. 模式评估

 

  1. 中文分词技术介绍(介绍文本挖掘的基础中文分词技术)
  2. 信息检索
  3. 倒排索引
  4. 文本分词
  5. 停用词
  6. 词根
  7. 主要的分词方法
  8. 基于规则的词性标注
  9. 自动语义标注
  10. 中文分词软件包
  11. R语言中文分词
  12. 代码实现中文分词
  13. TF-IDF算法介绍(介绍TF-IDF文章分类算法以及代码实

    刘晖老师的其他课程

    • 刘晖:大数据分析(Python)系统课程
    数据分析培训班(6门课程,共18天)(1)培训背景随着互联网、云计算、大数据、物联网、人工智能等科技的快速发展,经济发展已经进入全球化时代,企业的命运与国际经济环境紧密联系,如美国的经济危机会波及到全球各个国家与地区和企业,国家和企业已经不是孤立的存在。在经济全球化时代商业环境极其复杂,不仅要考虑国内、国外经济环境,同时还要考虑不同国家的国家政策,不同民族的民族文化,不同宗教的宗教信仰等,更加加深入了商业环境的复杂程度。在极其复杂的国际商业环境中,作为大型企业领导者仅凭经验与智慧无法全面了解与掌控企业、了解国际化的商业环境,因此很难做出正确的企业战略决策,甚至更无法做到企业精细化管理,更不可能做到高效运营,那么,如何突破因商业环境复杂度而导致的企业失控呢?并在复杂的商业竞争环境中脱颖而出并获得最大利润呢?答案是掌握企业数据和掌握国际化数据,并建立高效的数据分析体系,探索数据、挖掘数据高效准确的获取国际化的经济环境状况,洞察市场趋势提前做出有利于企业的战略决策,提高企业竞争力,规避市场风险,数据分析则是提升企业管理水平,实现上述目标的一种行之有效的方法。国际化的竞争就是信息的国际化竞争。随着大数据、人工智能的快速发展,数据的价值越发突显,并为海量的高并发的数据分析提供了新的工具与可行性,较以往的传统数据分析工具更为有效,甚至传统数据分析工具做不到的,大数据、人工智能都能做到。因此不仅仅企业,社会各个方面也因大数据的价值而提高了对数据的关注程度,也加大了数据分析的投入力度。无论是企业管理、战略决策、精准营销、精细化管理等都无处不体现着数据分析的重要性。数据如此重要,如何建设一个高效的数据分析体系呢?至少要具备以下两个条件:一是在宏观层面上正确理解数据分析;二是丰富的IT系统建设经验、分布式技术和较强的数据技术能力。第一点尤为重要,因为一旦在思想和认识层面对数据分析体系理解有误,那么即使精通于各种技术方案,所建立起来的也只是一堆技术架构的粗糙堆砌,虽然也能达到部分数据分析的效果,但必定会事倍功半。(2)培训目标本次数据分析技术培训课程,整个课程体系设计完备,思路清晰,学员通过本次课程的系统性学习可以掌握如下技能:了解数据分析的基础知识及基本理论;结合Python语言学会数据的产生、导入与预处理。掌握大数据生成与导入,数据分析流程与建模思想,数据清洗与数据加工等内容;结合Python语言掌握数据分析与挖掘基础。学习常见数据分析方法与数据挖掘概述,描述型数据分析。学习数据分析工具Python语言的数据分析实战。掌握结构化数据工具SQL的应用及相关知识。学习大数据可视化技术。包括数据可视化技术概述及培训关键点概述,数据挖掘与可视化工具介绍(Excel、SPSS、Tableau等),可视化案例分享等内容。学习Python与数据分析实战。包括Python语言入门,Python网络编程、爬虫与机器学习,Python数据分析案例分享等内容。(3)教学计划本系列课程总共由6门课程组成:教学设计NO.课程名称课程天数基础理论1概率论与数理统计1天SQL语法基础及进阶2数据分析与挖掘基础2天Python入门3Python环境准备及相关数据分析库(pandas、numpy、matplotlib、scipy)的安装及应用2天4Python语言基础知识1天5正则表达式及Python编程1天Python与数据分析实战6数据采集1天7数据分析4天8爬虫技术与实践4天数据可视化9大数据可视化2天 (4)具体课程方案(含课程大纲)课程1:概率论与数理统计-1天【匹配关键知识点】课程目标1:建立必要的概率论与数理统计基本知识素养,掌握探索随机现象统计规律的一般方法。课程目标2:掌握概率论与数理统计的基本概念、基本理论、基本方法和运算技能。包括概率论的基本概念、随机变量、多维随机变量、随机变量的数字特征、数理统计的基本概念、参数估计等相关知识。熟悉数据处理、数据分析、数据推断的各种基本方法。课程目标3:掌握处理随机现象的基本思想和方法,培养抽象概括、推理论证、严密的逻辑思维能力,以及使用概率论与数理统计的方法去分析和解决有关实际问题的能力。【课程时间】1天(8小时/天)【课程简介】通过本课程的学习,应掌握概率论与数理统计的基本概念,了解它的基本理论和方法,从而使学生初步掌握处理随机现象的基本思想和方法,培养学生运用概率统计方法分析和解决实际问题的能力,并且在知识传授的同时起到价值引领的作用,积极培育和践行社会主义核心价值观,培养学生科学、严谨的思维能力。 【课程特点】教学中以课堂讲授为主,以讨论为辅。采用启发式教学法,适当运用讨论式教学法。融入联系应用的案例式教学法,并倡导利用结合软件技术解决实际问题的实验式教学法。恰当使用多媒体教学与传统教学相结合的教学手段,充分运用教师对学生讲授与学生间自由讨论相结合、传统解题训练与开放型问题探索相结合、以及实体课堂面对面交流与虚拟课堂数字信息交流相结合的交互式教学手段,合理利用网络资源实施开放性教学手段,采用规范统考与多样化考查相结合的考核手段。【课程大纲】(1天*8小时)时间内容案例实践与练习Day1数据分析概述1面向小白的统计学:描述性统计(均值,中位数,众数,方差,标准差,与常见的统计图表)2概率的基本概念(方差、分位数、随机试验、样本空间、事件、频率、概率、排列组合),古典概型3条件概率与贝叶斯公式,独立性4微积分:随机变量及其分布(二项分布,均匀分布,正态分布)5多维随机变量及其分布6随机变量的期望,方差与协方差7大数定律、中心极限定理与抽样分布8从抽样推测规律之一:点估计与区间估计9从抽样推测规律之二:参数估计10基于正态总体的假设检验11秩和检验12预测未来的技术:回归分析13时间序列分析 案例练习: 研讨: 课程3:数据分析与挖掘基础-6天【匹配关键知识点】常见数据分析方法与数据挖掘概述,描述型数据分析,常见数据分析与挖掘算法(Kmeans、购物篮、决策树、朴素贝叶斯等)等内容。【课程时间】6天(8小时/天)【课程简介】随着大数据时代的快速到来,以及大数据在生产生活中迅速应用,数据分析、数据建模、数据挖掘、机器学习、神经网络、深度学习、人工智能等重要性越发突出,本课程是针对大数据时代的特点,尹老师总结多年数据分析经验,而精心设计的课程,课程内容涵盖了数据领域的数据处理、统计分析、数据挖掘、机器学习、神经网络、深度学习、人工智能等内容,以及人工智能的应用范围、发展前景剖析。【课程收益】1、常见数据分析方法与数据挖掘概述;2、描述型数据分析;3、常见数据分析与挖掘算法(Kmeans、购物篮、决策树、朴素贝叶斯等)等。【课程特点】常见数据分析方法与数据挖掘概述,描述型数据分析,常见数据分析与挖掘算法(Kmeans、购物篮、决策树、朴素贝叶斯等)等内容。【课程对象】     数据分析师、技术经理、产品经理、产品助理等     将承担数据分析师职责的业务人员或信息化人员     希望加强数据分析能力的软件开发人员     系统集成企业售前工程师、售前顾问及方案制作人员【学员基础】     具有2年以IT部门工作经验,将负责数据分析等相关任务的技术人员【课程大纲】(6天*8小时)时间内容案例实践与练习Day1常见数据分析方法与数据挖掘概述数据分析与建模的概念数据分析与建模过程数据分析模型开发过程数据建模概述机器学习概念机器学习算法剖析算法库分类算法库深度学习神经网络人工智能商业智能 案例练习:通过案例的剖析数据分析过程,体会数据分析的难点和要点。 研讨:数据分析的过程Day2描述型数据分析统计学基本概念统计数据的计量尺度常用基本统计量集中趋势的描述指标离散趋势的描述指标中心极限定理大数定律数据的分布正态分布的特征偏度和峰度检测数据集的分布数据的分布拟合检验与正态性检验抽样标准假设检验T检验置信区间案例练习:通过案例的剖析数据分析过程,体会数据分析的难点和要点。 研讨:描述性数据分析Day3常见数据分析与挖掘算法数据挖掘的基本任务数据挖掘建模过程定义挖掘目标数据取样数据探索数据预处理挖掘建模建立模型业务理解模型拟合训练集测试集模型评价常用的数学预测模型线性回归回归(预测)与分类决策树与随机森林聚类分析(kmeans)关联规则时序模式离群点检测深度学习人工智能神经网络案例:如何从数据中挖掘出有价值的信息案例研讨:通过案例的剖析数据分析过程,体会数据分析的难点和要点。 研讨:常用数据分析方法与算法Day4朴素贝叶斯与回归分析主成分分析和因子分析(深入剖析主成分分析及因子分析)主成分分析总体主成分样本主成分主成分分析模型案例:主成分分析模型实现课堂实操:主成分分析模型实现 方差分析(深入剖析方差分析方法及实现)单因素方差分析单因素方差分析模型因素效应的显著性检验因素各水平均值的估计与比较两因素等重复试验下的方差分析统计模型交互效应及因素效应的显著性检验无交互效应时各因素均值的估计与比较有交互效应时因素各水平组合上的均值估计与比较两因素非重复试验下的方差分析金融案例:方差分析实现课堂实操:方差分析实现Bayes统计分析(深入剖析Bayes统计分析)Baves统计模型Bayes统计分析的基本思想Bayes统计模型Bayes统计推断原则先验分布的Bayes假设与不变先验分布共轭先验分布先验分布中超参数的确定Baves统计推断参数的Bayes点估计Bayes区间估计Bayes假设检验案例:实现Bayes统计分析建模课堂实操:实现Bayes统计分析建模 数学建模(深入剖析数学建模)数学建模数学预测模型模型评估模型参数优化 回归分析与分类分析原理与应用(深入剖析数据的回归分析与分类分析的原理以及应用)回归与分类回归分析概念线性回归模型及其参数估计一元线性回归一元线性回归模型一元线性回归模型求解参数损失函数求偏导回归方程的显著性检验残差分析误差项的正态性检验残差图分析统计推断与预测回归模型的选取穷举法逐步回归法岭回归分析一元线性回归金融案例:一元线性回归模型检验多元线性回归概述多元线性回归模型金融案例:多元线性回归实现航空业信用打分和评级模型 Logistic回归分析(剖析Logistic回归与其它回归分析方法)Logistic回归介绍Logistic函数Logistic回归模型案例:SPSS Logistic回归实现课堂实操: Logistic回归实现航空业欺诈预测模型课堂实操: Logistic回归实现航空业风险分析模型 非线性回归原理及应用(剖析非线性回归原理及应用实践)非线性回归双曲线函数幂函数指数函数对数函数S型曲线案例:非线性回归实现课堂实操:非线性回归实现航空业经营分析和绩效分析模型案例练习:通过案例的剖析数据分析过程,体会数据分析的难点和要点。 研讨:主成分分析模型实现Day5聚类分析与关联规则挖掘 数据建模常用距离(深入剖析数据建模过程中常用的距离模型)数据挖掘常用距离欧氏距离曼哈顿距离切比雪夫距离闵可夫斯基距离标准化欧氏距离马氏距离夹角余弦汉明距离杰卡德距离 & 杰卡德相似系数相关系数 & 相关距离信息熵 聚类分析与建模实现(深入剖析聚类分析以及通过SPSS聚类算法模型分析数据)聚类分析聚类算法样品间相近性的度量快速聚类法快速聚类法的步骤用Lm距离进行快速聚类谱系聚类法类间距离及其递推公式谱系聚类法的步骤变量聚类案例:SPSS聚类实现及绘图案例:Kmeans应用案例剖析课堂实操:编写程序实现Kmeans应用案例剖析 关联规则分析与实现(深入剖析关联规则分析以及通过SPSS关联规则算法模型分析数据)关联规则支持度与置信度关联规则挖掘的过程Apriori算法关联规则案例支持度与置信度计算案例:SPSS实现关联规则课堂实操:SPSS实现航空业数据关联规则分析案例练习:通过编写程序实现Kmeans应用案例的剖析数据分析过程,体会数据分析的难点和要点。 研讨:编写程序实现Kmeans应用案例剖析Day6决策树与随机森林 决策树分析与实现(深入剖析决策树分析以及通过SPSS决策树模型分析数据)决策树分析决策树决策树构成要素决策树算法原理决策树法的决策过程决策树算法案例:实现决策树分析课堂实操:实现航空业客户细分模型随机森林  数据建模时序模式分析与实现(深入剖析时序模式分析)时序模式时间序列分析时间序列分析时间序列序列分析的三个阶段课堂实操:实现航空业客户流失模型案例练习:通过实现航空业客户细分模型案例的剖析数据分析过程,体会数据分析的难点和要点。 研讨:实现航空业客户细分模型 课程8:大数据可视化-2天【匹配关键知识点】数据可视化技术概述及培训关键点概述,数据挖掘与可视化工具介绍(SAS、Project、Excel、SPSS、Tableau等),可视化案例分享等内容。【课程时间】2天(8小时/天)【课程简介】随着互联网、移动智能设备、云计算技术、大数据技术的迅猛发展,使人类产生与获取数据的能力成数量级地增加,面对如此浩瀚的数据海洋,想通过人工分析大数据从而得到大数据中隐含的有价值的模式,几乎是不可能的。因此人们需要借助新的技术挖掘大数据中所蕴含的价值,采用数据可视化技术绝对是一个明智的选择。随着科学技术的不断发展,大量的由计算机产生的中间数据都需要进行可视化处理,以求达到辅助分析、再现客观事实的目的。通过视觉化呈现数据,可揭示了令人惊奇的模式和观察结果,某些数据是不可能通过简单统计就能显而易见的看到的模式和结论。正如作家、记者和信息设计师 David McCandless 在 TED 上说道:“通过视觉化,我们把信息变成了一道可用眼睛来探索的风景线,一种信息地图。当你在迷失在信息中时,信息地图非常实用”。由此足见数据可视化的价值。无论获得信息还是表达信息,最佳方式之一是通过视觉化方式,快速捕捉和展现信息要点与核心要义,这是数据可视化的价值点所在。数据可视化技术有着广阔的发展和应用空间,越来越受到人们的关注。【课程收益】1、数据可视化技术概述及培训关键点概述;2、数据挖掘与可视化工具介绍;3、可视化案例分享【课程特点】数据可视化技术概述及培训关键点概述,数据挖掘与可视化工具介绍(SAS、Project、Excel、SPSS、Tableau等),可视化案例分享等内容。【课程对象】     数据分析师、技术经理、产品经理、产品助理等     将承担数据分析师职责的业务人员或信息化人员     希望加强数据分析能力的软件开发人员     系统集成企业售前工程师、售前顾问及方案制作人员【学员基础】     具有2年以IT部门工作经验,将负责数据分析等相关任务的技术人员【课程大纲】(2天*8小时)时间内容案例实践与练习Day1数据可视化技术概述及培训关键点概述 数据可视化问题剖析(深入大数据时代数据可视化存在的问题)大数据特征vs数据可视化传统数据可视化问题剖析传统数据可视化工具特点剖析 数据可视化概述(介绍数据可视化工具、特征及基础架构)数据可视化概念数据可视化作用数据可视化目标数据可视化应用数据维度和指标图表产生过程可视化的表现形式可视化的显示可视化的色彩可视化案例实战:仪表盘制作标准图表的表现能力标准图表的选择标准图表制作原则可视化案例实战:数据占比柏拉图绘制可视化的决定性因素数据可视化技巧数据化可视化工具创意性数据可视化虚拟实现技术防止过度可视化一图胜千言可视化的升华:声音 可视化的探索性分析和数据挖掘工具(学习可视化数据挖掘工具)TableauExcelEChartsQlikViewR语言PythonSPSSSAS 数据可视化图表详解(通过实例讲述数据可视化方法、过程及含义)散点图雷达图条形图柱形图饼图直方图箱线图QQ图柏拉图制作仪表盘制作玫瑰图制作热力图制作地图制作文字云制作案例剖析案例练习:通过仪表盘制作案例的剖析数据分析过程,体会数据分析的难点和要点。 研讨:仪表盘制作Day2数据挖掘与可视化工具介绍(SAS、Project、Excel、SPSS、Tableau等),可视化案例分享 Tableau简介Tableau历史与趋势剖析Tableau使用Tableau的数据类型介绍Tableau的数据结构介绍Tableau数据的读入和输出Tableau数据库的读/写Tableau与Kylin集成定性变量离散变量连续变量多元变量日期和时间数据的操作处理 数据可视化应用场景,具体案例分析淘宝24小时生活数据可视化案例无线淘宝数据可视化案例Google公司数据可视化案例Facebook用户画像可视化案例个人用户画像案例 大数据可视化呈现ECharts实战(通过一个完整的实例讲述使用ECharts数据可视化的过程与方法)Echarts使用项目案例Echarts概述ECharts特性ECharts架构图整合How to use?Step1. 引入模块加载器Step2. 设置具备大小的DomStep3. 配置echarts模块路径Step4.动态加载echartsoption的使用InterfacesetOptionOption全局属性titlelegenddataRangetoolboxdataZoomgridxAxis/yAxis/axiscolor数值型类目型tooltip.formatterseries高度个性化其它参考图形热力图社交网络 分析结果呈现和分析报告撰写合理的数据呈现报告分析模板如何撰写一份优秀的数据分析报告案例研讨:通过淘宝24小时生活数据可视化案例的剖析数据分析过程,体会数据分析的难点和要点。 研讨:淘宝24小时生活数据可视化案例 课程9:Python与数据分析实战-13天【匹配关键知识点】Python语言入门,Python网络编程、爬虫与机器学习,Python数据分析案例分享,基于spark集群的python数据分析实战等内容。【课程时间】13天(8小时/天)【课程简介】随着大数据时代的快速到来,以及大数据在生产生活中迅速应用,大数据领域如雨后春笋般的出现大量的新技术,如Hadoop、Spark等技术,其中Python语言已经成为大数据技术中最为重要的一部分,被越来越多的企业所使用。Python语言的功能涵盖了大数据领域的数据处理、统计分析、数据挖掘、机器学习、人工智能、大数据应用开发等各种不同类型的计算操作,应用范围广泛、前景非常广阔。本课程是尹老师多年工作经验的总结和归纳,从实际业务案例为入口,使学员从理论层到实操层面系统的学习数据处理技术,使学员深入理解Python语言等数据分析工具。通过本课程的学习,学员即可以正确的分析企业的数据,为管理者、决策层提供数据支撑。【课程收益】1、Python语言入门;2、Python网络编程;3、Python网络爬虫;4、Python机器学习;5、Python数据分析案例分享;6、基于spark集群的python数据分析实战;【课程特点】Python语言入门,Python网络编程、爬虫与机器学习,Python数据分析案例分享,基于spark集群的python数据分析实战等内容。【课程对象】     数据分析师、技术经理、产品经理、产品助理等     将承担数据分析师职责的业务人员或信息化人员     希望加强数据分析能力的软件开发人员     系统集成企业售前工程师、售前顾问及方案制作人员【学员基础】     具有2年以IT部门工作经验,将负责数据分析等相关任务的技术人员【课程大纲】(13天*8小时)时间内容案例实践与练习Day1~Day3Python语言入门Python语言基础知识(介绍Python语言基础知识,包括Python语言数据类型、基础概念等)Python语言历史与趋势剖析Python语言安装如何运行Python程序PyCharm开发环境介绍Anaconda3开发环境介绍(以Anaconda3作为程序演示环境,Python3作为演示语言)Python语言help()命令Python基本命令变量(Variables)表达式(Expressions)基本数据类型字符串与正则表达式Python条件表达式循环(loops)案例实战:正则表达式在爬虫中应用实例Python数据结构Python创建数组Python矩阵运算Python语言语法结构案例:Python语言实现运营商数据分析处理 Python函数(深入Python函数的编写语言)Python函数介绍数据分析与建模过程Python语言定义函数规则Python语言自定义函数Python匿名函数Python内置函数Python函数案例 Python类(class)(深入剖析Python类的原理)类(class)介绍Python多重继承Python不支持函数重载Class and Instance VariablesMethod ObjectsPython类编写案例实战 Python异常处理(Exceptions)(深入剖析Python异常处理)异常处理(Exceptions)简介Python标准异常类Python异常类编程案例实战(爬虫实例) Python模块 (Modules)(深入剖析模块 (Modules))Python模块 (Modules)介绍Python自定义模块Python模块的导入与添加Python标准函数库模块Python第三方模块 Python文件读写(深入剖析Python文件读写)Python文件读写简介Python读写方法介绍Python读写文本文件Python读写二进制文件Python读写json文件Python读写xml文件 Python操作关系型数据库(深入剖析Python操作关系型数据)Python2安装MySQL Connector Python3安装MySQL ConnectorPython语言操作数据库Python语言数据库优化案例:Python语言实现话务数据时间序列建模案例练习:通过Python语言实现运营商数据分析处理案例的剖析数据分析过程,体会数据分析的难点和要点。 研讨:Python语言实现运营商数据分析处理Day4~Day5Python网络编程 多线程编程 (用实战实例介绍如何实现多线程) Python开发多线程的原理多线程创建线程锁网络应用程序编程实例:比如生成发送电子邮件  Python网络编程(介绍Python网络编程)TCP/IP网络介绍Socket基础知识Socket客户端服务器连接案例:聊天功能实战 Python Web开发实战(介绍Python Web实战)Python Web开发Django框架介绍定义和使用模型Django MVC架构Django开发环境搭建Django Session应用Django框架应用Django高级应用案例:客户通话历史记录查询案例练习:通过案例的剖析数据分析过程,体会数据分析的难点和要点。 研讨:网络编程Day6~Day7Python网络爬虫 Python基础知识和网络程序基础知识(介绍Python基础知识和网络程序基础知识)Python语言简介Python开发环境搭建和选择IO编程进程和多线程基础知识网络编程和TCP协议 Web前端基础知识(介绍Web前端基础知识)Web程序的结构Web前端的内容HTMLCSSJavaScriptXPathJsonHTTP协议标准HTTP头和主体Cookie信息 网络爬虫基础知识(介绍网络爬虫基础知识)网络爬虫概述网络爬虫及其应用网络爬虫结构HTTP请求的Python实现urllib2/urllib实现httplib/urllib实现更人性化的Requests HTML解析(HTML解析原理介绍)初识Firebug安装和配置Firebug正则表达式基本语法与使用Python中使用正则表达式BeautifulSoup概述安装和配置BeautifulSoupBeautifulSoup的使用lxml的XPath解析 基本的爬虫程序开发(介绍基本的爬虫程序开发)基础爬虫架构及运行流程URL管理器HTML下载器HTML解析器数据存储器爬虫调度器 协议分析(协议分析)Web端协议分析网页登录POST分析隐藏表单分析加密数据分析验证码问题IP代理Cookie登录传统验证码识别人工打码滑动验证码PC客户端抓包分析HTTPAnalyzer简介虾米音乐PC端API实战分析App抓包分析Wireshark简介酷我听书App端API实战分析API爬虫:爬取mp3资源信息 Scrapy爬虫框架(介绍Scrapy爬虫框架)Scrapy爬虫架构安装Scrapy创建cnblogs项目创建爬虫模块定义Item翻页功能构建ItemPipeline内置数据存储启动爬虫强化爬虫调试方法异常控制运行状态ItemLoaderItem与ItemLoader输入与输出处理器ItemLoaderContext?请求与响应下载器中间件Spider中间件扩展突破反爬虫案例研讨:通过案例的剖析数据分析过程,体会数据分析的难点和要点。 研讨:网络爬虫的实现Day8Python的NumPy模块NumPy 安装NumPy Ndarray 对象NumPy 数据类型NumPy 数组属性NumPy 创建数组NumPy 从已有的数组创建数组NumPy 从数值范围创建数组NumPy 切片和索引NumPy 高级索引NumPy 广播(Broadcast)NumPy 迭代数组Numpy 数组操作NumPy 位运算NumPy 字符串函数NumPy 数学函数NumPy 算术函数NumPy 统计函数NumPy 排序、条件刷选函数NumPy 字节交换NumPy 副本和视图NumPy 矩阵库(Matrix)NumPy 线性代数NumPy IONumPy Matplotlib案例练习:通过NumPy的案例的剖析数据分析过程,体会数据分析的难点和要点。 研讨:NumPy的数据处理Day9Python的Pandas模块Pandas环境安装配置Pandas数据结构Pandas快速入门Pandas系列Pandas数据帧(DataFrame)Pandas面板(Panel)Pandas基本功能Pandas描述性统计Pandas函数应用Pandas重建索引Pandas迭代Pandas排序Pandas字符串和文本数据Pandas选项和自定义Pandas索引和选择数据Pandas统计函数Pandas窗口函数Pandas聚合Pandas缺失数据Pandas分组(GroupBy)Pandas合并/连接Pandas级联Pandas日期功能Pandas时间差(Timedelta)Pandas分类数据Pandas可视化Pandas IO工具Pandas稀疏数据Pandas注意事项&窍门Pandas与SQL比较案例练习:通过Pandas使用案例的剖析数据分析过程,体会数据分析的难点和要点。 研讨:Pandas的使用方法Day10Python机器学习Python平台下的机器学习开发技术(介绍Python平台下的机器学习开发技术)Python平台下的数据分析工具Python平台下的数据分析工具概述NumPy数据处理NumPy案例Scipy数值计算SymPy符号处理Matplotlib绘制图表Pandas数据分析、探索工具Pandas的DataFrameDataFrame的构造StatsModels数据统计建模分析Scikit-Learn机器学习库Keras人工神经网络Keras的设计原则Gensim文本挖掘库OpenCV计算机视觉库案例:Python语言实现基于聚类的图像分割方法案例练习:通过案例的剖析数据分析过程,体会数据分析的难点和要点。 研讨:Python语言实现基于聚类的图像分割方法Day11Python机器学习 聚类模型原理与实现(深入剖析聚类原理以及通过Python语言实现聚类算法模型)聚类介绍聚类算法应用场景聚类算法应用案例样品间相近性的度量快速聚类法快速聚类法的步骤用Lm距离进行快速聚类谱系聚类法类间距离及其递推公式谱系聚类法的步骤变量聚类K-Means(K均值)聚类均值漂移聚类基于密度的聚类方法(DBSCAN)用高斯混合模型(GMM)的最大期望(EM)聚类凝聚层次聚类图团体检测(Graph Community Detection)案例:Python语言聚类实现及绘图案例:Kmeans应用案例剖析课堂实操:Python语言实现基于聚类的图像分割方法 决策树模型原理与实现(深入剖析决策树原理以及通过Python语言实现决策树模型)决策树介绍决策树应用场景决策树应用案例信息熵ID3算法C4.5算法CART算法决策树算法剪枝过拟合与调参决策树算法原理决策树法的决策过程案例:Python语言实现决策树模型课堂实操:Python语言实现决策树模型随机森林案例练习:通过案例的剖析数据分析过程,体会数据分析的难点和要点。 研讨: Python语言实现基于聚类的图像分割方法Day12Python数据分析案例分享 随机森林模型原理与实现(深入剖析随机森林原理以及通过Python语言实现随机森林模型)随机森林介绍随机森林的特点随机森林的相关基础知识信息、熵以及信息增益的概念随机森林的生成随机森林算法随机森林算法原理袋外错误率(oob error)随机森林应用场景随机森林应用案例案例:Python语言实现随机森林模型课堂实操:Python语言实现随机森林模型xgboost 支持向量机模型原理与实现(深入剖析支持向量机算法原理以及通过Python语言实现支持向量机模型)支持向量机介绍支持向量机应用场景支持向量机应用案例支持向量机算法支持向量机算法原理线性可分支持向量机间隔最大化和支持向量对偶问题求解柆格朗日函数非线性支持向量机和核函数超平面线性核多项式核高斯核拉普拉斯核sigmiod核线性支持向量机(软间隔支持向量机)与松弛变量松驰因子案例:Python语言实现支持向量机模型课堂实操:Python语言实现基于SVM的字符识别方法 神经网络模型原理与实现(深入剖析神经网络算法原理以及通过Python语言实现神经网络模型)神经网络介绍神经网络概念神经网络发展历史神经网络的别名神经网络研究的主要内容神经网络基本构成神经网络模拟人的智能行为的四个方面神经网络的特点学习能力适应性问题神经网络基本网络模型单层网络多层网络循环网络基本网络结构特点典型训练算法运行方式典型问题解决方法感知机线性神经网络BP神经网络RBF网络竞争网络反馈神经网络随机神经网络遗传算法PSO与神经网络优化自定义深度神经网络结构深度神经网络的优化方法深度框架的
    • 刘晖:SPSS数据统计分析课程
    【课程收益】认识和应用SPSS最新统计分析软件掌握SPSS软件及技术原理学会运用统计方法解决工作和学习中的实际问题提高SPSS软件的运用能力,解决工作中的实际问题如何在SPSS中完成数据的统计描述和参数估计,以及如何使用统计图表来进行数据的完美呈现【课程特色】1.   课上采用案例式教学,通俗易懂,课下一对一辅导强化训练,学与练交叉进行强化记忆,你所要做的就是认真听,勤于问,乐于练。2.   清晰的知识结构,根据应用经验采用最优化授课模式。3.   内容充沛、详略得当,前后呼应。4.   讲师资历丰富,具有丰富的实践经验。5.   知识讲授+贴身案例+场景故事+互动讨论+现场演练+落地跟踪根据课程提供相应的练习数据,实现边学编练,以实践为主线掌握相应的知识体系。【课程对象】相关人员【课程时间】2天(6小时/天)需要上机操作【课程大纲】第一部分 数据管理与软件入门一、数据分析概述与软件入门SPSS软件概述SPSS的安装SPSS操作入门SPSS软件的启动与退出SPSS的5个窗口SPSS的4种运行方式SPSS的4种结果输出数据分析概述数据分析方法论介绍SPSS系列产品对数据分析流程的支持二、数据录入与数据获取数据格式概述数据的直接录入外部数据的获取电子表格数据如何导入 SPSS中文本数据如何导入 SPSS中数据库格式数据如何导入SPSS中数据的保存存为 SPSS格式存为其他数据格式三、数据管理变量级别的数据管理计算新变量对变量值进行分组合并连续变量的可视化分段将字符变量转换为数值变量变量的编秩文件级别的数据管理记录排序记录拆分记录筛选记录加权数据汇总数据字典的定义与应用查找重复记录数据文件的重新排列与转置多个数据文件的合并第二部分 统计描述与统计图表一、连续变量的统计描述与参数估计连续变量的统计描述概述统计描述中可用的工具连续变量的统计描述指标体系SPSS中的相应功能集中趋势的描述指标算术均数中位数其他集中趋势描述指标离散趋势的描述指标全距方差和标准差百分位数、四分位数与四分位数间距变异系数连续变量统计描述实例连续变量的参数估计正态分布参数的点估计参数的区间估计二、分类变量的统计描述与参数估计分类变量的统计描述概述分类变量统计描述实例多选题的统计描述分类变量的参数估计三、数据的报表呈现SPSS报表概述表格入门用 OriginalTables模块制表用 CustomTable模块自由制表表格的编辑表格高级应用技术四、数据的图形展示统计图概述直方图与茎叶图箱图饼图条图线图散点图其他统计图交互式统计图的编辑SPSS绘图中的注意事项第三部分 常用假设检验方法一、分布类型的检验假设检验的基本思想正态分布检验二项分布检验游程检验二、连续变量的统计推断-t检验t检验基础样本均数与总体均数的比较成组设计两样本均数的比较配对设计样本均数的比较三、连续变量的统计推断-单因素方差分析方差分析入门为什么要进行方差分析方法原理单因素方差分析的应用条件单因素方差分析的 SPSS实现均数间的多重比较直接校正检验水准专用的两两比较方法两两比较方法的选择策略多重比较结果出现矛盾时的解释分析实例各组均数的精细比较方法原理分析实例事先计划的比较组间均数变化的趋势检验四、有序分类变量的统计推断-非参数检验非参数检验概述非参数检验的意义非参数检验预备知识两个配对样本的非参数检验方法原理分析实例确切概率的计算两个独立样本的非参数检验Mann-WhitneyU检验分析实例其他两样本非参数检验方法多个独立样本的非参数检验方法原理分析实例多个样本的两两比较多个相关样本的非参数检验Friedman检验分析实例Kendall协和系数检验与Cochran检验秩变换分析方法原理简介应用实例五、无序分类变量的统计推断-χ2检验χ2 检验基础拟合问题-样本率与已知总体率的比较分析实例检验方法的 SPSS实现单样本χ2检验的其他话题相关问题- 两(多)个率或构成比的比较分析实例检验方法的 SPSS实现多样本 χ2检验的其他话题两分类变量间关联程度的度量一致性检验与配对χ2 检验分层χ2检验六、相关分析与回归分析相关分析简介简单相关分析偏相关分析Distances过程简单回归分析
    • 刘晖:Python自动化办公
    【课程特色】1.   课上采用案例式教学,通俗易懂,课下一对一辅导强化训练,学与练交叉进行强化记忆,你所要做的就是认真听,勤于问,乐于练。2.   清晰的知识结构,根据应用经验采用最优化授课模式。3.   内容充沛、详略得当,前后呼应。4.   讲师资历丰富,具有丰富的实践经验。5.   知识讲授+贴身案例+场景故事+互动讨论+现场演练+落地跟踪【课程对象】相关人员【课程时长】3天(6小时/天)【课程大纲】第1章  走进Python编程1.1  搭建编程环境1.2  在Windows系统中搭建Python编程1.3  在OS X系统中搭建Python编程1.4  在Linux系统中搭建Python编程第2章  变量和简单数据类型2.1  变量2.2  字符串2.3  数字2.4  数据类型转化与运算2.5  代码注释第3章  程序控制结构3.1  分支结构3.2 for计数循环3.3 while条件循环 3.4  停止和跳出循环第4章  序列中的列表4.1  列表的概念 4.2  列表的基本操作4.3  列表分片4.4  列表排序第5章  序列中的元组5.1  认识元组5.2  元组的基本操作5.3  使用元组的方法第6章  序列中的字典6.1  认识字典6.2  字典的基本操作6.3  遍历字典6.4  字典嵌套第7章  Python工具之函数7.1  函数的基本认识和用法7.2  函数的特性7.3  函数的作用域第8章  类与对象8.1  类与对象的初级认识8.2  类与对象的进阶8.3  类与对象之继承8.4  类的三大特性第9章  程序的异常9.1  错误与异常9.2  异常的处理第10章  文件操作10.1 读取文件10.2 写入文件10.3 文件读写之应用第11章  文件办公自动化与AI应用11.1 os模块入门11.2 os模块进阶11.3 文字数据处理11.4 AI智能应用功能第12章  Excel操作的自动化12.1 xlrd库的介绍和安装12.1.1 xlrd库简介12.1.2 安装xlrdD三方库12.1.3 安装过程的问题处理 12.2 xlrd库的使用12.2.1 打开Excel工作表对象12.2.2 数据读取单个单元格12.2.3 数据读取多个单元格12.2.4 Excel工作表写入单个数据12.2.5 Excel工作表写入多个数据12.2.6 Excel工作表数据复制第13章  Excel格式控制13.1 设置列宽行高13.2 设置表的风格样式13.2.1 风格样式属性13.2.2 设定风格样式13.3 设置字体属性13.4 设置边界属性13.5 设置对齐属性13.6 设置模式属性13.7 合并单元格第14章  Excel自动建表实战14.1 自动化建表应用场景14.2 表格数据分析14.3 数据格式整理14.4 数据写入到表格 14.5 追加数据到表格 14.6 设置风格样式14.7 封装风格样式第15章  让Excel自动处理飞起来15.1 xlwings库的介绍和安装15.1.1 什么是xlwings模块15.1.2 安装xlwingsD三方库15.2 xlwings库初体验15.2.1 与Excel工作簿建立连接15.2.2 相对路径和JD路径15.2.3 获取单元格数据15.2.4 工作簿文件的保存15.3 xlwings库J速入门15.3.1 xlwings库结构分析15.3.2 实例化应用15.3.3 创建工作簿对象15.3.4 创建工作表对象15.4 xlwings库常用的API(1)15.4.1 了解API 15.4.2 工作表常用的API 15.4.3 单元格常用的API 15.5 xlwings库常用的API(2)15.5.1 获取表格有效区 15.5.2 工作表中的函数15.6 xlwings库的拓展API 15.6.1 设定字体样式 15.6.2 设定边界属性 15.6.3 设定对齐属性 第16章  Excel自动化处理实战16.1 超市扫码记账系统案例16.1.1 案例简介 16.1.2 文件的打包 16.1.3 exe文件图标设计 16.2 工作簿数据筛选16.2.1 案例思路分析16.2.2 模拟数据实现16.2.3 实现数据筛选第17章  Word文档的自动化操作17.1 安装Python-docxD三方库17.2 创建Word文档17.2.1 创建空白Word文档 17.2.2 添加标题、段落和分页符17.3 设置Word中图片和字体17.3.1 操作图片 17.3.2 设置文档字体 17.4 合并多个文本文件到Word17.5 Word中插入表格第18章  加载源Word文档的操作18.1 加载源Word文档18.2 学生在校证明模板渲染案例第19章  Word模板渲染19.1 docxtpl简介19.2 学生通知书渲染案例第20章  Word文档操作案例20.1 拆分Word文档 20.2 合并Word文档 第21章  PPT文件的自动化操作21.1 Python-pptx模块简介 21.1.1 安装Python-pptx库 21.1.2 创建PPT文件 21.2 PPT相关简介 21.2.1 PPT母版与PPT幻灯片 21.2.2 PPT层次结构 21.2.3 占位符 21.3 幻灯片相关操作21.3.1 操作文本框 21.3.2 添加段落 21.3.3 添加图片 21.3.4 添加表格 21.3.5 添加形状 21.4 模板渲染 21.5 四种基本图形 21.5.1 折线图 21.5.2 柱形图 21.5.3 饼图和条形图 21.6 删除指定页 第22章  邮件处理自动化操作22.1 安装yagmail、keyringD三方库22.2 关于邮箱POP3和SMTP协议22.2.1 POP3和SMTP简介 22.2.2 开启POP3和SMTP协议 22.3 发送邮件22.3.1 发送DY封邮件 22.3.2 添加图片或链接 22.3.3 群发邮件 22.4 添加附件和定时器 22.4.1 添加附件 22.4.2 设置定时器 22.5 读取邮件 22.5.1 读取所有邮件 22.5.2 查看不同类型的邮件 22.6 删除邮件 第23章  Web的自动化操作 23.1 Selenium模块简介 23.1.1 Selenium是什么 23.1.2 安装及环境配置 23.1.3 自动加载百度页面 23.2 数据解析提取 23.2.1 操控元素的基本方法 23.2.2 自动操作鼠标键盘 23.2.3 自动化交互—鼠标动作链 23.2.4 模拟百度自动化搜索23.3 页面等待23.3.1 显式等待 23.3.2 隐式等待 23.4 自动获取京东商城信息23.4.1 设计思路23.4.2 代码演示23.5 自动获取淘宝商城信息23.5.1 案例分析 23.5.2 代码分析

    添加企业微信

    1V1服务,高效匹配老师
    欢迎各种培训合作扫码联系,我们将竭诚为您服务

    Copyright © 2019-2023 . All Rights Reserved. 深圳鲸塔网络科技有限公司 版权所有 联系我们:13411875693