数据分析入门

Excel

Excel基础

Excel进阶

Excel入门实例(馒头独家)


Python基础

Python基础教程

Python爬虫

Python Pandas库

Python NumPy库

Python入门实例(馒头独家)


统计软件基础

SAS教程

SPSS教程

统计软件入门实例(馒头独家)


数据库基础

SQL教程

NoSQL教程

数据库入门实例(馒头独家)


数据挖掘

数理统计基础

数据库基础(见上)

数据挖掘入门

数据挖掘入门实例(馒头独家)


机器学习

机器学习入门

机器学习入门实例(馒头独家)


可视化和视觉分析基础

Python Matplotlib

Tableau

Matlab

PoweBI

可视化入门实例(馒头独家)

logo

数据分析在如今的职场上越来越重要。没有编程基础的小白,能学会数据分析么?该如何学习数据分析呢?馒头数据提供了清晰简单的数据科学入门教程。

你需要系统提升数据获取、数据分析、数据可视化、机器学习的水平。请按照如上板块系统的学习数据分析入门的技能。

第一阶段:Excel数据分析
每一位数据分析师都脱离不开Excel。

它是日常工作中最常用的工具,如果不考虑性能和数据量,它可以应付绝大部分分析工作。虽然现在机器学习满地走,Excel依旧是无可争议的第一工具。对于没有经验的你,Excel是一款必须熟练的工具。它是日常工作中最常用的工具,如果不考虑性能和数据量,它可以应付绝大部分分析工作。

第二阶段:SQL数据库语言
作为数据分析人员,我们首先要知道如何去获取数据,其中最常见的就是从关系型数据库中取数,因此你可以不会R,不会python,但是你不能不会SQL。

DT时代,数据正在呈指数级增长。Excel对十万条以内的数据处理起来没有问题,但是往小处说,但凡产品有一点规模,数据都是百万起。这时候就需要学习数据库。在招聘条件中,越来越多的产品和运营岗位,将会SQL作为优先的加分项。SQL是数据分析的核心技能之一,从Excel到SQL是数据处理效率的一大进步。

主要了解数据库查询语言,where,group by,orderby,having,like,count,sum,min,max,distinct,if,join,left join,limit,and和or的逻辑,时间转换函数等。

学习SQL最快的方法是能自己下载数据库管理工具,馒头提供入门数据练习帮助你快速入门。

第三阶段:数据可视化&商业智能
数据可视化能力已经越来越成为各岗位的基础技能。领英的数据报告显示,数据可视化技能在历年年中国最热门技能中排名第一。

可视化工作几乎是你正式进行数据分析的第一步,通过SQL拿到数据之后,我们需要使用可视化方法探索和发现数据中的模式规律。

数据分析界有一句经典名言,字不如表,表不如图。实际上除掉数据挖掘这类高级分析,不少数据分析就是监控数据和观察数据。

除此此外,数据分析的大多时候都是要兜售自己的观点和结论的,而兜售的最好方式就是做出观点清晰数据详实的PPT和报表给老板看。

可视化的工具有很多,这里我推荐Tableau或者FineBI。这两款都不要编程功底,实现起来简单,功能强大。下图是Excel制作销售管理分析仪案例:

第四阶段:数理统计学
统计学是数据分析最重要的基础之一,是数据分析的基石和方法论。

统计知识会要求我们以另一个角度看待数据。当你知道AB两组的差异用平均值看是多傻的事情,你的分析技巧也会显著提高。

这里我们需要从基础的统计理论(描述性统计、区间估计、假设检验等)出发,到基本的统计分析(T 检验、方差分析等),最后到商业常用的模型(回归分析、方差分析等),学习数据分析背后的逻辑,掌握实用统计学的概念和会利用统计的思维去思考问题。

第五阶段:数据分析与软件应用
SPSS是统计分析入门软件,如果你想快速入门而又不想学习编程,我推荐使用SPSS。

SPSS软件是世界三大统计分析软件之一,以其易于操作、易于入门,结果易于阅读的优点,一直备受数据分析人员的青睐,一般经过短期学习即可用SPSS 做简单的数据分析,包括绘制图表、简单回归、相关分析等等。

学习SPSS的重点并不在于软件本身,而是相关的统计学知识,这也是在前面建议大家铺垫的,也就是你要学会怎样去分析“输入数据后,软件给你呈现的结果”。

第六阶段:数据挖掘与软件应用
数据挖掘,英文是Data Mining 也叫作数据勘探,类似于采矿,但是数据是贫矿。我们需要结合行业课题,利用数据挖掘工具,建置数据挖掘模型,发掘规律和商业价值。另外数据挖掘是交叉学科,涉及统计学、计算机、机器学习、运筹学等多门学科,是一个运用广泛和富有前景的学科领域。

学习算法模型包括线性回归、逻辑回归、主成分分析、因子分析、聚类、关联规则、决策树、随机森林、支持向量机、贝叶斯、神经网络等。

对于工具,这一阶段,推荐选择python作为编程语言来学习。

Python的主要功能是编程,除了单纯的数据分析,在很多领域还有广泛利用,所以就业市场上对Python的需求是远大于R。

点击链接加入群聊【数据馒头交流群1】:https://jq.qq.com/?_wv=1027&k=fZJv6qY8

数据馒头 Big Data Mentor