收集整理了一些python数据分析相关教程,涵盖基础入门到高级实战部分,希望对大家学习python数据分析有所帮助!
一、Python数据分析基础教程:NumPy学习指南(第2版)PDF电子书
本书主要介绍NumPy以及相关的Python科学计算库,如SciPy和Matplotlib。《Python数据分析基础教程:NumPy学习指南(第2版)》内容涵盖NumPy安装、数组对象、常用函数、矩阵运算、线性代数、金融函数、窗函数、质量控制、Matplotlib绘图、SciPy简介以及Pygame等内容,涉及面较广。另外,Ivan Idris针对每个知识点给出了简短而明晰的示例,并为大部分示例给出了实用场景(如股票数据分析),在帮助初学者入门的同时,提高了本书可读性。
《Python数据分析基础教程:NumPy学习指南(第2版)》适合正在找寻高质量开源计算库的科学家、工程师、程序员和定量管理分析师阅读参考。
下载地址:http://www.2020gushi.com/5774.html
二、NumPy攻略:Python科学计算与数据分析PDF电子书
本书带领读者了解熟悉当下最流行的科学计算库NumPy的方方面面。书中不仅介绍了NumPy的安装、使用和各种相关概念,还介绍了如何利用这一最新的开源软件库,以尽可能接近传统数学语言的方式,编写可读性好、实现效率高和运行速度快的代码。最后还探究了几个和NumPy相关的科学计算项目。此外,本书将为你掌握NumPy数组和通用函数打下坚实的基础,也会通过实例教你用Matplotlib绘图,并了解和SciPy相关的项目。
本书将帮助你:
• 学习高级索引技术和线性代数知识
• 了解数组形状及图像大小的调整
• 探察广播机制和直方图
• 分析NumPy代码并用可视化的方式表示分析结果
• 用Cython为代码提速
• 使用数组接口共享数据
• 使用通用函数和互操作功能
• 学习Matplotlib以及经常和NumPy同时使用的SciPy
下载地址:http://www.2020gushi.com/5871.html
三、Python数据分析与挖掘实战PDF电子书
本书共15章,分两个部分:基础篇、实战篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。
基础篇(第1~5章),第1章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具Python语言进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理进行了介绍。
实战篇(第6~15章),重点对数据挖掘技术在电力、航空、医疗、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述分析方法与过程,最后完成模型构建的顺序进行的,在建模过程的关键环节,穿插程序实现代码。最后通过上机实践,加深读者对数据挖掘技术在案例应用中的理解。
下载地址:http://www.2020gushi.com/4990.html
四、利用Python进行数据分析PDF电子书(含配套源码)
还在苦苦寻觅用Python控制、处理、整理、分析结构化数据的完整课程?本书含有大量的实践案例,你将学会如何利用各种Python库(包括NumPy、pandas、matplotlib以及IPython等)高效地解决各式各样的数据分析问题。
由于作者Wes McKinney是pandas库的主要作者,所以本书也可以作为利用Python实现数据密集型应用的科学计算实践指南。本书适合刚刚接触Python的分析人员以及刚刚接触科学计算的Python程序员。
•将IPython这个交互式Shell作为你的首要开发环境。
•学习NumPy(Numerical Python)的基础和高级知识。
•从pandas库的数据分析工具开始。
•利用高性能工具对数据进行加载、清理、转换、合并以及重塑。
•利用matplotlib创建散点图以及静态或交互式的可视化结果。
•利用pandas的groupby功能对数据集进行切片、切块和汇总操作。
•处理各种各样的时间序列数据。
•通过详细的案例学习如何解决Web分析、社会科学、金融学以及经•济学等领域的问题。
下载地址:http://www.2020gushi.com/3892.html
五、Python金融大数据分析PDF电子书
唯一一本详细讲解使用Python分析处理金融大数据的专业图书;金融应用开发领域从业人员必读。
Python凭借其简单、易读、可扩展性以及拥有巨大而活跃的科学计算社区,在需要分析、处理大量数据的金融行业得到了广泛而迅速的应用,并且成为该行业开发核心应用的首选编程语言。《Python金融大数据分析》提供了使用Python进行数据分析,以及开发相关应用程序的技巧和工具。
《Python金融大数据分析》总计分为3部分,共19章,第1部分介绍了Python在金融学中的应用,其内容涵盖了Python用于金融行业的原因、Python的基础架构和工具,以及Python在计量金融学中的一些具体入门实例;第2部分介绍了金融分析和应用程序开发中最重要的Python库、技术和方法,其内容涵盖了Python的数据类型和结构、用matplotlib进行数据可视化、金融时间序列数据处理、高性能输入/输出操作、高性能的Python技术和库、金融学中需要的多种数学工具、随机数生成和随机过程模拟、Python统计学应用、Python和Excel的集成、Python面向对象编程和GUI的开发、Python与Web技术的集成,以及基于Web应用和Web服务的开发;第3部分关注的是蒙特卡洛模拟期权与衍生品定价实际应用的开发工作,其内容涵盖了估值框架的介绍、金融模型的模拟、衍生品的估值、投资组合的估值、波动率期权等知识。
《Python金融大数据分析》适合对使用Python进行大数据分析、处理感兴趣的金融行业开发人员阅读。
下载地址:http://www.2020gushi.com/5874.html
六、Python数据分析实战 (内利著)PDF电子书
Python数据分析实战一书展示了如何利用Python语言的强大功能,以最小的编程代价进行数据的提取、处理和分析,主要内容包括:数据分析和Python 的基本介绍,NumPy 库,pandas 库,如何使用pandas 读写和提取数据,用matplotlib 库和scikit-learn 库分别实现数据可视化和机器学习,以实例演示如何从原始数据获得信息、D3 库嵌入和手写体数字的识别。
下载地址:http://www.2020gushi.com/5868.html
七、Python数据分析视频教程
Python是一种面向对象、直译式计算机程序设计语言。也是一种功能强大而完善的通用型语言,已经具有十多年的发展历史,成熟且稳定。Python 具有脚本语言中最丰富和强大的类库,足以支持绝大多数日常应用。 Python语法简捷而清晰,具有丰富和强大的类库。它常被昵称为胶水语言,它能够很轻松的把用其他语言制作的各种模块(尤其是C/C++)轻松地联结在一起。
2012年的时候我们说R是学术界的主流,但是现在Python正在慢慢取代R在学术界的地位。从12年13.3%的使用率到15年30.3%的使用率, Python已经逐渐成为数据分析与挖掘软件的中流砥柱。所以,让我们一起来跟随课程的脚步,感受Python的魅力吧!
课程将从Python的基本使用方法开始,一步步讲解,从ETL到各种数据分析方法的使用,并结合实例,让学员能从中借鉴学习。
课程大纲:
第一部分. Python基础
第一课:Python的概览——Python的基本介绍、安装与基本语法、变量类型与运算符
第二课:了解Python流程控制——条件、循环语句与其他语句
第三课:常用函数——函数的定义与使用方法、主要内置函数的介绍
第四课:NumPy基础——数组的创建、组合与分割
第二部分 数据分析的准备
第五课:了解数据——数据加载、储存与文件格式;异常值的清理与缺失值处理
第六课:数据清洗与初步分析——数据清理、转换、合并与重塑;数据汇总与描述统计;
第七课:绘图与可视化——基本绘图命令与图形概览、图形元素设定与实例:地震危机数据的可视化
第八课:数据聚合与分组处理——数据聚合、分组运算与转换、透视表与交叉表
第三部分 数据分析初探
第九课:假设检验——常用假设检验与实例分析
第十课:线性回归——线性回归模型、分析结果呈现与解读;实例:商品价格预测
第十一课: logistic回归——logistic回归模型讲解;实例:电信客户流失分析
第十二课:时间序列分析——时间序列基本处理、时间序列模型构建与结果解读;实例:未来股票价格预测
第四部分 深入数据分析
第十三课:分类算法——knn、决策树、贝叶斯分类器等算法介绍;实例:网页注册用户预测
第十四课:聚类算法——k-means算法介绍;实例:通信基站聚类分析
第十五课:降维方法——主成分分析与因子分析算法介绍;实例:地区经济指标评分
下载地址:http://www.2020gushi.com/2220.html
请先
!