博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Python数据分析(一):工具的简单使用
阅读量:5230 次
发布时间:2019-06-14

本文共 2514 字,大约阅读时间需要 8 分钟。

1、Numpy

  安装:pip install numpy 

[root@kvm work]# cat numpy_test.py #!/usr/bin/env python#coding:utf-8from __future__ import print_function# 导入模块并添加别名import numpy as np# 创建数组a = np.array([2,0,1,7])print(a)print(a[:3])print(a.min())a.sort()print(a)# 创建二维数据b = np.array([[1,2,3],[4,5,6]])print(b)print(b*b)[root@kvm work]# python numpy_test.py [2 0 1 7][2 0 1]0[0 1 2 7][[1 2 3] [4 5 6]][[ 1  4  9] [16 25 36]]
简单使用

 2、Scipy

  安装:pip install Scipy

# coding : utf-8# 求解非线性方程组2x1 - x2^2 = 1, x1^2 - x2 = 2# 导入求解方程组的函数from scipy.optimize import fsolve# 定义求解方程组def f(x):    x1 = x[0]    x2 = x[1]    return [2*x1 - x2**2 - 1, x1**2 - x2 - 2]# 输入初值[1 ,1]并求解result = fsolve(f, [1, 1])print(result)# 数值积分#导入积分函数from scipy import integrate# 定义被积函数def g(x):    return (1 - x**2)**0.5pi_2, err = integrate.quad(g, -1, 1) #积分结果和误差print(pi_2 * 2) #由微积分知识知道结果为圆周率pi的一半
简单使用

 3、Matplotlib

  安装:pip install matplotlib

# coding: utf-8import numpy as npimport matplotlib.pyplot as pltx = np.linspace(0, 10 ,1000) #作图的变量自变量y = np.sin(x) + 1 #因变量yz = np.cos(x ** 2) + 1 #因变量z# 设置图像大小plt.figure(figsize=(8, 4))# 作图,设置标签、线条颜色、线条大小plt.plot(x, y, label='$\sin x+1$', color='red', linewidth=2)# 作图,设置标签、线条类型plt.plot(x, z, 'b--', label='$\cos x^2+1$')plt.xlabel('Time(s)') #设置x轴名称plt.ylabel('Volt') #y轴名称plt.title('A Simple Example') #标题plt.ylim(0, 2.2) #显示的y轴范围plt.legend() #显示图例plt.show() #显示作图结果
简单使用

  作图结果:

  

 4、Pandas

  安装:pip install pandas

# coding: utf-8import pandas as pds = pd.Series([1, 2, 3], index=['a', 'b', 'c']) #创建一个序列sd = pd.DataFrame([[1,2,3],[4,5,6]], columns=['a', 'b', 'c']) #创建一个表d2 = pd.DataFrame(s) #也可以用已有的序列创建一个表d.head() #预览前5行数据d.describe() #数据基本统计量print(d)print(d2)# 读取文件,注意文件的存储路径不能带有中文,否则读取可能出错pd.read_excel('data.xlsx') # 读取Excel文件,创建DataFramepd.read_csv('company_name.csv', encoding='gbk') #读取文本格式的数据
简单使用

 5、StatsModels

  安装:pip install statsmodels

# coding: utf-8# 导入ADF校验from statsmodels.tsa.stattools import adfuller as ADFimport numpy as np# 返回的结果有ADF值、p值等print(ADF(np.random.rand(100)))
简单使用

 5、Scikit-Learn

  安装:pip install scikit-learn

# coding: utf-8# 导入线性回归模型from sklearn.linear_model import LinearRegression# 建立线性回归模型model = LinearRegression()print(model)# 导入数据集from sklearn import datasets# 加载数据集iris = datasets.load_iris()# 查看数据集大小print(iris.data.shape)# 导入SVM模型from sklearn import svm# 建立线性SVM分类器clf = svm.LinearSVC()# 用数据训练模型clf.fit(iris.data, iris.target)# 训练完成模型之后输入新的数据进行预测clf.predict([[ 5.0, 3.6, 1.3, 0.25 ]])#查看训练好模型的参数print(clf.coef_)
简单使用

 

转载于:https://www.cnblogs.com/dukuan/p/7787346.html

你可能感兴趣的文章
OpenSSL 1.0.1 TLS/DTLS heartbeat information disclosure漏洞 测试
查看>>
软工课评价
查看>>
UIDeviceOrientationDidChangeNotification和UIApplicationDidChangeStatusBarFrameNotification
查看>>
Test is dead
查看>>
SPEC CPU2006的安装和使用
查看>>
webRTC脱坑笔记(二)— webRTC API之MediaStream(getUserMedia)
查看>>
Factory Design Pattern
查看>>
WinForm下窗体标题栏上有“帮助”按钮
查看>>
Spring Boot中自动执行sql脚本
查看>>
Mysql与python交互
查看>>
python中贪婪与非贪婪
查看>>
GMA Round 1 双曲线与面积
查看>>
guava API整理
查看>>
Python股票分析系列——基础股票数据操作(一).p3
查看>>
Kafka Ecosystem(Kafka生态)
查看>>
2019年7月3日星期三(开发环境)
查看>>
关于AspNetPager的用法(用于个人学习笔记)
查看>>
网页开发时的注意事项(关于编码问题)
查看>>
css(2)
查看>>
浅谈vue的生命周期
查看>>