Python数据分析及可视化实例之Numpy

系列文章总目录:python数据分析及可视化实例目录
本节及下一节scipy是数据分析绕不过去的基础,
虽说pandas大体上可以完成绝大多数清洗工作,
但还是有必要做个简单的介绍:
学习源码:
# coding: utf-8# # numpy基本概念# in[1]:from numpy import *# ## 数组操作# in[2]:a = [1, 2, 3, 4]a = array(a)a + 1# in[3]:b = array([2, 3, 4, 5])a + b# in[4]:a * b# in[5]:a ** b# ## 数组属性# in[6]:type(a)a.dtype# in[7]:# 1维数组,返回一个元组a.shape# in[8]:a.size #查看元素数目# in[9]:a.nbytes #查看所有元素所占的存储空间# in[10]:a.ndim # 查看数组维数# ## 索引与切片# in[11]:a = array([0, 1, 2, 3])a[0]# in[12]:a[0] = 10a# in[13]:a = array([[ 0, 1, 2, 3], [10,11,12,13]])a# in[14]:a[1, 3] # 行列式# in[15]:a = array([[ 0, 1, 2, 3, 4, 5], [10,11,12,13,14,15], [20,21,22,23,24,25], [30,31,32,33,34,35], [40,41,42,43,44,45], [50,51,52,53,54,55]])a# in[16]:a[0, 3:5]# in[17]:a[4:, 4:]# in[19]:a[:, 2] # 取某一列,以后在pandas更容易# ## 指定数组类型# in[25]:a = array([1.5, -3], dtype=float32)# in[26]:a.dtype# in[27]:asarray(a, dtype=float64)a.dtype# in[28]:a.astype(float64)a.dtype# # 数组方法# ## 求和# in[29]:a = array([[1,2,3], [4,5,6]])sum(a)# in[30]:sum(a, axis=0) # 列求和# in[31]:sum(a, axis=-1) # 行求和# ## 求最大最小值均值等统计参数# in[32]:from numpy.random import randa = rand(3, 4)get_ipython().magic('precision 3')a# in[33]:a.min()# in[34]:a.min(axis=0)# in[35]:a.mean()# in[36]:a.mean(axis=1)# in[38]:# 标准差a.std(axis=1)# in[39]:# 方差a.var(axis=1)# in[40]:a = array([1.35, 2.5, 1.5])a.round() # 取整# in[41]:a.round(decimals=1) # 保留一位小数# # 关于numpy其他高级操作自行学习
胶水语言博大精深,
本主只得一二为新人带路。