经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 程序设计 » NumPy » 查看文章
numpy和pandas的基本用法
来源:cnblogs  作者:抱紧小洪  时间:2023/8/29 10:26:37  对本文有异议

安装numpy模块

  1. pip install numpy

可以通过导入numpy模块来使用它

  1. import numpy as np

1.创建数组:

  1. a = np.array([1, 2, 3, 4, 5]) # 从列表创建一维数组
  2. b = np.zeros((3, 3)) # 创建一个3x3的全零数组
  3. c = np.ones((2, 2)) # 创建一个2x2的全一数组
  4. d = np.arange(0, 10, 2) # 从0到10(不包括10),步长为2创建一维数组

2.数组操作:

  1. a.shape # 获取数组的形状
  2. a.ndim # 获取数组的维度
  3. a.size # 获取数组的元素个数
  4. a.dtype # 获取数组的数据类型
  5. a.reshape((2, 3)) # 改变数组的形状
  6. a.min() # 返回数组的最小值
  7. a.max() # 返回数组的最大值
  8. a.sum() # 返回数组的元素和

3.数组运算:

  1. a + b # 数组相加(对应元素相加)
  2. a - b # 数组相减(对应元素相减)
  3. a * b # 数组相乘(对应元素相乘)
  4. a / b # 数组相除(对应元素相除)
  5. np.dot(a, b) # 数组的矩阵乘法
  6. np.sin(a) # 对数组中的每个元素应用sin函数

安装pandas模块

  1. pip install pandas

可以通过导入pandas模块来使用它

  1. import pandas as pd

1.创建和读取数据:

  1. # 从CSV文件读取数据
  2. df = pd.read_csv('data.csv')
  3. # 从excel文件读取数据
  4. data = pandas.read_excel('1.xlsx')

2.数据处理和操作:

  1. # 查看数据头部和尾部
  2. df.head() # 默认显示前5行
  3. df.tail(10) # 显示后10行
  4. # 查看数据统计信息
  5. df.describe() # 显示数值列的统计信息
  6. df['column'].mean() # 计算某一列的平均值
  7. # 选择和过滤数据
  8. df['column'] # 选择某一列
  9. df[['column1', 'column2']] # 选择多列
  10. df[condition] # 根据条件选择行
  11. # 添加和删除数据
  12. df['new_column'] = values # 添加新列
  13. df.drop('column', axis=1, inplace=True) # 删除列
  14. # 数据排序和分组
  15. df.sort_values('column') # 按列值排序
  16. df.groupby('column').mean() # 按列分组并计算平均值
  17. # 处理缺失数据
  18. df.dropna() # 删除包含缺失值的行
  19. df.fillna(value) # 用指定值填充缺失值

3.数据可视化:

  1. df.plot() # 绘制折线图
  2. df.plot(kind='bar') # 绘制柱状图
  3. df.plot(kind='scatter', x='column1', y='column2') # 绘制散点图

小案例(读取excel中的数据进行分析)

  1. import numpy as np
  2. import pandas as pd
  3. df = pd.read_excel('1.xlsx', sheet_name='Sheet1')
  4. # 在read_excel()函数中,1.xlsx是Excel文件的路径,Sheet1是要读取的工作表的名称。可以根据需要更改这些参数。
  5. df.head() # 查看数据前几行
  6. df.shape # 查看数据形状(行数和列数)
  7. df.columns # 查看列名
  8. df['column'] # 选择某一列
  9. df.describe() # 查看数据的统计信息
  10. # 使用NumPy的array()函数将数据转换为NumPy数组(如果需要):
  11. data = np.array(df)

原文链接:https://www.cnblogs.com/XxMa/p/17664119.html

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号