用python字典统计CSV数据

来源：cnblogs　　作者：TechSynapse　　时间：2024/5/29 9:10:07　　对本文有异议

1.用python字典统计CSV数据的步骤和代码示例

为了使用Python字典来统计CSV数据，我们可以使用内置的csv模块来读取CSV文件，并使用字典来存储统计信息。以下是一个详细的步骤和完整的代码示例：

1.1步骤

（1）导入csv模块。

（2）打开CSV文件并读取数据。

（3）初始化一个空字典来存储统计信息。

（4）遍历CSV文件的每一行数据。

（5）对于每一行数据，根据需要选择一列或多列作为键（key），并统计其出现次数（或执行其他类型的统计）。

（6）将统计结果存储在字典中。

（7）关闭CSV文件。

（8）（可选）输出或处理统计结果。

1.2代码示例

假设我们有一个CSV文件data.csv，内容如下：

Name,Age,Gender  
Alice,25,Female  
Bob,30,Male  
Charlie,25,Male  
Alice,26,Female

我们想统计每个年龄（Age）的人数。

import csv  
  
# 初始化一个空字典来存储统计信息  
age_counts = {}  
  
# 打开CSV文件并读取数据  
with open('data.csv', mode='r', encoding='utf-8') as csv_file:  
    csv_reader = csv.DictReader(csv_file)  
      
    # 跳过表头（如果有）  
    next(csv_reader, None)  # 消耗迭代器中的第一行（即表头）  
      
    # 遍历CSV文件的每一行数据  
    for row in csv_reader:  
        age = int(row['Age'])  # 假设年龄是整数，如果不是则需要相应处理  
          
        # 统计每个年龄的人数  
        if age in age_counts:  
            age_counts[age] += 1  
        else:  
            age_counts[age] = 1  
  
# 输出统计结果  
for age, count in age_counts.items():  
    print(f"Age {age}: {count} people")

运行上述代码，我们将得到以下输出：

Age 25: 2 people  
Age 26: 1 people  
Age 30: 1 people

这样，我们就使用Python字典成功地统计了CSV数据中的年龄信息。

2.详细的代码示例例子展示

我们展示几个不同的例子，这些例子展示了如何使用Python字典来统计CSV文件中的数据。

2.1统计每个名字的出现次数

假设我们有一个CSV文件names.csv，内容如下：

Name  
Alice  
Bob  
Charlie  
Alice  
Bob  
David

我们想要统计每个名字的出现次数。

import csv  
  
name_counts = {}  
  
with open('names.csv', mode='r', encoding='utf-8') as csv_file:  
    csv_reader = csv.reader(csv_file)  
    next(csv_reader, None)  # 跳过表头  
  
    for row in csv_reader:  
        name = row[0]  
        if name in name_counts:  
            name_counts[name] += 1  
        else:  
            name_counts[name] = 1  
  
# 输出统计结果  
for name, count in name_counts.items():  
    print(f"Name {name}: {count} occurrences")

2.2统计每个年龄段的用户数量

假设我们有一个CSV文件users.csv，内容如下：

Name,Age  
Alice,25  
Bob,32  
Charlie,18  
David,28  
Eve,19

我们想要统计18-24岁、25-30岁、31岁及以上每个年龄段的用户数量。

import csv  
  
age_groups = {  
    '18-24': 0,  
    '25-30': 0,  
    '31+': 0  
}  
  
with open('users.csv', mode='r', encoding='utf-8') as csv_file:  
    csv_reader = csv.DictReader(csv_file)  
    next(csv_reader, None)  # 跳过表头  
  
    for row in csv_reader:  
        age = int(row['Age'])  
        if 18 <= age <= 24:  
            age_groups['18-24'] += 1  
        elif 25 <= age <= 30:  
            age_groups['25-30'] += 1  
        else:  
            age_groups['31+'] += 1  
  
# 输出统计结果  
for age_group, count in age_groups.items():  
    print(f"Age group {age_group}: {count} users")

2.3统计每个性别在每个年龄段的用户数量

假设我们有一个CSV文件users_advanced.csv，内容如下：

Name,Age,Gender  
Alice,25,Female  
Bob,32,Male  
Charlie,18,Male  
David,28,Male  
Eve,19,Female

我们想要统计每个性别在每个年龄段（18-24岁、25-30岁、31岁及以上）的用户数量。

import csv  
  
age_gender_counts = {  
    '18-24': {'Male': 0, 'Female': 0},  
    '25-30': {'Male': 0, 'Female': 0},  
    '31+': {'Male': 0, 'Female': 0}  
}  
  
with open('users_advanced.csv', mode='r', encoding='utf-8') as csv_file:  
    csv_reader = csv.DictReader(csv_file)  
    next(csv_reader, None)  # 跳过表头  
  
    for row in csv_reader:  
        age = int(row['Age'])  
        gender = row['Gender']  
        if 18 <= age <= 24:  
            age_group = '18-24'  
        elif 25 <= age <= 30:  
            age_group = '25-30'  
        else:  
            age_group = '31+'  
        age_gender_counts[age_group][gender] += 1  
  
# 输出统计结果  
for age_group, gender_counts in age_gender_counts.items():  
    print(f"Age group {age_group}:")  
    for gender, count in gender_counts.items():  
        print(f"  {gender}: {count} users")  
    print()