Datawash3

发表于2025-03-24|更新于2025-03-24|辉夜の编程之路

|字数总计:136|阅读时长:1分钟|阅读量:

零、导入库

import pandas as pd
import numpy as np

# 读取数据
data = pd.read_excel('111.xlsx')
data.head()

一、重复查看

1 2	# 查看重复数据 data[data.duplicated()]

二、重复值删除

# 删除方法一
data[data['名称'] == '氮化镓器件性能'] # 查看这个条目的重复数据

# 保留出现的第一个
data1 = data.drop_duplicates(keep = 'first')
# 保留出现的最后一个
data2 = data.drop_duplicates(keep = 'last')

# 删除方法二
data.drop_duplicates(keep = 'last',subset = '名称') # 以某一列为标准删除重复值

Datawash3

https://www.noctuna.cc/2025/03/24/Datawash3/

作者

Noctuna

发布于

2025-03-24

更新于

2025-03-24

许可协议

CC BY-NC-SA 4.0

Python 编程数据清洗