零、导入库

1
2
3
4
5
6
import pandas as pd
import numpy as np

# 读取数据
data = pd.read_excel('111.xlsx')
data.head()

一、重复查看

1
2
# 查看重复数据
data[data.duplicated()]

二、重复值删除

1
2
3
4
5
6
7
8
9
10
# 删除方法一
data[data['名称'] == '氮化镓器件性能'] # 查看这个条目的重复数据

# 保留出现的第一个
data1 = data.drop_duplicates(keep = 'first')
# 保留出现的最后一个
data2 = data.drop_duplicates(keep = 'last')

# 删除方法二
data.drop_duplicates(keep = 'last',subset = '名称') # 以某一列为标准删除重复值