请对该数据集的字段absence进行二值化处理,超过8次的记为1,不超过8次的记为0,将处理后的结果存为该数据集的新列new_absence
提示:可以使用sklearn.preprocessing中的Binarizer函数实现上述功能
import pandas as pd
data = pd.read_csv('newdata.csv')
print(data[['absences']].head())
# 二值化转换
from sklearn import preprocessing
binarizer = preprocessing.Binarizer(threshold=8)
data['new_absences'] = binarizer.transform(data[['absences']])
print(data[['new_absences']].head())