美文网首页机器学习之路
2.Python机器学习pandas,numpy,matplot

2.Python机器学习pandas,numpy,matplot

作者: AlwaysInCoding | 来源:发表于2019-10-28 14:00 被阅读0次

1,Pandas

pandas中最重要的概念就是dataframe, 可用于矩阵计算

--pd.read_csv() :CSV 文件读入DataFrame

----sep :分隔符

----ignore_index : 序列行


pd.concat([pd.read_csv(fn, sep='\u0001')for fn in latest_lst], ignore_index=True)


--dataframe.to_csv() : DataFrame 写入 CSV 文件

----csv_buffer


with BytesIO() as csv_buffer:

with gzip.GzipFile(mode='wb', fileobj=csv_buffer)as gz_file:

dataframe.to_csv(TextIOWrapper(gz_file, 'utf-8'), **kwargs)

data = csv_buffer.getvalue()


--dataframe.dropna(subset=['RoomType'], inplace=True) :丢弃空行,inplace,直接改变原dataframe

--bcom_data = bcom_data.query('RoomID != "0"'):筛选符合条件的行

--expe_data = expe_data[['EID', 'Site', 'RoomID', 'RoomType']]:获取原dataframe中特定列,双[ ]

--column_names_bcom = ['BookingID', 'Site', 'RoomID']

--bcom_data.columns = column_names_bcom :重命名列名

--bcom_data = pd.merge(bcom_data, bcom_smoking, how='left', left_on='BookingID', right_on='BookingID') :dataframe合并

--bcom_data['RoomSmoking'] = bcom_data['RoomSmoking'].apply(utils.transform) :对每column应用变换,支持lambda表达式

--my_data['CombinedView'] = my_data.apply(lambda row: ViewList(row['View'], row['ViewFromAmenities']), axis=1)

--del bcom_data : 清除变量

--bcom_data.copy() :复制一个

--关于axis=1和axis=0的问题,如下图:

2, Numpy科学计算库

numpy.genfromtxt() : 从文本文件加载数据,并按指定的方式处理缺少的值

--delimiter: 用于分隔值的字符串。可以是str, int, or sequence。默认为任何连续的空格

--numpy.array: 创建一个向量或矩阵(多维数组) 

   ---np.array([[4, 3, 5], [1, 2, 1]])

相关文章

网友评论

    本文标题:2.Python机器学习pandas,numpy,matplot

    本文链接:https://www.haomeiwen.com/subject/htcbvctx.html