临时处理一个Numpy的二进制文件,分析知道里面是dict类型,简单小记一下,如果Numpy和Python基础不熟悉可以看我之前写的文章
In [1]:
%%timeimport numpy as np
In [2]:
%%timeimport pandas as pd
In [3]:
%%timedf = pd.DataFrame(np.load("data.npy")) # 通过narry创建DataFrame
In [4]:
%%timedf.head(10) # 快速预览前10行
Out[4]:
In [5]:
%%time# 提取email列df[‘Email‘] = df[0].map(lambda x : dict(x)["email"])# 提取pwd列df[‘MD5‘] = df[0].map(lambda x : dict(x)["pwd"] )# 删除无用列del df[0]
In [6]:
%%timedf.size # 查看总共多少数据
Out[6]:
In [7]:
%%timedf.shape
Out[7]:
In [8]:
%%timedf.head(10)
Out[8]:
In [9]:
%%timedf.T.to_json("user.json") # 重新保存为Json(转置只是为了存储成我们常见的json格式)
临时处理小记:把Numpy的narray二进制文件转换成json文件
原文地址:https://www.cnblogs.com/dotnetcrazy/p/9403230.html