Python之pandas-profiling:pandas-profiling库的简介、安装、使用方法之详细攻略

Python之pandas-profiling:pandas-profiling库的简介、安装、使用方法之详细攻略

 

 

 

 

目录

pandas-profiling库的简介

pandas-profiling库的安装

pandas-profiling库的使用方法

1、基础用法


 

 

 

pandas-profiling库的简介

        从pandas数据路由生成配置文件报告。pandas df.describe()函数很棒,但对于严肃的探索性数据分析来说有点基础。pandas_profiling通过php .profile_report()扩展了pandas DataFrame,用于快速数据分析。对于每一列,以下统计数据-如果与列类型相关-在一个交互式HTML报告中显示:

  • 类型推断:检测数据流中的列类型。
  • 基本要素:类型、唯一值、缺失值
  • 分位数统计如最小值,Q1,中位数,Q3,最大值,范围,四分位数范围
  • 描述统计,如平均值,众数,标准差,总和,中位数绝对偏差,变异系数,峰度,偏度
  • 最常见的价值观
  • 柱状图
  • 高度相关变量的相关性突出,Spearman, Pearson和Kendall矩阵
  • 缺失值矩阵,计数,热图和缺失值的树状图
  • 学习文本数据的分类(大写,空格),脚本(拉丁语,西里尔字母)和块(ASCII)。
  • 文件和图像分析提取文件大小,创建日期和尺寸和扫描截短的图像或那些包含EXIF信息。

 

 

 

pandas-profiling库的安装

pip install pandas-profiling

 

 

 

pandas-profiling库的使用方法

1、基础用法

import numpy as np
import pandas as pd
from pandas_profiling import ProfileReport

df = pd.DataFrame(
    np.random.rand(100, 5),
    columns=["a", "b", "c", "d", "e"]
)

profile = ProfileReport(df, title="Pandas Profiling Report")
profile.to_file("your_report.html")


profile = ProfileReport(large_dataset, minimal=True)
profile.to_file("output.html")

profile = df.profile_report(title='Pandas Profiling Report', plot={'histogram': {'bins': 8}})
profile.to_file("output.html")

 

 

 

 

 

©️2020 CSDN 皮肤主题: 代码科技 设计师:Amelia_0503 返回首页
实付 29.90元
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值