/ i) J1 I$ l6 w/ D7 F
如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
& S! c) J8 d+ m
1. 字段信息统计
& o0 S6 {1 k6 b7 A- i; f
在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
# A, R) k* X) _/ y, Q
. r, c& M0 S) W6 A; f, v' f h+ @! u( w( o0 G$ q. g
打开凤凰新闻,查看更多高清图片
" G' v* ~( L, h9 u
}/ s g9 P* Q1 c
/ K2 \# B# D' w$ V$ l% }8 U 2. 筛选生成新表
8 w5 v0 x8 D& T. Z/ t* Y5 s ~
对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
1 S1 x9 a$ d2 f* f/ b3 I- }

. G P' J, u7 n G 同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
+ @5 `0 n( w( }5 H

+ v5 m7 R) Y7 s$ z. X! U2 v& g
3. 生成关联数据
. o4 ?. w# x$ n# F2 d 选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
`, a, T! Y& y, f' k8 d4 W' N 1. 选择表做关联关系
6 O6 v6 V' G, Q2 ~

5 s1 y) \3 |) F4 r, b7 `3 `
2. 设置关联关系类型及关联字段
! n7 Z8 l$ j! w$ S5 h3 Z 
6 Z* H$ p p6 J7 v: s) ?$ [ 3. 选择最终生成关联新表数据需要的字段
) u% ?" C( f& L; J; I# I

. I! F) U \) @1 R2 _ 4. 主题表数据追加覆盖
5 L3 r8 g* c1 e; p 可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
, R# d1 A" m: V1 \. }& @ 1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
: v1 w- M( b b" i+ G/ H/ o) h, ^# P

( V1 K' L z3 d0 t) @; P 2. 选择文件数据源中的文件,点击追加或覆盖
1 C. a3 v1 ~9 {% y# [, p, K ^ 
3 E# ~. n! D# ` Z- w7 { 3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
2 L% F) v1 w p: ^

4 H0 J A" z% K v; [: Z4 \) s
4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
; i9 R6 _9 G4 k7 U# j$ ?" T' u2 W 
6 h* ^ |) H' U! v 5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
) e* X" P9 A+ \4 N N ^3 Y 
( L" b5 i$ u6 s8 Z 也可针对某一个字段自行选择设置字段对应关系
# H; _7 Y" E# n) U! T4 b

, K# H( {; o- \) [
设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
0 l4 j! D9 ~/ b