6 W1 t4 C% m& }: S* T: W( P5 C
如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
" L" I: T- t6 ^" y7 m
1. 字段信息统计
/ L7 G C( ?' o" q( ~5 C' H# C, R
在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
0 b$ n2 I7 \- p7 S- `. j X
' I. L: L" M: _1 } N, ]3 C
: S" a& _) g1 j; T) w5 g& y( W, l* o 打开凤凰新闻,查看更多高清图片
$ A: N) _3 A6 F" D
7 f8 s5 b+ x8 s8 g" A
, ] u, R q: [4 \ 2. 筛选生成新表
2 o( R& Y9 V! ^0 D& R' r1 y
对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
' ?& h6 r# z$ F 
6 p6 y3 Q4 X# a( ]. B) F
同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
) O2 b- d+ j5 @! Q# J 
9 U2 I) q, a/ D, p+ Y) c
3. 生成关联数据
# @/ M$ Z \1 B5 M 选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
! m/ q4 |; T" u3 S8 W- }
1. 选择表做关联关系
9 ?* q+ e' t6 [$ G 
; ~6 h1 i: j4 u; S% Y 2. 设置关联关系类型及关联字段
. E: g& e1 Y }8 F$ \

, x7 P/ _2 n0 N$ j: W- o) ?
3. 选择最终生成关联新表数据需要的字段
( _# o+ f6 X# Q J/ u

N8 Q( v: g/ S/ I( T% E 4. 主题表数据追加覆盖
/ d( d6 C u: o" k0 u7 v 可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
9 }, `8 j- t$ ~' w7 ~0 U; E# V
1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
$ V3 a' P/ @# j+ N9 s 
- n+ n6 F" w$ A' ?! X
2. 选择文件数据源中的文件,点击追加或覆盖
3 v! s+ l( F" X/ r' z7 m4 ~7 O: N 
! v5 X" a2 S6 {6 ~+ g) G 3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
3 F: [' \- f1 A8 @& p7 N- m8 A1 j 
+ Y- q9 q. O. ^9 G; x: j- o) \
4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
1 s! N2 X7 K, F5 D 
P# {7 c; i( L: Q4 Q 5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
8 _6 g6 R8 _* Q+ C4 M& _! b5 P" v( w

' F% ^$ k- Y( o# }5 K0 a5 F
也可针对某一个字段自行选择设置字段对应关系
- `6 O+ Q' _4 q 
6 |* E% ]8 o7 ~# w; T+ v 设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
% z. f: [: f* \, `3 F2 H. F1 F