8 m! B& g& S+ f. Y' K8 U4 y
如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
9 t5 S# {2 r* W" T0 p
1. 字段信息统计
$ t9 X) `- J# G3 t
在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
3 J: ~# w* ~5 x) V" t
1 P8 R. i( ~9 L
& Z" z0 [& B! X6 D! M 打开凤凰新闻,查看更多高清图片
' m9 q9 A7 M+ P
; X' X8 \2 L/ ~: g& f$ s . k! C |% R5 e8 |) d' _
2. 筛选生成新表
( X8 f8 M8 O' y! s8 p
对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
$ `6 _/ O) P! V6 d% o- T6 m# b

2 T- R9 t& d7 |- C7 G, E j5 X
同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
4 V2 ] F+ a; d9 c% X' [

8 R6 K' g s1 {. d
3. 生成关联数据
* Q* B& ?" o% U# Q% s' ^6 \4 x" J 选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
: w& ^! O8 w2 h$ M" S
1. 选择表做关联关系
6 m( B; V/ m1 g2 A1 i" k6 _8 D- E 
/ t+ b9 b- D7 e4 r. S
2. 设置关联关系类型及关联字段
9 B; e1 ?& z& O 
! L8 T. G1 U# _5 F) y# I; b 3. 选择最终生成关联新表数据需要的字段
: W$ ~. g% c/ z 
# w4 C( H5 ]3 @) x% \" p; F3 j 4. 主题表数据追加覆盖
# ], L$ f' U) j; v0 F, z; e
可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
. }; ^$ X( E9 i2 M1 E, W# W5 ^ 1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
# R: X* p( p( G* e2 C! z# Y$ _ 
- H3 ~, f8 i- h# S* g# b: K6 P 2. 选择文件数据源中的文件,点击追加或覆盖
7 _2 J: Q+ U; z

( }( {7 A% S8 W4 z
3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
0 x& J1 [7 H7 p" z4 C% v 
! a6 v9 ~" w0 D2 t. b3 n0 ] 4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
9 O- r2 }, q+ M9 } 
2 U! I( I% i3 ] 5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
B! `- v4 ^& p

+ w, K0 z1 v0 d- }
也可针对某一个字段自行选择设置字段对应关系
# _3 H$ m+ q* z; \ T" w- p

4 G! X d/ l$ ^ 设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
$ m! v: @1 b. W! w( b4 j) \