E) x. R; K5 I# J! h: Y. [# i
如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
- V4 G, ^% L1 }/ v [6 h0 m
1. 字段信息统计
& m- ~: p) [. L
在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
- g }# e# [# p8 k d0 c* b- ~# Q
! m+ \- s# V; l$ |* V1 ^4 i
4 ]6 p( `( @6 X3 I 打开凤凰新闻,查看更多高清图片
+ o: d. J$ q" k2 _# B& L! b! o
3 f$ u9 K) ^4 _
& v4 P. g/ g+ E! n 2. 筛选生成新表
& }+ c9 G0 j3 Q. J, j# m
对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
. J7 U' s5 _+ U# i9 O" _2 r 
% [+ D4 G* E y
同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
O) A1 l( u0 \& a8 u( z' t 
3 T8 T& a% {$ X/ R; W 3. 生成关联数据
/ D7 d2 Z; k6 {. k4 K 选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
2 ~6 V4 P0 n/ d7 b x) z; | 1. 选择表做关联关系
2 p+ o* d* @! ?" m2 U 
9 @6 B8 N! j7 ^ 2. 设置关联关系类型及关联字段
3 P) [- ^7 B7 B7 ]

1 R% |9 `7 D0 t+ I$ u
3. 选择最终生成关联新表数据需要的字段
4 Y: O; T2 i3 {. U6 E% O6 i+ `0 W 
& l" R+ Q1 Y/ y5 J3 r1 \5 [% z 4. 主题表数据追加覆盖
: X: J, }) O/ R- E4 f# h
可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
7 l9 g3 @; p; M$ I' W8 c 1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
0 H& f+ y8 D* y, O' P, Q: J4 E 
8 ? L: X. ^3 i' k b
2. 选择文件数据源中的文件,点击追加或覆盖
' v. R# C M, N4 G8 h) v5 Y

5 ?2 l5 [" P9 N8 b: I/ t* f$ _& R 3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
7 @8 N {3 R: y 
( O. y3 Z5 v1 @0 b* _; J 4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
8 y+ m: ~6 ^& R! {2 g 
- |. i; j. }8 K) g* E, l3 n0 z 5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
) A* i% ^5 }* I 
8 a/ k2 K2 t7 s5 s
也可针对某一个字段自行选择设置字段对应关系
( }3 h, Q) Q9 b 
9 ^% h& j6 K! d) T$ R3 O5 g 设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
: n1 z+ V4 w2 B- f$ |* a