数据仓库及BI工程师面试题集锦
前言
1、介绍一下项目经验、项目中的角色。
一、 数据库
1、 Oracle数据库,视图与表的区别?普通视图与物化视图的区别?物化视图的作用?
2、 Oracle数据库,有哪几类索引,分别有什么特点?
3、 Union与Union All的区别?
4、 对游标的理解?游标的分类?使用方法?
5、 如何查找和删除表中的重复数据?给出方法或SQL。
6、 不借助第三方工具,怎么查看SQL的执行计划?
7、 创建索引有哪些需要注意的要点?
8、 Oracle数据库中,有哪几种分区?各自特点是什么?作用是什么?分区索引的分类和作用?
9、 表T(a,b,c,d),要根据字段c排序后取第21—30条记录显示,请给出sql。
10、 备份如何分类?归档是什么含义?
11、 如果系统现在需要在一个很大的表上创建一个索引,需要考虑那些因素,如何做到尽量减小对应用的影响?
12、 是否有海量数据处理经验?有何方法?
二、 ETL工具
1、 Informatica中,Update组件叫什么?更新机制?
2、 Informatica中,LookUp组件有哪几类?区别是什么?
3、 Informatica中,如何调用存储过程?
4、 Informatica中,工作流控制有哪些组件?
5、 Informatica优化方案?
6、 DataStage的JOB有哪些类型?特点分别是什么?
7、 DataStage中,如何设置parallel job并行运行?
8、 DataStage中,Join Stage 与 Lookup Stage组件在使用上有何区别?
9、 DataStage的优化方案?
三、 模型设计
1、 有哪几种模型设计方法?特点分别是什么?
2、 模型设计的步骤?
3、 维度模型的设计方法?
4、 模型设计的思路?业务需求驱动?数据驱动?
3、模型设计经验说明。在概念模型设计、逻辑模型设计以及物理模型设计几个阶段主要的工作是什么?
四、 Cognos开发
1、 Cube刷新方案?
2、 报表数据权限控制方案?
3、 Cube增量刷新方案?
五、 Shell开发
1、 在Unix/Linux中,查看磁盘空间可以用哪些命令?
2、 在Unix/Linux中,压缩和解压缩文件可以用哪些命令?
3、 sed命令的作用?
4、 在Unix/Linux中,添加用户用什么命令?
5、在Unix/Linux中,查看文件行数什么命令?
六、 数据仓库设计
1、 增量数据获取方案?
2、 请解释以下概念:数据集市、事实表、维度表、OLAP
3、 元数据管理在数据仓库中的运用有何心得?
4、 数据仓库系统的数据质量如何保证?方案?
5、 数据仓库系统组件接口设计方案?
七、 项目管理
八、 其他
1、 能否出差?
2、 期望薪资待遇多少?
3、 个人发展方向?
数据仓库及BI工程师面试题集锦
前言
1、介绍一下项目经验、项目中的角色。
一、 数据库
1、 Oracle数据库,视图与表的区别?普通视图与物化视图的区别?物化视图的作用?
2、 Oracle数据库,有哪几类索引,分别有什么特点?
3、 Union与Union All的区别?
4、 对游标的理解?游标的分类?使用方法?
5、 如何查找和删除表中的重复数据?给出方法或SQL。
6、 不借助第三方工具,怎么查看SQL的执行计划?
7、 创建索引有哪些需要注意的要点?
8、 Oracle数据库中,有哪几种分区?各自特点是什么?作用是什么?分区索引的分类和作用?
9、 表T(a,b,c,d),要根据字段c排序后取第21—30条记录显示,请给出sql。
10、 备份如何分类?归档是什么含义?
11、 如果系统现在需要在一个很大的表上创建一个索引,需要考虑那些因素,如何做到尽量减小对应用的影响?
12、 是否有海量数据处理经验?有何方法?
二、 ETL工具
1、 Informatica中,Update组件叫什么?更新机制?
2、 Informatica中,LookUp组件有哪几类?区别是什么?
3、 Informatica中,如何调用存储过程?
4、 Informatica中,工作流控制有哪些组件?
5、 Informatica优化方案?
6、 DataStage的JOB有哪些类型?特点分别是什么?
7、 DataStage中,如何设置parallel job并行运行?
8、 DataStage中,Join Stage 与 Lookup Stage组件在使用上有何区别?
9、 DataStage的优化方案?
三、 模型设计
1、 有哪几种模型设计方法?特点分别是什么?
2、 模型设计的步骤?
3、 维度模型的设计方法?
4、 模型设计的思路?业务需求驱动?数据驱动?
3、模型设计经验说明。在概念模型设计、逻辑模型设计以及物理模型设计几个阶段主要的工作是什么?
四、 Cognos开发
1、 Cube刷新方案?
2、 报表数据权限控制方案?
3、 Cube增量刷新方案?
五、 Shell开发
1、 在Unix/Linux中,查看磁盘空间可以用哪些命令?
2、 在Unix/Linux中,压缩和解压缩文件可以用哪些命令?
3、 sed命令的作用?
4、 在Unix/Linux中,添加用户用什么命令?
5、在Unix/Linux中,查看文件行数什么命令?
六、 数据仓库设计
1、 增量数据获取方案?
2、 请解释以下概念:数据集市、事实表、维度表、OLAP
3、 元数据管理在数据仓库中的运用有何心得?
4、 数据仓库系统的数据质量如何保证?方案?
5、 数据仓库系统组件接口设计方案?
七、 项目管理
八、 其他
1、 能否出差?
2、 期望薪资待遇多少?
3、 个人发展方向?