文档视界 最新最全的文档下载
当前位置:文档视界 › 数据仓库架构师笔试题

数据仓库架构师笔试题

数据仓库架构师笔试题
数据仓库架构师笔试题

数据仓库架构师笔试题

1、请简述下什么缓慢变化维,以及通过设计怎样解决缓慢变化维的问题。

参考答案:这道题是数据仓库的基础知识题,能答对答全的基本可确定对方有一定的数据仓库开发和设计经验。

1)

2、请简述下数据仓库一般有哪两种设计模式,以及这两种设计模式的优缺点。

参考答案:这题属于简单的基础知识题。其解题思路如下:

1)能准确说出雪花模型和星型模型这两个模型的,算及格。

2)能描述出雪花模型和星形模型分别是怎样一种模型,比如星型模型是维度与事实表直接关联,不存在多层维度的结构,而雪花模型层了维度表保持三范

式或准三范式设计外其它与星形模型一样的,最好能用图例画出来的,得90

分。

3)能够说出雪花模型和星形模型的优缺点的,其中星形模型减少了关联,用空间换时间,性能更优,雪花模型结构更清晰,维护更方便,但性能差一些。

通常的数据仓库建设都是两者的混合模式存在。得满分。

3、请简述下自己做过的项目中用过那些实体,以及各实体间的关系,并将实体中的一些核

心属性列出来。

参考参考:这道题没有标准答案,根据各自项目的情况有不同答案,首先面试者必须将项目中的关键实体、实体属性,以及实体间的关系描述出来。另外可以通过对方的描述,了解对方在对所做项目的了解程度,在项目中承担的角色和作用,以及对方的语言沟通能力。

4、7、请简述下在实体关系是1对1,1对多,多对多的情况下,怎么去设计表来记录两

个实体之间的关系,可举例说明。

参考答案:本题算是一道相对简单的设计基础题,如果这题答不出来,基本确定没什么数据库设计经验,并且作为开发人员对数据库结构的了解也是很有限的。解题思路如下:1)1对1关系可以将其中一个表的主键带到另一个表中,以便于关联查询。

2)1对多关系只能将前者的主键带在后者的表中,不能反过来。比如学校和班级表,只能表学校的标识放在班级表中,而不能反过来。

3)多对多关系则必须在两者之间额外创建一张中间表(一般叫交叉表),这个答案才是最关键的答案,没答对这个,基本可以判定不及格。

5、请简述下数据库(以Oracle为例)有哪几种常见的Join方式,并简要描述各种Join

方式用在哪种场景下会比较适合?

6、请简要描述下数据库(以Oracle为例)有哪几种常见的索引,并说明每种索引的优缺

点。

7、假设现在有一个社保缴费清单表A(社保号,参保单位编号,缴费月份),缴费清单保

存个人历史所有参数记录。请用一个SQL(可使用伪代码)统计出每个参保人(以社保号标识一个人)在每段工作经历(以缴纳社保为准)的最早缴社保月份、最近缴社保月份,

以及缴纳月份数。

参考答案:这题是一道比较复杂的题,即考验了一个人的理解能力,也考验了实

际开发能力。具体解题思路和计分情况如下:

4)此题如果如果知道通过社保号、参保单位编号作为分析函数的分组键,然后取最大月份,最小月份,算30分。

5)如果能了解到一个人可能对某家公司有多次进出的情况。算及格。

6)如果能分清楚直接用在某家企业最大缴纳月份减去最小缴纳月份取月份数存在可能性错误的,可得80分。

7)如果能通过缴纳月份减去以社保号、参保单位作为分组,以缴纳月份排序生成的序号来作为每次工作经历的分组基数,再通过该分组基础取最大月份和

最小月份之差得出结果的,以满分计。如果能通过其它更复杂的思路得出结

果,可算90分。

8、假设现在有一张日志表(日志流水号,程序名,开始时间,结束时间,运行状态),目

前日志流水号是主键,程序名和运行状态这两个字段上建了普通索引,请用一个SQL 求出最近某个程序的最近成功运行时间。假设总共只有10个程序在运行,但每过3秒运行一次,使得运行的日志越来越大,那以上面的SQL性能是否已经出现问题?如果出现问题,请在不删除日志记录的情况下,怎么去优化这个过程。

参考答案:这首题算中等复杂难度。解决思路及计分情况如下:

1)能知道当前性能的瓶颈使用当前索引根本无法解决的,算及格。

2)能通过将日志表按天分区按小时子分区存储日志,然后尽量从最近分区向早期分区递进查询的,算80分。

3)能想出重新创建一张表,通过程序控制只保存最近成功日志,则可得满分。

软考系统架构设计师(高级)学习笔记汇总

2011年软考系统架构设计师学习笔记第一章 1.1.1 系统架构师的概念 现代信息系统“架构”三要素:构件、模式、规划;规划是架构的基石,也是这三个贡献中最重要的。 架构本质上存在两个层次:概念层,物理层。 1.2.1 系统架构师的定义 负责理解、管理并最终确认和评估非功能性系统需求,给出开发规范,搭建系统实现的核心架构,对整个软件架构、关键构建、接口进行总体设计并澄清关键技术细节。 主要着眼于系统的“技术实现”,同时还要考虑系统的“组织协调”。 要对所属的开发团队有足够的了解,能够评估该开发团队实现特定的功能需求目标和资源代价。 1.2.2 系统架构师技术素质 对软件工程标准规范有良好的把握。 1.2.3 系统架构师管理素质 系统架构师是一个高效工作团队的创建者,必须尽可能使所有团队成员的想法一致,为一个项目订制清晰的、强制性的、有元件的目标作为整个团队的动力; 必须提供特定的方法和模型作为理想的技术解决方案; 必须避免犹豫,必须具备及时解决技术问题的紧迫感和自信心。 1.2.4 系统架构师与其他团队角色的协调 系统分析师,需求分析,技术实现 系统架构师,系统设计,基于环境和资源的系统技术实现 项目管理师,资源组织,资源实现 由于职位角度出发产生冲突制约,不可能很好地给出开发规范,搭建系统实现的核心架构,并澄清技术细节,扫清主要难点。 所以把架构师定位在项目管理师与系统分析师之间,为团队规划清晰的目标。 对于大型企业或项目,如果一人承担多个角色,往往容易发生顾此失彼的现象。 1.3 系统架构师知识结构 需要从大量互相冲突的系统方法和工具中区分出哪些是有效的,那些是无效的。 1.4 从开发人员到架构师 总结自己的架构模式,深入行业总结规律。 几天的培训不太可能培养出合格的软件架构师,厂商的培训和认证,最终目的是培养自己的市场,培养

最新运维中心笔试题答案

数据库运维中心笔试题答案 一、单项选择 1、T-SQL语句是由哪一家公司设计出的:(A) A Microsoft B IBM C SUN 2、 SQL-Server 的数据库类型属于哪一类型:(A) A 关系型数据库 B 网络型数据库 C 层次型数据库 3、要启动SQL-Server 的服务器,在命令提示符下键入以下什么命令可以启动SQL-Server服务器:(B) A net send B net start mssqlerver C net help 4、输入和调试T-SQL语句的工具是:(B) A 企业管理器 B 查询分析器 C 服务器网络使用工具 D 联机丛书 5、创建数据库的关键字是: (B) A delete B Create C from D talbe 6、数据库的日志文件的扩展名是:(B) A mdf B ldf C ndf D log 7、创建表的主约束使用哪个关键字:(B) A check B primary C foreign D rull 8、datetime属于什么数据类型:(A) A 日期型 B 时间型 C 字符串型 D 整数型 9、下列数据类型中不能属于sql_variant 型的是:(C) A varchar B int C image D datetime 10、存储过程sp_bindrule的作用是什么:(A) A 绑定规则 B 查看表结构 C 绑定默认值 D 查看过程 11、insert 表示的含义:(A) A 添加 B 删除 C 查询 D 更改 12、SQL-Server 中外键约束关键字为:(C) A primary key B unique C foreign key D check 13、alter view 表示:(B) A 创建视图 B 更改视图 C 检索视图 D 删除视图

(完整word版)建设数据仓库的八个步骤

大数据技术部 建设数据仓库的八个步骤2017年04月25日编制

建设数据仓库的八个步骤 摘要: 建立数据仓库是一个解决企业问题的过程,业务人员往往不懂如何建立和使用数据仓库,发挥其决策支持的作用;信息部门的人员往往又不懂业务,不知道应该建立哪些决策主题。 关键词:数据仓库元数据 建设数据仓库 建立数据仓库是一个解决企业问题的过程,业务人员往往不懂如何建立和使用数据仓库,发挥其决策支持的作用;信息部门的人员往往又不懂业务,不知道应该建立哪些决策主题,从数据源中抽取哪些数据。因此数据仓库的项目小组应该由业务人员和信息部门的人员共同组成,双方需要相互沟通,协作开发数据仓库。 开发数据仓库的过程包括以下几个步骤。 1.系统分析,确定主题 建立数据仓库的第一个步骤就是通过与业务部门的充分交流,了解建立数据仓库所要解决的问题的真正含义,确定各个主题下的查询分析要求。 业务人员往往会罗列出很多想解决的问题,信息部门的人员应该对这些问题进行分类汇总,确定数据仓库所实现的业务功能。一旦确定问题以后,信息部门的人员还需要确定一下几个因素: ·操作出现的频率,即业务部门每隔多长时间做一次查询分析。 ·在系统中需要保存多久的数据,是一年、两年还是五年、十年。 ·用户查询数据的主要方式,如在时间维度上是按照自然年,还是财政年。 ·用户所能接受的响应时间是多长、是几秒钟,还是几小时。

由于双方在理解上的差异,确定问题和了解问题可能是一个需要多次往复的过程,信息部门的人员可能需要做一些原型演示给业务部门的人员看,以最终确定系统将要实现的功能确实是业务部门所需要的。 2.选择满足数据仓库系统要求的软件平台 在数据仓库所要解决的问题确定后,第二个步骤就是选择合适的软件平台,包括数据库、建模工具、分析工具等。这里有许多因素要考虑,如系统对数据量、响应时间、分析功能的要求等,以下是一些公认的选择标准: ·厂商的背景和支持能力,能否提供全方位的技术支持和咨询服务。 ·数据库对大数据量(TB级)的支持能力。 ·数据库是否支持并行操作。 ·能否提供数据仓库的建模工具,是否支持对元数据的管理。 ·能否提供支持大数据量的数据加载、转换、传输工具(ETT)。 ·能否提供完整的决策支持工具集,满足数据仓库中各类用户的需要。 3.建立数据仓库的逻辑模型 具体步骤如下: (1)确定建立数据仓库逻辑模型的基本方法。 (2)基于主题视图,把主题视图中的数据定义转到逻辑数据模型中。 (3)识别主题之间的关系。

2012下半年系统架构设计师下午试题Ⅱ分析与解答

2012年下半年系统架构设计师下午试题Ⅱ分析与解答 (总分75, 考试时间120分钟) 试题一论基于架构的软件设计方法及应用 基于架构的软件设计(Architecture-Based Software Design,ABSD)方法以构成软件架构的商业、质量和功能需求等要素来驱动整个软件开发过程。ABSD是一个自顶向下,递归细化的软件开发方法,它以软件系统功能的分解为基础,通过选择架构风格实现质量和商业需求,并强调在架构设计过程中使用软件架构模板。采用ABSD方法,设计活动可以从项目总体功能框架明确后就开始,因此该方法特别适用于开发一些不能预先决定所有需求的软件系统,如软件产品线系统或长生命周期系统等,也可为需求不能在短时间内明确的软件项目提供指导。 请围绕“基于架构的软件开发方法及应用”论题,依次从以下三个方面进行论述。 1.概要叙述你参与开发的、采用ABSD方法的软件项目以及你在其中所承担的主要工作。 2.结合项目实际,详细说明采用ABSD方法进行软件开发时,需要经历哪些开发阶段?每个阶段包括哪些主要活动? 3.阐述你在软件开发的过程中都遇到了哪些实际问题及解决方法。 试题一写作要点 一、论文中要具体介绍项目的背景与总体需求、系统所采用的技术路线以及你所承担的实际工作。 二、采用ABSD方法进行软件开发时,需要经历架构需求、架构设计、架构文档化、架构复审、架构实现和架构演化六个阶段。 1.架构需求阶段需要明确用户对目标软件系统在功能、行为、性能、设计约束等方面的期望。其主要活动包括需求获取、标识构件和架构评审。 (1)需求获取活动需要定义开发人员必须实现的软件功能,使得用户能够完成他们的任务,从而满足功能需求。与此同时,还要获得软件质量属性,满足一些非功能性需求。 (2)标识构件活动首先需要获得系统的基本结构,然后对基本结构进行分组,最后将基本结构进行打包成构件。 (3)架构需求评审活动组织一个由系统涉众(用户、系统分析师、架构师、设计实现人员等)组成的小组,对架构需求及相关构件进行审查。审查的主要内容包括所获取的需求是否真实反映了用户需求,构件合并是否合理等。 2.架构设计阶段是一个迭代过程,利用架构需求生成并调整架构决策。主要活动包括提出架构模型、将己标识的构件映射到架构中、分析构件之间的相互作用、产生系统架构和架构设计评审。 3.架构文档化的主要活动是对架构设计进行分析与整理,生成架构规格说明书和测试架构需求的质量设计说明书。 4.在一个主版本的软件架构分析之后,需要安排一次由外部人员(客户代表和领域专家)参加的架构复审。架构复审需要评价架构是否能够满足需求,质量属性需求是否

2017年系统架构师考试综合版

2017年系统架构师考试科目一:综合知识 1.某计算机系统采用5级流水线结构执行指令,设每条指令的执行由取指令(2?t )、分析指令(1?t )、取操作数(3?t )、运算(1?t )和写回结果(2?t )组成,并分别用5个子部完成,该流水 线的最大吞吐率为();若连续向流水线输入10条指令,则该流水线的加速比为()。(1)A.Δt 91B.Δt 31C.Δt 21D.Δt 11 (2)A.1:10 B.2:1 C.5:2 D.3:1 【解析】 理论流水线执行时间=(2t ?+1t ?+3t ?+1t ?+2t ?)+max(2t ?,1t ?,3t ?,1t ?,2t ?)*(n-1) =9t ?+(n-1)*3t ?; 第一问: 最大吞吐率:Δt 31Δt 6t nΔ3n Δt 31)(n-Δt+9n n =+=?∞→lim 第二问: 10条指令使用流水线的执行时间=9t ?+(10-1)*3t ?=36t ?。 10条指令不用流水线的执行时间=9t ?*10=90t ?。 加速比=使用流水线的执行时间/不使用流水线的执行时间=90t ?/36t ?=5:2。 【答案】:B 、C 。 2.DMA (直接存储器访问)工作方式是在()之间建立起直接的数据通路。 A.CPU 与外设 B.CPU 与主存 C.主存与外设 D.外设与外设 【解析】 直接主存存取(Direct Memory Access ,DMA )是指数据在主存与I/O 设备间的直接成块传送, 即在主存与I/O 设备间传送数据块的过程中,不需要CPU 作任何干涉,只需在过程开始启动(即向设备发出“传送一块数据”的命令)与过程结束(CPU 通过轮询或中断得知过程是否结束和下次操作是否准备就绪)时由CPU 进行处理,实际操作由DMA 硬件直接完成,CPU 在传送过程中可做其它事情。 【答案】:C 。 3.RISC(精简指令系统计算机)的特点不包括:()。 A.指令长度固定,指令种类尽量少 B.寻址方式尽量丰富,指令功能尽可能强 C.增加寄存器数目,以减少访存次数 D.用硬布线电路实现指令解码,以尽快完成指令译码 【解析】RISC 与CISC 的对比表所示: 指令系统类型指令寻址方式 实现方式其他CISC (复杂)数量多,使用频率差别大,可变长格式 支持多种 微程序控制技术研制周期长RISC (精简)数量少,使用频率接近,支持方式少增加了通优化编译,

bi etl 数据仓库面试培训题

面试培训题 1.BI(business intelligence)模型有哪些? 答:星星模型和雪花模型, 雪花模型一般不用,星星模型就是一个事实表和多个维表相关联。 2.维度建模的数据仓库中,有一个概念叫Slowly Changing Dimensions,中文一般翻译成“缓慢变化维”,经常被简写为SCD。 缓慢变化维的提出是因为在现实世界中,维度的属性并不是静态的,它会随着时间的流失发生缓慢的变化。这种随时间发生变化的维度我们一般称之为缓慢变化维,并且把处理维度表的历史变化信息的问题称为处理缓慢变化维的问题,有时也简称为处理SCD的问题。 例如:员工维表,这个员工在某段时间在这个部门,然后过段时间换了部门换了工作地,需要多行数据来记录这种变化,人员的属性是变化的,就叫缓慢变化维。 3oracle的存储单位是什么?结构是什么样的?有什么组成? 物理存储结构:多种物理文件,如数据文件,日志文件,参数文件,控制文件 逻辑存储结构:表空间,段,区,数据块组成 4工作中用到哪些ETL软件? E-extract 抽取T-transform 转换L-load 加载 IBM公司的datastage(DS) 5实例=内存+进程 Instance:SGA,PGA SGA:shared pool(library cache,dictionary data cache ),database buffer cache ,redo log buffer, BWN:数据文件CKPT:控制文件LGWR:在线日志

六.对SQL优化的认识? QL三段分拆法,SQL可以分为3段 1.SELECT 部分,重点关注SELECT 部分有没有标量子查询,有没有自定义函数 2.FROM 后面,重点关注有没有内联视图,有没有视图套视图,看有没有进行视图合并、谓词推入 3.WHERE 条件部分,看有没有IN,NOT IN,EXISTS,NOT EXISTS 子查询,将in/exist都改成WITH AS 最好有没有外连接,有没有在列上面有函数导致不能走索引,减少表关联,看表设计是1:1还是1:N的关系 4看统计信息是否过期,过期的进行收集 5关注大表,大表才有新问题,是否是小表当驱动表,大表当被驱动表 6看执行计划是hash还是nl(嵌套循环)用hint来改变执行计划 (nl和hash就是两种执行计划,就是说你选择的是哪种路径,坐公交还是地铁,让sql跑的块,到达目的地。sql查出来的数据是不会变的,对应目的地是不会变的。公交方式有多种,对应执行计划有多种)

2014年系统架构设计师真题及答案

2014年下半年系统架构设计师考试上午真题(标准 参考答案) 卷面总分:75.0 分 答题时间:150 分钟 测试次数:1475 次 平均得分:54.8 分 是否需要批改:否 单项选择题 每题的四个选项中只有一个答案是正确的,请将正确的选项选择出来。 1 某计算机系统中有一个CPU、一台输入设备和一台输出设备,假设系统中有四个作业T1、T2、T3和T4,系统采用优先级调度,且T1的优先级>T2的优先级>T3 的优先级>T4的优先级。每个作业具有三个程序段:输入I i 、计算C i 和输出 P i (i=1,2,3,4),其执行顺序为I i →C i →P i 。这四个作业各程序段并发执行的前驱 图如下所示。图中①、②、③分别为(),④、⑤、⑥分别为()。 A.I 2、C 2 、C 4 B.I 2、I 3 、C 2 C.C 2、P 3 、C 4 D.C 2、P 3 、P 4 A.C 2、C 4 、P 4 B.I 2、I 3 、C 4 C.I 3、P 3 、P 4 D.C 4、P 3 、P 4 [选择问题 1 的答案] ?A ?B ?C ?D [选择问题 2 的答案] ?A ?B

?C ?D ? ? 2 某文件系统文件存储采用文件索引节点法。假设磁盘索引块和磁盘数据块大小均为1KB,每个文件的索引节点中有8个地址项iaddr[0]~iaddr[7],每个地址项大小为4字节,其中iaddr[0]~iaddr[5]为直接地址索引,iaddr[6]是一级间接地址索引,iaddr[7]是二级间接地址索引。如果要访问icwutil.dll文件的逻辑块号分别为0、260和518,则系统应分别采用()。该文件系统可表示的单个文件最大长度是()KB。 A.直接地址索引、一级间接地址索引和二级间接地址索引 B.直接地址索引、二级间接地址索引和二级间接地址索引 C.一级间接地址索引、一级间接地址索引和二级间接地址索引 D.一级间接地址索引、二级间接地址索引和二级间接地址索引 A.518 B.1030 C.16514 D.65798 [选择问题 1 的答案] ?A ?B ?C ?D [选择问题 2 的答案] ?A ?B ?C ?D ? ? 3 设关系模式R(U,F),其中u为属性集,F是U上的一组函数依赖,那么函数依赖的公理系统(Armstrong公理系统)中的合并规则是指()为F所蕴涵。 A.若A→B,B→C,则A→C B.若,则X→Y

数据仓库面试题

数据仓库及BI工程师面试题集锦 前言 1、介绍一下项目经验、项目中的角色。 一、数据库 1、Oracle数据库,视图与表的区别?普通视图与物化视图的区别?物化视图的作 用? i.视图与表的区别 1. 1、视图是已经编译好的sql语句。而表不是 2. 视图没有实际的物理记录。而表有。 3. 表是内容,视图是窗口 4. 表只用物理空间而视图不占用物理空间,视图只是逻辑概念的存在, 表可以及时四对它进行修改,但视图只能有创建的语句来修改ii. 物化视图与视图区别 1.物化视图和视图差别非常大,不是几句能说清物化视图是自动刷新或者 手动刷新的,视图不用刷新物化视图也可以直接update,但是不影响b ase table,对视图的update反映到base table上物化视图主要用于 远程数据访问,物化视图中的数据需要占用磁盘空间,视图中不保存数据。 2、Oracle数据库,有哪几类索引,分别有什么特点? a) 1.单列索引与复合索引 一个索引可以由一个或多个列组成,用来创建索引的列被称为“索引列”。 单列索引是基于单列所创建的索引,复合索引是基于两列或者多列所创建的索引。 2.唯一索引与非唯一索引 唯一索引是索引列值不能重复的索引,非唯一索引是索引列可以重复的索引。

无论是唯一索引还是非唯一索引,索引列都允许取NULL值。默认情况下,Oracle 创建的索引是不唯一索引。 3.B树索引 B树索引是按B树算法组织并存放索引数据的,所以B树索引主要依赖其组织并存放索引数据的算法来实现快速检索功能。 4.位图索引 位图索引在多列查询时,可以对两个列上的位图进行AND和OR操作,达到更好的查询效果。 5.函数索引 Oracle中不仅能够直接对表中的列创建索引,还可以对包含列的函数或表达式创建索引,这种索引称为“位图索引”。 3、Union与Union All的区别? a)Union会对查询结果进行排序去重,效率比union all 低,union all只是两个查 询集的合并操作。建议使用Union all,查询出来后再对数据进行去重操作。 4、对游标的理解?游标的分类?使用方法? 游标是映射在结果集中一行数据的位置实体,有了游标,用户就可以访问结果集中的任何一条数据。游标分为静态游标和REF游标,静态游标分为显示游标和隐式游标,显示游标使用步骤是声明游标,打开游标,获取记录,关闭游标。所有的DML语句为隐式游标,可以从游标的属性获得sql语句的信息。REF游标是动态关联结果集的临时对象,使用步骤也是先要进行声明游标,然后打开游标,获取记录,关闭游标。 5、如何查找和删除表中的重复数据?给出方法或SQL。 查询表中重复数据。 Select * from people where id in (Select id from people group by id having count(id)>1); Delete from people where id in(select id from people group by id having count(id)>1) and rowid not in (select min(rowid) from people group by id hacing count(id)>1);

数据仓库实例

计算机
王莹

本例采用的是SQl Server2005所提供的商业智能服务和工 具,主要包括Analysis Services(分析服务), Integration Services(集成服务),Reporting Services(集成服务)和Bussiness Intelligence Developer Studio(BIDS)。

分析服务(Analysis Services) SQL Server 分析服务(SSAS)是一个用于分析数据仓库中数据的工 具,它包括了OLAP和数据挖掘工具。在SQL Server 2005数据库系统 中,Analysis Services工具以服务器的方式为用户提供管理多维数 据立方体的服务。Analysis Services可以把数据仓库中的数据组织 起来,经过预先的聚集运算,加入到多维立方体中(即建立立方 体),然后对复杂的分析型访问做出迅速的回答。

集成服务(Integration Services) SQL Server 集成服务(SSIS)被定位成一个能生成高性能数据集成解决 方案(包括数据仓库中数据的提取、转换和加载(ETL))的平台。其集 成的含义主要就是指把ETL集成在一起。SSIS通过一个统一的环境向用户 提供了数据转换服务(DTS)所能提供的所有功能,并且大大减少了用户 花在编写程序和脚本上的精力和时间。 SSIS的基本功能包括:
? ? ? ? ? ? 合并来自异类数据源中的数据 填充数据仓库和数据集市 整理数据和将数据标准化 精确和模糊的查找功能 将商业智能置入数据转换过程 使管理功能和数据加载自动化

2016系统架构师考试知识点总结

2016系统架构师考试知识点总结

1操作系统 操作系统是计算机系统中的核心系统软件,负责管理和控制计算机系统中硬件和软件资源,合理组织计算机工作流程和有效利用资源,在计算机与用户之间起接口的作用 1.1 操作系统的类型 操作系统的类型(依据使用环境和对作业的处理方式)分为批处理、分时、实时、网络和分布式等。 1、批处理:把作业分类,把一批作业编成一个作业执行序列。可分联机和脱机。特征为脱机使用计算机、成批处理和多道程序运行。 2、分时:采用分时技术,使多个用户同时以会话控制自己程序的运行,每个用户都认为拥有各自独立的、支持自己请求服务的系统。特征有交互性、多用户同时性和独立性。 3、实时:专用,系统与应用难分离。并不强调资源利用率,更关心及时性、可靠性和完整性。分实时过程控制和实时信息处理。特征有即时响应、高可靠性。 4、网络:按网络架构的各个协议标准制订,包括网络管理、通信、资源共享、系统安全和多种网络应用,实现协同工作和应用集成。特征有互操作性、协作处理。 5、分布式:要求一个统一的操作系统,实现系统操作的统一性,负责全系统的资源分配和调度,为用户提供统一的界面。 6、操作系统的5项基本功能,包括处理器管理、存储管理、设备管理、文件管理和作业管理。 1.2 操作系统的结构 结构分为无序、层次、面向对象、对称多处理和微内核。 1、无序:又称整体或模块结构。以大型表格和队列为中心,操作系统各个部分围绕着表格运行,整个系统是一个程序。模块结构相对独立,模块之间通过规定的接口相互调用。优点为缩短开发周期。缺点是模块之间调用关系复杂、相互依赖,使分析、移植和维护系统较易出错。 2、层次:操作系统分解成若干个单向依赖的层次,由多层正确性保证操作系统的可靠性。优点层次结构清晰,简化了接口设计,有利于系统功能的增加或删改,易于保证可靠性,便于维护和移植。 3、面向对象:基于面向对象程序设计的概念,采用了各种不同的对象技术。把对象最为系统中的最小单位,由对象、对象操作、对象保护组成的操作系统。优点适用于网络操作系统和分布式操作系统。 4、对称多处理:所有多处理运行且共享同一内存(内存储器、主存、实存)。优点适合共享存储器结构的多处理机系统。 5、微内核:把系统的公共部分抽象出来,形成一个底层核心,提供最基本的服务,其他功能以服务器形式建立在微内核之上。具有良好的模块化和结构化特征,模块之间和上下层之间通过消息来通信。 操作系统大多拥有两种工作状态:核心态和用户态。一般的应用程序工作在用户态,内核模块和最基本的操作系统核心工作在核心态。 微内核结构由一个简单的硬件抽象层和一组比较关键的原语(仅仅为建立系统必须的部分,包括线程管理、地址空间和进程间通信)或系统调用组成。 微内核的目标将系统服务的实现和系统的基本操作规则分离开来。

数据仓库团队面试题-答案

目录 1简答题 (1) 1.1SQL Server与Oracle、DB2三种数据库比较 (1) 1.2以下三种数据库语言都包含哪些细项 (2) 1.3UNION 和UNION ALL的区别 (2) 2实例题................................................................................................................... 错误!未定义书签。3逻辑推理题 (5) 答案............................................................................................................................... 错误!未定义书签。1简答题 1.1 SQL Server与Oracle、DB2三种数据库比较 SQL Server与Oracle、DB2三种数据库进行比较,有何区别?请从开放性,可伸缩性,并行性,安全性三个方面叙述。 答案: 开放性 SQL Server 只能在Windows 上运行,没有丝毫的开放性,操作系统的系统的稳定对数据库是十分重要的。Windows9X系列产品是偏重于桌面应用,NT server只适合中小型企业。而且Windows平台的可靠性,安全性和伸缩性是非常有限的。它不象Unix那样久经考验,尤其是在处理大数据量的关键业务时。 Oracle 能在所有主流平台上运行(包括 Windows)。完全支持所有的工业标准。采用完全开放策略。可以使客户选择最适合的解决方案。对开发商全力支持。 DBz 能在所有主流平台上运行(包括Windows)。最适于海量数据。DB2在企业级的应用最为广泛,在全球的500家最大的企业中,几乎85%以上用DB2数据库服务器,而国内到97年约占5%。 可伸缩性,并行性 SQL Server 并行实施和共存模型并不成熟。很难处理日益增多的用户数和数据卷。伸缩性有限。Oracle平行服务器通过使一组结点共享同一簇中的工作来扩展Window NT的能力,提供高可用性和高伸缩性的簇的解决方案。如果WindowsNT不能满足需要, 用户可以把数据库移到UNIX中。 DB2 DB2具有很好的并行性。DB2把数据库管理扩充到了并行的、多节点的环境。数据库分区是数据库的一部分,包含自己的数据、索引、配置文件、和事务日志。数据库分区有时被称为节点或数据库节点。

十大架构师谈服务器选型 ——证券行业篇

十大架构师谈服务器选型——证券行业篇 证券企业一般在全国范围内经营业务,网络庞大、结构复杂,典型业务模式有柜台交易、自助委托、电话委托、网上委托等。各证券营业部和总部通过网络将交易所、证券公司与交易者三方连接在一起,共同完成证券交易,并实现行情、交易、结算、办公等各环节的自动化。证券企业网络一般由四部分组成:总部网络、营业部网络、银证交易系统和网站系统。 证券集中业务体系解决方案 作为支撑业务运转的基础平台,证券公司总部、区域总部成为证券营业业务的处理核心,证券营业部、服务部、支持部等分支机构成为业务服务单位。 营业部、服务部等分支机构实现了各分支机构的基本工作职能,它侧重于本地IT系统建设,其通信服务功能模块只起到辅助作用。 利用集中式交易系统, 具有相当规模的证券公司将远距离控制多个分支机构和为远程 大户提供服务,相应业务范围和工作模式都会有很大改变,因此需要一个强有力的IT体系解决方案来支撑证券业务集中业务和其他相关增值业 证券集中系统解决方案 采用集中交易模式,券商总部就成为整个交易体系的核心,所有分支机构的交易请求等业务均由券商总部中心进行处理,各分支机构只保留行情服务系统、客户服务接入平台、通讯中间层等前端处理平台;这样有利于统一公司对外服务形象和服务品牌,符合数据仓库、CRM的建设发展趋势,还可以大大降低运营成本。实行集中交易后,总部的重要性显而易见,在使用集中式交易模式,在建设的同时建立至少一个灾难备份中心,起到数据备份和灾难恢复的重要作用。 采取集中交易模式后,整个网络体系结构由两个中心(数据中心和灾备中心)、分支机构等构成,所有分支机构直接接入总部中心。 证券集中交易解决方案 根据券商集中交易的规模(营业部数量、股民数量等),数据中心和灾备中心的主机和数据库系统选型:

ETL 面试资料

题目 1.ETL部分 1.什么是数据准备区?在数据准备区中允许使用的数据结构有哪些?各有什么优缺点? 答: 2.简述异构数据源中的数据抽取技术。 答: 3.数据质量检查的四大类是什么?为每类提供一种实现技术。 答: 4.简述数据仓库中的表的基本类型,以及为了保证引用完整性该以什么样的顺序对它们进行加载。答: 5.在ETL过程中四个基本的过程分别是什么? 答:

6.从ERP源系统中抽取数据最好的方法是什么? 答: 7.简述直接连接数据库和使用ODBC连接数据库进行通讯的优缺点。 答: 8.什么是代理键?简述代理键替换管道如何工作。 答: 9.什么叫缓慢维度变化?请分别阐述三大类维度处理方式。 答: 10.如何实现增量抽取,分别阐述各种增量抽取方式,并且比较各种方式的优劣,及你推荐的做法?答: 11.用过什么ETL工具,以及该工具简单讲述特点。 答:

12. ETL工具一般有哪些组成部分,其中数据流中常用的控件有? 答: 13.简述你在以前项目中的ETL架构思想。 答: 2.数据库部分 1. 比较truncate和delete 命令 答: 2. 视图与表有何区别? 答: 3.请说明ORACLE数据库中实例与数据库的关系,表空间和数据文件的关系。答:

4.ORACLE中varchar2,char两种数据类型有什么区别,如果库表某字段输入“ABC”后储存,该字段数据类型分别为varchar2(10),char(10)存储字节长度以及内容有何区别? 答: 5.找出"作者"库表中没有出现在"获奖名单"库表中的所有作者信息的SQL语句,(提示:使用NOT I N,NOT EXISTS,以及外部连接三种方法),并说明那种方法是不优化的。 出版社: 出版社代码 char(2),出版社名称 varchar2(32) 图书: 图书编号 char(8),图书名称 varchar2(128),出版社代码 char(2),作者代号char(4),图书简介 varchar2(128) 作者: 作者代号 char(4),作者名称 varchar2(10),性别 char(1),年龄 number(3),文学方向 var char2(64) 获奖名单: 获奖日期 date,获奖人员 char(4) 答: 6.有下列两表 Table1 Col1 INT Col2 CHAR (30) Table2 Col1 INT Col2 CHAR (30) 请问下列哪条语句会将table2的全部列插入到table1?() A. INSERT INTO table1(table2.col1,table2.col2) B. INSERT INTO table1SELECT col1, col2 FROM table2 C. INSERT INTO table1 VALUES(SELECT col1,col2FROM table2) D. INSERT INTO table1 (col1, col2) VALUES (SELECT col1, col2 FROM table2) 7.有下列两表 TAB1 TAB2 C1 C2 CX CY ---- ----- ------ ----- A 11 A 21 B 12 C 22 C 13 D 23

数据架构师岗位职责

数据架构师岗位职责 篇一:数据仓库架构师的岗位职责和岗位要求】 数据仓库架构师的岗位职责和岗位要求 根据网络招聘的资料合成的,不过好像听起来好像和项目经理的角色区别不大,呵呵!而且好像都是要全能的上将![@more@] 岗位职责 1. 制定数据仓库建设方案 2. 数据仓库的设计和开发 3. 数据仓库应用方案设计和推广 岗位要求 1 、熟悉大型企业商业智能整体运作模式和系统框架,深刻理解商业智能对业务运营的杠杆作用,能够应用bi 工具指导和帮助业务过程的改进。 2、5 年以上oracle 或者sqlserver 数据库管理经验,熟练使用unix 和linux ,深刻理解数据仓库应用设计原理和实践; 3 、精通数据库索引和sql 语句的优化,和服务器的性能参数调整,有perl, 4 、熟练一种以上主流etl 工具和bi 工具,如informatica,owb,dts 5 、能根据业务需求设计数据仓库模型,有3 年以上数据仓库开发实施经验,掌握多种数据仓库开发,多维分析相关技术和olap 前端展现工具; 6 、有相关行业数据分析经验者及互联网点击流数据分析经验者优先;有数据挖掘应用和开发经验优先; 7 、强烈责任心,开放的性格,良好的沟通能力;较强的分析问题、解决问题能力,良好的沟通能力、团队精神。 8 、熟悉erwin 或powerdesigner 建模工具; 9 、有一个以上企业级数据仓库项目设计经验,精通数据仓库架构,熟悉数据仓库项目的实施流程; 【篇二:数据架构师岗位职责】 1. 制定面向产品的数据设计规范和流程,制定数据设计所需的各种文档模板; 2. 负责数据仓库建模、数据库优化、数据部署,数据抽取等etl 的设计,编写专业的系统设计文档; 3. 对于it 系统应对大数据量和大并发所要求的性能指标从数据模型和部署等方面给出设计和持续的优化支持; 4. 参与产品架构设计文档和详细设计文档的评审; 5. 完成上级领导安排的其他任务。

数据仓库工程师面试题(笔试1)

数据仓库工程师面试题 姓名:____张小核______ 开始时间:_____:______ 结束时间:_____:_____ 一、数据库 1.使用过哪些数据库?试说出它们的异同。 答:使用过SQL SERVER和ORACLE 它们的区别是:1.sql server 是中小型企业用的,oracle是中大型企业用的;oracle跨平台能在linux上运行,sqlserver只能在windows运行,而linux平台比windows平台稳定,所以安全性高;sqlserver操作简便,oracle比较复杂;oracle能把数据存在不同的硬盘上sqlserver不能;oracle能够回滚表空间查询sqlserver不能;oracle支持label security,sqlserver不能;oracle扩展性比较强。 2.事务有多个性质,其中不包括( B ) A.一致性 B.唯一性 C.原子性 D.隔离性 3.CHAR类型和V ARCHAR类型有何区别? 答:char的长度是固定的,最长2000个字符,当输入的字符小于你定义的字符数目时,它会自动补空值,所以它占用空间较大但是效率高;varchar的长度是可变的,用它可以节省存储空间,但是效率没有char高。 4.视图与表有何区别? 表是实际存在的,视图是一个或多个表结果的映射,实际不存在,所以视图不占用实际的物理空间,但删除时不影响数据,而表影响 5.数据库中常见的约束有哪些? 答:1.非空值约束,是not null;2。唯一性约束,不能重复造成冗余;3.检查约束,能够保证数据完整性;还有主键不能为空,应该是唯一的,字段属性要不能再分 6.有一个空表t_empty,结构是: create table t_empty ( a integer ) 请问以下各语句的输出分别是什么? (A) select sum(a) from t_empty 什么都不输出 (B) select NullToZero(a) from t_empty *假定NullToZero是一个将Null值转成0的标函数 (C) select count(*) from t_empty 7.有下列两表 Table1 Col1 INT

2018年系统架构师考试科目二:案例分析

2018 年系统架构师考试科目二:案例分析 1.阅读以下关于软件系统设计的叙述,在答题纸上回答问题 1 至问题 3。 【题目】 某文化产业集团委托软件公司开发一套文化用品商城系统,业务涉及文化用品销售、定制、竞拍和点评等板块,以提升商城的信息化建设水平。该软件公司组织项目组完成了需求调研,现已进入到系统架构设计阶段。考虑到系统需求对架构设计决策的影响,项目组先列出了可能影响系统架构设计的部分需求如下: (a)用户界面支持用户的个性化定制; (b)系统需要支持当前主流的标准和服务,特别是通信协议和平台接口; (c)用户操作的响应时间应不大于 3 秒,竞拍板块不大于 1 秒; (d)系统具有故障诊断和快速恢复能力; (e)用户密码需要加密传输; (f)系统需要支持不低于 2G 的数据缓存; (g)用户操作停滞时间超过一定时限需要重新登录验证; (h)系统支持用户选择汉语、英语或法语三种语言之一进行操作。 项目组提出了两种系统架构设计方案:瘦客户端 C/S 架构和胖客户端 C/S 架构,经过对上述需求逐条分析和讨论,最终决定采用瘦客户端 C/S 架构进行设计。 【问题 1】(8 分) 在系统架构设计中,决定系统架构设计的非功能性需求主要有四类:操作性需求、性能需求、安全性需求和文化需求。请简要说明四类需求的含义。 【问题 1 解析】 统性能需求(Performance Requirements):指响应时间、吞吐量、准确性、有效性、资源利用率等与系统完成任务效率相关的指标。可靠性、可用性等指标可归为此类。 安全性需求(Security Requirements):系统向合法用户提供服务并阻止非授权用户使用 服务方面的系统需求。 操作性需求(Operational Requirements):与用户操作使用系统相关的一些需求。 文化需求(Cultural Requirements):带有文化背景因素的系统需求。 【问题 2】(8 分) 根据表 1-1 的分类,将题干所给出的系统需求(a)~(h)分别填入(1)~(4)。 表 1-1需求分类 【问题 2 解析】 (1):(a)、(b) (2):(c)、(d)、(f) (3):(e)、(g) (4):(h) 【问题 3】(8 分)

Oracle数据库DBA面试题

数据库。热备份的优点在于当备份时,数据库仍旧可以被使用并且可以将数据库恢复到任意一个时间点。冷备份的优点在于它的备份和恢复 操作相当简单,并且由于冷备份的数据库可以工作在非归档模式下,数据库性能会比归档模式稍好。(因为不必将archive log写入硬盘) 2. 你必须利用备份恢复数据库,但是你没有控制文件,该如何解决问题呢 解答:重建控制文件,用带backup control file 子句的recover 命令恢复数据库。 3. 如何转换到spfile 解答:使用create spfile from pfile 命令 . 4. 解释data block , extent 和segment的区别(这里建议用英文术语) 解答:data block是数据库中最小的逻辑存储单元。当数据库的对象需要更多的物理存储空间时,连续的data block就组成了extent . 一 个数据库对象拥有的所有extents被称为该对象的segment. 5. 给出两个检查表结构的方法 解答:1、DESCRIBE命令 2、包 6. 怎样查看数据库引擎的报错 解答:alert log. 7. 比较truncate和delete 命令 解答:两者都可以用来删除表中所有的记录。区别在于:truncate是DDL操作,它移动HWK,不需要rollback segment .而Delete是DML操作 , 需要rollback segment 且花费较长时间. 8. 使用索引的理由 解答:快速访问表中的data block 9. 给出在STAR SCHEMA中的两种表及它们分别含有的数据 解答:Fact tables 和dimension tables. fact table 包含大量的主要的信息而dimension tables 存放对fact table 某些属性描述的

2016年下半年软件水平考试(高级)系统架构师《案例分析》下午真题及答案

2016年下半年软件水平考试(高级)系统架构师 《案例分析》下午真题 (总分000, 考试时间90分钟) 1. 阅读以下关于软件架构设计的叙述,在答题纸上回答问题1至问题3。 [说明]某软件公司为某品牌手机厂商开发一套手机应用程序集成开发环境,以提高开发手机应用程序的质量和效率。在项目之初,公司的系统分析师对该集成开发环境的需求进行了调研和分析,具体描述如下:1.需要同时支持该厂商自行定义的应用编程语言的编辑、界面可视化设计、编译、调试等模块,这些模块产生的模型或数据格式差异较大,集成环境应提供数据集成能力。集成开发环境还要支持以适配方式集成公司现有的应用模拟器工具。2.经过调研,手机应用开发人员更倾向于使用Windows系统,因此集成开发环境的界面需要与Windows平台上的主流开发工具的界面风格保持一致。3.支持相关开发数据在云端存储,需要保证在云端存储数据的机密性和完整性。4.支持用户通过配置界面依据自己的喜好修改界面风格,包括颜色、布局、代码高亮方式等,配置完成后无须重启环境。5.支持不同模型的自动转换。在初始需求中定义的机器性能条件下,对于一个包含50个对象的设计模型,将其转换为相应代码框架时所消耗时间不超过5秒。6.能够连续运行的时间不小于240小时,意外退出后能够在10秒之内自动重启。7.集成开发环境具有模块化结构,支持以模块为单位进行 调试、测试与发布。8.支持应用开发过程中的代码调试功能:开发人员可以设置断点,启动调试,编辑器可以自动卷屏并命中断点,能通过变量监视器查看当前变量取值。在对需求进行分析后,公司的架构师小张查阅了相关的资料,认为该集成开发环境应该采用管道一过滤器(Pipe-Filter)的架构风格,公司的资深架构师王工在仔细分析后,认为应该采用数据仓储(Data Repository)的架构风格。公司经过评审,最终采用了王工的方案。 1.[问题1]识别软件架构质量属性是进行架构设计的重要步骤。请分析题干中的需求描述, 填写表1—1中(1)~(5)处的空白。 该问题分值: 2 答案:正确答案:(1)f(2)性能(3)d(4)g(5)b 2.[问题2]请在阅读题干需求描述的基础上,从交互方式、数据结构、控制结构和扩展方法4 个方面对两种架构风格进行比较,填写表1—2中(1)~(4)处的空白。 该问题分值: 2 答案:正确答案:(1)工具之间无直接交互,通过数据仓储间接交互(2)流式数据(3)数据驱动(4)

相关文档
相关文档 最新文档