阿里巴巴DBA面试题答案

作者:Webbery 提交日期:2008-10-10 12:17:00
一:SQL tuning 类
1 列举几种表连接方式
 等连接、非等连接、自连接、外连接(左、右、全)
2 不借助第三方工具,怎样查看sql的执行计划
I) 使用Explain Plan,查询PLAN_TABLE;
 EXPLAIN PLAN
 SET STATEMENT_ID='QUERY1'
 FOR
 SELECT *
 FROM a
 WHERE aa=1;
 SELECT operation, options, object_name, object_type, ID, parent_id
 FROM plan_table
 WHERE STATEMENT_ID = 'QUERY1'
 ORDER BY ID;
II)SQLPLUS中的SET TRACE 即可看到Execution Plan Statistics
 SET AUTOTRACE ON;

3:如何使用CBO,CBO与RULE的区别
 IF 初始化参数 OPTIMIZER_MODE = CHOOSE THEN --(8I DEFAULT)
 IF 做过表分析
 THEN 优化器 Optimizer=CBO(COST); /*高效*/
 ELSE
 优化器 Optimizer=RBO(RULE); /*高效*/
 END IF;
 END IF;
 区别:
 RBO根据规则选择最佳执行路径来运行查询。
 CBO根据表统计找到最低成本的访问数据的方法确定执行计划。
 使用CBO需要注意:
 I) 需要经常对表进行ANALYZE命令进行分析统计;
 II) 需要稳定执行计划;
 III)需要使用提示(Hint);
 使用RULE需要注意:
 I) 选择最有效率的表名顺序
 II) 优化SQL的写法;

4 如何定位重要(消耗资源多)的SQL
 使用CPU多的用户session
 SELECT a.SID, spid, status, SUBSTR (a.program, 1, 40) prog, a.terminal,a
.SQL_TEXT,
 osuser, VALUE / 60 / 100 VALUE
 FROM v$session a, v$process b, v$sesstat c
 WHERE c.statistic# = 12 AND c.SID = a.SID AND a.paddr = b.addr
 ORDER BY VALUE DESC;

5 如何跟踪某个session的SQL
 利用TRACE 跟踪
 ALTER SESSION SET SQLTRACE ON;
 COLUMN SQL format a200;
 SELECT machine, sql_text SQL
 FROM v$sqltext a, v$session b
 WHERE address = sql_address
 AND machine = '&A'
 ORDER BY hash_value, piece;

6 SQL调整最关注的是什么
 检查系统的I/O问题
 sar-d能检查整个系统的iostat(IO statistics)

7 说说你对索引的认识(索引的结构、对dml影响、对查询影响、为什么提高查询性能)
 索引有B-TREE、BIT、CLUSTER等类型。ORACLE使用了一个复杂的自平衡B-tree结构;
 通常来说,在表上建立恰当的索引,查询时会改进查询性能。但在进行插入、删除、修改时,同时会进行索引的修改,在性能上有一定的影响。
 有索引且查询条件能使用索引时,数据库会先度取索引,根据索引内容和查询条件,查询出ROWID,再根据ROWID取出需要的数据。由于索引内容通常比全表内容要少很多,因此通过先读索引,能减少I/O,提高查询性能。

8 使用索引查询一定能提高查询的性能吗?为什么
 通常,通过索引查询数据比全表扫描要快.但是我们也必须注意到它的代价.
 索引需要空间来存储,也需要定期维护, 每当有记录在表中增减或索引列被修改时,
 索引本身也会被修改. 这意味着每条记录的INSERT,DELETE,UPDATE将为此多付出4,5 次的磁盘I/O. 因为索引需要额外的存储空间和处理,那些不必要的索引反而会使查询反应时间变慢.
 使用索引查询不一定能提高查询性能,索引范围查询(INDEX RANGE SCAN)适用于两种情况:
 基于一个范围的检索,一般查询返回结果集小于表中记录数的30%宜采用;
 基于非唯一性索引的检索

9 绑定变量是什么?绑定变量有什么优缺点?
 绑定变量是指在SQL语句中使用变量,改变变量的值来改变SQL语句的执行结果。
 优点:使用绑定变量,可以减少SQL语句的解析,能减少数据库引擎消耗在SQL语句解析上的资源。提高了编程效率和可靠性。减少访问数据库的次数, 就能实际上减少ORACLE的工作量。
 缺点:经常需要使用动态SQL的写法,由于参数的不同,可能SQL的执行效率不同;

10 如何稳定(固定)执行计划

 可以在SQL语句中指定执行计划。使用HINTS;

11 和排序相关的内存在8i和9i分别怎样调整,临时表空间的作用是什么
 SORT_AREA_SIZE 在进行排序操作时,如果排序的内容太多,内存里不能全部放下,
则需要进行外部排序,
 此时需要利用临时表空间来存放排序的中间结果。

12 存在表T(a,b,c,d),要根据字段c排序后取第21—30条记录显示,请给出sql
 SELECT *
 FROM (SELECT ROWNUM AS row_num, tmp_tab.*
 FROM (SELECT a, b, c, d
 FROM T
 ORDER BY c) tmp_tab
 WHERE ROWNUM <= 30)
 WHERE row_num >= 20
 ORDER BY row_num;

二:数据库基本概念类

1 Pctused and pctfree 表示什么含义有什么作用
 pctused与pctfree控制数据块是否出现在freelist中,
 pctfree控制数据块中保留用于update的空间,当数据块中的free space小于pctfree设置的空间时,
 该数据块从freelist中去掉,当块由于dml操作free space大于pct_used设置的空间时,该数据库块将被添加在freelist链表中。

2 简单描述tablespace / segment / extent / block之间的关系
 tablespace : 一个数据库划分为一个或多个逻辑单位,该逻辑单位成为表空间;每一个表空间可能包含一个或多个 Segment;
 Segments : Segment指在tablespace中为特定逻辑存储结构分配的空间。每一个段是由一个或多个extent组成。包括数据段、索引段、回滚段和临时段。
 Extents : 一个 extent 由一系列连续的 Oracle blocks组成.ORACLE为通过extent 来给segment分配空间。
 Data Blocks :Oracle 数据库最小的I/O存储单位,一个data block对应一个或多个分配给data file的操作系统块。

3 描述tablespace和datafile之间的关系
◎ 一个表空间可包含一个或多个数据文件。
◎ 表空间利用增加或扩展数据文件扩大表空间,表空间的大小为组成该表空间的数据文件大小的和。
◎ 一个datafile只能属于一个表空间;

4 本地管理表空间和字典管理表空间的特点,ASSM有什么特点
n 本地管理表空间:(9i默认)
n 空闲块列表存储在表空间的数据文件头。
n 特点:减少数据字典表的竞争,当分配和收缩空间时会产生回滚,不需要合并
n 字典管理的表空间:(8i默认)
n 空闲块列表存储在数据库中的字典表里.
n 特点:片由数据字典管理,可能造成字典表的争用。存储在表空间的每一个段都会有不同的存储字句,需要合并相邻的块;

5 回滚段的作用是什么

 回滚段用于保存数据修改前的映象,这些信息用于生成读一致性数据库信息、在数据库恢复和Rollback时使用。一个事务只能使用一个回滚段。

6 日志的作用是什么

 日志文件(Log File)记录所有对数据库数据的修改,主要是保护数据库以防止故障,以及恢复数据时使用。其特点如下:

 a)每一个数据库至少包含两个日志文件组。每个日志文件组至少包含两个日志文件成员。
 b)日志文件组以循环方式进行写操作。
 c)每一个日志文件成员对应一个物理文件。

7 SGA主要有那些部分,主要作用是什么

 系统全局区(SGA):是ORACLE为实例分配的一组共享缓冲存储区,用于存放数据库数据和控制信息,以实现对数据库数据的管理和操作。

 SGA主要包括:
u a)共享池(shared pool) :用来存储最近执行的SQL语句和最近使用的数据字典的数据。
u b)数据缓冲区 (database buffer cache):用来存储最近从数据文件中读写过的数据。
u c)重作日志缓冲区(redo log buffer):用来记录服务或后台进程对数据库的操作。

另外在SGA中还有两个可选的内存结构:
u d)Java pool: 用来存储Java代码。
u e)Large pool: 用来存储不与SQL直接相关的大型内存结构。备份、恢复使用。

8 Oracle系统进程主要有哪些,作用是什么

u 数据写进程(DBWR):负责将更改的数据从数据库缓冲区高速缓存写入数据文件
u 日志写进程(LGWR):将重做日志缓冲区中的更改写入在线重做日志文件
u 系统监控 (SMON): 检查数据库的一致性如有必要还会在数据库打开时启动数据库的恢复
u 进程监控 (PMON): 负责在一个Oracle 进程失败时清理资源
u 检查点进程(CKPT):负责在每当缓冲区高速缓存中的更改永久地记录在数据库中时,更新控制文件和数据文件中的数据库状态信息。
u 归档进程 (ARCH):在每次日志切换时把已满的日志组进行备份或归档
u 恢复进程 (RECO): 保证分布式事务的一致性,在分布式事务中,要么同时commit,要么同时rollback;
u 作业调度器(CJQ ): 负责将调度与执行系统中已定义好的job,完成一些预定义的工作.

三:备份恢复类

1 备份如何分类
 物理备份
u 物理备份是最主要的备份方式。用于保证数据库在最小的数据库丢失或没有数据丢失的情况下得到恢复。

n 冷物理
u 冷物理备份提供了最简单和最直接的方法保护数据库因物理损坏丢失。建议在以下几种情况中使用。
u 对一个已经存在大最数据量的数据库,在晚间数据库可以关闭,此时应用冷物理备份。
u 对需对数据库服务器进行升级,(如更换硬盘),此时需要备份数据库信息,并在新的硬盘中恢复这些数据信息,建议采用冷物理备份。

n 热物理

u 主要是指备份过程在数据库打开并且用户可以使用的情况下进行。需要执行热物理备份的情况有:
u 由于数据库性质要求不间断工作,因而此时只能采用热物理备份。
u 由于备份的要求的时间过长,而数据库只能短时间关闭时。
n 逻辑备份 (EXP/IMP)
u 逻辑备份用于实现数据库对象的恢复。但不是基于时间点可完全恢复的备份策略。只能作为联机备份和脱机备份的一种补充。

n 完全逻辑备份
 完全逻辑备份是将整个数据库导出到一个数据库的格式文件中,该文件可以在不同的数据库版本、操作系统和硬件平台之间进行移植。

n 指定表的逻辑备份
u 通过备份工具,可以将指定的数据库表备份出来,这可以避免完全逻辑备份所带来的时间和财力上的浪费。

2 归档是什么含义

n 归档是归档当前的联机redo日志文件。
n SVRMGR> alter system archive log current;
n 数据库只有运行在ARCHIVELOG模式下,并且能够进行自动归档,才可以进行联机备份。有了联机备份才有可能进行完全恢复。

3 如果一个表在2004-08-04 10:30:00 被drop,在有完善的归档和备份的情况下,如何恢复
 I) 9i 新增的FLASH BACK 应该可以;
 II) Logminer应该可以找出DML。
 III)有完善的归档和备份,先归档当前数据,然后可以先恢复到删除的时间点之前,把DROP 的表导出来,然后再恢复到最后归档时间;
 不过,我没试过,都是理论的说!!

4 rman是什么,有何特点
n RMAN可以用来备份和还原数据库文件、归档日志和控制文件。它也可以用来执行完全或不完全的数据库恢复。
n RMAN启动数据库上的Oracle服务器进程来进行备份或还原。备份、还原、恢复是由这些进程驱动的。
n 注意:RMAN不能用于备份初始化参数文件和口令文件。
具有如下特点:

n 功能类似物理备份,但比物理备份强大N倍;
n 可以压缩空块;
 可以在块水平上实现增量;
n 可以把备份的输出打包成备份集,也可以按固定大小分割备份集;
n 备份与恢复的过程可以自动管理;
n 可以使用脚本(存在Recovery catalog 中)
n 可以做坏块监测

5 standby的特点

 备用数据库(standby database):ORACLE推出的一种高可用性(HIGH AVAILABLE)数据库方案,
 在主节点与备用节点间通过日志同步来保证数据的同步,备用节点作为主节点的备份
 可以实现快速切换与灾难性恢复,从920开始,还开始支持物理与逻辑备用服务器。
 9i中的三种数据保护模式分别是:
n MAXIMIZE PROTECTION :最大数据保护与无数据分歧,LGWR将同时传送到备用节点,
u 在主节点事务确认之前,备用节点也必须完全收到日志数据。如果网络不好,引起LGWR不能传送数据,将引起严重的性能问题,导致主节点DOWN机。
 MAXIMIZE AVAILABILITY :无数据丢失模式,允许数据分歧,允许异步传送。
u 正常情况下运行在最大保护模式,在主节点与备用节点的网络断开或连接不正常时,自动切换到最大性能模式,u 主节点的操作还是可以继续的。在网络不好的情况下有较大的性能影响。
n MAXIMIZE PERFORMANCE:这种模式应当可以说是从8i继承过来的备用服务器模式,异步传送,无数据同步检查,可能丢失数据,但是能获得主节点的最大性能。9i在配置DATA GUARD的时候默认就是MAXIMIZE PERFORMANCE

 没实践过,只是把答案列出来。

6 对于一个要求恢复时间比较短的系统(数据库50G,每天归档5G),你如何设计备份策略
 数据库比较大逻辑备份没什么必要,每天归档5G,每周三/周六自动归档10G,每月RMAN归档全库。
 应该有standby。
 我对备份和恢复缺少实践机会,JUST PAPER。

四:系统管理类

1 对于一个存在系统性能的系统,说出你的诊断处理思路
 I) 做statspack收集系统相关信息
 了解系统大致情况/确定是否存在参数设置不合适的地方/查看top 5 event/查看top sql等
 II) 查v$system_event/v$session_event/v$session_wait
 从v$system_event开始,确定需要什么资源(db file sequential read)等
 深入研究v$session_event,确定等待事件涉及的会话
 III)从v$session_wait确定详细的资源争用情况
 通过v$sql/v$sqltext/v$sqlarea表确定disk_reads、(buffer_gets/executions)值较大的SQL

2 列举几种诊断IO、CPU、性能状况的方法

 top
 uptime
 vmstat
 iostat
 statspack
 sql_trace/tkprof
 查v$system_event/v$session_event/v$session_wait
 查v$sqlarea(disk_reads或buffer_gets/executions较大的SQL)
 或者第三方的监视工具,TOAD就不错。

3 对statspack有何认识

 认识不深。仅限了解。StapSpack是Oracle公司提供的一个收集数据库运行性能指标的软件包。
 可以做数据库健康检查报告。

4 如果系统现在需要在一个很大的表上创建一个索引,你会考虑那些因素,如何做以尽量减小对应用的影响
 可以先表分析一下,然后测试创建索引前后对应用的性能影响;
 需要考虑的是该索引列不经常更新,不是有很多重复值的情况时, 在大表中使用索引特别有效.
 创建的索引可以跟数据表分不同表空间存储。

5 对raid10 和raid5有何认识
 几乎不懂。没配过磁盘阵列

五:综合随意类

1 你最擅长的是oracle哪部分?
pl/sql及sql优化

2 喜欢oracle吗?喜欢上论坛吗?或者偏好oracle的哪一部分?
 喜欢。PL/SQL比较得心应手。

3 随意说说你觉得oracle最有意思的部分或者最困难的部分
 我对数据库的备份/恢复和性能调优经验明显不足,自然觉得有些困难。
基于ORACLE的研究应该是个宽广的领域,所以我觉得还是有意思的。

4 为何要选择做DBA呢?

 我对数据库的备份/恢复和性能调优经验明显不足,主要是缺乏环境和交流。
 因此,算不上什么DBA。不过因此我更需要这样的机会。
 不过就整个ORACLE 来说,一直从事与它相关的工作,感情还是颇深的。放弃可惜。而
且就技术本身而言我觉得自己还是有学习和创新的能力,它的诸如数据仓库,数据挖掘
之类的领域也很广。
posted on 2008-12-07 02:03  happyriver  阅读(303)  评论(0)    收藏  举报