<b>資料庫管理者(Database Administrator,簡稱DBA)</b>,是從事管理和維護資料庫管理系統(DBMS)的相關從業人員的統稱,他屬于運維工程師的一個分支,主要負責業務資料庫從設計、測試到部署傳遞的全生命周期管理。DBA的核心目标是保證資料庫管理系統的穩定性、安全性、完整性和高性能。
我也在阿裡的招聘網站上搜尋了一些相關的DBA的職位,有不少我比較感興趣的職位,比如安全部-(集團安全)資料倉庫專家和資料系統架構師。
我特意給大家切了兩個圖放在下面,感興趣的小夥伴就瞅準技術要求,找準方向,下功夫努力學習吧。
分析這樣的職位要求,有幾項要求是相同的,比方說Java技術,資料庫sql技術,還有最好掌握Hadoop等體系…好了,具體内容大家自己看咯。接下來就為大家分享文章:
<b></b>
<b>正文:</b>
<b>《阿裡DBA面試題》</b>
一. SQL tuning 類
1:列舉幾種表連接配接方式
hash join/merge join/nest loop(cluster join)/index join
2:不借助第三方工具,怎樣檢視sql的執行計劃
set autot on
explain plan set statement_id = &item_id for &sql;
select * from table(dbms_xplan.display);
或者:
SQL>EXPLAIN PLAN FOR SELECT * FROM EMP;
SQL>SELECT plan_table_output FROM TABLE(DBMS_XPLAN.DISPLAY('PLAN_TABLE'));
3:如何使用CBO,CBO與RULE的差別
Rule Based Optimizer(RBO):基于規則
Cost Based Optimizer (CBO):基于成本,或者講統計資訊。
在optimizer_mode=choose時,如果表有統計資訊(分區表外),優化器将選擇CBO,否則選RBO。RBO遵循簡單的分級方法學,使用15種級别要點,當接收到查詢,優化器将評估使用到的要點數目, 然後選擇最佳級别(最少的數量)的執行路徑來運作查詢。
CBO嘗試找到最低成本的通路資料的方法,為了最大的吞吐量或最快的初始響應時間,計算使用不同的執行計劃的成本,并選擇成本最低的一個,關于表的資料内容的統計被用于确定執行計劃。
4:如何定位重要(消耗資源多)的SQL
select sql_text from v$sql where disk_reads > 1000 or (executions > 0 and buffer_gets/executions > 30000);
5:如何跟蹤某個session的SQL
exec dbms_system.set_sql_trace_in_session(sid,serial#,&sql_trace);
select sid,serial# from v$session where sid = (select sid from v$mystat where rownum = 1);
exec dbms_system.set_ev(&sid,&serial#,&event_10046,&level_12,'');
6:SQL調整最關注的是什麼
檢視該SQL的response time(db block gets/consistent gets/physical reads/sorts (disk))
7:說說你對索引的認識(索引的結構、對dml影響、為什麼提高查詢性能)
b-tree index/bitmap index/function index/patitional index(local/global) 索引通常能提高select/update/delete的性能,會降低insert的速度
8:使用索引查詢一定能提高查詢的性能嗎?為什麼
索引就是為了提高查詢性能而存在的, 如果在查詢中索引沒有提高性能, 隻能說是用錯了索引,或者講是場合不同
9:綁定變量是什麼?綁定變量有什麼優缺點?
綁定變量是相對文本變量來講的,所謂文本變量是指在SQL直接書寫查詢條件,這樣的SQL在不同條件下需要反複解析,綁定變量是指使用變量來代替直接書寫條件,查詢bind value在運作時傳遞,然後綁定執行。優點是減少硬解析,降低CPU的争用,節省shared_pool ;缺點是不能使用histogram,sql優化比較困難
10:如何穩定(固定)執行計劃
query_rewrite_enabled = true
star_transformation_enabled = true
optimizer_features_enable = 9.2.0
建立并使用stored outline
11:和排序相關的記憶體在8i和9i分别怎樣調整,臨時表空間的作用是什麼
8i中sort_area_size/sort_area_retained_size決定了排序所需要的記憶體.如果排序操作不能在sort_area_size中完成,就會用到temp表空間
9i中如果workarea_size_policy=auto時,排序在pga内進行,通常pga_aggregate_target的1/20可以用來進行disk sort;如果workarea_size_policy=manual時,排序需要的記憶體由sort_area_size決定.在執行order by/group by/distinct/union/create index/index rebuild/minus等操作時,如果在pga或sort_area_size中不能完成,排序将在臨時表空間進行(disk sort),
臨時表空間主要作用就是完成系統中的disk sort.
12:存在表T(a,b,c,d),要根據字段c排序後取第21—30條記錄顯示,請給出sql
create table t(a number(),b number(),c number(),d number());
/
begin
for i in 1 .. 300 loop
insert into t values(mod(i,2),i/2,dbms_random.value(1,300),i/4);
end loop;
end;
select * from (select c.*,rownum as rn from (select * from t order by c desc) c) where rn between 21 and 30;
select * from (select * from test order by c desc) x where rownum < 30
minus
select * from (select * from test order by c desc) y where rownum < 20 order by 3 desc
相比之 minus性能較差
<b>二. 資料庫基本概念類</b>
1:pctused and pctfree 表示什麼含義有什麼作用
pctused與pctfree控制資料塊是否出現在freelist中,pctfree控制資料塊中保留用于update的空間,當資料塊中的free space小于pctfree設定的空間時,該資料塊從freelist中去掉,當塊由于dml操作free space大于pct_used設定的空間時,該資料庫塊将添加在freelist連結清單中。
2:簡單描述table / segment / extent / block之間的關系
table建立時,預設建立了一個data segment,每個data segment含有min extents指定的extents數,每個extent據據表空間的存儲參數配置設定一定數量的blocks
3:描述tablespace和datafile之間的關系
一個tablespace可以有一個或多個datafile,每個datafile隻能在一個tablespace内,table中的資料,通過hash算法分布在tablespace中的各個datafile中,tablespace是邏輯上的概念,datafile則在實體上儲存了資料庫的種種對象。
4:本地管理表空間和字典管理表空間的特點,ASSM有什麼特點
本地管理表空間(Locally Managed Tablespace簡稱LMT):8i以後出現的一種新的表空間的管理模式,通過位圖來管理表空間的空間使用。
字典管理表空間(Dictionary-Managed Tablespace簡稱DMT):8i以前包括以後都還可以使用的一種表空間管理模式,通過資料字典管理表空間的空間使用。
動段空間管理(ASSM):它首次出現在Oracle920裡有了ASSM,連結清單freelist被位圖所取代,它是一個二進制的數組,能夠迅速有效地管理存儲擴充和剩餘區塊(free block),是以能夠改善分段存儲本質,ASSM表空間上建立的段還有另外一個稱呼叫Bitmap Managed Segments(BMB 段)。
5:復原段的作用是什麼
事務復原:當事務修改表中資料的時候,該資料修改前的值(即前影像)會存放在復原段中,當使用者復原事務(ROLLBACK)時,ORACLE将會利用復原段中的資料前影像來将修改的資料恢複到原來的值。
事務恢複:當事務正在處理的時候,例程失敗,復原段的資訊儲存在undo表空間中,ORACLE将在下次打開資料庫時利用復原來恢複未送出的資料。
讀一緻性:當一個會話正在修改資料時,其他的會話将看不到該會話未送出的修改。當一個語句正在執行時,該語句将看不到從該語句開始執行後的未送出的修改(語句級讀一緻性).當ORACLE執行SELECT語句時,ORACLE依照目前的系統改變号(SYSTEM CHANGE NUMBER-SCN)來保證任何前于目前SCN的未送出的改變不被該語句處理。可以想象:當一個長時間的查詢正在執行時,若其他會話改變了該查詢要查詢的某個資料塊,ORACLE将利用復原段的資料前影像來構造一個讀一緻性視圖。
6:日志的作用是什麼
記錄資料庫事務:最大限度地保證資料的一緻性與安全性
重做日志檔案:含對資料庫所做的更改記錄,這樣萬一出現故障可以啟用資料恢複,一個資料庫至少需要兩個重做日志檔案
歸檔日志檔案:是重做日志檔案的脫機副本,這些副本可能對于從媒體失敗中進行恢複很必要。
7:SGA主要有那些部分,主要作用是什麼
SGA:db_cache/shared_pool/large_pool/java_pool
db_cache: 資料庫緩存(Block Buffer)對于Oracle資料庫的運轉和性能起着非常關鍵的作用,它占據Oracle資料庫SGA(系統共享記憶體區)的主要部分。Oracle資料庫通過使用LRU算法,将最近通路的資料塊存放到緩存中,進而優化對磁盤資料的通路.
shared_pool:共享池的大小對于Oracle 性能來說都是很重要的。共享池中儲存資料字典高速緩沖和完全解析或編譯的的PL/SQL 塊和SQL 語句及控制結構
large_pool:使用MTS配置時,因為要在SGA中配置設定UGA來保持使用者的會話,就是用Large_pool來保持這個會話記憶體使用RMAN做備份的時候,要使用Large_pool這個記憶體結構來做磁盤I/O緩存器
java_pool: 為java procedure預備的記憶體區域,如果沒有使用java proc,java_pool不是必須的
8. Oracle系統程序主要有哪些,作用是什麼
資料寫程序(dbwr):負責将更改的資料從資料庫緩沖區高速緩存寫入資料檔案
日志寫程序(lgwr):将重做日志緩沖區中的更改寫入線上重做日志檔案
系統監控(smon) :檢查資料庫的一緻性如有必要還會在資料庫打開時啟動資料庫的恢複
程序監控(pmon) :負責在一個Oracle 程序失敗時清理資源
檢查點程序(chpt):負責在每當緩沖區高速緩存中的更改永久地記錄在資料庫中時,更新控制檔案和資料檔案中的資料庫狀态資訊。
歸檔程序(arcn) :在每次日志切換時把已滿的日志組進行備份或歸檔
作業排程器(cjq) : 負責将排程與執行系統中已定義好的job,完成一些預定義的工作.
恢複程序(reco) : 保證分布式事務的一緻性,在分布式事務中,要麼同時commit,要麼同時rollback;
<b>三. 備份恢複類</b>
1:備份如何分類
邏輯備份:exp/imp
實體備份:
1). RMAN備份: full backup/incremental backup(累積/差異)
2). 熱備份: alter tablespace begin/end backup;
3). 冷備份: 脫機備份(database shutdown)
2:歸檔是什麼含義
關于歸檔日志:Oracle要将填滿的線上日志檔案組歸檔時,則要建立歸檔日志(archived redo log)。
其對資料庫備份和恢複有下列用處:資料庫後備以及線上和歸檔日志檔案,在作業系統和磁盤故障中可保證全部送出的事物可被恢複。在資料庫打開和正常系統使用下,如果歸檔日志是永久儲存,線上後備可以進行和使用。
資料庫可運作在兩種不同方式下:NOARCHIVELOG方式或ARCHIVELOG方式. 資料庫在NOARCHIVELOG方式下使用時,不能進行線上日志的歸檔,如果資料庫在ARCHIVELOG方式下運作,可實施線上日志的歸檔。
3:如果一個表在2004-08-04 10:30:00 被drop,在有完善的歸檔和備份的情況下,如何恢複?
手工拷貝回所有備份的資料檔案
startup mount;
sql alter database recover automatic until time '2004-08-04:10:30:00';
alter database open resetlogs;
4:rman是什麼,有何特點?
RMAN(Recovery Manager)是DBA的一個重要工具,用于備份、還原和恢複oracle資料庫, RMAN 可以用來備份和恢複資料庫檔案、歸檔日志、控制檔案、系統參數檔案,也可以用來執行完全或不完全的資料庫恢複。
RMAN有三種不同的使用者接口:COMMAND LINE方式、GUI 方式(內建在OEM 中的備份管理器)、API 方式(用于內建到第三方的備份軟體中)。
具有如下特點:
1)功能類似實體備份,但比實體備份強大N倍;
2)可以壓縮空塊;
3)可以在塊水準上實作增量;
4)可以把備份的輸出打包成備份集,也可以按固定大小分割備份集;
5)備份與恢複的過程可以自動管理;
6)可以使用腳本(存在Recovery catalog 中)
7)可以做壞塊監測
5:standby的特點
備用資料庫(standby database):ORACLE推出的一種高可用性(HIGH AVAILABLE)資料庫方案,在主節點與備用節點間通過日志同步來保證資料的同步,備用節點作為主節點的備份.可以實作快速切換與災難性恢複,從920開始,還開始支援實體與邏輯備用伺服器。
9i中的三種資料保護模式分别是:
1)、MAXIMIZE PROTECTION :最大資料保護與無資料分歧,LGWR将同時傳送到備用節點,在主節點事務确認之前,備用節點也必須完全收到日志資料。如果網絡不好,引起LGWR不能傳送資料,将引起嚴重的性能問題,導緻主節點DOWN機。
2)、MAXIMIZE AVAILABILITY :無資料丢失模式,允許資料分歧,允許異步傳送。正常情況下運作在最大保護模式,在主節點與備用節點的網絡斷開或連接配接不正常時,自動切換到最大性能模式,主節點的操作還是可以繼續的。在網絡不好的情況下有較大的性能影響。
3)、MAXIMIZE PERFORMANCE:這種模式應當可以說是從8i繼承過來的備用伺服器模式,異步傳送,無資料同步檢查,可能丢失資料,但是能獲得主節點的最大性能。9i在配置DATA GUARD的時候預設就是MAXIMIZE PERFORMANCE
6:對于一個要求恢複時間比較短的系統(資料庫50G,每天歸檔5G),你如何設計備份政策
rman/每月一号 level 0 每周末/周三 level 1 其它每天level 2
<b>四:系統管理類</b>
1.對于一個存在系統性能的系統,說出你的診斷處理思路
1) 做statspack收集系統相關資訊
了解系統大緻情況/确定是否存在參數設定不合适的地方/檢視top 5 event/檢視top sql等
2) 查v$system_event/v$session_event/v$session_wait
從v$system_event開始,确定需要什麼資源(db file sequential read)等
深入研究v$session_event,确定等待事件涉及的會話
從v$session_wait确定詳細的資源争用情況(p1-p3的值:file_id/block_id/blocks等)
3) 通過v$sql/v$sqltext/v$sqlarea表确定disk_reads、(buffer_gets/executions)值較大的SQL
2:列舉幾種診斷IO、CPU、性能狀況的方法
top/vmstat
statspack
sql_trace/tkprof
查v$system_event/v$session_event/v$session_wait
查v$sqlarea(disk_reads或buffer_gets/executions較大的SQL)
3:對statspack有何認識
StapSpack是Oracle公司提供的一個收集資料庫運作性能名額的軟體包,該軟體包從8i起,在9i、10g都有顯著的增強 。該軟體包的輔助表(存儲相關參數與收集的性能名額的表)由最初的25個增長到43個。收集級别參數由原來的3個(0、5、10)增加到5個(0、5、6、7、10)通過分析收集的性能名額,資料庫管理者可以詳細地了解資料庫目前的運作情況,對資料庫執行個體、等待事件、SQL等進行優化調整。利用statspack收集的snapshot,可以統計制作資料庫的各種性能名額的統計趨勢圖表。
4:如果系統現在需要在一個很大的表上建立一個索引,你會考慮那些因素,如何做以盡量減小對應用的影響
在系統比較空閑時;nologging選項(如果有dataguard則不可以使用nologging)大的sort_ared_size或pga_aggregate_target較大
5:對raid1+0 和raid5有何認識
RAID 10(或稱RAID 1+0)與RAID 0+1不同,它是用硬碟驅動器先組成RAID 1陣列,然後在RAID 1陣列之間再組成RAID 0陣列。RAID 10模式同RAID 0+1模式一樣具有良好的資料傳輸性能,但卻比RAID 0+1具有更高的可靠性。RAID 10陣列的實際容量為M×n/2,磁盤使用率為50%。RAID 10也需要至少4個硬碟驅動器構成,因而價格昂貴。 RAID 10的可靠性同RAID 1一樣,但由于RAID 10硬碟驅動器之間有資料分割,因而資料傳輸性能優良。RAID 5與RAID 3很相似,不同之處在于RAID 5的奇偶校驗資訊也同資料一樣被分割儲存到所有的硬碟驅動器,而不是寫入一個指定的硬碟驅動器,進而消除了單個奇偶校驗硬碟驅動器的瓶頸問題。RAID 5磁盤陣列的性能比RAID 3有所提高,但仍然需要至少3塊硬碟驅動器。其實際容量為M×(n-1),磁盤使用率為(n-1)/n 。
<b>五:綜合随意類 </b>
1:你最擅長的是oracle哪部分?
2:喜歡oracle嗎?喜歡上論壇嗎?或者偏好oracle的哪一部分?
3:随意說說你覺得oracle最有意思的部分或者最困難的部分
4:為何要選擇做DBA呢?
<b>正文完</b>
<b>本系列文章:</b>
<a href="https://yq.aliyun.com/articles/7259" target="_blank"><b>如何拿到阿裡技術offer:從《阿裡電話面試經過與總結》體味阿裡社會招聘</b></a>
<a href="https://yq.aliyun.com/articles/7260" target="_blank"><b>如何拿到阿裡技術offer:從《阿裡巴巴面試總結與感悟》體味阿裡社會招聘</b></a>