相信會對即将投身于資料倉庫事業中的同行們有點幫助!不過這隻是針對初級資料倉庫工程師的基本問題。
本題隻代表自己對資料倉庫的膚淺認識,不代表任何公司的面試題目。
對于進階資料倉庫工程師的問題更側重于各種工具的細枝末節。
對于資料倉庫架構師的問題更側重于資料倉庫的架構和總體認識。
對于資料倉庫項目經理的問題除了以上的問題外,就是一般項目管理的技能了吧。
關于資料倉庫部分的面試問題!
什麼叫資料倉庫?(相信inmon的資料倉庫概念的四個特點是最基本的吧,當然需要加上自己的了解)
資料倉庫和資料庫有什麼差別?(事務性資料庫和決策支援資料庫的差別,當然包括目标、用途、設計等等)
什麼叫OLAP?用途是什麼?(OLAP指多元資料庫了,主要用于多元分析了;包括三種實作方式)
什麼叫次元和路徑成本?(一個是出發點,一個是觀察值)
資料倉庫的基本架構是什麼?(資料源,ETL,data stage,ODS,data warehouse,datamart,OLAP等等,可能為針對每一個結構進行發問啊)
什麼叫緩慢次元變化?(為了表現和記錄基礎資料變化情況在資料倉庫中的記錄,包括三大類次元處理方式,緩慢變化維包括三小類)
什麼叫查找表,為什麼使用替代鍵?(其實目的和上面一樣,從基礎表到緩慢次元表的過程中的一種實作途徑)
如何實作增量抽取?(主要采用時間戳方式,提供資料抽取和處理的性能)
用過什麼ETL工具(informatica,ssis,owb,datastage),以及該工具簡單講述特點。
ETL都包括那些組成部分(工作流和資料流,資料流包括若幹元件處理ETL的各個環節)
用過什麼報表工具(bo,hyperion,congo,reporing servce),以及該工具基本特點。
資料倉庫項目最重要或需要注意的是什麼,以及如何處理?(一般答資料品質,主要是資料源資料品質分析,資料清洗轉換,當然也可以定量分析)
關于資料庫部分的面試題(不是要DBA的,但是還是要具備DBA的部分知識結構)
用過什麼資料庫(SQLServer,Oracle),并能夠講述其實體和邏輯結構,以Oracle為主
能夠寫基本的SQL語句,分組函數和關聯,通常會給幾個例子的
如何進行性能優化,隻要能答索引的基本原理以及各種索引的差別就行了
事實上資料倉庫和DBA或者其他技術不同,沒有什麼絕對的答案,隻要能表達和描述清楚自己的觀點就行了