導讀:
<b> </b><b>一、概述</b>
<b></b>
Integration
Services 是用于生成高性能資料內建和工作流解決方案(包括針對資料倉庫的提取、轉換和加載 (ETL) 操作)的平台。
Integration Services 包括:
a)生成并調試包的圖形工具和向導;
b)執行如 FTP 操作、SQL 語句執行和電子郵件消息傳遞等工作流功能的任務;
c)用于提取和加載資料的資料源和目标;
d)用于清理、聚合、合并和複制資料的轉換;
e)管理服務,即用于管理 Integration Services 包的 Integration
Services 服務;
f)用于對 Integration Services 對象模型程式設計的應用程式接口
(API)。
<b> </b><b>二、SSIS</b><b>體系結構</b>
SSIS由四大部分組成:服務、對象模型、運作時和資料流。
下面這張大圖顯示了各部分之間的關系:
服務
在Configuration Manager中可以看到SSIS的服務:SQL Server
Integration Services。
提示:
1、設計和執行IS包不需要啟動該服務,可以使用 SQL
Server 導入和導出向導、SSIS 設計器、執行包實用工具以及 dtexec 指令提示實用工具運作包。
2、如果要通過SQL Server Management Studio監視包,則需要啟動該服務。
使用SSMS監視時,可以看到兩個頂級檔案夾:“正在運作的包”和“已存儲的包”。
在“正在運作的包”檔案夾下可以停止某個運作的包。
對象模型
對象模型包括用于通路 Integration Services 工具、指令行實用工具以及自定義應用程式的本機和托管應用程式程式設計接口 (API)。
工具介紹:
Business
Intelligence Development Studio(BIDS)
建立和調試包。
BIDS中的設計器
如下圖:
指令
dtexec:運作現有的包;
如執行包:dtexec /f "c:\pkgOne.dtsx"
dtutil:可以對包進行通路,複制、删除、移動和
簽名等;
如複制包:dtutil /FILE c:\myTestedPackage\package.dtsx /DestServer myserver
/COPY SQL;newpackage
運作時
包的運作時,為日志記錄、斷點、配置、連接配接和事務提供支援。
資料流
資料流任務封裝資料流引擎。資料流引擎提供将資料從源移動到目标的記憶體中的緩沖區,并且調用從檔案和關系資料庫中提取資料的源。
<b>三、典型用途</b>
合并來自異類資料存儲區的資料
合并存儲在不同資料存儲系統中的資料,提取這些資料合并到單個一緻的資料存儲系統中。
<b> </b>
填充資料倉庫和資料集市
資料倉庫和資料集市中的資料具有更新頻繁和加載量大的特點,SSIS專門提供了一個從平面檔案大容量加載到 SQL
Server的任務。
清除資料和資料标準化
Integration
Services 包含一些内置轉換,可将其添加到包中以清理資料和将資料标準化、更改資料的大小寫、将資料轉換為不同類型或格式或者根據表達式建立新列值。
将商業智能置入資料轉換過程
Services 提供了用于将商業智能置入 SSIS 包的容器、任務和轉換。
可能需要根據資料值對資料進行彙總、轉換和分發,SSIS
包中的邏輯可能需要執行以下類型的任務:
a)合并來自多個資料源的資料。
b)計算資料并應用資料轉換。
c)根據資料值将一個資料集拆分為多個資料集。
d)将不同的聚合應用到一個資料集的不同子集。
e)将資料的子集加載到不同目标或多個目标。
使管理功能和資料加載自動化
管理功能自動化,例如備份和還原資料庫等,可以使用 SQL Server 代理作業安排SSIS 包。
參考:ms-help://MS.SQLCC.v9/MS.SQLSVR.v9.zh-CHS/extran9/html/c4398655-5657-4ae4-a690-a380790fe84f.htm