前言
目前整個企業級資料管理市場面臨着數字化轉型,如何更好的管理資料、挖掘非結構化資料(專業文檔、視訊、圖像等)的價值是目前企業需要解決的問題。
阿裡雲存儲開放的資料湖體系引入衆多計算引擎。通過阿裡雲智能媒體管理産品,對象存儲OSS面向視訊處理應用,圖像處理應用,文檔處理應用開放了接入能力。目前通過智能媒體管理支援圖像識别、人臉檢測、視訊截幀、圖檔處理、文檔預覽、文字檢索等多項資料處理能力,為上層應用提供強有力的支援。
架構介紹
![](https://img.laitimes.com/img/__Qf2AjLwojIjJCLyojI0JCLicWZwpmL0MjYzYjN5Y2N0EjN3U2NjFjYkBTY3QWZxY2N0gTYmdTZhZTN3QDN58CXt92Yu4GZjlGbh5SZslmZxl3Lc9CX6MHc0RHaiojIsJye.jpeg)
阿裡雲OSS為在雲上的資料打通了一個處理與使用的快速通道。通過簡單的 RESTful 接口,可以在任何時間、任何地點、任何網際網路裝置上對存儲在OSS中的資料進行分析處理。
資料處理包含以下兩種:
-
阿裡雲OSS原生處理服務
阿裡雲OSS原生處理服務包括圖檔處理和視訊截幀,其中圖檔處理包括圖檔的縮略、剪裁、參數調節等, OSS原生處理服務無需開通,預設內建在OSS中,建立完Bucket後即可使用。産生的資料處理費用直接在OSS上結算。
-
智能媒體管理服務
阿裡雲OSS與智能媒體管理(IMM)深度結合,支援文檔預覽、文檔格式轉換、人臉識别、圖檔分析、二維碼識别等豐富的資料分析處理操作。
操作示例:當操作用于即時處理傳回結果時,可以采用GET方式觸發。參數在QueryString中傳遞。如:
http://image-demo.oss-cn-hangzhou.aliyuncs.com/example.jpg?x-oss-process=image/circle,r_100(該請求是Public請求,無需簽名。部分操作必須通過進行簽名後才能進行操作。)
文檔預覽實踐
這裡實作OSS上面的文檔預覽來快速幫助大家體驗整個流程。目前的文檔預覽支援主要的office系列格式。
步驟1:開通相關産品
實作文檔預覽主要依賴于外部的智能媒體管理,将其作為插件接入到OSS進行使用。
- 開通對象存儲OSS: 點選這裡
- 開通智能媒體管理:
- 開通智能媒體管理後,進入管理控制台,會彈窗提示授權 IMM 通路 OSS 的相關權限。這裡點選同意;
OSS資料處理最佳實踐--文檔預覽前言架構介紹文檔預覽實踐步驟4:實踐使用更多資料處理能力
步驟2:建立 或進入OSS Bucket
在北京、杭州、上海、深圳區域選擇已有Bucket(智能媒體管理處理插件功能僅上述區域支援)。
如果還沒有Bucket,建立标準存儲類型即可:
步驟3:綁定智能媒體管理
進入 智能媒體 管理欄,如果是初次使用,可以點選 批量建立 按鈕,勾選 文檔預覽 選擇框。即綁定完成。
通過 批量建立 會幫助預設建立一個智能媒體管理項目,然後與該Bucket綁定。如果需要綁定現有的項目,或者解綁,可以點選綁定後的 設定 進行選擇調整。
步驟4:實踐使用
方式一:控制台直接檢視
進入控制台 檔案管理 欄,點選任何office系列文檔即能立即線上預覽。
方式二:SDK方式調用
- 用戶端向服務端發起預覽請求,并提供要預覽的檔案。
- 服務端根據請求檔案進行 URL 簽名,将簽名完成的 URL 提供給用戶端。
- 用戶端拿到簽名後直接通路 OSS 檢視檔案。
服務端簽名生成預覽URL的代碼如下:
# 建立存儲空間執行個體,所有檔案相關的方法都需要通過存儲空間執行個體來調用。
bucket = oss2.Bucket(oss2.Auth(access_key_id, access_key_secret), endpoint, bucket_name)
# 文檔預覽,擷取signURL。
process = 'imm/previewdoc,copy_1'
params = {}
params.update({bucket.PROCESS: process})
url = bucket.sign_url("GET", objectKey, 3600, params=params)
#列印結果
print url
更多資料處理能力
更多資料處理,
點選檢視