天天看點

OSS資料處理最佳實踐--文檔預覽前言架構介紹文檔預覽實踐步驟4:實踐使用更多資料處理能力

前言

目前整個企業級資料管理市場面臨着數字化轉型,如何更好的管理資料、挖掘非結構化資料(專業文檔、視訊、圖像等)的價值是目前企業需要解決的問題。

阿裡雲存儲開放的資料湖體系引入衆多計算引擎。通過阿裡雲智能媒體管理産品,對象存儲OSS面向視訊處理應用,圖像處理應用,文檔處理應用開放了接入能力。目前通過智能媒體管理支援圖像識别、人臉檢測、視訊截幀、圖檔處理、文檔預覽、文字檢索等多項資料處理能力,為上層應用提供強有力的支援。

架構介紹

OSS資料處理最佳實踐--文檔預覽前言架構介紹文檔預覽實踐步驟4:實踐使用更多資料處理能力

阿裡雲OSS為在雲上的資料打通了一個處理與使用的快速通道。通過簡單的 RESTful 接口,可以在任何時間、任何地點、任何網際網路裝置上對存儲在OSS中的資料進行分析處理。

資料處理包含以下兩種:

  • 阿裡雲OSS原生處理服務

    阿裡雲OSS原生處理服務包括圖檔處理和視訊截幀,其中圖檔處理包括圖檔的縮略、剪裁、參數調節等, OSS原生處理服務無需開通,預設內建在OSS中,建立完Bucket後即可使用。産生的資料處理費用直接在OSS上結算。

  • 智能媒體管理服務

    阿裡雲OSS與智能媒體管理(IMM)深度結合,支援文檔預覽、文檔格式轉換、人臉識别、圖檔分析、二維碼識别等豐富的資料分析處理操作。

操作示例:當操作用于即時處理傳回結果時,可以采用GET方式觸發。參數在QueryString中傳遞。如:

http://image-demo.oss-cn-hangzhou.aliyuncs.com/example.jpg?x-oss-process=image/circle,r_100

(該請求是Public請求,無需簽名。部分操作必須通過進行簽名後才能進行操作。)

文檔預覽實踐

這裡實作OSS上面的文檔預覽來快速幫助大家體驗整個流程。目前的文檔預覽支援主要的office系列格式。

步驟1:開通相關産品

實作文檔預覽主要依賴于外部的智能媒體管理,将其作為插件接入到OSS進行使用。

  • 開通對象存儲OSS: 點選這裡
  • 開通智能媒體管理:
  • 開通智能媒體管理後,進入管理控制台,會彈窗提示授權 IMM 通路 OSS 的相關權限。這裡點選同意;
    OSS資料處理最佳實踐--文檔預覽前言架構介紹文檔預覽實踐步驟4:實踐使用更多資料處理能力

步驟2:建立 或進入OSS Bucket

在北京、杭州、上海、深圳區域選擇已有Bucket(智能媒體管理處理插件功能僅上述區域支援)。

如果還沒有Bucket,建立标準存儲類型即可:

OSS資料處理最佳實踐--文檔預覽前言架構介紹文檔預覽實踐步驟4:實踐使用更多資料處理能力

步驟3:綁定智能媒體管理

OSS資料處理最佳實踐--文檔預覽前言架構介紹文檔預覽實踐步驟4:實踐使用更多資料處理能力

進入 智能媒體 管理欄,如果是初次使用,可以點選 批量建立 按鈕,勾選 文檔預覽 選擇框。即綁定完成。

通過 批量建立 會幫助預設建立一個智能媒體管理項目,然後與該Bucket綁定。如果需要綁定現有的項目,或者解綁,可以點選綁定後的 設定 進行選擇調整。

步驟4:實踐使用

方式一:控制台直接檢視

OSS資料處理最佳實踐--文檔預覽前言架構介紹文檔預覽實踐步驟4:實踐使用更多資料處理能力

進入控制台 檔案管理 欄,點選任何office系列文檔即能立即線上預覽。

方式二:SDK方式調用

OSS資料處理最佳實踐--文檔預覽前言架構介紹文檔預覽實踐步驟4:實踐使用更多資料處理能力
  1. 用戶端向服務端發起預覽請求,并提供要預覽的檔案。
  2. 服務端根據請求檔案進行 URL 簽名,将簽名完成的 URL 提供給用戶端。
  3. 用戶端拿到簽名後直接通路 OSS 檢視檔案。

服務端簽名生成預覽URL的代碼如下:

# 建立存儲空間執行個體,所有檔案相關的方法都需要通過存儲空間執行個體來調用。
bucket = oss2.Bucket(oss2.Auth(access_key_id, access_key_secret), endpoint, bucket_name)
# 文檔預覽,擷取signURL。
process = 'imm/previewdoc,copy_1'
params = {}
params.update({bucket.PROCESS: process})
url = bucket.sign_url("GET", objectKey, 3600, params=params)
#列印結果
print url           

更多資料處理能力

更多資料處理,

點選檢視