天天看點

lzg_ad:在WES中添加語音識别功能

如果我們希望在WES作業系統中添加語音識别和語音朗讀功能,那麼我們需要關注以下元件:

Speech Control Panel:

添加該元件可以在控制面中添加語音控制圖示,我們可以通過這個功能來選擇或者配置Speech recognition(SR-語音識别)或者 text-to-speech engine(TTS-文本語音轉化引擎)。 這些設定取決與可選擇的語言,聲音輸出和聲音品質, 也包括可選擇的麥克風輸入。 在語音屬性中可以制定和更新使用者配置檔案。通過使用者配置檔案,使語音識别引擎能夠更好地認識到一個發言者的習慣和在一個特定的環境下的背景聲音。

Text To Speech Core:

該元件作為一個文本語音轉換的核心元件為文本語音轉換和語音識别提供了一個公共的、基礎的組成檔案。 因為任何系統以外的語音或講話都直接通路這些動态連結庫的情況是不可能的。

注意:SAPI的共同組成部分檔案無法直接測試。因為這些檔案需要的語音業務,而成功的測試功能需要包括相關講話來證明他們的存在和目前的狀态。

Speech API English Text To Speech Engine:

該元件包含一個裝置驅動程式,負責的文字轉換成語音。該動态連結庫( DLL )無法直接被應用程式所通路,但可以通過語音的API ( SAPI子產品)獲得。這一元件預設提供了微軟英文支援和至少包含一個英文的聲音。一般來說,每一種語言,都需要自己的DLL和支援檔案。此外,至少有一個朗讀聲音是需要為每種語言所必需的可用發音。制造商可以提供他們自己的語言格式,或符合現有的Microsoft模式。

Speech API English Text To Speech Voice (Sam):

該元件包含一個程式,輸入或儲存轉換的文字語言。通過該程式可以用語音描述文本。 Microsoft提供了一個預設的聲音-Microsoft Sam。可以從獨立的語音引擎制造商購買到更多的第三方廠商提供的聲音,并在安裝過程中加載到語音識别系統中。

Speech API Core:

該元件提供了基本的語音功能所提供的語音應用程式程式設計接口( SAPI子產品) 。sapi.dll檔案是元件的一個組成部分,需要依賴所有的語音功能元件。元件的其他檔案-sapisvr.exe,用于語音識别,該功能不能在作業系統初始安裝後安裝。

Speech Text Services v1.1:

該元件是一個是基于文本服務架構的API的Windows輸入服務。結合語音的API( SAPI子產品)和語音識别引擎,該元件提供聽寫和文字轉換語音服務。

Text Services Framework:

文字服務架構(TSF)的組成部分是一個元件對象模型(COM)為基礎的系統服務,它提供了一種簡單且可擴充的架構,以便提供先進的文本輸入和自然語言技術。TSF可以啟用在應用程式中或作為TSF文字服務啟動。TSF提供多國語言文字服務的支援,并提供文字服務,如鍵盤輸入服務,手寫識别和語音識别。

TSF是一個獨立于裝置的,語言中立,和可擴充的系統提供文字和語言的技術。TSF的應用程式可以使用任何文字服務來支援TSF。

下面的清單介紹了這部分的内容:

一個具有TSF的應用程式将會與文本服務架構互動。

TSF文字服務,提供了多種輸入編輯功能。文字服務控制軟鍵盤輸入,語音識别,文字轉換,和文本編輯。

作為TSF文字服務和啟用了TSF的應用程式之間的接口。除了從TSF文字服務響應輸入,TSF也回應改變的檔案,這将啟動更多的文字服務。

CUAS IME:

該元件允許以前版本的應用程式或文本服務架構不知道的控件免費的使用TSF。該元件還為所有的應用程式在桌面上提供了一個一緻的使用者界面。這部分還可以在任何應用程式上用于語音聽寫和手寫輸入的文字,例如記事本。

Accessibility Core:

該元件是一套元件對象模型(COM)界面和應用程式設計接口(API),用于提供了一個可靠的方式來表現和收集有關基于Windows的使用者界面(UI)元素。利用此資訊,可以查詢技術供應商用于使用者界面表現的替代格式,如語音、盲文、語音指揮和控制應用程式可以遠端操作的界面。

Windows Narrator (Screen Reader):

該元件為弱視使用者提供了文本語音轉換工具。朗讀文本内容顯示在使用者的螢幕上,例如,内容的活動視窗,菜單選項,并輸入文字的網頁。

該元件将能夠讀取記事本,寫字闆,控制台程式, Internet Explorer , Windows桌面和Windows安裝程式。在其他應用程式中,該元件可能無法正确地讀詞。

該元件允許通過使用者定制的方式閱讀螢幕的以下幾個方面内容:

在顯示新的視窗,菜單或快捷菜單可以朗讀。

鍵入的字元可以朗讀。

滑鼠指針可以按照項目在螢幕上的位置進行朗讀。

朗讀速度,音量,或音調可以更改。

輔助工具在Microsoft Windows XP的目的是提供一個最低限度的功能以供有特殊需要的使用者使用。

Microsoft Japanese IME Soft Keyboard Program:

微軟日語IME軟鍵盤擴充計劃的組成部分為微軟日語IME核心元件,允許使用者通過軟體鍵盤在螢幕上輸入字元。這一元件提供了以下軟體鍵盤。

字母, QUERTY鍵盤布局

字母數字,字母鍵盤布局

平假名/片假名,日本JIS鍵盤布局

平假名/片假名,拼音鍵盤布局

軟體鍵盤輸入号碼和日期

Utility Manager:

該實用程式管理器元件使使用者能夠檢查無障礙計劃中的狀态和啟動或停止的無障礙計劃程式。使用者管理者級通路權限可以通過管理器有計劃的啟動輔助工具。使用者還可以在Windows登入之前,或者在登入到計算機歡迎螢幕時,按下Windows徽标鍵+u啟動輔助程式。

開始時打開輔助工具管理器可以使用内置的輔助程式,像放大鏡,朗讀和螢幕鍵盤,叙述者,文字語音轉換程式。這使低視力使用者也能立即進入作業系統。

使用輔助工具管理器,使用者可以通知Windows在每次登入到他們的電腦時自動啟動無障礙程式,或當輔助工具管理器啟動鎖定他們的電腦桌面。例如,使用者可以指定自動啟動放大鏡程式在下一次登入到計算機上的時候。這不需要在每次使用者登入到計算機上按照标準步驟打開放大鏡。

Microsoft Japanese IME Speech Recognition Program:

Microsoft Japanese IME Character List/Stroke Count/Radical Programs:

微軟日語IME字元清單/筆畫數/基礎程式元件擴充了微軟日文輸入法編輯器( IME )核心元件,允許使用者輸入未知的漢字字元。這部分支援以下的功能:

字元清單程式,它允許使用者從一個清單中輸入一個字元。

筆畫數程式,它允許使用者使用指定其筆畫數輸入一個字元。

基礎程式,它允許使用者根據基礎字元輸入一個字元。

Microsoft Japanese IME Handwriting Program:

微軟日語IME手寫計劃的組成部分擴充了微軟日語IME核心元件,允許使用者通過滑鼠輸入日文文本或手寫筆。這部分采用日本的手寫識别部分承認手繪日語字元,并釋出了官方的字元輸入法。

    以上元件是WES中關于語音識别相關功能的元件,如果我們需要在我們的WES作業系統中添加語音功能,首先應該保證的是添加了以上的元件并進行了完整的關聯檢查。在以上元件說明中,我是以日文語言包來描述各個元件功能的,如果我們需要添加中文語音識别功能,則需要替換成相應的中文語言包。WES中預設帶的是英文的(Microsoft Sam),如果我們需要使用中文的,是必須在安裝WES的時候,把中文語言包支援勾選上的。

    另外,由于WES\XPE均是局部漢化,而不是像XPP那樣從核心開始漢化,是以對與中文語言的語音支援,可能不能像XPP那樣完善。但是我們可以通過下載下傳第三方的一些語音識别程式來達到一樣的功能效果。

本文轉自雷志剛 51CTO部落格,原文連結:http://blog.51cto.com/leizhigang/237745

繼續閱讀