飛書妙記語音轉文字功能非常好用,整理錄音稿的利器。但是,有一個小問題,如果是對話式的錄音,内容是這樣:
裡面有說話人1、說話人2的自動标注。
如果我們隻想要說話人的全部内容,該怎麼辦呢?
如果錄音稿不長,可以手工一段段複制。但是如果是幾十頁的文檔,那可要累死人了。
AI時代,遇事不決問ChatGPT。可以讓chatgpt編一段代碼來完成這件簡單重複的事。
提示語如下:
電腦d盤有一個名為speech的TXT格式文檔,文檔裡面是一篇錄音轉文字的稿件,稿件部分内容如下:XXX
寫一段Python程式,把“說話人 1 ”的全部内容提取出來。具體實作步驟如下:
讀取電腦d盤中的文檔:speech.txt;
把“說話人 1 ”的全部内容提取出來;
将提取的内容儲存在d盤的speechfinish.txt的TXT文檔中
複制這段Python代碼到Visual Studio Code,執行,但是遇到錯誤
複制錯誤代碼丢給GPT4
告訴我是檔案編碼導緻的。之前我儲存的speech.txt是ansi編碼的,于是我把speech.txt打開,另存為utf8編碼的
重新運作程式,大功告成!
整理好後的文檔如下:
然後把這個程式打包成一個exe檔案:
以後再要處理這樣的文本,點選打開exe檔案就可以了,非常友善。
詳細的源代碼和打包好的exe可以在GitHub上檢視:https://github.com/anfushuang/feishumiaojiTXT