Hōo電腦聽台灣話、講台灣話 ——電腦有luā巧主講/薛丞宏    
整理/黃悅綺


話頭


6--月台語sa攏有講座邀請意傳有限公司科技技術長薛丞宏來主講。三年前設立意傳公司,一開始lóng是接case,時間khah充分,ē做一寡電腦技術,譬如台語ê辨識、合成、翻譯、漢羅轉換,後--來想beh做一寡一般民眾需要ê mi̍h件,親像「輸入法」。Beh按怎透過「語音合成」kap「語音辨識」兩項技術,hōo電腦看台文、講台灣話、聽有台灣話--leh?

語料ê收集


八年前薛丞宏iáu leh讀資工系hit時,想beh做台語ê語音技術,m̄-koh hit-tsūn無台語語料、台語合成模型相關ê資源,tsiah促成後--來ê「媠聲 Suí-siann」計畫。

語料ê收集有兩種方式,ē-sái照錄音稿唸或者是收集自然對話。若照錄音稿錄,ē-tàng收著仝一个人ê聲音檔,後尾ê khang-khuè khah省工,m̄免聽拍一句一句寫幼稿,所以採用頭一个方法,請王秀容老師做發音人。

若beh錄音ê資料有齊全,例句ài有聲調、構詞、句法相關ê語言現象在內,人工校對ê時tsūn ài記hōo正確,kā khah多元ê語言現象lóng整理hōo電腦聽。親像leh教囡仔講話,電腦聽愈濟mā ē愈厲害。


語音合成kap語音辨識


合成ê技術有三種:「接--ê、語音學分析音kuân kap頻譜、End-to-End(『端對端』)」。「接--ê」就是kā語詞錄音檔囥做伙;啊若「語音學分析音kuân kap頻譜」,就是用電腦統計音ê kuân度,tsit个技術mā是現此時tī「iTaigi 愛台語」網站聽--著ê聲音。頭前兩項技術雖然效果bē-bái,m̄-koh iáu有欠點,tsit三種技術mā ē-sái lām leh使用,hōo電腦講話koh-khah接近人ê聲音。

用語音學分析ê方式做語音合成,tio̍h-ài先買語料kap處理語料ê程式,頭前ê準備真費工夫。Koh來,kā整理好ê資料tàn入去有顯示卡ê主機,hōo open source內底ê Kaldi軟體走兩禮拜,訓練電腦就好勢--ah。Kā影片傳--起-去,走出粗坯ê結果,tsiah-koh人工修改。透過語音學分析,ē-tàng kā sio倚ê詞揣--出-來,tī辭典、語言模型內底揀上有可能ê答案。

Tsit項技術ē-sái應用tī LINE機器人,hōo伊thang分析lán傳--起-去ê錄音檔,tsiah-koh走出羅馬字、漢字kap華文翻譯;若拍台文--入-去,伊mā ē-tàng讀hōo你聽。

M̄-koh LINE機器人寄錄音檔ê方式,因為技術ê限制,時間ē拖khah長,ài先傳音檔去電腦規句分析了,tsiah-koh回傳,無法度親像google語音辨識,ē-tàng先「偷聽」頭前leh講啥。Tsit-má gún先做出簡單ê demo,因為使用者ê需求lóng真無仝款,suà--來看使用者koh有啥mih需求,gún tsiah沓沓仔調整,做一項逐家lóng tsiok想beh使用ê mi̍h件出--來,mā ǹg望透過tsia-ê技術來幫贊台語ê推廣。

(若beh聽khah詳細,請參考講座影片 
https://www.youtube.com/watch?v=-DVFid2XC84)


#台語sa攏有 專欄,本文使用教育部推薦漢字kap臺灣閩南語羅馬字拼音方案。
台文通訊BONG報316期,2020年7月出刊。


歡迎捐款贊助 #李江却台語文教基金會 (捐款thang抵稅,匯款了後請通知02-23112199)
線上捐款(定期定額) https://ppt.cc/fF5bhx
線上捐款(單筆) https://ppt.cc/fcycox


郵政劃撥:19021486
戶名:財團法人李江却台語文教基金會

電匯:123-20-050514-2
華南銀行士林分行活儲
戶名:財團法人李江却台語文教基金會

李江却台語文教基金會需要你ê定期捐款,逐個月捐助NT$200以上,lán做伙來推動復振台灣語文ê事工,歡迎利用劃撥、電匯、信用卡、郵局『存簿儲金自動轉帳』扣款iah是線頂捐款、現金贊助。

◎逐個月贊助本會(台文通訊BONG報發行單位)NT$200(iah是逐冬NT$2,400)以上,做伙支持基金會事工kap雜誌編印發行費用。歡迎利用郵局劃撥、信用卡(寫捐款單)、線頂捐款、現金贊助、銀行/ATM轉帳(轉帳了後請通知)、支票、郵局戶頭自動轉帳扣繳(寫授權書),捐款收據ē-tàng做『列舉扣除額』抵稅ê用途。