連語法、關鍵詞都不一定看的出來了。
后來一次又一次地把每周獎勵替換成對小C的升級迭代,又融合了后來的語言反應智能模塊。
這下,蘇航是徹底看不懂了。
蘇航在手機上敲著一個語音小程序。
前兩天老媽和他抱怨,這個手機上的字太小了,一些軟件功能也不會用,說明的字體就更小了,每次都要瞇著眼睛才看得清。
蘇航手把手地把每一個常用軟件給老媽講清楚了,還把字體調大,但還是覺得不太保險。
蘇航撓撓頭。
發際線不知不覺上移中…
他只好從比較清楚的方向,語音識別來開展工作。
一開始他以為,語音識別也就那樣吧,應該不難。
不過就是自然語言的處理嘛。
其原理,也就是輸入聲波信號,并將其轉化為文本序列。
而輸入的時候,需要去噪聲。
蘇航之前再數學建模的時候就已經了解過所謂的去噪聲,那時董利老師還特地拿這個問題考了蘇航一下。
有的時候,這個步驟一不小心就跳過了。
聲波中的噪聲就更是格外明顯。
最容易認知到的就是環境噪聲,當然還有一些由于保真啊什么的導致噪聲干擾。
這個蘇航還是會的。
分幀、加窗、預加重、特征提取。
選擇特征參數,基音周期,共振峰,短時平均能量或幅度,線性預測系數,感知加權預測系數,短時平均過零率,線性預測倒譜系數,自相關函數,梅爾倒譜系數,小波變換系數,經驗模態分解系數,伽馬通濾波器系數…
蘇航寫寫畫畫,不得不說,數學真的好用,不愧是第一大理科學類。
數學就像是退而織網一樣,不去想這網有什么用,就慢慢地、自顧自地發展著,等到那一天,漁夫(物理學家等科學家)突然發現這網太好用了,以前想都不敢想的大魚,也可以輕松捕獲,才開始感慨那些看似沒用的數學。
比如黎曼幾何,在數十年后的廣義相對論才體現出它驚人的價值。
以前,數理不分家,漁夫要撈什么樣的魚,就得自己去織網。
而現在,數學似乎和物理分成了兩門學科。
但是實際上,數學卻依舊為所有的學課提供著最有力的工具。
蘇航最初以數學作為突破口,也是存了這樣的心思。
高屋建瓴、居高臨下地從數學入手,對其它專業各個擊破。
把握重點論,抓住主要矛盾,何愁大業不興。
蘇航很快就準備好了信號處理和特征提取。
當然離不開小C的幫忙。
接下來就是測試語音訓練和利用歐氏距離、協方差矩陣、貝葉斯距離來進行失真判決。
通常來說,語音識別技術可以分為三類。
模型匹配、概率統計、辨別器分類。
蘇航選擇的是神經網絡的方法,屬于辨別器分類方法之一。
基于循環神經網絡和長短時記憶模塊進行建模。
循環神經網絡在深度神經網絡的隱層上增加了一個反饋連接,這讓它更加適合用在時序信號的建模上,還有一定的記憶功能,也即可以根據上下文語境來做出判斷和決策。
引入長短時記憶模塊則是為了解決傳統簡單RNN梯度消失等問題。
不過蘇航發現一個問題。
爸媽說話并不算是特別標準的普通話,方言、口音混雜,這也就意味著自己要么自己輸入訓練數據,要么就得找相關公司、領域研究所的數據庫來訓練。
而且訓練數據不一定準確夠用。
比如自己輸入,就這放假七天,就算爸媽一刻不停的說話,連續24小時也沒用啊。
不夠多,最后形成的模型就不夠精確。
更重要的是,這也不足以實現之前的目標。
自己做出來的也只是一個類似于市面上的語音助手,甚至還不如他們的。
所以,蘇航停下筆。
要不花一筆積分吧。
分出一個小小C來?
那這可不就有了一個超智能助手了?
而且,小C強大的學習能力是它最大的優勢。
這讓小C可以不需要預先投喂大量的數據,而是一邊使用,一邊學習改進。
自適應,這才是小C最大的優勢。
而且,有小C跟著爸媽,蘇航也放心一些。
現在網絡詐騙、推銷騙子這么多,蘇航覺得有必要防范一下。
一般的手機助手可能識別不了詐騙,但是小C可以啊。
這就給小C再開一個域名,就開那個法律文書網。
讓小C好好學一學法律規范。
再輸入一些防詐騙手冊和案例教學。
這何愁會被騙啊。
小C的未來不可限量啊,不過得找個時間給它換個載體了。
這臺移動工作站時不時的發燒,蘇航還真擔心哪天就給燒壞了。
說干就干。
蘇航呼出了系統界面。
此時積分已經相當的富余了,畢竟蘇航近期沒有怎么花過積分。
詢問系統,答復果然是肯定的。
而且和以往一樣,允許使用每周獎勵機會來替代部分積分。
蘇航毫不猶豫地用獎勵做了替換。
這周要回家,根本沒怎么好好學習,換來的獎勵說不定又是那種很菜的。
這樣的話,其實就相當于把每周獎勵換成了自己想要的東西。
而且可以用積分來加強。
花在爸媽身上的東西,蘇航果斷地用積分強化了一波。
結果得到的居然是!
加個語音助手吧。
雖然現在手機上也也有一些人工智障,但那個根本滿足不了使用要求。
沒有注釋的源代碼,這就是天書啊。
而且當初小C是以多種語言及其編譯器作為藍本,交由系統和積分進行完善組成的。
之前就嘗試過解析小C,結果很不理想。
在家的日子好無聊。
所以蘇航就參照著小C的語言功能,打算自己弄一個出來。
最起碼的要求是,可以識別語音和他們這的方言,然后在手機里查找到相應的功能。
好在蘇航把小C帶了回來,不然全靠自己弄,那可就難敲代碼了。
蘇航甚至難以理解小C的一些基本代碼原理。
更重要的是,沒有注釋,沒有注釋,沒有注釋。
重要的事情說三遍。
再進一步,那就是根據使用者的要求,來完成使用者想要達成的目標。
所以,蘇航就開始自己弄咯。
而且,小C已經和這臺電腦的操作系統深度綁定,但是從系統界面來看,它又可以隨時剝離,且適配任何系統,只要硬件符合要求。
這就很神奇。
其實小C就足以完成大部分的功能,要是可以分出一個小小C來就好了。
不需要太多的智能,只要語音識別和文檔生成與分析就行了。
進一步就是可以讀出軟件的一些說明,以及解釋一些功能,并做出一些風險性的判斷。
學習使我富裕最新內容記住老\幺\小\說\網w\w\w。l\a\o\y\a\o。\o\r\g