(智能學習示範影片)

其他超自然輸入法示範

 


團隊介紹

  我是一個獨立工程師,談不上團隊。因此,從最基本的打字、建立詞庫、校對所有相關資料庫、撰寫程式、演算法設計、介面設計都由我自己一個人完成。這個時間很漫長,長達十幾年。
  個人研究語言學大概是從國中時期看喬姆斯基的「深層語法」開始的,接著逐漸接觸到所謂的「漢語文法、中文文法」等書籍,最後接觸到最新的語義學知識等等。個人從事中文語義研究與文言古籍的語義考證,長達十幾年,主要著作是《孫子兵法論正》。並有一個專門介紹中國兵法的網站「策略研究中心(www.cos.url.tw)」,其中收藏了世界最多的中國兵法電子書,而這些電子書多數都是我一個字一個字內建而成,並經過數次校對的成果。
  對於語言學的興趣來源於我對人工智慧的興趣。人工智慧也是二十幾年來少數我從未間斷研究的課題。

電影:超驗駭客
 



  人工智慧研究的範圍很廣,一句話來概括這個領域的目的,就是要製造出能像人一樣思考的「程式」。由於手持式裝置如平板、智慧手機的輸入鍵盤與使用方式不像桌上型電腦一樣便利,通常的情況下人們無法動用雙手進行輸入的動作。因此,在這些裝置上,更講究輸入法的「預測」功能。那麼人是如何把想法轉變成文字、語言本身有哪些規律(牽涉到人如何對語言進行利用與解碼),便是一個高明的預測型輸入法需要理解的知識。而這些,也屬於人工智慧研究的範圍。

時間就是金錢

  1991年,我還在念國中,由於那時家裡有一台XT電腦。因此地理老師常常委託我幫她出一些題目來考同學,譬如東北有哪三寶?山東煙台出產什麼?之類的。(至今記憶猶新)說穿了本質上更像是打字任務。由於當時沒受過任何打字訓練,因此只會使用單手打字。因此,整個打字過程非常漫長,常常從吃過晚飯後打到深夜,由於當時正值冬季,常常打到手腳冰冷。雖然我總是把任務完成,不過有了那些夜晚的痛苦經驗之後,我深刻感到一個糟糕的輸入法是如何的消耗我的生命與時間,因此從那時起我便決定研發自己的輸入法。
  後來,我便利用假日的時間,開始把字典中的字一個字一個字的謄寫在自製的表格上。那個表格上面每一行有十幾個格子,每個格子放著我分解每個漢字的部件。就這樣,一直進行到了一千多字後,我便發覺這個方法不可行。但苦於當時的電腦技術等問題,因此,我便暫停了這個工作。
  我當時是打算研發一個新的、類似倉頡這種拆形的輸入法,而不是在「注音輸入法」上進行改良。但在那個連書局都不一定找得到電腦程式書籍的年代,對於一個國中生而言,這個計畫是有點大了。
  雖然,我暫停了研發的工作。但研發自己的輸入法的想法始終沒有斷過,相關的資料與想法也從那時起開始累積、深化。22年,很快就過去了。人生雖然沒有多少成就,但在2013年,我終於利用了自己多年來累積的想法與資料,開發出了自己的輸入法。其中一個輸入法,就是在「注音輸入法」的基礎上,進行改良的成果。也就是這個被我稱為「超自然輸入法」的輸入法。
 



  在智慧手機與平板盛行之前,人們對於手機上的鍵盤與輸入法已經有一些依賴性。可以說,「輸入法」是不少人(尤其在台灣)在換手機時一個考量的重點。這幾年平板與智慧手機大爆發,間接或直接改變了人們的很多習慣。由於通訊軟體、臉書、微薄、搜索引擎、備忘錄、電子書(可註解),一下子全出現在了智慧手機與平板的系統裡面,因此輸入法的重要性被提高到了前所未有的地步。由於輸入法的使用頻率被一下子拉高了,因此即便是使用拼音文字(如英文)的國家也開始重視起如何在平板與智慧手機上節省輸入時間的問題。因此,SwiftKey之類的預測型輸入法開始出現並盛行。而中文世界,由於中文資訊處理技術存在許多難點,因此一個有效率、能真正大幅節省人們寶貴生命的預測型輸入法始終沒有出現。
  所謂「預測型輸入法」是指使用者不用完全輸入完整的注音碼(或其他如倉頡碼),它便能成功預測出使用者想要輸入的下一個詞彙甚至句子的輸入法。因此可以說,它是一種「信息不完整」的輸入法,而有別於我們一般在桌上型電腦雙手使用的「信息完整」的輸入法(如雅虎輸入法),也就是使用者必須提供完整的注音碼,它才能幫使用者判斷出正確文字的輸入法。

感覺通常只是幻覺

  在以前,很多人睡覺時突然想到一些想法,需要記載下來,可能會想要打開桌上型電腦或筆記型電腦,加以記錄。但有了平板或智慧手機之後,很多人開始覺得這些新科技產品的開機速度比較快、方便,因此開始用平板或智慧手機承接了以前桌上型、筆記型電腦的部分任務。
  但在不使用語音備忘錄、語音辨識或語音辨識功能糟糕的情況下,使用者真的能比較快達到記錄自己思想的目的嗎?答案是悲觀的。只是通常人們會受到表象的迷惑,於是以為用平板與智慧手機來記錄會比較快。但事實上,只要真正的記錄一下打字時間,我們就能知道,在任何情況下,我們使用平板或智慧手機來做打字輸入的工作,都是非常耗時、沒有效率的事情。但通常這些手持式裝置又是我們在搭乘捷運或者一些交通工具等零散時間時,最有可能使用的科技產品。因此,打字輸入不該成為使用它們記錄思想的障礙。
  可惜,一般人並沒有更多的選擇。而寶貴的生命,也就在使用者辛苦的輸入文字時,無情的流逝了。
就我個人的經驗而言,在電腦上一分鐘可以打出一百多個字,但要在平板、智慧手機上使用標準配備的輸入法打出同樣多的字,要耗費多達十幾倍甚至數十倍以上的時間。
  面對這樣的困境,一般的使用者除了購買一些第三方輸入法之外,就只有使用語音記錄、語音辨識等功能,用手寫的一般都會比打字輸入慢,就算快,也不可能快到哪去。且語音辨識目前的精準度還不高,使用者反覆在上面做修改的時間,不一定真的比較省。通常的情況是,你感覺比較快了,但事實上並沒有。感覺常常只是幻覺,就好像我們走熟悉的路回家感覺會比較快一樣,但那一條路往往並不一定是最短的路徑。
  當前一般使用者面對的這個困境,也不是使用者苦練輸入法就能完善解決,或者使用者外接了一個鍵盤就能妥善解決的。因為畢竟平板與智慧手機之所以原本就沒裝上鍵盤,有它們的理由,而它們也確實活得不錯。這表示沒裝上鍵盤不會減弱它們對人們的吸引力。因此,最後一個解決使用者在平板與智慧手機上所面臨的輸入困境的方法,只有一個:一個智慧的預測型輸入法。

輸入法效率比較

  我們怎麼客觀的度量我們在輸入法上所耗費的時間,以及我們花錢買了第三方輸入法後又能節省多少時間呢?如果僅是用一句話(一串文字)的輸入時間來衡量,其實每一個人的輸入速度都不太相同,很難有一個客觀的比較基礎。我們曾經就許多句子,對一些在智慧手機上苦練倉頡輸入法的人進行度量,譬如「今天跟朋友一起去某個地方吃飯」這句話,對於一個熟練的倉頡使用者,他把手機放在桌子上用雙手打,24秒便能完成。而讓一個習慣用注音輸入法的人打同樣的一句話,卻要35秒左右。感覺上,倉頡很快,但事實上,倉頡使用者平均比一般使用頻率預測型輸入法的注音使用者多按下了1.4倍的按鍵。也就是說,如果以同樣的速度來打注音,注音使用者可以比倉頡使用者快1.4倍。(因為選單介面都是相同的,因此其他因素造成的差異可以忽略不計。)



  顯然,如果我們只是隨便拍了一部影片就企圖告訴使用者,我們的輸入法很快,能幫使用者節省三分之二或更多的生命,那是不客觀也不太負責任的作法。因此,我們也知道輸入中文所用的「按鍵數」,是最客觀、最容易度量與轉換成時間、效率的數值。此外,使用者在選擇答案時的落點距離,也是一個可以用來度量輸入法預測準確度的數值。
  以一個人一天打100個字為例,平均打出每個字如果需要三個鍵(輸入注音符號+選擇鍵、翻頁鍵)。打一百個字需要付出三百個鍵的勞力。如果按一個鍵平均需要2秒來計算,整個過程就要六百秒,相當於10分鐘。按照一般的實際使用狀況,使用者在平板或智慧手機上輸入一百個字,絕大多數都超過10鐘。換句話說,按一個鍵可能需時2秒以上。
  以下以市佔率最高的兩款智慧手機與平板廠商內建的輸入法以及超自然輸入法,在十個句子中的實際表現為例,來說明其中的差異性。由於三星、蘋果內建的輸入法都具備一些簡單的頻率調整功能,因此,可能每一個使用者得出的數據會有一些些的差距。此外,超自然輸入法本身具備「自動學習」的智慧功能,因此,學習前(超一)與學習後(超二)的表現並不相同,我們也一併列出當做比較。


 

句子

字數

谷歌

三星

蘋果

超一

超二

今天就是我餘生開始的第一天

13

22

31

32

17

9

葉問要打十個

6

13

15

15

16

9

沒有遺憾的人生多無趣

10

16

24

23

17

6

所以我留下了一個空位

10

18

24

25

14

9

沒想到還能見到妳

8

13

21

15

12

8

要不要一起去看電影

9

15

18

17

11

7

我們不能再錯過

7

11

15

15

9

4

幸福是我對你的承諾

9

17

18

22

17

11

我們結婚吧

5

8

12

12

11

4

我是東尼史塔克

7

13

19

23

16

14

總和

84

146

197

199

140

81

/中文

 

1.738

2.345

2.369

1.666

0.964

 


  從這個表可見,蘋果輸入法與超自然輸入法在按鍵的比例上,硬是多了一倍多,達2.457倍。(不計介面的影響,僅以按鍵數來換算成時間。)谷歌的注音輸入法是其中表現比較好的一個,很接近超自然輸入法了。但這是排除了注音首字輸入錯誤修正、反覆嘗試的按鍵數的較優結果。以谷歌的效率而言,還是相當於超自然輸入法的1.8倍。而超自然輸入法本身是內建很多常用句式的,也就是說,使用者一開始使用超自然輸入法時,超自然輸入法已經經過了一些常見句式的訓練了。換句話說,多數的句子會達到接近0.964的水平。
  全世界有接近48.6%的繁體中文使用者,每天使用的都是三星與蘋果的平板或智慧手機。如果他們能換成使用超自然輸入法來完成中文輸入的任務。那麼以下是一個簡單的算數問題:
  假設每人每天在這些裝置上,平均花十分鐘的時間做輸入的動作。那麼:
  一個人使用超自然輸入法一天,可以省「五」分鐘。
  一個人使用超自然輸入法一百天,可以省「五百」分鐘。
  一萬個人使用超自然輸入法一天,全世界就可以節省「五萬」分鐘。
  十萬個人使用超自然輸入法一天,全世界就可以節省「五十萬」分鐘。
  一百萬個人使用超自然輸入法一天,全世界就可以節省「五百萬」分鐘。

電影:鐘點戰
 

  改變看似微小,卻很像涓滴細流最終匯聚成大海一樣。使用的人越多,節省的能源(平板、手機電源)與生命便越龐大,它存在的價值也就越大。而這些時間,我們既可以用來做其他更有意義的事情,也可以用來對世界製造出更多的貢獻。
  我們現在說的並不是「願景」,談論的也不是「理論」。我們現在已經實作了核心的部分,並經過了廣泛的測試與驗證,剩下的工作就是移植到平板與智慧手機的平台上。

第三方輸入法值得購買嗎?

  超自然輸入法的售價相比於其他市面上的第三方輸入法還要昂貴一點點,但事實上,那只是六杯咖啡左右的價值。只要使用者願意用六杯咖啡的代價換幾年裡省下的無數能源、時間、生命,那麼很顯然這是值得去做的事情。

 

  如果使用者覺得這樣不值得,我們也會推薦使用者換用谷歌的注音輸入法,因為至少那是目前經過實測後,市面上最快的輸入法,也是表現最好的輸入法,即便它也有需要正確使用注音首字輸入的問題,但注音首字輸入的問題普遍存在於其他第三方輸入法之中。因此,只是站在環境保護的立場,即便讀者對超自然輸入法不感興趣,我們也推薦各位使用谷歌的注音輸入法。
  以大陸近來對於第三方輸入法的下載統計數據來看,排第一的搜狗輸入法下載數達3700萬次以上。即便經過實測,它的平均值落在2.0左右,與蘋果、三星的差距不大。但僅僅是這0.3%左右的差距,在一個巨量使用的加乘下,它所製造出的價值,已經非常之大。
3700萬*0.3=1110萬。也就是說,這些使用者每天只要輸入一個中文字,全部加總起來就節省了1110萬個按鍵數與能量、時間、生命,那可以減少多少空氣污染呢?而超自然輸入法與其他輸入法的差距遠遠大於0.3,並且是用倍數來計算的。

超自然輸入法

  超自然輸入法,著重於「預測」技術的研發。也就是根據文本存在的語言規則、使用者使用的個人經驗、特點,來進行「預測」。也就是使用者輸入了任一注音符號,它便能根據頻率與語法規則、使用者個人習慣來進行預測。
  對於一句陌生的句子,它只要學習一次,就能自動類推到其他的例子上。因此,即便使用者輸入了一句不存在於資料庫中的句式,它也能在學習一次之後,舉一反三。那麼當使用者下次輸入一句完全相同的句子時,固然能節省很多的時間,即使輸入的是內容不同但形式相同的句子,它也能用學習過後的效果來讓使用者更快的完成輸入的工作。譬如:程式學了「我很高興」這一句,使用者下次再輸入時,不僅這一句的用鍵數會更少,甚至所有相關的句子,譬如「小明很高興、你們很興奮」之類的,都會達到近似、同樣的效果,而不需要再學習一次。
  在超自然輸入法的介面上,它也對選單的數量進行了調整。背後的理由是,如果在使用者可見的視域裡增加五個選項,就能讓使用者平均少打0.1個鍵,為什麼不做?而事實上,超自然輸入法的預測準確落點平均停留在五以下。這也就是說,即便我們仍然只提供十個選項的第一時間可視選單,還是能達到相同的功效。

  以下是一個簡單的介面示意圖,最終的結果會與這張草圖有些差距。但保留一些「細節」上的設計,希望最後能給使用者一點點驚喜。


超自然輸入法平板、手機介面草稿

  其中半透明選單區的使用,主要就是為了一次提供使用者更多的選項選擇,以節省使用者按鍵的頻率。而透明程度為可調整狀態。半透明也能讓使用者不致於完全看不到背後的文字。
  輸入區,則類似常見輸入法的輸入區,目的在於讓使用者不用瞻前顧後,可以輸入長句後再輸出。如此一來,使用者可以更快的、更有效率的完成一個完整句子的輸入。(而眼睛的目光不需要移來移去)
  觸控鍵盤區,不會有太大的變化。以盡量讓使用者不需要再熟悉一個新的鍵盤排列方式為訴求。

  依照我心中的理想狀態,目前的「超自然」,只完成到大概75%左右,在經過學習後,平均0.964個鍵可以輸出一個中文。而我們希望使用者拿到手時,超自然輸入法已經經過了學習的過程,也希望它至少要能達到平均少於一鍵的取碼數,來幫使用者達到快速輸入中文的目的。目前,我們還在持續的做測試與增加預測規則之中,希望最終的結果還能超越0.964的平均值。

為什麼來募資平台

  我對於人工智慧與中文資訊處理的熱情,似乎是與生俱來的。因此,多數時候,我都是在沒有任何資源的情況下進行研究。
  早在「超自然輸入法」以前,我曾研發過「校對軟體」。也就是用來幫使用者校對文字並自動改正的軟體。即便這套軟體找出錯誤的機率,只停留在平均65%左右,但由於它能幫使用者自動修正錯誤,從而把原本使用者需要花費十五天時間或以小時算二三十個小時才能完成的工作,壓縮在30分鐘以內完成。
  但這樣的效果,卻無法在類似出版界的編輯群裡,得到普遍的認可。在我接觸到的少數人群裡,反應都很冷淡。這原因當然可以很複雜,但也確實讓一般的使用者感到不可思議。總之,這樣的樣本數太少,不足以反應一個實際的狀況。
  募資平台有很多的讀者,我們相信這裡的讀者僅就「量」而言,能提供我們一些更寶貴與客觀的意見。並且在「超自然輸入法」還沒在平板與智慧手機平台誕生前,讓更多的人有機會認識到它,並最終成為它的使用者。畢竟,一個好的科技產品,如果沒有使用者,那麼它便不能展開它自己的生命歷程,它便喪失了它存在的意義與價值。

電影:鋼鐵人3
 

  其實我並不是一個喜歡單打獨鬥的人,只是過往的經歷與背景都與我所研究的「任何領域」的人欠缺交集。加上好的合作夥伴原本就不好找(認為這樣的產品沒市場)、個人的資源也非常欠缺,理論又過於先進甚至簡單(以至於聽到的人都覺得不可行)。因此,我最終被迫只能走獨立研發的路徑。
  但我所研究的領域,它所牽涉到的技術其實非常複雜,它所面對的「數據量」也總是大到超出一個人所能負擔的範圍。因此,這些研究其實需要很大的資金的投入與資助。在當前的中文資訊處理領域裡,還有很多難點需要克服。我們相信很多需求不是不存在,而是使用者聽信了許多專家的意見,而認為這樣的技術「不可能」出現,最終放棄了期待,最終讓自己的許多工作停留在十幾年前電腦剛普及時的水準。
  但,我們可以保證,改變正要來臨。技術不是問題。
  是的,我們需要更多的資源,甚至尋找潛在的合作夥伴。因此,我們來到了募資平台。

資金運用

  關於資金的運用方式,我們將提撥三分之一的費用,來繼續豐富與完善我們的詞庫與知識庫。
其他資金將主要用來製作Android 版第三方輸入法與相關網站的建置。至於往後的維護費以及其他費用則必須依靠它實際的營收來支持。至於IOS版的,由於蘋果有審核機制的關卡,因此沒人可以保證一定能履行。且蘋果不接受第三方輸入法,  因此,對於蘋果的支持者,我們只能暫時說抱歉。
  Android 版第三方輸入法目前只打算支援Android 3.0以上的版本。

回饋內容


  100元,無償贊助。感謝您的支持與贊助,讓我距離夢想更近了一步。
  350元,一年內輸入法免費升級。
  750元,輸入法永久免費升級。
  3375元,五個人團體優惠,輸入法永久免費升級。(相當於9折)
  6000元,十個人團體優惠,輸入法永久免費升級。(相當於8折)

  估計於2014年4月27日,使用者可以取得帳號,以及相關的操作說明書。並預計於2014年5月4號(母親節)當天,讓資助者可以下載「超自然輸入法」。

感謝

  在輸入法的「感謝名單」上放上資助者的大名。

臉書平台

  「中文魔方」是一間致力於發展人工智慧的企業。
  創作人工智慧是我從小的夢想,也是我始終堅定不移的信念。
2012年,我用我所開發的簡易的半自動校對軟體的原型(https://www.youtube.com/watch?v=BM6cv_vzsGc),找到了一筆小資金,因此創辦了「中文魔方」。
  公司的宗旨在於,研發一些能節省人類生命、能改變世界的科技產品。但由於資金與能力的限制,我們暫時會以軟體開發為主要方向。
  目前的研發方向與焦點,也集中在非常匱乏的中文資訊處理等相關產品上。因此,輸入法(中文、英文)、自動校對(全自動校對)、雙語自動翻譯、搜索引擎、知識問答系統,都是我們短期內的重要目標。至於強人工智慧則自始至終都是我們的終極目標。
  2013年年終,我完成了適用於平板、智慧手機的輸入法:超自然輸入法。這個輸入法的核心算法,可以很輕易的安裝在任何一種輸入法(譬如倉頡、拼音)的規則之下進行運用,它也很容易可以改成類似「雅虎輸入法」的雙手輸入法。由於「雅虎輸入法」個人認為已經非常好用,因此,我們暫時決定不涉足這個領域。除了公司資源有限的因素之外,主因自然還是因為我們雖然可以輕易的將「超自然輸入法」改為一般桌上型電腦使用的雙手輸入法,但相較於已經存在的輸入法,它並不能造成什麼巨大的改變。因此,至少在目前,它對我們缺乏足夠的意義與驅動力。
  「超自然」輸入法的誕生,也可以說是我正式邁向人工智慧的第一步。我希望它有機會發揮影響世界的作用。
  個人網站:策略研究中心:http://www.cos.url.tw/
  「中文魔方」臉書:https://www.facebook.com/onlysoter

附錄

  以下是針對谷歌輸入法在不使用「注音首字輸入」功能的前提下進行的「學習前(谷一)、學習後(谷二)」測試。以及倉頡碼結合「智慧」(其實只是頻率)預測的成果統計。

 

句子

字數

谷一

谷二

倉頡

今天就是我餘生開始的第一天

13

23

21

43

葉問要打十個

6

16

13

24

沒有遺憾的人生多無趣

10

20

19

35

所以我留下了一個空位

10

22

15

30

沒想到還能見到妳

8

15

14

26

要不要一起去看電影

9

17

16

30

我們不能再錯過

7

13

11

18

幸福是我對你的承諾

9

20

14

30

我們結婚吧

5

10

10

15

我是東尼史塔克

7

18

16

24

總和

84

174

149

275

/中文

 

2.071

1.773

3.273

 

リスク&チャレンジ

  • 1.我們當盡力的讓超自然輸入法準時完成發送。當回饋若無法準時發送時,若是因為程式無法準時設計完成,我們將全額退費。若是因為程式存在一些臭蟲,我們會在修復臭蟲後再發送。 並在逾時的十天內完成發送動作,否則依然全額退費。 2.超自然輸入法的設計規格可能變更的地方在於介面的設計上,由於超自然輸入法是將已經經過驗證的演算法核心移植到Android,因此他並非是包含了介面設計的元素。因此,我們可能在實際的設計過程中遇到一些問題而對原本的設計加以改良,或者因為發現更好的設計而變更原本的介面設計。750元以上的贊助者則享有永久維修保固與更新的權力,但不提供退換貨的服務。