馬占凱:Sogou輸入法之父
時間:2014-11-08
來源:未知
點擊:0 次
中文輸入法這樣亟待改善但缺乏商機的“荒原”,如何成為一個創(chuàng)新主戰(zhàn)場?
經(jīng)過幾個月前搜狐與谷歌那場聲勢浩大的“抄襲風(fēng)波”,現(xiàn)在你已經(jīng)可以重新估量輸入法對于一家網(wǎng)絡(luò)公司的價值:從4月8日搜狐公司發(fā)布聲明稱,谷歌拼音抄襲了搜狗輸入法詞庫,至今搜狐的股價已經(jīng)增長了接近 50%。而在此之前的1年時間里,搜狐的股價下跌了18%。雖然將階段性的股價變化歸結(jié)于某一種力量的結(jié)果是天真的,但一個較為準確的說法是:通過一款幾 兆大小的輸入法軟件,市值近12億美元的搜狐重新撬動了華爾街對自己的熱情。
這是怎么開始的?答案:這是一次為偷懶而創(chuàng)新的結(jié)果。
2005年,本科剛畢業(yè)、在太原一家國企做機械設(shè)計的馬占凱找到了一種省力的方法:寫東西時,如果輸入法不能直接打出所需詞語,他不愿意去輸入法的詞表 里一頁一頁尋找想敲的字,而是在搜索框里輸入相應(yīng)的拼音(比如:zhoujielun),獲得搜索引擎相應(yīng)的提示(“您要找的是不是:周杰倫”),由此復(fù)制粘貼。
這名沒有任何計算機背景,但每天可能使用百余次搜索的年輕人,曾經(jīng)自己猜測出一套解釋:搜索引擎有一個人工整理的巨大詞 庫。但稍微刨根問底之后,他發(fā)現(xiàn),搜索引擎充分利用了用戶輸入的關(guān)鍵詞,每當(dāng)某個關(guān)鍵詞的搜索量達到一定的數(shù)目,比如幾百萬次,那么這個關(guān)鍵詞就自動被收 入搜索引擎的詞庫。換言之,用搜索引擎來生成一個常用詞的巨大詞庫,花費極小。
這讓馬占凱隱隱覺得,讓搜索引擎來做輸入法大有可為。
如果當(dāng)時他認識任何輸入法業(yè)內(nèi)人士,他的想法會被無情打擊:誰還會在2005年進入輸入法行業(yè)呢?早在1980、1990年代,微軟就相繼收購了智能 ABC和微軟拼音,捆綁在Windows操作系統(tǒng)之中。此后還有一些來自民間程序師的作品,到2005年,這幾乎已經(jīng)成為一個寡頭壟斷的領(lǐng)域:智能 ABC、紫光拼音、拼音加加和微軟拼音占據(jù)了輸入法市場的90%。
理論上,所有這些產(chǎn)品都具備充分的改進空間。它們都是由人工整理詞庫,成本高且效果不好,很多詞不能及時被收入詞庫。占市場第一位的紫光拼音,甚至2003年到2006年初沒有推出一個升級版本。
但商業(yè)的力量阻止了改善的動力。輸入法是一個叫好不叫座的產(chǎn)品。盡管中國的用戶不可避免使用到它,但是卻無法靠它取得收入。于是,輸入法領(lǐng)域的狀態(tài)是:不斷有人看到市場需求,不斷有人做出解決了某些問題的新產(chǎn)品,卻沒有人能堅持長期而頻繁的升級和維護過程。
從某種程度上說,馬占凱改變了這一切。如今,他已是搜狗輸入法的產(chǎn)品經(jīng)理,他創(chuàng)意和設(shè)計的輸入法,為搜狐提供了一個接觸廣泛用戶的新通道:8月底第11 版輸入法推出,新產(chǎn)品將和用戶賬戶綁定,通過同一賬戶可以在不同電腦上使用自己的個性化輸入法。于是,輸入法和博客一起,成為整個搜狐產(chǎn)品的入口,將為帶 動其新聞、社區(qū)等產(chǎn)品產(chǎn)生積極效用。
更重要的是,自QQ旋風(fēng)般占據(jù)四億網(wǎng)民的桌面開始,客戶端軟件就展示了其巨大的想象空間。而輸入法是客戶端中粘性大、使用頻率高的軟件之一,比如,紫光拼音2005年的下載量就僅次于騰訊的QQ,約為2到3億。
雞肋
在中國科技業(yè)商業(yè)化程度不高時,輸入法曾是創(chuàng)新最密集的領(lǐng)域——除了拼音、五筆,還有自然碼等數(shù)十種相關(guān)產(chǎn)品。
早在1980年代末,哈工大的一位博士生王曉龍就研發(fā)出了一款支持整句輸入的輸入法系統(tǒng),后來為微軟所收購,成為微軟拼音。早期,輸入法領(lǐng)域還有“中文 之星”所提供的新拼音輸入法,以及后來同樣被微軟收購的智能ABC。“中文之星”留給很多人的記憶已經(jīng)淡薄,然而這款讓計算機識別中文的產(chǎn)品,其開發(fā)者包 括新浪奠基人王志東,以及后來的拼音加加的創(chuàng)始人廖恒毅。
在這些基礎(chǔ)之上,1996年,名噪一時的黑馬輸入法推出。其開發(fā)者王勵 在聯(lián)想漢卡待了三年多,在中文處理上積累了豐富經(jīng)驗。那時,這個技術(shù)愛好者因為聯(lián)想要安排其去做管理職位而離開聯(lián)想,加入黑馬飛騰科技有限公司,主導(dǎo)起校 對技術(shù)的開發(fā),并抽時間開發(fā)出了“黑馬神拼”。
直到前不久搜狗和谷歌的爭端激烈之時,中國最著名的博客之一王小峰還在其博客上稱贊使用多年的黑馬神拼質(zhì)量之高,引發(fā)了外界對黑馬的關(guān)注。
王勵把黑馬輸入法歸為是有別于五筆的字輸入、智能ABC及搜狗輸入法等的詞輸入的第三代輸入法,在整句輸入上準確率很高。黑馬拼音的句庫來自報紙、文學(xué) 作品等成文的文字內(nèi)容,并有自動學(xué)習(xí)功能,既杜絕了錯詞的出現(xiàn),又具有相當(dāng)高的智能化水平。不過,黑馬輸入法也有一個致命的弱點:體積大,有400多兆, 不利于傳播。
但在當(dāng)時互聯(lián)網(wǎng)連接不暢情況下,這倒不成為問題。依靠光盤銷售,黑馬神拼給黑馬公司帶來了意料之外的收入。直到今天,黑馬采取的仍然是這種銷售模式。
不過,2001年,考慮到競爭對手是強大的微軟、輸入法又無法提供企業(yè)所需要的資金,王勵放棄在輸入法上的繼續(xù)更新,把精力集中到了黑馬的文字校對業(yè)務(wù),只留下黑馬神拼2001版和一些輸入法底層技術(shù)作為銷售和合作之用。
而因為找不到合適輸入法使用、干脆自己開發(fā)了拼音加加的廖恒毅,也一度因為每月上百元的注冊費無法支撐,而停止了開發(fā)和更新。
當(dāng)然,這些人也并非沒有嘗試過尋找商業(yè)化途徑讓輸入法增值,不過僅僅停留在個人站長式的經(jīng)營方式上。比如,廖恒毅曾將拼音加加的首頁放置了一個百度的搜 索框,進而和百度合作分成。后來,廖恒毅干脆把首頁設(shè)成了一個類似hao123.com那樣的導(dǎo)航頁面,這樣一來,他便能每月從中獲得 10萬元左右的收入,這才結(jié)束了停止更新的日子。
“融資上市是一個機會,不過我只是一個資深技術(shù)人員,過程太復(fù)雜,無法把握。”王勵表示。
于是,這些輸入法的創(chuàng)始人們,幾乎都只把輸入法作為一個“副業(yè)”,自己卻不約而同的投入企業(yè)軟件這個“離錢更近”的領(lǐng)域。
這就使得2005年中,作為一個互聯(lián)網(wǎng)行業(yè)的門外漢,馬占凱有機會憑借一個資深互聯(lián)網(wǎng)用戶的體會、拿著對輸入法產(chǎn)品的重新定義敲開了搜狐的大門:體積小,容易在互聯(lián)網(wǎng)上傳播;能敲打出熱門詞語;有一個專門的團隊運作,更新快。
尋找伯樂
那時是馬占凱工作一周年,他終于忍受不了國有企業(yè)的沉悶與緩慢而辭職,懷揣著從親友那里借來的錢,只身來到北京,起初的目的是為了學(xué)些技能,再找工作。
在北京,撲面而來的,是互聯(lián)網(wǎng)的熾熱:一時間,李開復(fù)離開微軟來到谷歌中國、雅虎與阿里巴巴簽訂收購協(xié)議、百度即將上市前景看好。
這讓輸入法的創(chuàng)意在馬的腦海中重新升起。
百度上市前半個小時,馬占凱趴在電腦前,按照網(wǎng)上的客服郵箱給百度寫電子郵件,簡要闡釋了輸入法的創(chuàng)意:把百度搜索默認的拼音提示都納入字庫中,再加上在線同步升級數(shù)據(jù)庫的功能,互聯(lián)網(wǎng)上的熱詞馬上就能出現(xiàn)在輸入法的詞庫中。
發(fā)出去之后,馬坐立不安地等待回復(fù),在腦子里又搜索了一遍,生怕遺漏任何會引起別人的注意的建議。第二天中午,馬又補充了一封信,加上在輸入法中集成百 度搜索和桌面搜索功能的提議。然而,幾天下來,不斷刷新郵箱的他只收到百度的一封例行回復(fù),無任何進一步商談或合作意向。
馬不甘心,在又發(fā)去幾封郵件仍石沉大海之后,決定轉(zhuǎn)投搜狐。這一次,馬等來了迅速而且熱情洋溢的回復(fù),搜狐的人表示對此很有興趣,約馬占凱三天之后到辦公室一談。
這三天的等待時間,馬占凱并沒有浪費。他全神貫注的待在電腦前,不斷使用搜索引擎、閱讀相關(guān)理論,想為來之不易的面試做足準備。于是,三天之后,在去搜 狐前,他把這三天的成果事先發(fā)了過去——30 頁的文檔,其中包括上萬字的搜索筆記、200個靈感點和100個小創(chuàng)意。
這種對搜索引擎的熟悉和產(chǎn)品思維為馬占凱順利贏得了第二份工作,成為搜狐的產(chǎn)品經(jīng)理。
馬決定繼續(xù)去游說搜狐公司副總裁王建軍。為了使自己更具有說服力,他統(tǒng)計了QQ和輸入法在各大下載網(wǎng)站上的下載量,并逐個分析了輸入法這個領(lǐng)域的競爭對手,把這些做成兩份 PPT。其顯示: QQ有約5億次下載,而輸入法的下載量是2到3億次。
第二次看完P(guān)PT之后,王明確:一定要做。
“輸入法效應(yīng)”
事實上,輸入法的開發(fā),與搜狐的戰(zhàn)略轉(zhuǎn)移有很大關(guān)系。
1998年,張朝陽仿效雅虎的網(wǎng)頁目錄模式建立搜狐,進入大而全的門戶運作。然而,2003年左右,這種內(nèi)容主導(dǎo)的思路產(chǎn)生了動搖。讓搜狐有切膚之痛的關(guān)鍵在于:在諸多重要產(chǎn)品上,如搜索、即時通訊等,搜狐都因為技術(shù)不如對手而落后甚遠。
不久之后,搜狐建立研發(fā)中心,主要是在搜索領(lǐng)域加強技術(shù)研發(fā),即研制搜狗搜索引擎。一則從長遠來看,搜索是互聯(lián)網(wǎng)發(fā)展的一個重要方向。二則搜索本身技術(shù) 含量較高,研發(fā)出來的技術(shù)也可以輻射到搜狐的其他產(chǎn)品領(lǐng)域。早期,研發(fā)中心甚為保密,并未和搜狐在同一辦公樓,也沒有門牌標識。由于與網(wǎng)易研發(fā)中心同處一 樓,張朝陽每次去時都要拉低帽沿,生怕被對方員工認出。
即便采取此般暗渡陳倉之道,挑戰(zhàn)仍然顯而易見:百度的技術(shù)已經(jīng)積累4年之久,搜狗能依靠什么突破口迎頭趕上?
正在搜狐高管們?yōu)檫@件事情頭疼的時候,輸入法的創(chuàng)意擺在了眼前。“輸入法的開發(fā),是搜狗的搜索技術(shù)發(fā)展過程中結(jié)出的一個果實,同時也可以提高搜狗的品牌形象。”搜狐技術(shù)副總裁王小川告訴《環(huán)球企業(yè)家》。
王小川正是統(tǒng)籌輸入法開發(fā)的技術(shù)小組的負責(zé)人。在收購紫光拼音不成的情況下,2005年10月,一個幾人組成的小組開始進行技術(shù)上的摸索,直到 2006年6月5日搜狗輸入法第一個版本發(fā)布,首階段工作持續(xù)了八個月。
事實上,因搜狗的搜索引擎的使用量不高,當(dāng)時拼音提醒和糾錯功能都還沒有實現(xiàn),因此在詞庫整理和篩選并不容易。
除了搜索關(guān)鍵詞之外,“詞庫運動”還幾乎動用了整個搜狐的資源。比如,開發(fā)人員從go2map.com處要到地理信息名詞列表,從搜狐音樂搜索得到歌曲和歌手名稱列表,從體育頻道獲得體育明星和賽事名詞列表??跨部門的合作耗費了諸多精力和時間。
另外,由于詞語來源于互聯(lián)網(wǎng),和黑馬神拼等相比,搜狗要解決的一個重要問題是錯詞。搜狗每周會發(fā)布一份錯詞報告,糾正詞庫中的錯誤。
正因此,在第一版推出之后的十個月里,搜狗輸入法幾乎一個月就推出一個新版本,不斷的糾正詞庫錯誤,提高準確率,并添加一些吸引用戶的小功能,比如輸入法皮膚、自定義詞庫。
于是,這個新興的輸入法一經(jīng)推出,馬上獲得了預(yù)期的效果,迅速出現(xiàn)在無數(shù)人的桌面上,取代了原本紫光們的位置。
谷歌輸入法則更進一步,其能跟網(wǎng)絡(luò)賬戶綁定。也就是說,無論你在任何電腦上,登錄你的個人賬戶,便能使用你已熟練操作的詞庫。同時,谷歌的“一鍵搜索”則讓搜狗員工嘆息品牌效應(yīng)的威力。
馬占凱稱,自己最初的創(chuàng)意里也包括“一鍵搜索”,即在輸入法框上集成搜索。它被討論數(shù)次,一直擱置未實行的原因,在于搜狗為避免被誤認為“流氓軟件”的謹慎考慮,“這會影響用戶體驗,也不能帶來太多搜索量”,馬認為。
業(yè)內(nèi)有人士稱,在技術(shù)領(lǐng)域,搜狗和谷歌輸入法的技術(shù)能力都不強,并不如黑馬和微軟。但搜狐和谷歌在易用性上的突破,讓它們暫時成功。
在一篇總結(jié)性質(zhì)的PPT中,馬占凱寫道:在Gmail之前大家以為email就是這樣了,在搜狗輸入法之前大家以為輸入法就是這樣了,中國互聯(lián)網(wǎng)領(lǐng)域很多都沒有開始商業(yè)化運作,機會還很多。
對于輸入法而言,商業(yè)化運作剛剛開始,成功也有多種可能性。
Powered by
shidainet.cn探究馬氏古今,傳承中華文明,整理編纂族譜,凝聚血脈親情。馬氏研究院,馬姓歷史文化研究的主陣地!
電話:18851666077 地址:北京市昌平區(qū)小湯山鎮(zhèn)西官莊村341號 備案號:
京ICP備2020044749號-1 技術(shù)支持:
冰楓網(wǎng)絡(luò)