1.媒體來源:
台灣新浪網
2.完整新聞標題/內文:
巴西當地時間7月17日,隨著百度董事長兼CEO李彥宏現場輸入首個葡語版搜索關鍵詞“
BrazilChina”,百度巴西葡語版搜索引擎正式啟動。
對於正在向創新型國家邁進的中國來說,技術創新輸出將成為未來對外經貿和外交的重點
方向。作為最大的中文搜索引擎企業,百度近年來也以技術創新為後盾,積極推進國際化
發展戰略。此次進軍葡語搜索市場,正是百度國際化戰略的重要一步。
進軍巴西推葡語搜索
百度一直對全球化市場和多語種搜索“蠢蠢欲動”,在海外研發、海外人才招募、海外市
場開拓、海外業務支撐上都有多重佈局。在此之前,百度就先後發佈過泰文搜索和阿拉伯
語搜索,在更早之前的2008年,百度還高調進入了日本市場。此外,百度貼吧、Hao123、
百度安全客戶端、百度瀏覽器等產品均已推出泰文等外文版本。
巴西是金磚成員,人口眾多,經濟即將迎來爆髮式增長,是繼中印等國家之後的下一代新
興市場,發展空間廣闊。以百度貼吧為例,其海外MOU高達3000萬,其中來自巴西的就有
1500萬。正是在這一背景下,百度決定進軍巴西市場。
從百度的國際化發展戰略來看,發佈葡語搜索確實是百度海外戰略的一個裡程碑式的事件
,不僅預示著百度在海外市場掀開了新的篇章,而且走出了真正憑藉技術實力闖市場的海
外發展模式。
逐一突破三大難點
搜索引擎是一門“語言科學”,搜索引擎的發展過程實際上是其“語言處理能力”的提升
。百度在中文語言處理上的優勢自然不必多說,不過,要把中文領域積累的優勢複製到新
的語種上,卻並不容易。
百度開發葡語搜索引擎,面臨幾個難點:
難點一:語種差異帶來的NLP演算法挑戰。
葡語屬於屈折語,和中文孤立語相比有大量形態變換,構詞、句法等方面上也有很大差
異。
如何破解?百度藉助NLP(自然語言處理系統)透徹分析語言特點,在大數據環境下運用
統計方法快速定位差異、總結規律,制定出有針對性的語言分析手段,能解決語種差異上
的“初識挑戰”。
難點二:積累空白背後的語料詞庫缺乏。
搜索引擎不斷積累全網內容、Query請求以及基於此分解的詞庫、語料和演算法。與
百度已深耕15年的中文搜索不同,在葡語搜索引擎領域,百度沒有這些數據積累,要從頭
開始。
如何破解?除了吸引國際優秀人才加入,大規模應用機器學習模型和自然語言技術之
外,百度在早期技術研發中已經考慮到了未來多語種的可能性,搭建了可擴展、可遷移和
國際化的技術框架,這個系統縮短了小語種NLP基礎技術建設周期。
難點三:市場差異對產品、運營和推廣帶來新挑戰。
葡萄牙語是世界第六大流行語種,使用它的國家和地區包括葡萄牙、巴西、安哥拉、中國
澳門、西班牙等。每個國家和地區都有本地化的市場特點和用戶習慣,進而對產品、技術
和運營提出不同要求。
如何破解?百度技術和產品團隊已經習慣的中文搜索思維需要推倒重來,不能預先假
設,必須分析當地語言特性、市場特點和用戶反饋,同時聘請專業語言專家做跨界研究,
制定更合理、更通用的技術方案。
靠NLP與Google競爭
百度進入巴西以及葡萄牙語搜索市場還有一個障礙,那就是對手Google。Google早已進軍
葡語搜索和巴西搜索市場,百度引以為豪的NLP技術、深度學習技術也是Google的強項,
說到底還是要看百度與Google在新的戰場PK技術。
百度NLP技術並不比Google弱。搜索圈內人都知道,百度NLP團隊是世界領先的NLP技術團
隊之一。百度NLP技術更註重實用性和工業價值,強調技術為產品服務,這與Google相比
風格迥異。當Google鼓搗無人汽車、GoogleGlass等酷玩意兒的時候,百度正在做阿拉丁
計劃、地圖、O2O、金融、貼吧、知道等更“接地氣”的業務和產品。
百度在巴西與Google競爭,還有非常有利的一點:巴西十分需要百度,會給予百度相應的
支持。據瞭解,百度與巴西科技創新部的合作包括:百度將在巴西建立世界級企業研發中
心,為巴西互聯網科技提供創新性解決方案,培養互聯網科技人才,支持巴西創業公司。
在業界關注百度葡語搜索上線消息本身的同時,資本市場也將開啟一輪對百度市值增長空
間的想像。假以時日,百度與Google在其他多國的PK和較量,勢必將引發全球搜索引擎市
場更大範圍的格局變化。
3.新聞連結:
http://ppt.cc/lXE7
備註: 有野心