好久沒聽演講了,把握Google的翟本喬博士來系上演講的機會,照例作一下記錄,演講公告有翟本喬博士的簡介。
[Products – What can I use Google for?]
‧Google把使用者和資訊結合起來,目的是整理全世界資訊,使得資訊容易得以及方便使用。
‧目前有Local search、Picasa、Gmail、Toolbar、Desktop Search、oogle Print、Google Mobile Search、Google Checkout等許多服務。
[Business – How does Google make money?]
‧Google有98%的收入來自廣告,廣告有點擊才收錢。
‧使用者喜歡才能永續經營,讓使用者舒服才是重點。
‧網站使用Google作內部搜尋時會在旁邊放廣告、利用AdSense分析網頁內容並選取合適的廣告。
‧Inventory 多少空間可以登廣告
Keywords 關鍵字
Impression 放廣告出來一次
Creative 廣告的本文
CPM 一千次登出所花的錢
CPC 一次點擊費用
CTR 使用者點擊的頻率
‧把廣告變成一種特殊的搜尋,當使用者搜尋時同時尋找哪個廣告最適合。
‧並不一定是把價錢最高(CPC)的放在最頂端,而是加上考慮CTR,用兩者相乘,也就是CPM來排序。
‧利用Vickrey的2nd price auction方式,例如排第二的CPM只有$8,第一名可以降低CPC,只要CPM能高過第二即可。
‧點擊率並不易計算,因為同樣的廣告可用不同關鍵字搜尋到。
‧另外也有程式避免投機取巧的行為,例如同一IP重複點擊等。
‧未來還有其他種類的廣告出現Image ads、Audio ads、Click to call ads,另外收費方式也有可能改變,如Cost per impression、Cost per acquisition。
[Infrastructure – What's running Google?]
‧由於科技不斷進步,使得Google真的有機會能整理全世界的資料。
‧Google大部分是用廢棄或便宜的零件,所以採用開放空間方便修理,改良擺設方式例如魔鬼沾方便更換零件。
‧最小的程式都要至少2000台機器來跑,所以軟體一定要能夠處理failure。
‧儲存資料,要考慮何種資料該放何種機器。
‧開始強調省電省能源。
‧Google Query Serving Infrastructure(圖)
‧Google File System(圖)
‧MapReduce(圖)的架構讓工程師不用考慮容錯的部份。
‧Query log太龐大無法用一般資料庫來儲存。
[Applications - How is the infrastructure used?]
‧拼字檢查,以前的方式是用字典作檢查,但很多專有名詞例如人名等無法作檢查,或者拼出字典有卻不是想要的字,但Google是採用搜尋的技巧,利用資料的數量決定正確的用法。
‧統計性機器翻譯,比較兩種不同語言的同樣網頁或原文和譯本,對照來尋找可能的正確翻譯,這種方式要在資料非常龐大才可能實現,只要資料多一倍就增加0.5%的正確率。
[User Interface – What do users see?]
‧Google Map,圖是由Google產生而不是由使用者端處理,且會先讀取上下左右一段使得使用者可以移動而不感覺遲鈍,並且開放API。
[Culture – What's it like at Google?]
‧20% rule:任何工程師想要作自己想作的專案,只要對公司有益,可以花自己20%的時間去作。
‧快樂的工作環境,許多員工福利。
‧“You have to wear something” – Eric Schmidt。隨便你穿什麼,只要有穿就好!