2007, 十月 25 in 藝文, 課業 by polaristin

[演講] Search Engine in Web 2.0 – Challenges and Opportunities

本來以為要上課沒機會聽到簡博士的演講,沒想到一上課老師就宣佈下半節課讓我們去聽演講,既然筆記都抄了,就順便留一份下來囉。

主題:Search Engine in Web 2.0 – Challenges and Opportunities
演講者:簡立峰博士, Google台灣工程研究所所長
時間:2007/10/25, 11am

[Search Engine]

  • centralized、星球級computing
  • 更新速度2hr ~ 1day,重點網頁可達 3min
  • 平台,非內容提供,求開放及公平

[Next Google]

  • Question and answering
  • Structure information retrieval (組織性,如飛機時刻及票價等,近期內有可能出現)
  • Temporal information retrieval (依時件起始脈絡排列,否則通常舊的事件因點擊較多而會出現在前)
  • Geographic information retrieval (依照地區來區分)
  • Speech retrieval (常用於手機,但還需克服螢幕太小之問題)
  • Invisible web search

[Web 2.0]

  • User’s sharing and collaboration. Ex: Wikipedia, youtube, facebook
  • 大者恆大(除了中國的獨特性)
  • 整合及豐富的search engine不一定好,重要的是user experience,根據調查navigation query佔總query的80%
  • 搜尋結果只有排序,無法看到評論、參考資料等其他資訊(google有納入排序考量)
  • 排序用machine learning,且依國家、區域不同而有不同結果,方法絕對不能被猜到,事實上google內部也無人明確知道

[Google v.s. Web 2.0]

  • Web search
  • - Content sharing:pages(無法即時), blogs(排名較難計算), news(會出現在較前面)
    - User’s collaboration:page rank, click info, anchor text (link數有逐漸下降的趨勢,但那僅是其中一個參數)

  • Maps, Youtube, iGoogle (information organization)
  • - 台灣在igoogle的競賽中作出了200多個小工具
    - 工程師會review code確保沒有違反智財權
    - maps所提供的street view將會利用face detection、motion detection的方式去除有人的部分(privacy),台北暫不提供街景

[Open Platform and Personalization]

  • search engine不要太複雜,會引導或影響user的搜尋
  • google的簡潔介面是希望讓user想想該如何search,如何增加search skill來獲得想要資料
  • 提供不同介面給不同人使用,包含使用者及分享者(例如gadget、mapplet、tubelet)

[Opportunities and Challenges]

  • Technology impact
  • - relevance & ranking
    - infrastructure, scalability, storage, bandwidth, freshness

  • Social impact
  • - info literacy (資訊素養,能自己對結果下判斷,從keywork長度可看出)
    - information ethic, legal and culture, security and privacy
    - data center用大量電力,改成水力發電? 太陽能發電?

["NTU" & Domain]

  • 在All webs和traditional Chinese only搜尋NTU的結果不同
  • 依照40種語言,切成200個domain,每個domain的搜尋結果均不同
  • User type:By languages/ regions/ genders/ personal interest
  • 在台灣default採用all web而不是繁體中文,是怕使用者侷限於中文的世界
  • google suggest約有20多%的人採用,大部分是打2個字選4個字,是否未來會拿掉?(會有引導user的疑慮)
  • related search

[Q & A]

  • Google是媒體消失的推手? 新聞的quality v.s. speed?
  • Google 絕對不作content,不然有球員兼裁判的感覺
  • Google無業務圑隊,並且沒有打廣告,在中國並不易推廣

註:TANET 2007有提供線上轉播,有興趣者可以收看

Related posts:

  1. [演講] Google 的技術與文化
  2. 新學期新氣象
  3. 新增線上人數統計

No Responses so far | Have Your Say!

Leave a Feedback

XHTML: You can use these tags: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Bad Behavior has blocked 116 access attempts in the last 7 days.