隨意搜尋 Ambient Findability

先從書名談起吧,Ambient Findability 的原意是環境可尋性,描述一個可以在任何時候從任何地點,找尋到任何人或事物。當然現在尚未達到這種境界,不過未來的趨勢如此,因此這本書就在探討”行動運算”與”網際網路”的資訊互動等等議題。

findability (n.) 某物件容易被找尋到的程度
ambient (adj.) 環境的;包圍的; 

作者 Peter Morville 是資訊架構學一書的作者,而這本書可說是他對可尋性的見解雜談,學識淵博的作者走訪各家之言,提供我們很好的全貌性技術觀察跟思考,是非常值得推薦的知識性小書。

(其實去年看到英文版就想買了,只是我英文太破看了幾頁看不懂只好放棄,想不到竟然等到資深譯者蔡學鏞。題外話,他最近在關注Adobe Apollo 喔 :p)

第一章 失誤招領,談尋性

隨著科技發展跟資訊來源爆增的現代,資訊辨識能力(information literacy)越來越重要了。我們如何取得想要的知識,做出消息靈通的決策? 可尋性,可以幫助我們瞻前顧後。

可尋性是一種特質,可以從兩個方面來量測,一是個別物件中,有助於尋找該物件的屬性,像是文件的標題、救生衣的顯眼顏色、RFID標籤等。二是系統層次幫助人們尋路或找物的支援程度,例如病人如何抵達醫院、使用者在網站上是否會迷路? 在數位的領域中,我們相當依賴文字(word)、關鍵字(keyword)、標籤(label)、超連結(link)的字等來區分物件。

從商務價值上來看,可尋性有一個很大的重點: 許多使用者並不是從網站首頁開始瀏覽的,而是透過搜尋工具、部落格、網路書籤等直接深層連結到網站裡面。因此為網站建立一個具有可尋性的網站比狹隘的網站設計目標 (只關注網站從首頁起好不好看好不好用) 更為關鍵重要。作法有提供好的資訊架構、支援Web標準相容、提供matadata (如RSS feed)、將內容提供出來而不是埋在資料庫中等等。可尋性除了影響Web 設計,也正在轉變市場,這就是目前很流行的長尾理論(Long Tail)。

第二章 尋路的歷史

這章非常科普知識性質,蠻有趣的。講了動物(螞蟻、老鼠、蜜蜂等)如何尋路,再講人類在大自然跟人造環境中如何導航。人們也使用語言來建構出一個可以幫忙導覽的語言世界,並利用無所不在”譬喻”來解釋和形塑人類經驗。在 Web 的世界中,我們更是盡情擁抱譬喻(例如網站地圖、導覽系統等),不過要注意的是譬喻應該是”互補”而非”取代”,所有的譬喻都有不足和過頭的地方,但我們不應該因此否定他們的核心價值。

作者提到用資訊視覺化的技術來將Web地圖化的技術大都失敗了,例如嘗試用互動式地圖來解決搜尋和導覽問題,這是因為Web是沒有實際空間的啊,滑鼠點一點就過去了,而且也有眾多路徑可以相通。而利用關鍵字搜尋可以在四分之一秒將四十億網站排序出來,Google就不搞什麼譬喻,只要文字和超連結的搜尋結果,而且要快,這樣就夠了。我們對於Web的體驗,決定用於傳達意義的”字”,這些譬喻影像雖然可行,但幫助不大。

第三章 資訊互動,詳述資訊尋找行為的來龍去脈

1959年 莫爾斯定律:
如果顧客覺得擁有資訊比不擁有資訊更痛苦、更麻煩,那個人們寧願不使用資訊檢索系統。

現今製造的資訊量大概是一年五十萬個美國國會圖書館,因此是時候該把焦點從建立豐富的資訊,轉移到解決注意力貧乏的新問題上了。首先作者先來探討資訊的定義,再來必須把資訊分類,因此我們依賴 “類型 (genre)” 作為 “指出訊息和媒體” 的方式。

1948年學者提出資訊檢索(information retrieval),核心概念是適切性(relevance),適切的結果就是使用者感興趣且有用的結果。這裡使用兩個量測方式,一是”精確度“,即 存取出的適切數量/總存取數量,代表”系統只取出適切文件的能力”; 二是”涵蓋度“,即 存取出的適切數量/總適切數量,代表”系統取出全部適切文件的能力”。

這兩個量測在不同情況有不同的重要性,在樣本搜尋(sample search)中,只要找到少數優良文件即可,所以精確度比涵蓋度重要。大多數的Google搜尋者,只要快速找到適用的文件即可,不會想花費更多精力篩選。如果已經有特定範圍,又稱做存在性搜尋(existence search),則精確度又更重要了。

另一方面,地毯式搜尋(exhaustive search)則是涵蓋度較為重要,律師和研究者願意犧牲精確度,以嗅出蛛絲馬跡。不過涵蓋度的測量並不容易,因為需要知道”總適切數量”。這裡一個大重點就是規模(scale),涵蓋率會隨著集合數目的增加而巨幅滑落。要繼續探討規模的影響,我們需要回到人類的”語言”。

用”文字”重現”概念”,這就是資訊檢索的根本問題。文字是模棱兩可的,人類根據不同情境有不同解釋。這裡出現一個冪次法則(Power Law),出現在許多小事件和少數大事件同存的狀況,也就是我們熟知的80/20法則(如80%的連結指向15%的網頁),而語言也正是屬於這種系統。少數單字常常出現(前六名佔20%,前五十名佔50%),另一些則很少,語言學教授認為這是”聯合性”(一字多義)和”分化性”(單字單義)互相競爭的結果,在檢索的情境中,則可以解釋成”描述”和”辨識”的力量,前者盡可能說明文件的智慧內容,後者盡可能區隔每一份文件。全文檢索偏向描述; 唯一識別 (如 ISBN)用於辨識; 詮釋資料欄位(如書名、作者) 和控制詞彙(預先訂好的標準詞彙,例如有固定幾種分類)則介於兩者之間。

當系統有1000份文件的時候,其中有100份包含”computing”,用10種不同方式。
當系統有1000,000份文件的時候,其中有7100份包含”computing”,用84種不同方式。

這項分析告訴我們,若沒有更多關鍵字或特殊環境說明,精確度也會隨著資訊規模變大而急遽下跌,除非我們透過辨識的力量來改善。因此我們常常替詮釋資料欄位制定專用的控制詞彙,但是隨著規模的成長,自己貼標籤的成本太高。而Google的複合演算法(結合全文、詮釋資料和大眾評估等)雖然有些進展,且近年來關於電腦粹取語意的研究不斷,但只要人類還用語言,資訊檢索就會持續不完美。

回到一個更基本的問題,人也是問題,因為適切度的量度也是主觀的,因為每個人已經知道的事情和想知道的都不一樣。已知最重要的事實是”最省事原則”,即為了取用的方便,使用者常常願意犧牲一部份的資訊品質。人類並不總是理性或最佳行為,在有限理性(bounded reiotnality)的狀況下,我們只願滿足最低條件(satisfice),這是1950年經濟學家為了解釋”以理性決策為理論建立的經濟模型”和”事實的失控狀況”間的差異。另外人類對於電腦的奉承,也會有正面的反應跟評價。在情感設計(Emotional Design)一書中,也提出好看有吸引力的東西,會比較好用。

儘管在資訊和通訊技術有很大的進步,我們依然很依賴非正式的人際溝通網絡,而喜歡八卦閒聊的人,也常常搶先得到關鍵性的小道消息。我們對於”非正式消息”的信賴度,常常比”官方說法”更高。今天很多網路應用的核心,就是八卦閒聊的威力跟普遍,透過群眾的力量驅使越來越多人參予,進而改善資訊檢索。

此時稱做檢索已不再適合,我們開始有了資訊尋找行為的社交和心理層面,我們需要資訊互動。古典資訊檢索模型是單一查詢,而現今Web搜尋行為則是”採草莓”模型,適切文件就像草苺一樣散布在資訊收集場所中,使用者有豐富多變的策略,不斷地切換搜尋和瀏覽模式。接下來作者又提到一些新的研究,像是資訊覓食(information foraging)、資訊氣味(information scent),從生物的”合作覓食行為”找出適合Web上的”合作過濾行為”、認知工作分析(Congnitive Work Analysis)、資訊塑形(information shape)等,各個學者從不同領域切入研究。

資訊和物件的疆界日漸模糊,你可以注意到Google不斷改變資訊的定義,將越來越多的東西納入他們的範圍,一開始只有網站,接下來有圖片、新聞、地圖、圖書館…. 等,這表示Google對於資訊有一張很大的設計藍圖,比我們對於Web的認知還要廣泛。

第四章 緊密交織,談 Mobile 行動運算

萬用件(everyware),我們使用行動裝置來通訊、上網、EMail、日曆、通訊錄、音樂、相機、電視、GPS、moblog 等等,各種新奇用法無邊無際,與我們的生活緊密交織在一起。但它仍不完美,目前的技術限制有電池、無線網路等,好消息是這兩個都算有進展,壞消息是介面的進步就難說了,螢幕的解析度會改善,但是螢幕的尺寸依然是行動運算的天生問題,我們必須期待完全不同的解決方案,這些新技術(如數位紙張、頭戴式顯示器)何時才會走出實驗室呢?

輸入方式也是一樣,肥大的手指在微小的鍵盤上吃力的按,這讓行動運算的生產力不彰,而語音辨識的進展不大,況且講出來別人會聽到。回到人的注意力問題,想做好工作可能還是得乖乖的在辦公室用符合人體工學的鍵盤,使用大大的螢幕。行動運算不會取代桌上型電腦,但它的用途將會擴展到各種利基點上。我們為許多實體位置標上虛擬註記和影像,努力將世界轉變成一個巨大的黑板。

行動運算的一個問題是隱私。例如有一個科技產品是給小孩子(或失智老人)載的GPS手錶,讓父母可以隨時知道小孩的位置(隨時監控?!),我們除了運用行動運算技術讓我們不會迷路,也可以讓我們被找到。自由與隱私在此必須做出平衡的抉擇,這些地點感知的應用,哪些可以接受?哪些可以救人?哪些只是窺視?

RFID 技術代表向環境可尋性前進一大步,就像一個事物的網際網路。RFID又分成被動式跟主動式。前者不需電池,標籤小價格便宜,但範圍在三公尺以內,一次只能讀取一個標籤;後者必須有內部電池,標籤大也貴,但距離較遠且可以同時追蹤上千個移動物品。顯然目前都是用被動式,所以”事物的網際網路” 還只是個夢想,不過想像若技術獲得進展,每樣物品都可以用主動式標籤,我們就可以精準定位我們實體世界的任一樣東西。

接下來作者提了一個有趣的現象觀察,資訊進口跟資訊出口。前者指我們進口大量真實世界的資訊到網路空間,例如甚至是路口攝影機都可以在網路上看見;後者主要的價值在新的介面體驗,例如一些利用物理環境來呈現數位資訊的介面。最後提到人機合一的研究領域,例如可穿式運算的進展,進而到”神經機械學”領域。

當我們把自己帶往未來,和”有好處但要付出代價”的事物緊密交織,我們必須問自己: “真的要這樣做嗎?”。我們愛用手機,但又不喜歡干擾;我們喜歡照相手機,但有時又失去隱私;我們用電子郵件,但不喜歡spam。技術終究得面對現實的考驗

第五章 推與拉,談行銷

這章描述可尋性和web 正在轉變市場的形式,重新塑形新的行銷規則。 

環境廣告,一種隨處可見的廣告形式,透過推播式媒體(push media) 送到你眼睛前面,但當它”跨越界線”時,就會變得十分煩人。但界線在哪裡呢? 推播(push) 黑暗面的經典例子正是不請自來的垃圾郵件(spam)。另一方面 Web 則是拉取(pull)式的媒體,我們輕點幾下就可以得到我們想要的資訊。這樣看起來好像只需要使用者拉取所需事物即可,不過作者認為推拉是一體兩面,無法獨自存在,就像結合陰陽的太極。一個沒有push的世界太安靜了,我們也失去pull的動力。

例如RSS訂閱,我們選擇讓資訊推播放,而無需(花時間)拉取資訊。雖然其中還是有很多不需要的文章,但人類早已習慣過濾推播,例如聽人家說話的時候,我們只記得重要的片段 :p 另外作者認為 Google 也在推拉之間取得平衡,亂七八糟具有侵略性的大廣告已經不受青睞,取而代之的對使用者跟廣告商都比較友善的 Google 廣告。

延伸閱讀: alanc的這篇 淺談網路核心價值以及網路搜尋 寫的正是尋找成本的問題,alanc 認為網路核心價值是節省資訊搜尋成本,與此書的推與拉平衡哲學有異曲同工之妙。

今日的行銷市場,買家有更多的權利可以比較各家產品的價錢跟功能服務,有多元的選擇跟豐富的資訊可以做抉擇。不過資訊的豐富,也讓我們注意力分散,因此行銷手法層出不窮,像是一對一行銷、病毒式行銷、置入性行銷、垃圾郵件等,只有最適者能夠生存。作者認為適者必須取得推拉之間的平衡,而企業依然偏好推播,而行銷手法正喪失讓產品更可尋的機會。我們應該致力於讓顧客能在有需要的時候,找到他們所需的事物。例如更多的使用者研究,改良搜尋與導覽,少放橫幅廣告等。

接著作者介紹了網頁設計的推與拉平衡,我們可以把網頁上的搜尋與導覽看成pull,而商標、標語、照片、廣告等是push。網頁領土有限,網頁設計師責無旁貸不讓 push帶給使用者困擾,並幫助使用者快速找到想要的資訊,而且使用者往往不是從首頁開始,而是從搜尋引擎直接到網站中的某一頁,首頁的作用只是路標而已。接者作者引述 Peter Morville 的使用者體驗蜂巢模型:

smeantics.jpg

在情感設計(Emotional Design)領域,有吸引力的東西作用比較好。渴望度和信賴度之間有很強的關係。網頁設計得良好,就會提高使用者的信賴程度。而搜尋的排名越前面,使用者的信賴程度也會提高。這都證明信賴度和可尋性之間的關係。作者也引述 Jeffrey Zeldman的話,使用Web標準技術,我們可以同時改進能用度、無障礙、渴望度、可尋性、合作性、與過去的相容性,同時又能降低成本,減少建置時間。

可尋性比能用度重要
不管是在文字上,或是在Web上
尋找不到的事物,根本無從用起

可尋性如此重要,但在責任分際上,卻常常落入邊隙之中沒有人處理,設計師、工程師和行銷部門沒有合作,眼花繚亂的產品分類、導覽系統不堪使用、沒有做搜尋引擎最佳化(SEO)。特別是SEO領域需要能用度、資訊架構、文案設計等多元素交織。統計資料顯示搜尋僅次於Email,是最受歡迎的網路活動,而透過搜尋引擎找到我們的網站,比透過橫幅廣告來的有更高的購買商品機會。

SEO 可視為行銷的一部份。資訊搜尋是消費者購買程序中的一道關鍵手續。但SEO不僅是行銷的範圍,它還牽扯到設網頁設計與工程規劃。例如很多政府單位和非營利單位,SEO做的很爛,讓很多需要幫助的人根本不知道上門尋求協助,這實在有違他們的任務。目前已經有幾家公司已經修改組織,例如HP成立了可尋性事業群,跨專業領域負責使用者介面設計、資訊架構和搜尋。

個人化(personalization)是推與拉的奇怪合體,介於行銷與技術之間,理想是藉由個人化,自動把我們想要的東西送到面前。不過事情沒有這麼簡單,很多投資都失敗了。個人化極度困難,原因包括語義不明確、有效使用者的矛盾(必須先有大量精準的個人興趣資料,但誰有耐心去填寫?)、行為的不明確性、時間因素、需要的演變、隱私考量等等。不過即使如此,我們還是可以朝這個方向努力,從廣義的角度來看,其實我們主動拉取的資訊所佔的比率相當低,你週遭的個人化管道主動將知識推播過來,這才是大部分的知識來源,包括 人(家人、朋友、同事)、組織、地理(居住的國家、城市等)、媒體(電視、報紙等)、每天看到的訊息跟經驗都是。

今日的世界充斥著行銷手法和無所不在的廣告,推播淹沒拉取,幾乎快把我們搞瘋了。我們用立法來阻止侵略性廣告(例如垃圾郵件),我們不計代價想要贏得勝利。作者認為我們必須致力於可尋性才能贏得這場戰爭,改善溝通的雜訊比率,同時幫助收訊息跟送訊息的一方。當然,道高一尺魔高一丈,總會有創意的方式,又將我們不想要的訊息推播過來,邁向環境可尋性的路上,危機重重,套句老子的話: “無為而無不為”,以不變應萬變。

第六章 社會語義網路

語意網(Semantic Web) 是由 W3C所推廣的技術,提供了超棒的WWW願景: 建構一個有意義的網頁結構,讓代理人(Semantic Web agent)可以代替使用者處理複雜的工作,語意網將幫助人類的知識演化為一個整體。

聽到這裡,有些了解 AI 有什麼還做不到的人覺得不對勁了。有人擔心語意網會走 SGML的(失敗)老路,因為metadata的正規化,必須在受限的應用中才有用,但如果這樣就不是Web了。有人認為語意網只是個沒什麼了不起的三段論推理機器罷了,沒什麼實用價值。持平的說法認為,雖然有些語意網的遠大目標不切實際,但其中的研究可能有其價值,而其中的許多相關標準(如XML、RDF、FOAF、OWL、RSS、CSS、URI) 都已經被廣泛使用,這些東西一起發揮作用,我們的確可以塑造出一個格式更清晰的Web。未來的成果必須要站在今日的基礎設施上,明天的使用者體驗,要靠今天的語意網路技術。

詮釋資料(matadata)的能力就是幫助人們找出他們需要的東西。最基本常見的就是用分類法,例如樹狀結構、多重階層(一物件屬於多個分類)、分面式分類(一群物件可以依照不同屬性,如依主題、依品牌、依售價來做分類)。或是使用控制詞彙(controlled vocabulary)來管理語言的模稜兩可,使用 preferred term 定義對等關係,指定聯想關係等。但分類固然重要,但進入位元世界仍不夠用。語意網使用知識本體 (ontologies),利用RDF(Resource Description Framework)來描述並交換詮釋資料,它是由三位一體(主詞、述詞、受詞) 的XML標籤所組成,是個有型別關聯的無窮陣列,可以支援分類法、控制詞彙、分面式分類和豐富的語意關係。這項技術讓我們可以在搜尋的時候有更好的精準度,而不是只能用籠統的關鍵字,也有人認為利用RDF才是找東西的正確方法

但這麼幻夢的理想怎麼還沒實現? 有人怪RDF太難、有人說當初說的願景不切實際造成誤解、有人認為焦點沒有放在人際互動。作者則認為最大原因有以下兩個:

第一,大多數的資訊系統並非有結構化的metadata跟控制詞彙,而只是堆積(pile)跟歸檔(file),我們把東西放在桌上做線性排列,我們把東西丟到櫃子跟目錄裡。大多數的公司網站,只是用簡單的階層模型罷了。這樣的世界又如何能夠跟的上語意網的腳步。

第二,泛用型的分類系統,在設計上的複雜度很高,而且又亂又貴。我們每天生活的大多數分類,都是由模糊的認知模型所定義,受到語言、文化、政治和道德的影響,而不是根據客觀的規則。組織資訊並貼上標籤的方法不見得只有一種,幾乎所有領域都會面對歸納群組和分解最小單位時的複雜度。機器間可以準確對話,但人類必須提供語彙和衍生出價值。

再看看現實世界運作的Web,不管是不是語意網,都是關於人類的合作,市場就是對話,超連結破壞了階層,充滿了生氣勃勃的社交活動。社交軟體(social software)讓一群人可以溝通協力工作,例如線上遊戲、網路社群、wiki、del.icio.us、網路書籤、Fkickr 相簿等非常多的應用,跟著這些軟體順勢來到的就是群眾分類法,讓使用者自行定義標籤

有人認為標籤的豐富性和群眾智慧將超越結構化的分類。但也有人認為用標籤只是”有總比沒有好”而已,因為控制詞彙擴充性不夠。anyway… 標籤就像針線,可以縫接起異質的物件集合,當許多人對相同物件用不同標籤,當許多人對不同物件用同樣標籤時,事情就變的非常有趣。熱好此法的人認為趕緊忘了知識本體跟分類法吧,群眾分類法才是未來。”舊的方法建立了一顆樹,新的方法是把樹葉用鐵耙集中起來“。

作者認為 群眾分類法相當適合在WWW裡遨遊,是觀察趨勢和探索網路的好工具,適合保存已經找到的東西維持在”找到”的狀態(例如個人書籤工具)。但作者也認為此法對可尋性所需要對等性、階層性跟其他語意關係確無能為力,到了一定規模就會變得不堪一擊。因此作者仍傾向古老的知識樹,而不是一時流行的落葉潮。不過我們也不用二選一,這兩種方法並不是互斥,在企業網站中,投資知識本體和分類的正式結構有其價值,而在WWW上使用群眾分類法,當然比什麼都不用來的好。而在某些領域,例如內部網路和知識網路,同時使用這些技術可能也不錯。

這兩者甚至可以潛在的協力合作,進入步調分層(pace layering)的概念。有些東西步調快變化多,應該用群眾分類法,因為彈性大、適應性強。這些知識一段時間之後,則可以進入到更耐久、具有社會和語義基礎的層次,這才是可尋性和社會語義導航的未來展望。

接著作者探討社會網路分析(social network analysis),就是我們聽過的”六度分離”理論,最多透過六個人就可以聯絡上你想連絡的人。在網路上則是最多點19下就可以連到任一份文件。不過作者認為“小世界”現象不能解決可尋性問題,六度分離理論容易被誤導成在小世界中找物件很容易,這是不正確的,所有東西跟所有人都距離如此。使用者輸入關鍵字,必須連結到目的網站上的關鍵字,不然這趟旅程還沒開始就結束了。

然後作者探討”文件”這件事,基本的定義放在資訊的形式為書寫或印刷,歷史上文件的作用為”有權利的物件”,有些人認為現在正是”文件末日”,因為電腦、Wiki、文字編輯器、CMS、RIA 正呈現出可編輯的文件。不過作者認為文件還會繼續存活,因為它並非和技術綁在一起,而是人類心智的產物。文件是卓越的可尋物件,熟悉的文件設計方便使用,整合性的內容跟結構則支援導覽,其中的關鍵就在由表現形式、內容和目的構成的類型(genre) ,例如地圖、價目表、報紙、雜誌、白皮書等。注意到類型不等於”溝通的媒體”,例如備忘錄可以在紙上也可以在EMail裡。

新的Web類型也正在出現,如首頁、網站地圖(sitemap)、FAQ、Blog等(請參考 Development of the Genre Concept)。在搜尋跟導覽上,數位類型扮演重要角色。第一,類型讓文件提高可尋性,例如可以用內容型態來過濾蒐尋範圍。第二,類型可以提高文件辨識度,使用者可以快速辨認出它的本質跟目的,判斷是否是需要的東西。第三,類型支援文件內的導覽,例如科學論文有熟悉的形狀,允許檢視跟跳讀。研究顯示語義跟結構是相互依賴的,結構促進理解,意義則有助於形成對結構位置的感覺。因此,在Web發明十年後,類型仍然非常好用,而且在手持裝置年代,新的形式也將會逐漸被開發出來。

隨著遍存運算(ubicomp)將越來越多實體物件放到文件的分類中,”把物件變成文件“的這個概念早有學者提出,如果你觀察物件就可以得到資訊的話,此物件也可以被視為文件。據此一些學者討論出一些規範,一份文件意圖被當作證據對待、被經過加工或處理、被感覺是一份文件、能被索引,被一群証據組織起來。作者接著再發想,我們是否可以使用”文件”這樣的稱呼方式,加到人、地方、物件上,例如透過RFID晶片、GPS傳輸器或指定一個URL,我們將建立了一個全新的可尋物件分類方式。

最後重點是”資料和詮釋資料的界線正在糢糊化“,這個趨勢對可尋性影響相當大。曾經資料是資料,標籤是標籤,但看看 Amazon.com,某本書的紀錄不只有內容,還混合了豐富的語義和群眾詮釋資料,其中書的每個字都是關鍵字可以被搜尋跟連結。再進一步思考,我們越來越讓數位物件接受歷史的滋養,就像現實世界中有折角的舊書、磨損的階梯,互動的史跡歷歷在目。

傳統資訊科學中,只有在檔案和紀錄管理上,才會去強調情境(context)比內容(content)的重要,我們辨識出原始出處跟經手過的人,盡量保存一切紀錄,維持文件不受變動。但這種檔案式管理,乃是用在證據的保存價值和學術上的理解,跟可尋性無關。

但是 Web 則帶給我們交互影響的歷史如何能夠支援社會導覽,最常見的就是熱門程度和名聲了,例如 Google 的 PageRank、Technorati 根據被連結數列出最權威的部落格、Yahoo拍賣的好評、Flickr 列出最受歡迎的標籤、Amazon 根據點選路徑,呈現看過這個產品的人,也看了什麼,更多網站列出最受歡迎的頁面,令人驚訝的是,這些受歡迎程度和名聲的詮釋資料,也相當適合用在適切性上。我們安逸地相信群眾的智慧,這種受歡迎程度的 情境詮釋資料 不只影響我們找到的資料,也影響我們對於資料的看法。也就是會有資訊可尋性偏頗黑暗現象。富者更富,受歡迎的連結會更容易被連結。

當然情境詮釋資料領域不只有歡迎度,誰什麼時候由誰做了什麼改變,這些資訊都可以讓文件本身的價值增加。作者接著發想跨出Web,已有學者研究時間軸、時間地標、空間位置記憶,在資料管理與檢索上的效用,未來到了能夠感知地點的年代,當人、地、物都能加上metadata時,文件與物件的可尋性和價值,也將會由這個”關於性”所形塑。

Googlebombing 是個很好的例子,這種”關於性”產生的影響力,連頁面的語義內容都無法抗衡。這反映出力量已經逐漸從作者轉移到讀者手上,從權威人士轉移到普羅大眾,這場全球革命將快速發展下去。 

其實這章談的群眾分類法,不就是跟時下最流行的 Web 2.0 做法嗎? 不過作者寫書的時候 Web 2.0 還不紅就是了,所以都沒提到。anyway… 你會發現 Web 2.0 的一個成形脈絡,還有為何及何時使用標籤這種大眾分類法的情境背景。大伙在一窩瘋追求 Web 2.0,想盡創意跟辦法把Web 2.0到處應用的時候,也許可以停下來思考一下 “有總比沒有好” 以及 “情境詮釋資料” 這件事?

第七章 談人工智慧和人類的行為如何啟發決策

首先談 AI 決策樹,找出選擇跟結果,乘上每個結果的機率跟價值,就可以將決策變成量化分析,理性決策不正是智慧的象徵嗎? 但人類的心智卻不是如此,在目標模糊、資訊不全、時間有限的情況下,人類只有部分理性,追求”只滿足最低條件”,不一定會去尋求最佳解。

人類的非理性程度有多深? 先入為主、堅信不移、深刻難忘、維持現狀、不願意承認過去的錯誤,我們常常找合理的藉口來做出決策。在演化心理學和神經科學的研究中,人類的腦是雖已有理智的新皮質,但熱情的杏仁核仍和狩獵時代相同,人類的重大決策,經常和情緒EQ最為相關。

面對這種”有限的非理性”,”群眾的智慧”是一帖很能安慰的良方,不過作者認為群眾智慧不見得就是要否定聰明的個體,和消息靈通之下所做的抉擇。尤其是網際網路讓我們可以取得大量資料,讓我們有更好的決策能力,讓我們可以輕易跳出家人、朋友跟同事的小圈圈,尋求獨立智慧和集體智能的協助。

但是網際網路的問題是,大量高水準的出版品仍無法從網路取得,搜尋引擎偏向關鍵字而不是概念性比對。圖書館員更抱怨學生都用Google搜尋,而不上圖書館了, 資料來源的權威性、精確性、流通性及品質都被忽略。保守派人士緬懷大英百科全書的集權,另一端自由主義者則喜愛部落格的地方分權。網際網路將智力放在端點,而非中心,讓任何人都可以在中立的架構下參予革新。

定義權威、委交信任、決策判斷、獨立學習,這些隨著網路而改變的行為中,可尋性都是關鍵角色,例如作者舉自己的親身經歷,認為隨著醫藥資訊的增加,我們自己找答案,才最能符合自身的利益,畢竟醫生給病人的時間太短,專注的太少。而當我們自己做抉擇負責時,我們和權威的關係也改變了,醫生還是可以幫助我們,但他們(專家)不再握有控制大權。 (資訊的)易取用性不只單純地要求我們對更多事情做出決策,還邀請我們更常做出資訊充分的決策。

承第三章所提到的,當資訊量過多時,人的決策品質反而會下降。當資訊太多時,我們停止拉取(pull),忍受推播(push),只注意自動上門的資訊,搜尋時只是飛快略讀,這稱作資訊過荷。接著作者探討資訊失調的病症,塗鴉理論,作者認為所有流經感官的資訊,都會持續且無知無覺地形塑人類的記憶、信念、預測、決斷和行為,就如同引爆趨勢一書所提到的環境力量-破窗理論,一種資訊型塑行為。

這會有什麼負面影響? 少數人的看法容易變成多數人的輸入,老字號媒體(報紙、電視)的內容輸出被大財團把持,很可能會有反饋障礙。社會事件新聞太過普遍,讓人們嚴重高估週遭風險,造成錯誤的判斷。事實的真相常常難以釐清,作者舉了一個例子,在蘋果橘子經濟學一書中,Levitt指出1990年代犯罪率下降的原因不是因為警方的政策,也不是各種合理解釋,而因為1973年墮胎開始合法化,墮胎可以降低犯罪是個令人不舒服的事實,也是人們容易視而不見的新聞。

但作者認為我們每個人都有控制輸入來源的能力,Web 可以讓我們存取到世界各地的意見跟資料,讓我們有能力可以讓自己具有充足資訊,可以管理自己的”資訊餐飲”,盡量選擇有助於讓”理性和直覺決策”健康的資訊餐飲。但很可惜Web只是資訊不足的一半解藥,一來冪次法則和偏好連結會建立起優勢中心,少數公司跟人會吸引過多的注意,二來在這個高精準度和低涵蓋度的領土上,只有15%的網頁會包含敵對觀點的連結。

因此若沒有良好的資訊能力,這些資訊反倒造成愚昧。就作者自己說,他比較相信華爾街日報跟大英百科全書,但部落格跟維基百科也相當有價值,權威是主觀的,適切性也是主觀的,是由閱覽者所認定,作者相信社會需要較佳的資訊能力,但不確定教育體系最好準備了沒。作者也對 Google 的數位圖書館計畫感到興奮,認為這是對我們的集體記憶的一個重大更新,將會擴增我們的智能。

回頭看圖書館,其實跟開放原始和網際網路有很多共同點跟相仿的歷史,作者認為重要的是都代表價值分享。我挑作者的這句話來結束這一章: “我們找到什麼東西,就會影響自己變成什麼人。”

參與討論

1 則留言

  1. 因此這本書就在探討”行動運算”與”網際網路”的資訊互動等等議題。 —請教您,您覺得這本書是屬於行銷的書,還是獎資訊架構的書呢?

發佈留言

發表迴響