星期一, 5月 01, 2006

辭典編纂工程

今天利用閒暇把一本小書讀完,《OED的故事:人類史上最浩大的辭典編纂工程》,會挑這本書來讀的是因為我之前讀過該作者的另一本書《瘋子、教授、大字典》。

在『字典』隨手可得的今日,一切『字義』都可以從字典裡得到釐清,很難想像沒有字典的時代,如果有不懂的字該如何學習?尤其是階級分明的時代,在沒有字典的情況下,自學顯得多麼困難。

在此之前,我從來沒有想過字典的由來,似乎有點與天地同壽的意味;提到編撰字典,我想到的就是在現有的字典上擴充新字而已。寫一本書,一篇論文往往就要耗費多年的時間,編撰數十冊的大字典的難度可想而知;在這本書中提到的巨大的金錢消耗,時間消耗,都不足以讓我驚訝;最讓我驚訝的是,大量的義工自願耗費閒暇時間為 OED 的編輯提供詞條,以及決定字詞定義的主觀性。

猶記得兩年前,有人介紹 Wikipedia 時,我還曾在 blog 上寫一篇文章質疑這種網路百科的可信度和可行性。但是現在我完全收回我的話。

這兩年來,其詞條的增長速度特快,數學相關詞條我想應該已經超越 MathWorld 了。Computer Science 或者 Physics 領域的詞條數目也很可觀。實際上,我在採用 Answers.com 的服務時,十之八九跳出來的也都是 Wikipedia 的頁面。

在研究上,我常使用各種學術資料庫和搜尋引擎,當我碰到不明白的用詞時,第一時間就是連上 Wikipedia。就我自己使用的觀感,Wikipedia 的內容算不上很好。對一些抽象的,理論的用詞,往往解釋得不是很清楚(不夠 insightful),相關知識之間的整合也有待改善。(當然也是有寫得很好的詞條)

關於這點,我想可能很難有良好的解決方案,不過在作為知識的傳播者上,他的角色是可以肯定的。如果我們允許耗費數十年的時間來編撰 OED,那麼成立至今僅僅五年就有今日成就的 Wikipedia 當然是相當值得期待了。

換個角度來看,對於快速取得對另一個領域或者未知名詞的概念,其實這樣也就夠了。比起百科全書這麼權威式的出版物,我更傾向於把 Wikipedia 看成是一種複合型態的工具"書"。

E. Bright Wilson 在 An Introduction to Scientific Research 中,將學術文獻分為幾類 Encyclopedias, Literature Guides, Handbooks, Books, Reviewed Journals, Abstract and indexing journals. 就我自己的領域 Computer Science 來說,大量的文獻都已經網路化,除了收費的學術資料庫之外,很多學者也都把自己的文章放到網路上,包括各式免費的 technical reports, survey, reviwes。在一個做研究這麼方便的時代(至少跟前人比起來),百科全書的完備和精緻未必那麼重要了,廣泛地爬梳知識,並對可靠的網路資源做篩選和索引,其實在相當程度上就已經足夠了。(這樣的說法顯然有點何不食肉糜的感覺了,畢竟鍊結到學術資料庫裡的文章就不是人人可以閱讀了。而且也不是每個領域都像 Computer Science 這樣蓬勃發展。)

Ref. : Wikipedia Governance 維基百科的治理

P.S. : 有意思的是雖然依賴大量的義工,但是 Wikipedia 和 OED 都一樣,基本上還是依賴少數『狂熱貢獻者』....書中強調該時代雖然沒有完善的字典,然而,有錢有閒的精英族群,其知識之廣博的程度可能遠遠超越任何一個時代。以至於報紙上的報導往往簡潔到可以說缺乏足夠的資訊。然而,在今日這個知識經濟時代,就以台灣來說,每年有多少的碩博士產生?足夠的人力來執行這個計畫顯然不是問題,倒是如何維持他們的熱情?

Update 2006-09-05:
Ref. : 誰創作了維基百科? - Blog on 27th Floor

相反觀點!非精英貢顯最多...:) 誰才是對的呢?

Tag: []