2008年8月21日 星期四

數位典藏的大眾力量:認舊書古字,全球人力幫忙


  現在網站為了增加安全性的管理,都會在登入資料時,多加一道「認字」的手續:就是有一張圖片,然後請你填入數字或英文字母。如此可以防止大量的帳號測試程式(竊取帳號用),或是避免廣告信等。

  想不到國外居然有人這麼聰明,把這樣的機制與數位典藏的工作結合,讓全球的網民「免費」幫忙校對,真是太有創意了!

  從自我到公開,從自利到合作,網路讓彼此的界限消融。數位時代,思考也會變得更有創意與靈活,跳出框框,擁有更寬廣的視野。

 

---------------------------------------------------------------------

認舊書古字,全球人力幫忙http://mag.udn.com/mag/digital/storypage.jsp?f_ART_ID=143838

 

登入做善事,舉手之勞解謎題!
每天在網路上登入、買東西或留言時,總會遇到要認怪字母的填入手續。這道手續主要是為了證明正在做這件事的不是機器,而是個活生生的人。

圖片來源:www.npr.org網站

這樣的安全認證舉措,全世界每天大約發生兩億次,每次大約花費每人10秒鐘。如果這些加乘起來,大約等於每天耗費50萬小時的人力!

圖片來源:www.npr.org網站

卡內基美隆大學的路易斯福安(Luis von Ahn)教授和全世界4萬個網站合作,利用他的CAPTCHA安全系統,讓人們認字時,等於在幫助古書或舊報紙認字,這樣人們每天花費的認字人力,就不會白浪費。

許多圖書館和報社,都將古書或舊報紙數位化,但辨識系統對於掃描後的文件,常錯誤百出,然而這些模糊不清的文字對人類來說,卻輕而易舉(圖2),於是福安結合網路登入認證,發明讓人們填入對機器來說難,對真人來說簡易的安全機制。

參與合作計畫的美國紐約時報,其數位化技術長表示,「每個月這計畫幫紐約時報認出的字,等於過去紐約時報要花上兩年的時光。」而路易斯福安也說,目前全球網友已經認出了13億的單字,2007年大約等於認出了一萬七千本書,而且幾乎99%正確無誤。

原來一件超級無聊的網路安全認證,動個腦筋轉念一想,變成全球人力辨識系統,讓網友來幫忙確認1900年以前的老報或舊書數位化工作,這idea實在聰明!

延伸連結:
.npr.org: Web Security Words Help Digitize Old Books
.多了解CAPTCHA系統

延伸閱讀:
不只為五斗米,更為慈善!
How CAPTCHA got trashed(編按:簡單的數位化認字,機器人還是可以破解,是以也有討論CAPTCHA變成垃圾的文章,不過本文目的強調創意,而非論證此系統的優劣。)

【更多報導,盡在大小創意dxmonline.com

 

2 則留言: