星期四, 6月 25, 2009

Who cares about linguistics?

聽完 Hans Rosling 在 TED 的演講,忍不住就用 Google Visualization API 試著實作看看。隨著資料的巨增與可得性,資料的呈現方式也越來越強悍。我選用3個地區6個國家的假想資料,取3個參數 (google 搜尋 "linguistics" 數量,語言期刊書籍出版數量,與語言社群人口數量) 並將時間軸設在2000-2005年之間,跑出來的motion chart 如下。其實更有趣的應該是我們看資料的方式。嗯,如果資料是真實的,夠多,對於社會語言學家應該是一扇有趣的窗口。

說到鉅量,威力很大,但是必須小心看待攸關人文社會的道德議題。比方說,它雖然對於快速建構強健性系統很好用,但是卻容易將邊緣化的東西繼續邊緣化。記得上次在荷蘭開歐盟跨國科研計劃會議時,總主持人曾表達他的憂心。他說,Google 將世界弄扁平了。因為一個重排序的 (科學) 意識型態,容易忽略差異。(問你多久沒去看google 的第十頁之後的搜尋結果了?) 也因為你量少,少到根本沒有成類的意義,沒有成為 support vector 的資格;-p,是不重要的,noise.

這種想法對於人文研究殺很大。

我很想把這件事再多講清楚一點,但是無奈咖啡喝兩杯還是昏昏欲睡。就先玩玩就好了,ㄎ。


2 則留言:

  1. 你還可以統計你的網誌中跟語言學有關的篇章以及非語言學有關的篇章之回應率(不過跟讀者組成也有關係XDD)

    回覆刪除
  2. 你還可以統計你的網誌中跟語言學有關的篇章以及非語言學有關的篇章之回應率(不過跟讀者組成也有關係XDD)

    回覆刪除