帶水桶去逛網站–介紹離線瀏覽器(一)

by 貓鼻子

尼采說,到女人那裡去時,記得要帶鞭子。我忘記了那是在《瞧!這個傢伙!》這本書中寫的,還是在他洋洋灑灑的另外幾本偉大的著作中,常常被人引述的經典話語。當然,我不是尼采,我只是個網路美女;我想到的卻是,去逛網站時,記得要帶水桶。這個水桶就是離線瀏覽器。

逛街有兩種:純粹的腳力訓練,以及定點掃描的焦土政策;帶水桶去逛網路的策略適用於後者。當你輕輕鬆鬆徜徉在異國的街頭,喝杯久已停產的歐香咖啡時, 你是不需要離線瀏覽器的。但是當親愛的妳,為了工作或學術或興趣的需要,鎖定了這麼一個定點的網站,想要仔細品嚐、徹頭徹尾地剖析了解乃至於全部帶回家的 時候,妳難道有時間一頁、一頁慢慢地走麼?焦土政策碰上了有著幾十頁、幾百頁架構的中大型網站,你是否希望這時身邊有個小廝提著水桶,幫著你把一堆堆的資 料倒入桶中,馬上運回家慢慢地看呢?

毫無疑問的,你需要一套離線瀏覽器(Offline Browser)。離線,就是不再連線(disconnected),也就是在沒有連到網際網路的狀況下,閱讀網頁。其實嚴格來說,所有的瀏覽都一定是 「瞬間離線」的,因為你必須要先把任何人網站的內容下載了之後,才能夠閱讀他們;而以往的下載會由瀏覽器先暫存在檔案快取(cache)的區域,而這個過 程使用者往往都一無所悉。把一般瀏覽器的功能加強,自動循著網頁裡所有的超鏈結(hyper-link)的瀏覽方式取回所有的網站內容,這就是離線瀏覽器 幫你作的工作啦。

想想這個景象,就好像有十個小廝(teleport會一次送出十個下載要求 request)專門在幫你不停地按著超鏈結,然後將所有的網頁內容存到你的硬碟中,有系統的分門別類儲存好,這麼好的事有沒有什麼問題呢?首先你必須要 知道,沒有搞清楚命令的機器人男傭是會摔破整箱整箱的碗盤的。你首先必須要知道的幾個概念,我列在下面:

@啟始網址:從這一頁開始,對所有的超鏈結作瀏覽的動作。
@探索深度與範圍:距離啟始網址幾個超鏈結的範圍。
全球資訊網常常被人比喻為蜘蛛網,因為所有的超鏈結彼此牽連的程度超過我們一般的想像。記得房間裡的貓的問題麼?房子裡有十個角落,每個角落坐著十隻 貓,每隻貓的身上又有十隻貓…….(什麼?我又說錯了?)倘若妳帶著水桶,到處亂抓的話,你可能會把網路上的所有貓通通帶回家了。輕微的損傷是妳 的硬碟被貓灌爆,或者是因為造成交通堵塞(幾百萬隻貓排成好幾列走回你家)而被 proxy 伺服器管理者禁止連線。

好啦,我們現在知道了什麼是離線瀏覽器、也知道她的用途、帶來的好處與可能的問題,終於可以上路啦!

★作者:該軟體是由 Tennyson Maxwell 公司所製作,產品相關 訊息位於:
http://www.tenmax.com
http://www.tenmax.com/products.html
★美商溫普敦公司(代理商)
http://www.winpreton.com.tw
★國內介紹 Teleport 的網站(Atlantis Neogeo製作) http://w5.dj.net.tw/~kwwei/TelePort/
★國內檔案搜尋網站 Archie 伺服器(搜尋 teleport 字元,選擇日期最新的檔案)
http://archie.edu.tw
★離線瀏覽器使用者注意事項(台大計算機中心)
http://proxy.ntu.edu.tw/user-guide/robot.html

觀看次數:

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *