wget 筆記

2008/08/09
~ 阿亮 ~

wget 筆記

◎ 用 wget 抓檔案,我想從 log 檔取得 url 列表,但發現 log 檔內的 url 會變成亂碼,如下圖:

wget01.png

這是 wget 試得所得的 url 轉成 OS 預設字體,以供我們易讀。但在 MacOSX 下,系統預設是 MacOSX Big5(I guess),所以,轉換後有問題。

這種在環境設定成 LANG=zh_TW=UTF-8 也是沒用的。正解是 wget 加上下述的參數即可。

--restrict-file-names=nocontrol

 

◎ 今天另有類似的問題,但不是在於 wget 的問題,而是 php 的問題,用 fprintf 的方式將 utf-8 的字元,寫出到檔案,會發生檔案編碼不是 vi/vim 可讀的情形,雖然用 more/less 的方式去讀該檔時是正常。根據此頁的情形 ,將

export LANG=zh_TW.UTF-8

改成

export LANG=zh_TW.UTF8

即可,但這又很奇怪了,用 locale -a 來查,前者才是列表內的項目 (至少目前手上的 MacOSX Leopard 是),所以,php (v.5.2.6) 只認得後者,設成前者就亂了? 但 more 等就兩個都認?

但設成 LANG=zh_TW.UTF8,用 locale 查又呈現下述的情形,

LANG="zh_TW.UTF8"
LC_COLLATE="C"
LC_CTYPE="C"
LC_MESSAGES="C"
LC_MONETARY="C"
LC_NUMERIC="C"
LC_TIME="C"
LC_ALL="C"

會不會 php 輸出可以用,變成其他不能用啊

補:freebsd 用 zh_TW.utf8,在 MacOSX 下用  zh_TW.UTF-8



歡迎留言

敝站會審核留言的適宜性,您的留言可能會較晚發佈,而且小弟保留刪除的權利!!

站內搜尋



本站其他服務

本站其他軟體



  • 下一班火車 (nextRail)

    這個 app 只要開啟後,就根據定位幫你過濾出最近火車站的時刻表,不用再按任何按鈕了,方便您在很快時間內確定要坐的哪一班火車


  • 下一班高鐵 (nextTHSR)

    這個 app 只要開啟後,就根據定位幫你過濾出最近高鐵站的時刻表,不用再按任何按鈕了,方便您在很快時間內確定要坐的哪一班高鐵


  • 台灣空污警報(AirInfo)

    設定特定站點為推播通知關注點後,當該站點空氣品質變糟時,即時推播通知給您。另外提供站點附近基本天氣預測資料。


  • 照片去背(PhotoEraser)

    一款方便移除背景的工具,產生透明背景圖可以存回原本相簿,也可分享到其他 App 使用.


  • 標案快訊

    讓你可以輕鬆追蹤含有您想要關注關鍵詞的任何採購標案,只要有最新的資訊,「標案快訊」即會推播通知給你.


  • 批踢踢快訊 (pttNews)

    身為鄉民的您,是不是常常覺得現在的批踢踢 (PTT) 閱讀器,明明您就只要看幾個板,都幫您分類好,但不是您要的?甚至您只想關注某個人(或某件事)的消息,卻散布在不同東西,找出來很辛苦? 這個 App 可以解決您這些問題,快來用吧!