2011年12月16日 星期五

Perl parse HTML page

參考 http://mirlab.org/jang/books/perl/getWebPage01.asp?title=7-1%20%BA%F4%AD%B6%A7%EC%A8%FA%BBP%A4%C0%AAR%A1G%A4J%AA%F9%BDg

以抓取天氣預報網頁為例,去除 HTML Tag 轉成 TEXT 只要四行 (太簡單了吧~~):

use LWP::Simple;
use HTML::Parse;
$url = 'http://www.cwb.gov.tw/V7/forecast/taiwan/Hsinchu.htm';
print parse_html(get ($url))->format;

如果 Perl 出現缺少部分模組的訊息,請參考 Perl 安裝模組 範例。

沒有留言:

張貼留言