$ mkdir /KazMuzik/digidesign.com .... $ cat seeds/seeds.txt http://digidesign.com/ $ cat conf/crawl-urlfilter.txt -^(file|ftp|mailto): -\.(gif|GIF|jpg|JPG|png|PNG|ico|ICO|css|sit|eps|wmf|zip|ppt|mpg|xls|gz|rpm|tgz|mov|MOV|exe|jpeg|JPEG|bmp|BMP)$ # -[?*!@=] -.*(/.+?)/.*?\1/.*?\1/ +^http://([a-z0-9]*\.)*digidesign.com/ -. $ ... $ bin/nutch readseg -list -dir crawl-20080705112059/segments | sort 20080705112103 1 2008-07-05T11:21:12 2008-07-05T11:21:12 2 0 20080705112117 1 2008-07-05T11:21:21 2008-07-05T11:21:21 1 1 20080705112125 5 2008-07-05T11:21:29 2008-07-05T11:21:34 5 5 20080705112137 101 2008-07-05T11:21:42 2008-07-05T11:24:32 102 99 20080705112444 1382 2008-07-05T11:24:49 2008-07-05T12:04:07 1441 1310 NAME GENERATED FETCHER START FETCHER END FETCHED PARSED $ |
Pro Tools の Mac OS X Leopard サポートに関する記事を検索してみました。最初の2つは、英語(langid=100)で
最初の記事を、Nutch segment の cache から表示してみましたが、CSS が読み込まれていないせいだと思いますが、ヘッダーの部分が縦に長々と表示されて、ち
これらは、customize の余地がありそうなので、いろいろなテクノロジを取り入れながら、ぼちぼち紹介してい
Tags: computer_technology