APIãŒæä¾›ã•ã‚Œã¦ã„ãªã„サービスã‹ã‚‰æ¬²ã—ã„æƒ…å ±ã ã‘ã‚’å–å¾—ã™ã‚‹ã«ã¯ã€HTMLãªã©ã‹ã‚‰è‡ªå‰ã§ã‚¹ã‚¯ãƒ¬ã‚¤ãƒ”ングを行ã†ã—ã‹ã‚ã‚Šã¾ã›ã‚“。PHPã§ã®ã‚¹ã‚¯ãƒ¬ã‚¤ãƒ”ングã«å½¹ç«‹ã¤ãƒ©ã‚¤ãƒ–ラリãªã©ã‚’ã¾ã¨ã‚ã¦ã¿ã¾ã—ãŸã€‚ Perlã‚„Rubyã«ã¯è‰²ã€…ã¨ä¾¿åˆ©ãã†ãªã‚‚ã®ãŒè¦‹ã¤ã‹ã‚‹ã®ã§ã™ãŒã€PHPã«ã¯ãªã‹ãªã‹ã“ã‚Œã¨ã„ã£ãŸã‚‚ã®ãŒãªã„ã§ã™ã。 Webスクレイピングライブラリ HTMLScraping HTMLã‚’XML化ã—ã¦DOMã‚„XPathã§æ“作ã§ãるクラス。主ã«HTTP_Request+HTMLParser(XML_HTMLSax3ã‚’å«ã‚€)/Tidy+Cache_Liteã¨ã„ã†æ§‹æˆã§ã€ã‚¹ã‚¯ãƒ¬ã‚¤ãƒ”ングã«å¿…è¦ãªã‚‚ã®ãŒä¸€é€šã‚Šæƒã£ã¦ã„る。ライセンスã¯LGPL他。 WebScraper シンプルãªæ±Žç”¨ã‚¹ã‚¯ãƒ¬ã‚¤ãƒ”ングクラス。HTTP_Client+HTMLParser(XML_HTMLSax3ã‚’å«ã‚€)ã¨ã„ã†æ§‹æˆã§ã€XPathã§è¦ç´ を抽出ã§ã
{{#tags}}- {{label}}
{{/tags}}