WebTextPicking


WebTextPicking
このサービスは、特定のWEBページから指定したタグのテキスト情報を抜き出し、XML形式で取得するサービスです。

利用方法
以下の形式で解析対象URLとタグを指定したURLを作成し、リクエストしてください。
http://www.pb-lab.net/webtextpicking/def/xml.html?url=[対象URL]&tag=[タグ]&link=1
上記リクエストのレスポンスとして、以下のようなXMLを返します。
<?xml version="1.0" encoding="UTF-8"?>
<tagset>
<tag>
<name>body</name>
<text><![CDATA[
	2008年05月26日(月)
	何の日?:県民防災の日(秋田県)
	有名人の誕生日:伊東美咲
]]></text>
</tag>
<link><href>http://search.livedoor.com/search/?c=ld_top_sl&amp;ie=utf8&amp;q=%E7%9C%8C%E6%B0%91%E9%98%B2%E7%81%BD%E3%81%AE%E6%97%A5%EF%BC%88%E7%A7%8B%E7%94%B0%E7%9C%8C%EF%BC%89</href><text>県民防災の日(秋田県)</text></link>
<link><href>http://search.livedoor.com/search/?c=ld_top_sl&amp;ie=utf8&amp;q=%E4%BC%8A%E6%9D%B1%E7%BE%8E%E5%92%B2</href><text>伊東美咲</text></link>
</tagset>
リクエストパラメータ
パラメータ名必須/任意レスポンスタグ内容
url必須無し解析対象URL(UTF-8でURLエンコードすること)
tag必須/tagset/tag/name, /tagset/tag/textテキストを取得するタグ名。指定がない場合は a タグを取得します
link任意/tagset/link/href, /tagset/link/textテキストとは別にa タグのhref(リンク)のリストを取得する場合は href=1 パラメータを追加してください。

利用例
※クリックして動作を確認してください
例1) www.livedoor.com トップページの body タグ内のテキストを取得したい。
http://www.pb-lab.net/webtextpicking/def/xml.html?url=http%3A%2F%2Fwww.livedoor.com&tag=body

例2) www.livedoor.com トップページの body タグ内のテキストを取得し、さらにリンク一覧を取得したい。
http://www.pb-lab.net/webtextpicking/def/xml.html?url=http%3A%2F%2Fwww.livedoor.com&tag=body&link=1