2015/11/03
固有表現抽出APIはリクエストで送られた日本語文字列から、人名や地名、日付表現などの固有表現を抽出します。
例えば、"鈴木さんがきょうの9時30分に横浜に行きます。"という文字列からは、人名として"鈴木"、地名として"横浜", 日付表現として"きょう"、時刻表現として"9時30分"がそれぞれ抽出されます。
このほかにも"○○株式会社"といった組織名や、"△△ビル"といった固有物名を抽出可能です。
固有表現抽出APIを利用すると、人名や地名などの固有表現を抽出するアプリケーションを作成できます。このAPIを用いることにより、最近1週間のSNS上の投稿のなかで話題になっているスポットを発見するといった分析を行うことが容易になります。
固有表現抽出とは、自然言語で書かれた文章(テキストデータ)から、人名、地名、組織名、日付表現などの固有表現を抽出する事を指します。コンピュータによる自然言語処理技術の一つとして、検索エンジン、キーワード出現頻度分析、機械学習などに用いられます。
https://labs.goo.ne.jp/api/entity
application/x-www-form-urlencoded、application/json形式でのPOSTを受け付けます。
※GETは受け付けませんのでご注意ください。
パラメータ名 | 説明 |
---|---|
app_id (Required) | アプリケーションID 必須項目 |
request_id | リクエストID 省略時は"labs.goo.ne.jp[タブ文字]リクエスト受付時刻[タブ文字]連番"となります。 |
sentence (Required) | 解析対象テキスト 必須項目 |
class_filter | 固有表現種別フィルタ : named entity's type filter ART(人工物名)、ORG(組織名)、PSN(人名)、LOC(地名)、DAT(日付表現)、TIM(時刻表現)、MNY(金額表現)、PCT(割合表現)のうち、出力する情報を文字列で指定します。複数指定する場合は、"|"で区切って複数記載してください。 省略時は全ての種別を出力します。 |
JSONフォーマットのテキスト形式となります。Content-typeは"application/json"となります。
パラメータ名 | 説明 |
---|---|
request_id | リクエストと同じ値となります。 |
class_filter | リクエストと同じ値となります。 |
ne_list | 固有表現リスト: 表記・固有表現種別を要素として持つ固有表現情報の配列 |
エラーレスポンスについてはこちらに詳細がございますので、適宜ご参照下さい。
APIを利用するための手順についてはこちらで説明していますので、ぜひご活用ください。
利用登録はこちらからお願いします。
当APIを活用したWEBサービス、アプリも歓迎致します。ご相談はこちらからお問い合わせお願い申し上げます。