API

固有表現抽出API

2015/11/03

固有表現抽出APIの概要

固有表現抽出APIはリクエストで送られた日本語文字列から、人名や地名、日付表現などの固有表現を抽出します。

例えば、"鈴木さんがきょうの9時30分に横浜に行きます。"という文字列からは、人名として"鈴木"、地名として"横浜", 日付表現として"きょう"、時刻表現として"9時30分"がそれぞれ抽出されます。
このほかにも"○○株式会社"といった組織名や、"△△ビル"といった固有物名を抽出可能です。

固有表現抽出APIを利用すると、人名や地名などの固有表現を抽出するアプリケーションを作成できます。このAPIを用いることにより、最近1週間のSNS上の投稿のなかで話題になっているスポットを発見するといった分析を行うことが容易になります。

固有表現抽出とは

固有表現抽出とは、自然言語で書かれた文章(テキストデータ)から、人名、地名、組織名、日付表現などの固有表現を抽出する事を指します。コンピュータによる自然言語処理技術の一つとして、検索エンジン、キーワード出現頻度分析、機械学習などに用いられます。

リクエスト先URL

https://labs.goo.ne.jp/api/entity

リクエストパラメータ

application/x-www-form-urlencoded、application/json形式でのPOSTを受け付けます。
※GETは受け付けませんのでご注意ください。

パラメータ名 説明
app_id (Required) アプリケーションID
必須項目
request_id リクエストID
省略時は"labs.goo.ne.jp[タブ文字]リクエスト受付時刻[タブ文字]連番"となります。
sentence (Required) 解析対象テキスト
必須項目
class_filter 固有表現種別フィルタ : named entity's type filter
ART(人工物名)、ORG(組織名)、PSN(人名)、LOC(地名)、DAT(日付表現)、TIM(時刻表現)、MNY(金額表現)、PCT(割合表現)のうち、出力する情報を文字列で指定します。複数指定する場合は、"|"で区切って複数記載してください。
省略時は全ての種別を出力します。

レスポンスパラメータ

JSONフォーマットのテキスト形式となります。Content-typeは"application/json"となります。

パラメータ名 説明
request_id リクエストと同じ値となります。
class_filter リクエストと同じ値となります。
ne_list 固有表現リスト:
表記・固有表現種別を要素として持つ固有表現情報の配列

エラーレスポンス

エラーレスポンスについてはこちらに詳細がございますので、適宜ご参照下さい。

入出力サンプル

入力例

{"app_id":"[発行されたapp_id]", "request_id":"record002", "sentence":"鈴木さんがきょうの9時30分に横浜に行きます。"}

出力例

{"ne_list": [["鈴木","PSN"],["9時30分","TIM"],["横浜","LOC"]],"request_id": "record002"}

APIを利用するための手順についてはこちらで説明していますので、ぜひご活用ください。
利用登録はこちらからお願いします。

当APIを活用したWEBサービス、アプリも歓迎致します。ご相談はこちらからお問い合わせお願い申し上げます。

APIコンソール

開く

日本語解析API一覧

■形態素解析API
日本語文字列を、形態素と呼ばれる意味を持つ最小限の単語単位に分割します
■固有表現抽出API
日本語文字列から、人名や地名、日付表現などの固有表現を抽出します
■ひらがな化API
日本語文字列を、ひらがな もしくは カタカナ による記載に変換します
■キーワード抽出API
人名や地名、組織など文書を特徴づけるキーワードを抽出します
■時刻情報正規化API
時刻情報となる部分を抽出しそれらを正規化した値を生成します
■テキストペア類似度API
2つのテキストを比較し、その意味的な類似度を返却します。
■スロット値抽出API
スロット値抽出APIを利用すると、氏名、生年月日などの基本的な情報を簡単に抽出できます。