API

キーワード抽出API

2015/12/16

キーワード抽出APIを利用すると、入力した文書のキーワードを抽出するアプリケーションを作成できます。

キーワード抽出APIの概要

キーワード抽出APIはリクエストで送られたタイトルと本文からなる文書から、人名や地名、組織など文書を特徴づけるキーワードを抽出します。キーワードはタイトルや本文における出現位置や、文書中における出現回数、固有表現の種別などによってスコア付けされます。

このAPIを用いることにより、ニュース記事をキーワードでタグ付けして検索しやすくするといったことが容易になります。

リクエスト先URL

https://labs.goo.ne.jp/api/keyword

リクエストパラメータ

application/x-www-form-urlencoded、application/json形式でのPOSTを受け付けます。
※GETは受け付けませんのでご注意ください。

パラメータ名 説明
app_id (必須項目) アプリケーションID
request_id リクエストID
省略時は"labs.goo.ne.jp[タブ文字]リクエスト受付時刻[タブ文字]連番"となります。
title (必須項目) 解析対象タイトル
body (必須項目) 解析対象本文
max_num 最大出力キーワード数
省略時は10となります。
focus 注目固有表現種別
ORG(組織名)、PSN(人名)、LOC(地名)のうち、スコアを強く算出したい固有表現種別を1種類のみ文字列で指定します。
省略時または上記以外の種別指定時は、全ての種別を同等に扱います。

レスポンスパラメータ

JSONフォーマットのテキスト形式となります。Content-typeは"application/json"となります。

パラメータ名 説明
request_id リクエストと同じ値となります。
focus リクエストと同じ値となります。
keywords キーワードリスト
スコアを要素として持つキーワードの配列になります。

入出力サンプル

入力例

{"app_id":"[発行されたapp_id]","request_id":"record001","title":"「和」をコンセプトとする 匿名性コミュニケーションサービス「MURA」 gooラボでのβ版のトライアル実施 ~gooの検索技術を使った「ネタ枯れ防止機能」によりコミュニティの話題活性化が可能に~","body":"NTTレゾナント株式会社(本社:東京都港区、代表取締役社長:若井 昌宏、以下、NTTレゾナント)は、同じ興味関心を持つ人と匿名でコミュニティをつくることができるコミュニケーションサービス「MURA」を、2015年8月27日よりgooラボ上でβ版サイトのトライアル提供を開始します。","max_num":3,"focus":"ORG"}

出力例

{"request_id":"record006","focus":"ORG","keywords":[{"NTTレゾナント株式会社":1.0},{"コミュニケーションサービス":0.8312},{"MURA":0.8312}]}

APIを利用するための手順についてはこちらで説明していますので、ぜひご活用ください。利用登録はこちらからお願いします。

当APIを活用したWEBサービス、アプリも歓迎致します。商用利用に関するご相談はこちらからお問い合わせお願い申し上げます

APIコンソール

開く

日本語解析API一覧

■形態素解析API
日本語文字列を、形態素と呼ばれる意味を持つ最小限の単語単位に分割します
■固有表現抽出API
日本語文字列から、人名や地名、日付表現などの固有表現を抽出します
■語句類似度算出API
キーワードについて、その語句の発音内容を比較してその類似度を算出します
■ひらがな化API
日本語文字列を、ひらがな もしくは カタカナ による記載に変換します
■商品評判要約API
商品レビュー記事の集合から要約文を生成します
■キーワード抽出API
人名や地名、組織など文書を特徴づけるキーワードを抽出します
■時刻情報正規化API
時刻情報となる部分を抽出しそれらを正規化した値を生成します