API

語句類似度算出API

2015/11/03

語句類似度算出APIを利用すると、発音内容を比較してその類似度を算出し解析を行うアプリケーションを作成できます。

語句類似度算出API

語句類似度算出APIはリクエストで送られた2つのキーワードについて、その語句の発音内容を比較してその類似度を算出します。

例えば、"東京"と"トーキョー"といった読みの似通ったキーワードの組に対して、高い類似度を算出できます。類似度は0から1の範囲となり、0.3以上ですとおおよそ似通っていると判定できます。

このAPIを用いることにより、人名などの記述内容に差異のあるデータベース間で同一内容を示すレコードを探し出す分析などが容易になります。また顧客からの問い合わせ情報で、自社商品名が多様な書き方で表現されている場合の集計作業などにも適用可能です。

リクエスト先URL

https://labs.goo.ne.jp/api/similarity

リクエストパラメータ

application/x-www-form-urlencoded、application/json形式でのPOSTを受け付けます。
※GETは受け付けませんのでご注意ください。

パラメータ名 説明
app_id(必須項目) アプリケーションID
request_id request_id
リクエストID
省略時は"labs.goo.ne.jp[タブ文字]リクエスト受付時刻[タブ文字]連番"となります。
query_pair (必須項目) 類似度算出対象配列

配列形式で2つの文字列を入力してください。
ex: {query_pair : ["ウィンドウズ", "windows"]}

レスポンスパラメータ

JSONフォーマットのテキスト形式となります。Content-typeは"application/json"となります。

名前 説明
request_id リクエストと同じ値となります。
score 類似度スコア

文字列間の類似度を0~1の範囲で出力します。(1に近いほど類似)

入出力サンプル

入力例

{"app_id":"[発行されたapp_id]", "request_id":"record004", "query_pair":["phablet", "ファブレット"]}

出力例

{"request_id":"record004","score":0.4836754003448215}

APIを利用するための手順についてはこちらで説明していますので、ぜひご活用ください。利用登録はこちらからお願いします。

APIコンソール

開く

日本語解析API一覧

■形態素解析API
日本語文字列を、形態素と呼ばれる意味を持つ最小限の単語単位に分割します
■固有表現抽出API
日本語文字列から、人名や地名、日付表現などの固有表現を抽出します
■語句類似度算出API
キーワードについて、その語句の発音内容を比較してその類似度を算出します
■ひらがな化API
日本語文字列を、ひらがな もしくは カタカナ による記載に変換します
■商品評判要約API
商品レビュー記事の集合から要約文を生成します
■キーワード抽出API
人名や地名、組織など文書を特徴づけるキーワードを抽出します
■時刻情報正規化API
時刻情報となる部分を抽出しそれらを正規化した値を生成します