API

形態素解析API

2015/11/03

形態素解析APIの概要

形態素解析APIはリクエストで送られた文章つまり日本語文字列を、形態素と呼ばれる単語単位に分割します。
例えば”この商品はデザインが斬新だ”という文字列は、”この”, "商品", "は”, ”デザイン”, ”が”, ”斬新”, ”だ”というように分割されます。

形態素解析APIを利用すると、日本語文字列(テキストデータ)を形態素と呼ばれる単語単位に分割するアプリケーションを作成できます。このAPIを用いることにより、自社製品のレビュー記事からどのような表現でよく評価されているかといった分析を行うことが容易になります。

形態素解析とは

形態素解析とは、自然言語で書かれた文章(テキストデータ)から、文法や辞書を参照し、「形態素」と呼ばれる単語単位(例:「この」、「商品」、「は」など)に分割し、各々の形態素の品詞等を識別する事を指します。コンピュータによる自然言語処理技術の一つとして、検索エンジン、かな漢字変換、機械翻訳、キーワード出現頻度分析などに用いられます。

リクエスト先URL

https://labs.goo.ne.jp/api/morph

リクエストパラメータ

application/x-www-form-urlencoded、application/json形式でのPOSTを受け付けます。
※GETは受け付けませんのでご注意ください。

パラメータ名 説明
app_id(必須項目) アプリケーションID
request_id リクエストID
省略時は"labs.goo.ne.jp[タブ文字]リクエスト受付時刻[タブ文字]連番"となります。
sentence(必須項目) 解析対象テキスト
info_filter 形態素情報フィルタ
form(表記)、pos(形態素)、read(読み)のうち、出力する情報を文字列で指定します。複数指定する場合は、"|"で区切って複数記載してください。
省略時は"form|pos|read"を指定したものとみなします。
pos_filter 形態素品詞フィルタ
出力対象とする品詞を"|"で区切って指定します。省略時は全形態素を出力します。設定可能な項目は「形態素解析APIの品詞一覧」をご参照ください。

レスポンスパラメータ

JSONフォーマットのテキスト形式となります。Content-typeは"application/json"となります。

パラメータ名 説明
request_id リクエストと同じ値となります。
info_filter 入力と同じ値となります。
pos_filter 入力と同じ値となります。
word_list 形態素リスト
形態素リストは文ごとに分かれた文単位形態素リストの配列となります。
文単位形態素リストは形態素情報の配列で、形態素情報には表記・形態素・読みのうち形態素情報フィルタで指定された要素が含まれます。例:
形態素リスト: [[["文"],["1つ"],["。"]],[["文"],["2つ"],["。"]]]
文単位形態素リスト: [["文"],["1つ"],["。"]]
形態素情報: ["文"]

エラーレスポンス

エラーレスポンスについてはこちらに詳細がございますので、適宜ご参照下さい。

入出力サンプル

入力例

{"app_id":"[発行されたapp_id]", "request_id":"record001", "sentence":"日本語を分析します", "info_filter":"form"}

出力例

{"info_filter":"form","request_id":"record001","word_list":[[["日本語"],["を"],["分析"],["し"],["ます"]]]}

APIを利用するための手順についてはこちらで説明していますので、ぜひご活用ください。利用登録はこちらからお願いします。

当APIを活用したWEBサービス、アプリも歓迎致します。ご相談はこちらからお問い合わせお願い申し上げます。

APIコンソール

開く

日本語解析API一覧

■形態素解析API
日本語文字列を、形態素と呼ばれる意味を持つ最小限の単語単位に分割します
■固有表現抽出API
日本語文字列から、人名や地名、日付表現などの固有表現を抽出します
■ひらがな化API
日本語文字列を、ひらがな もしくは カタカナ による記載に変換します
■キーワード抽出API
人名や地名、組織など文書を特徴づけるキーワードを抽出します
■時刻情報正規化API
時刻情報となる部分を抽出しそれらを正規化した値を生成します
■テキストペア類似度API
2つのテキストを比較し、その意味的な類似度を返却します。
■スロット値抽出API
スロット値抽出APIを利用すると、氏名、生年月日などの基本的な情報を簡単に抽出できます。