API

形態素解析API

2015/11/03

形態素解析APIの概要

形態素解析APIはリクエストで送られた文章つまり日本語文字列を、形態素と呼ばれる単語単位に分割します。
例えば”この商品はデザインが斬新だ”という文字列は、”この”, "商品", "は”, ”デザイン”, ”が”, ”斬新”, ”だ”というように分割されます。

形態素解析APIを利用すると、日本語文字列(テキストデータ)を形態素と呼ばれる単語単位に分割するアプリケーションを作成できます。このAPIを用いることにより、自社製品のレビュー記事からどのような表現でよく評価されているかといった分析を行うことが容易になります。

形態素解析とは

形態素解析とは、自然言語で書かれた文章(テキストデータ)から、文法や辞書を参照し、「形態素」と呼ばれる単語単位(例:「この」、「商品」、「は」など)に分割し、各々の形態素の品詞等を識別する事を指します。コンピュータによる自然言語処理技術の一つとして、検索エンジン、かな漢字変換、機械翻訳、キーワード出現頻度分析などに用いられます。

リクエスト先URL

https://labs.goo.ne.jp/api/morph

リクエストパラメータ

application/x-www-form-urlencoded、application/json形式でのPOSTを受け付けます。
※GETは受け付けませんのでご注意ください。

パラメータ名 説明
app_id(必須項目) アプリケーションID
request_id リクエストID
省略時は"labs.goo.ne.jp[タブ文字]リクエスト受付時刻[タブ文字]連番"となります。
sentence(必須項目) 解析対象テキスト
info_filter 形態素情報フィルタ
form(表記)、pos(形態素)、read(読み)のうち、出力する情報を文字列で指定します。複数指定する場合は、"|"で区切って複数記載してください。
省略時は"form|pos|read"を指定したものとみなします。

pos_filter 形態素品詞フィルタ
出力対象とする品詞を"|"で区切って指定します。省略時は全形態素を出力します。設定可能な項目は「形態素解析APIの品詞一覧」をご参照ください。

レスポンスパラメータ

JSONフォーマットのテキスト形式となります。Content-typeは"application/json"となります。

パラメータ名 説明
request_id リクエストと同じ値となります。
info_filter 入力と同じ値となります。
pos_filter 入力と同じ値となります。
word_list 形態素リスト
形態素リストは文ごとに分かれた文単位形態素リストの配列となります。
文単位形態素リストは形態素情報の配列で、形態素情報には表記・形態素・読みのうち形態素情報フィルタで指定された要素が含まれます。

例:
形態素リスト: [[["文"],["1つ"],["。"]],[["文"],["2つ"],["。"]]]
文単位形態素リスト: [["文"],["1つ"],["。"]]
形態素情報: ["文"]

入出力サンプル

入力例

{"app_id":"[発行されたapp_id]", "request_id":"record001", "sentence":"日本語を分析します", "info_filter":"form"}

出力例

{"request_id":"record001","info_filter":"form","word_list":[[["日本語"],["を"],["分析"],["し"],["ます"]]]}

APIを利用するための手順についてはこちらで説明していますので、ぜひご活用ください。利用登録はこちらからお願いします。

当APIを活用したWEBサービス、アプリも歓迎致します。商用利用に関するご相談はこちらからお問い合わせお願い申し上げます

APIコンソール

開く

日本語解析API一覧

■形態素解析API
日本語文字列を、形態素と呼ばれる意味を持つ最小限の単語単位に分割します
■固有表現抽出API
日本語文字列から、人名や地名、日付表現などの固有表現を抽出します
■語句類似度算出API
キーワードについて、その語句の発音内容を比較してその類似度を算出します
■ひらがな化API
日本語文字列を、ひらがな もしくは カタカナ による記載に変換します
■商品評判要約API
商品レビュー記事の集合から要約文を生成します
■キーワード抽出API
人名や地名、組織など文書を特徴づけるキーワードを抽出します
■時刻情報正規化API
時刻情報となる部分を抽出しそれらを正規化した値を生成します