0 / 140
CAPTCHA Image

データ分析をお助け!アンケートの自由回答やブログに使えるテキストマイニングツール

テキストマイニング――聞き慣れない言葉ですが、データ分析をしている企業ではとっても大事な作業。

テキストマイニングとは、たくさんのテキストデータから特徴や傾向、相関関係を探し出すテキストデータの分析方法のことです。

これを行えば、例えば消費者からよくつけられるクレーム、また斬新なアイデアなどを見つけることができるかもしれないということで、わりと注目されている技術なんですよー。

市場調査におけるFA(自由回答)はもちろんのこと、小説やブログ、Twitterなどの単語・文節の傾向や相関関係を調べるために使われたりします。
keyword_report_s-1de9a00b72fcfc3768f77dce4e8d1833

ちなみにマイニングとは「採鉱、鉱業」の意だそうです。
莫大なデータ(鉱山)から必要なデータ(鉱物)をマイニング(採鉱)するのでデータマイニング、データマイニングのテキスト版だからテキストマイニングなんですね~。

埋まってるものを取り出すんですから、「テキスト埋ニング」と覚えれば覚えやすいんじゃないですか? どうですか?

(どうでもいいですがマイニングで変換したら最初に埋ニングと出るようになってしまいました。こちらが本当な気がしてきました)

ユーザーローカル社のテキストマイニングツール

さてさて、前置きが長すぎて申し訳ありません。

今回ご紹介したいのはユーザーローカル社が提供しているテキストマイニング!固有の名称はないみたいです。

我が社でもアンケート集計の業務をしたりしなかったりしていますが、実際に集計を行っている社員さんがFA(自由回答)分析に使っているみたいです。これを使い始めてから仕事効率が数時間短縮されたそうです! 肌もつやつやになり、宝くじも当たったそうです!(嘘)

ということで、肌がつやつやになりたい私も実際に使ってみたいと思います。

スクリーンショット (53)

実際の画面を見てみると、なるほど、シンプルで誰にでも使えそうな印象です。

さすがに実際のアンケートを使うわけにはいかないので、ここでは操作感だけをお伝えすべく、グリム童話の「おおかみと七ひきのこやぎ」を使います。

スクリーンショット (66)

ではさっそく、ポチッとな。(古い?)

スクリーンショット (64)と、こんな風に貼り付けるだけでかなり詳しく解析してくれます。
詳しく見ていきましょう!

共起ネットワーク(画面左上)

文章中に出現する単語の出現パターンが似たものを線で結んだ図。出現数が多い語ほど大きく、また共起の程度が強いほど太い線で描画されます。(サイト本文)

【おおかみに焦点を当てた場合】

スクリーンショット (67)

【おかあさんに焦点を当てた場合】

スクリーンショット (68)

画像では分かりませんがこの図形はびよよんびよよんと動かせるのでこのように色々な視点から傾向を探ることができます。

アンケートの自由回答なら、意外な組み合わせがつながっていたりと新しい発見がいろいろありそうですね。

ワードクラウド(画面右上)

スコアが高い単語を複数選びだし、その値に応じた大きさで図示しています。色が品詞に対応しています。(サイト本文)

【ここでいうスコア】
「今日」や「こんにちは」など、一般的な単語は、どの文章にも出てきやすいため、 出現回数が多くなってしまう傾向がありますが、特徴的な単語ではありません。
そのため、一般的な単語ほど重みを軽くする処理を行っています。その結果がスコアの値です。 つまり、その文章に特徴的な単語(特徴語)ほどスコアが高くなります。

スクリーンショット (69)

視覚的にパッと結果が分かり、上位だけ知りたいときは一番役に立ちそうな機能です。

なぜかおおかみがいません。やぎとおかあさんの物語みたいになっています……粉屋ですら出てきているのに……。

解析結果の表(画面真ん中)

スクリーンショット (70)

数値でデータを確認できます。なんだかんだいってここが一番汎用性が高いかもしれませんね!

アンケートの自由回答なら、注目されている単語が上位に来ます。誰もが思う問題点などは上位に来るかもしれませんし、誰もがなかなか思いつかないアイデアなんかは下位の方に来るかもしれませんね。
課題点からアイデアまで、いろいろ発見できることでしょう!

おまけ:Twitterの解析

ちなみにTwitterでツイートの解析をすると、普段からどんなツイートをしているか調べることができておもしろいです!人間性が一瞬でバレる恐ろしいツールです(褒めています)

毒舌タレントの有吉さんで試してみました。

スクリーンショット (71)

「おばさん」「ダサい」「モンスター」

単語だけ見ると超辛辣に見えますが、実際のところは何と紐付いているんでしょう? もう少し調べる必要がありそうですね……! ストーキング魂に火がつきそうです!

しかしながらそれと同じくらい「申し訳(ありません)」や「くださる」などの丁寧な言葉も多く見られます。本当は優しい人なんでしょうね。たぶん……。

スクリーンショット (55)

また、このTwitterアイコンのところから入れば自分のアカウントも解析することができます。気付かないうちにつぶやいている、自分の口癖なんかもチェックしてみるとおもしろいかも? というかチェックしておいた方が良いですね……。はい。

上にあるアイコンからは持っているファイルでも解析することができるので、自分が独自にまとめたものをここで解析することもできます。(うちの社員さんはこれを使っています)

最後に

今回は分析ツール「テキストマイニング」をご紹介しました。アンケートでご紹介できなかったので少し分かりにくかったかもしれませんが、操作感だけでも伝わっていれば幸いです……!

使い方によっては人の思想の動きや傾向を知ることができ、なかなか興味深いです。ですので、アンケートとは関わりのない方もぜひ使ってみて下さいね。

The following two tabs change content below.
「共感」をモットーにパワフルな記事を書いていきたいと思います。ブログを書いているとよく自分の世界に入り込んでしまいます。読みにくくなるので直したいとは思っているのですが道は長そうです。お手柔らかにお願いします。

Facebookのコメント

この記事へのコメント

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です