この募集は2017年06月29日に終了しました。

Mecab Autolink 設定 自然言語処理の仕事

Mecab Autolink 設定 自然言語処理に関する仕事・募集案件ページです。クラウドソーシングのランサーズで、Webシステム開発・プログラミングに関する最適な外注/発注先をお探しの方、副業案件・求人をお探しのフリーランスの方はまず会員登録がおすすめです。

見積もり募集の結果

募集期間

5日間

提案数

0件

当選人数

0 件

(募集人数1人)

見積もり募集の内容

依頼の目的・背景
MeCabのAutoLink表示などを設計したいと考えています。
特に、MeCabのコスト設計や、辞書作成、自然言語処理に詳しい方だとさらにうれしいです。よろしくお願いします。
下記のようなautolink作成ですと、残念ながら非常に短い単語の登録ができません。
6ヶ月目 で、月と目を登録すると、月と目がリンクされてしまいます。普通のmecabをautolinkのようにはき出す方法やコスト設計などご指導をいただけると助かります。
http://chasen.org/~taku/blog/archives/2006/01/mecab_090_auto.html
開発の進捗状況
ランサーに相談して決めたい
開発の継続性
ランサーに相談して決めたい
重視する点
クオリティ、柔軟な対応、業務経験・知識
希望開発言語
PHP、Python、Perl
フレームワーク
ランサーに相談して決めたい
補足説明
設定なし
また、文章の前処理などにも詳しい方がいらっしゃいましたら優遇をさせて下さいませ。
以下について下記の質疑応答がありました。親切な方からわかりにくいとの話を受けたのでお返事をさせていただいています。
なお、autolink は、まず、Android の開発の話でなく、「例えば地名である文字列を自動的に探して、指定のリンク先を含んだアドレスに置き換える」事を言っている(当方が推測)と述べるべきです。

質問:
例えば検索した結果というのは、検索してヒットした元となる情報より、
文字列を判断しまして、その内容を置換して例えばリンク(HTMLで言うアンカー)にしているのだと思います。そういった内容でしょうか?

またそのアドレスのリンク先ではしっかりは調べておりませんが

Google,0,0,-5878,http://www.google.com/
Yahoo,0,0,-4472,http://www.yahoo.com/
ChaSen,0,0,-5878,http://chasen.org/
京都,0,0,-3200,http://www.city.kyoto.jp/

といった様な内容、つまりヒットする元となる情報に対してのアドレスを
ここでセットしております。

なので、「京都」といった単語に対して、置換をして
<a href="http://www.city.kyoto.jp/">京都</a>
と置き換えてアンカーにしているのです。

まず、多くの人が説明を聞いて「autolink」という単語、何の話なんだろう?と思っていると思います。
また、MeCab を知っていても、
なんでMeCab が必要なんだろう?置換するのにMeCab が必要性はなんだろう?と思う訳です。

つまり単語をご存知かもしれませんが、それの説明があちこち抜けているので、
何をおっしゃっているか、多分多くの者が推測程度にしか理解していないのです。



次にMeCab を使う理由が分からないです、
文字列を検索して置換するだけならば、MeCab は必要ないです。

MeCab は形態素解析 といって日本語の文法を元に、簡単に申しますと文を単語に分けてくれるものです。

なので、この2つの意味をタイトルに持ってきていらっしゃいますが、
そこからして、文面を読んでいる側は、知っている人は知っている人なりに
何を連想すれば良いのか、余計に分からなくなるのです。


返答:
MeCabは形態素解析ですが、形態素解析が普通の置換より優れるところは単語の文字の切り出しがよりよいためです。
3ヶ月目 ということばがあって、月と目が登録されている場合は 目と月がリンクされてしまいます。なので、形態素が必要です。
会員登録する (無料)