新語の属性を自動で判別

要点:沖電気情報通信研究機構NICT)はウェブサイトから新語を取得して、その属性を判別する技術を開発。新技術では、かな漢字変換や翻訳ソフトなどで使われる「形態素解析」を採用。ウェブサイト上にある文を、文法的に意味のある最小単位(形態素)に分割し、固有表現抽出や既存辞書とのマッチングを行い、用語全体の属性を判別・推定。これにより新語を高速かつ自動的にウェブサイトから取得、利用可能になる。7/22〜23に沖縄県宜野湾市で開催される情報処理学会自然言語処理研究会で紹介。

    • -

何をもって”新語”と定義しているのか?どれくらいの数の新語が日々生まれているのか?
参考
http://nikkeibp.jp/wcs/leaf/CID/onair/jp/it/387326