NEologd Casual Talks 参加メモ

NEologd Casual Talksに参加してきた。

NEologdをどう使うと便利なのか - クエリ拡張における活用 - (@Quasi_quant2010)

  • クエリSuggestにおける前処理エラーの補正
  • Suggestにおける複合語を補正
  • 検索漏れを防ぐ
    • 辞書としてNeologdを使う
    • クエリ拡張
    • N-Best


前処理用Pythonモジュールneologdnの紹介 (@_yukinoi)

  • neologdn
    • NEologdの前処理用Pythonモジュール
    • Cython使っているのでちょっと速い


ファッションを扱うサービスの検索改善のために、Elasticsearchのユーザー辞書とシノニム辞書を作った話 (@sinamon129)

  • ElasticSearchのuniGram
    • 再現率が高くて適合率が低い
      • ○ ワンピで検索した時にワンピースが出る
      • × ファーで検索してローファーが出る
  • ElasticsearchのtokenizerをuniGramからkuromojiに変更
  • ユーザ辞書追加
  • シノニム辞書追加


知識を紡ぐための言語処理と、そのための言語資源 (@conditional)

  • エンティティ・リンキング
    • テキスト中の固有表現に適切な実体を付与


2016年末のNEologd (@overlast)

  • カラム拡張機能
    • 拡張したカラムに好きなデータを追加できる
    • gitリポジトリにUPしたカラム拡張を共有できる
  • 今後
    • 動詞エントリの拡張
    • 略語エントリの追加
    • 新語の追加