NEologd Casual Talks 参加メモ
NEologd Casual Talksに参加してきた。
NEologdをどう使うと便利なのか - クエリ拡張における活用 - (@Quasi_quant2010)
- クエリSuggestにおける前処理エラーの補正
- Suggestにおける複合語を補正
- 検索漏れを防ぐ
- 辞書としてNeologdを使う
- クエリ拡張
- N-Best
前処理用Pythonモジュールneologdnの紹介 (@_yukinoi)
- neologdn
- NEologdの前処理用Pythonモジュール
- Cython使っているのでちょっと速い
ファッションを扱うサービスの検索改善のために、Elasticsearchのユーザー辞書とシノニム辞書を作った話 (@sinamon129)
- ElasticSearchのuniGram
- 再現率が高くて適合率が低い
- ○ ワンピで検索した時にワンピースが出る
- × ファーで検索してローファーが出る
- 再現率が高くて適合率が低い
- ElasticsearchのtokenizerをuniGramからkuromojiに変更
- ユーザ辞書追加
- シノニム辞書追加
知識を紡ぐための言語処理と、そのための言語資源 (@conditional)
- エンティティ・リンキング
- テキスト中の固有表現に適切な実体を付与
- 日本語Wikificationコーパス
- 拡張固有表現 + Wikipediaデータ
- http://www.languagecraft.com/enew/
- 世界のありとあらゆるものを200クラスに階層化した辞書
2016年末のNEologd (@overlast)
- 今後
- 動詞エントリの拡張
- 略語エントリの追加
- 新語の追加