GONKURABE

だら科日記

Word2Vecのメモ

Word2Vec:発明した本人も驚く単語ベクトルの驚異的な力 - DeepAge

メリット :単語の意味をベクトル化できる.
デメリット:対義語同士の意味の違いを理解できない.

  1. CBow: Continuous Bag-of-Words
    前後の単語から、対象単語を推測していく方法.
  2. Skip-gram
    単語から、前後の単語を推測していく方法.
    Skip-gramは学習データが少なくてもある程度の精度が出るそうな.

アルゴリズムが知りたいなぁと思ったけど、ちょい諦め気味。
先人の知恵を借りて、実践で使えるところまで行けたら深掘りしようかどうか考えようと思う。
word2vecに関する勉強会に参加してきました - 5次元のカオス

 

- Jaccard/Dice/Simpson係数について

文書の類似度計算(Python3.5):Jaccard係数、Dice係数、Simpson係数 | Welcome to Singularity

 

Word2Vecを使ってみよう

米googleの研究者が開発したWord2Vecで自然言語処理(独自データ) - Qiita

 

参考にさせていただきましたーありがとうございます!