前回、簡単なモデル作成まで行いました。 文書内の区分ごとで比較したところ文章が長い方が評価結果が良い傾向になりました。しかし、パラメータ調整することや、学習データに手を加えるなど評価値を上げる方法はいくつか考えることがで […]
【Doc2Vec:その3】モデルの評価
本記事では実際に作成したモデルを評価した方法について紹介します。 評価に関しては正解不正解が判定できる2値分類などと違い、対象としたものによって上手く評価方法を見極めて評価してする必要があります。 そのため、本記事では1 […]
【Doc2Vec:その2】gensimでの実装方法
本記事では実際にgensimを使って文書のベクトル化をしていく方法について記述していきます。 gensimのDoc2Vecの記述方法と学習に使う文書データの2つについて記述していきます。 Pythonの全体コード [cr […]
【Doc2Vec:その1】Doc2Vecの簡単な概要と導入(環境構築的な話)
近年、機械学習を用いて様々なタスクを処理することや、自動化することが増えています。 今回はそんな機械学習により文書をベクトル化するDoc2Vecというものについて記述していきたいと思います。 5回にわたりDoc2Vecに […]
入力データを作成して、学習させる
早速、訓練データとテストデータを作成してみたいと思います。非常に簡単な例として、一次関数のグラフを書いて、適当に点をプロットして、そのグラフよりも下にある点を+1、そのグラフよりも上にある点を-1としたものをデータとして […]