JSA Technology Blog -

DeepMind社の気象システムの記事の紹介

Google DeepMind社が新たに従来より高い精度で気候状態を予測するGraphCastモデルを発表している記事を紹介します。 GraphCastは、中期の天気予報を行うことができる気象システムです。従来のシステム […]

機械学習やデータ分析などでよく使われる解析ライブラリのPandasを利用して、データ内のミスなどを調べる方法を紹介している記事がありましたので、紹介します。本記事では、解析ライブラリのPandasを用いて、データ内の重 […]

Chat GPTでも画像生成が利用できるようになったということを紹介します。 2023年10月にOpenAIが提供しているチャットボットシステムであるChat GPTで、画像生成も利用できるようになったと発表されました。 […]

紹介する書籍は、発行が岩波書店、著者が岡野原　大輔氏の「拡散モデル　データ生成技術の数理」です。本書は、DALL-E2やMidjourney、Stable Diffusionなどの生成サービスやソフトにおいて、データ生 […]

Doc2Vecについて今まで4回にわたって記事を書いてきました。今回は前回までの簡単なまとめと、Doc2Vecを使う際の問題点について記述していきたいと思います。 Doc2Vec記事のまとめ Pythonのgensim […]

前回、簡単なモデル作成まで行いました。文書内の区分ごとで比較したところ文章が長い方が評価結果が良い傾向になりました。しかし、パラメータ調整することや、学習データに手を加えるなど評価値を上げる方法はいくつか考えることがで […]

本記事では実際に作成したモデルを評価した方法について紹介します。評価に関しては正解不正解が判定できる2値分類などと違い、対象としたものによって上手く評価方法を見極めて評価してする必要があります。そのため、本記事では1 […]

本記事では実際にgensimを使って文書のベクトル化をしていく方法について記述していきます。 gensimのDoc2Vecの記述方法と学習に使う文書データの2つについて記述していきます。 Pythonの全体コード [cr […]

近年、機械学習を用いて様々なタスクを処理することや、自動化することが増えています。今回はそんな機械学習により文書をベクトル化するDoc2Vecというものについて記述していきたいと思います。 5回にわたりDoc2Vecに […]

圧縮ファイルの圧縮解除処理でパストラバーサルの脆弱性を招く問題とその対応について説明します。問題圧縮ファイルの圧縮解除処理で、パストラバーサルの脆弱性を含むコードは以下になります。 [crayon-687ad69b9 […]

早速、訓練データとテストデータを作成してみたいと思います。非常に簡単な例として、一次関数のグラフを書いて、適当に点をプロットして、そのグラフよりも下にある点を+1、そのグラフよりも上にある点を-1としたものをデータとして […]

交差検証という名称について前のエントリーで、交差検証について書きましたが、交差検定と呼ばれることもあります(ありました?)。ただ、検定というと、統計学の用語であって、あらぬ誤解を生む可能性があるので、交差検証又は交差確 […]