覚え書きブログ

Adversarial examples

Adversarial examplesという、入力画像に意図的に妨害するノイズを入れることにより、DNNの認識を失敗させる方法が研究されている。 Explaining and Harnessing Adversarial Examples, Goodfellow et al., arxiv2015 入力画像に、DNNのロス関数のに関する勾…

CGデータを用いたDeep Neural Networkの学習

最近、Deep Learningを学習するためにCGデータを活用するための研究が注目を集めている。単にCGデータを生成して学習に使うのではなく、学習にとって有用なデータを生成するために、CGのパラメータを適応的に調整するのが特徴である。以下は最近の論文の簡単…

多重重点サンプリング法

多重重点サンプリング法とは、複数のソース分布からサンプリングしたデータと密度比を持ちいて、ターゲット分布に基づく期待値をバリアンスを抑えて推定する方法である。 https://graphics.stanford.edu/courses/cs348b-03/papers/veach-chapter9.pdfもう少…

3次元空間の圧縮表現

Hilbert Map センサーデータをクラスタリングし、クラスター中心とのカーネル関数を用いて3次元のoccupancy mapを特徴量化している https://www.semanticscholar.org/paper/Large-scale-3D-scene-reconstruction-with-Hilbert-Guizilini-Ramos/f1d8ab06faefa…

強化学習覚え書き(policy gradient法の種類)

policyは、状態が与えられたもとで、行動を選択する条件付き確率とする。 PGPE (Policy Gradient with Parameter-Based Exploration) policyのパラメータの事前分布を導入し、policyを学習する問題を事前分布を学習する問題に置き換える。ただし、policyはg…