覚え書きブログ

読者です 読者をやめる 読者になる 読者になる

異種混合学習(FAB編)

今回は続きのFAB(Factorized Asymptotic Bayesian inference)についてメモる。 hirotaka-hachiya.hatenablog.com【4. Factorized Asymptotic Bayesian Inference Algorithm】 まず、FICに含まれるは、ML(Maximum Likelihood)推定量なのだが、実際には求…

異種混合学習(FIC編)

下記のブログを参考にして、 d.hatena.ne.jp NECの異種混合学習技術に関連する論文を読んでみることにした。今回は、AISTATS2012で発表された藤巻さんと森永さんの論文「Factorized Asymptotic Bayesian Inference for Mixture Modeling」の前半FIC(Factoriz…

Pythonの覚え書き(DataFrameのSettingWithCopyWarningの対処方法)

DataFrameの要素の値を更新する際に、SettingWithCopyWarningという警告が出ることがある。 例えば、次のようにユーザのデータを管理するDataFrameにおいて年齢(age)を更新する場合などである。 >>> import pandas as pd >>> df = pd.DataFrame({'name':['…

Pythonの覚え書き(グラフのプロット編)

Pythonでグラフをプロットするには、matplotlibライブラリのpylabのplotが標準的に用いられる。 >>> import matplotlib.pylab as plt >>> import numpy as np >>> plt.plot(np.random.rand(100)) csvファイルで保存されたデータをプロットするには、pandasラ…

行動認識の覚え書き(improved dense trajectoriesのインストール編)

行動認識でよく用いられているImproved Dense Trajectories(以下、IDTと呼ぶ)を試してみた。 IDTのコードは、Heng Wangにより以下のサイトで公開されている。 http://lear.inrialpes.fr/people/wang/improved_trajectoriesIDTは、FFmpegとOpenCVを用いてい…

Pythonの覚え書き(リストの連結編)

Pythonでは、2つのリストを、+を用いることにより簡単に連結することができる。 >>> list1=[1,2,3] >>> list2=[4,5,6] >>> list1+list2 [1, 2, 3, 4, 5, 6] ただし、+で連結できるのは、水平方向だけで、垂直方向の連結はできない。垂直方向の連結をする場…

Pythonの覚え書き(pandasのDataFrame編)

PythonのpandasモジュールのDataFrameを使うと、簡易的なデータベースを作ることができる。csvやhdfファイルで保存されたデータを読み込むこともできるため、非常に便利である。以下は、DataFrameの定義の例である。 >>> import pandas as pd >>> df = pd.Da…

Ubuntuの覚え書き(flash playerプラグインのインストール編)

Ubuntu14.04のMozilla FirefoxにFlash playerのプラグラインを入れてみた。 まず、下記のAdobeのFlash playerのダウンロードサイトにアクセスしてみたが、Ubuntu用のパッケージ(debファイル)が見当たらない。 https://get2.adobe.com/jp/flashplayer/そこ…

ソフトウェアアーキテクトが知るべき97のこと

O'REILLYジャパンからから発売されている、ソフトウェアアーキテクトに向けた助言がまとめられた本「ソフトウェアアーキテクトが知るべき97のこと」が、Webで公開されている。 http://ソフトウェアアーキテクトが知るべき97のこと.com/英語版「97 things eve…

Python覚え書き(lambdaとsorted編)

Pythonでは、lambdaオペレータを使うと名前のない関数、つまり匿名関数(anonymous function)を定義することができる。 例えば、 >>> myFunc=lambda x: x*x << のように定義された関数は、次のdefオペレータを使った場合と同じ関数となる。 >> >>> def myFu…

データサイエンスフェスティバル最終発表会への参加

Start todayにより開催されたデータサイエンスフェスティバル(zozotownの閲覧履歴データの解析)の最終発表会に参加してきた。 https://lpc.zozo.jp/recontest/ 最終発表会では、上位5チームのプレゼンと最終結果発表が行われた。賞金は1位が100万円、…

最近のオープンデータ

最近は、製品やサービスから集めたデータを一般に公開する企業が増えている。ここでは、いくつかの事例を紹介する。 zozotown: データサイエンスフェスティバル https://lpc.zozo.jp/recontest/ ファッション通販サイトzozotownの閲覧、購入履歴データを公開…

Pythonの覚え書き(Scikit-learn, statsmodels編)

Pythonで機械学習といえばScikit-learn、時系列予測といえばstatsmodels。まずは、コマンドプロンプトで次のコマンドでscikit-learnをインストールした。 >pip install -U scikit-learn Downloading/unpacking scikit-learn from https://pypi.python.org/pa…

Python の覚え書き(Numpy編)

Pythonの数値計算ライブラリNumpyを使って行列演算をしてみた。まずは、Numpyをインポートする。 import numpy 次に、arrayを使ってベクトルa, b, cを定義する。 a=array(1,2,3) b=array(4,5,6) c=array(5,7,3) 次に、ベクトルの転置とベクトルの積から行列A…