Re:ゼロから始めるML生活

どちらかといえばエミリア派です

Recsim NGを使ってみる(その2)

この前、RecSim NGのチュートリアルをやってました。 www.nogawanogawa.com このときは特に強化学習っぽいところまで行きませんでした。 今回は確率的シミュレーションに関するチュートリアルをやってみたいと思います。

RecSim NGを使ってみる

先日とあるチュートリアルを聞いていたところ、RecSimというライブラリが使用されていました。 どうやら、推薦を行うエージェントがコーパスやユーザーと対話する推薦システム環境をシミュレーションするライブラリのようでした。 こちらのライブラリが2019…

「オンラインテスト後の長期的な介入効果」について考える

A/Bテストなどのオンラインテストを行っている事例はネットで探せば沢山見つかります。 ただ、そのオンラインテスト後の介入効果の長期影響について分析については、あまり見かけない気がします。 いざ実務でオンラインテストを行うと、「A/Bテストが良かっ…

Rで時系列の疑似データを作る

最近時系列データを使ってゴニョゴニョしたいことがありました。 定期的に状態空間モデルとか使って時系列モデリングしたくなるけど、だいたいのケースで何も覚えてなくて詰む。— 野川の側 (@nogawanogawa) 2022年8月29日 時系列データだと、Rが使われること…

形態素解析器をいろいろ試す

日本語自然言語処理を行う際に、形態素解析をどうするかという問題はいつもつきまとってきます。 今回記事を書こうと思ったのは、Vaporettoなる形態素解析器を見かけたからです。 こちらに興味が湧いたのと、他の形態素解析器と比較してみたくなったので、や…

MLFlowでLightGBMの学習結果をtrackingしてみる

結構前にMLFlowをいろいろ触ってみていたんですが、最近全然触っていなかったので色々見てみました。 www.nogawanogawa.com 前に自分が触っていたときよりだいぶ使いやすくなってたので、今回は最近の自分の用途に合わせて改めてMLFlowを使ってみます。

推薦システムにおけるニューラルネットワークの活用について読んだ論文をゆるくまとめる

ここ数ヶ月くらい、推薦システムにおけるNNの活用というテーマで論文をちょこちょこ読んでいました。 推薦システムにNNを適用・応用するという守備範囲も広いテーマではありますが、せっかく良い機会なので自分用にまとめてみたいと思います。 理解が曖昧な…

協調フィルタリングとMatrix Factorizationについてこっそり勉強する

matrix で検索したらこっちのmatrixの画像が出てきた あんまり大きな声では言えませんが、協調フィルタリングって実はあんまり理解してないんですよね… Matrix Factorizationなんて、全くわかっていませんし。 これを言うと、いろんな人にシバかれそうなので…

推薦"システム"が一般的にどう動いているかを調べる

最近、システムという観点での推薦システムって、一般的にどうやって作られてるんだろう?って考えることがありました。 そんなことを考えていたところ、最近こちらのブログを拝見しました。 medium.com 今回はこちらのブログを読んで、考えてみたことをまと…

"Attention is All You Need" は本当か調べる

”Attention is All You Need”というタイトルでTransformerの論文が発表されてから随分経ちます。 ただ、最近は”大事なのはSelf Attentionじゃない”といった趣旨の論文をちらほら見かけるようになってきていると感じていて、これについて自分用のメモがてらま…

Feature Storeについてふんわり理解する

最近こちらのサイトを参考にfeature storeに関して勉強してみたので、今回はそのメモです。 www.featurestore.org

【備忘録】PyTorchのOptimizerとSchedulerの挙動

PyTorch書いてて、ちょっとわからなくなってしまったので、調べたことを備忘として残しておくメモです。

BigQueryで始めるt検定

BQを使っているときに、かんたんな検定であればBQ内で完結したくなります。 これが実現できないものかと調べてみたところ、こちらの記事を拝見しました。 lab.mo-t.com ちょっとこれを実際に試してみたくなったので、実際にやってみたいと思います。

インターリービングについて勉強する

最近interleavingという手法について勉強してました。 勉強するにあたって、資料を探していたらこちらのチュートリアルを拝見しました。 disk.yandex.ru また、日本語だとこちらの記事が非常にわかりやすかったです。 qiita.com これらをベースに勉強してみ…

Replay推定量を勉強する

先日こんなことをやっていました。 www.nogawanogawa.com オフラインテストにはバイアスがつきもので、そのへんを考慮せずにオフライン評価しようとすると、ちょっと困ったことが発生することを確認した感じですね。 今回はそんなオフラインテストでバイアス…

ログのバイアスをシミュレーションしてみる

最近ちょっと痛い目見たので自分用に勉強してみます。 今回はログのバイアスの話です。

検索の評価に関するあれこれ

以前、こちらの書籍を読んでました。 情報検索 :検索エンジンの実装と評価森北出版Amazon この中で、検索の評価に関する話がありました。 検索の文脈でアルゴリズムを評価したくなるかもしれません。 このときの評価の方法がいまいちわかっておらず、いい機…

A/Bテストで使用される検定を試してみる

最近A/Bテストについて勉強してました。*1 この前、こちらの記事を拝見しました。 www.rco.recruit.co.jp この手の検定の話は結構苦手意識があり、良い機会だったので勉強してみたので今回はそのメモです。 *1:https://www.nogawanogawa.com/entry/ab_testing

A/Bテスト初心者のメモ

世間でA/Bテストについて調べると、結構あっさり書かれていたり、逆にとんでもなく突っ込んで書かれた記事に出会ったりします。 自分のような初心者には、帯に短し襷に長しという感じだったので、こちらの書籍を読んでA/Bテストについて勉強してみました。 …

【参加録】atmaCup #11 (画像編)

7/22まで行われていた「#11 [初心者歓迎! / 画像編] atmaCup」に参加してました。 それに取り組む中で勉強した事を備忘として記録していきたいと思います。 www.guruguru.science

【論文メモ:DINO】Emerging Properties in Self-Supervised Vision Transformers

タイトルの論文を読んでみたので、内容に関する雑なメモです。

【論文メモ】SimClusters: Community-Based Representations for Heterogeneous Recommendations at Twitter

タイトルの論文を読んでみたので、内容に関する雑なメモです。

SHAPを使ってみた

先日こちらの記事を見かけました。 towardsdatascience.com 機械学習モデルの解釈についてあまり勉強したことがなく、いい機会だったので上記の記事を参考に勉強してみたので、今回はそのメモです。

【論文メモ】PinnerSage: Multi-Modal User Embedding Framework for Recommendations at Pinterest

タイトルの論文を読んでみたので、内容に関する雑なメモです。

【論文メモ】Efficient Deep Learning: A Survey on Making Deep Learning Models Smaller, Faster, and Better

こちらの記事を拝見しました。 stmind.hatenablog.com こちらで紹介されている論文が、結構きれいまとめられているように見えたので、この論文を読んだメモを書いてみたいと思います。

xfeatを使ってみる

pfn-researchから公開されているxfeatという特徴量エンジニアリングのライブラリがあります。 【リリース】特徴量エンジニアリングのライブラリ xfeat を公開しました。データフレームから特徴量を作成するための各種エンコーダーを実装しています。cuDF を…

【論文メモ: Latent Cross】Latent Cross: Making Use of Context in Recurrent Recommender Systems

タイトルの論文を読んでみたので、内容に関する雑なメモです。

【論文メモ: Google Drive Recommendation】Improving Recommendation Quality in Google Drive

タイトルの論文を読んでみたので、内容に関する雑なメモです。

時系列クラスタリングってやつをやってみる

複数の時系列データがあるとき、これらを傾向に従ってクラスタリングしたくなることがあります。 そういった手法を、時系列クラスタリングと呼ぶらしいです。 ちょっと調べてみると、こちらの記事を見かけました。 時系列クラスタリングの研究サーベイ論文を…

ベイズ構造時系列モデルってやつをやってみる

時系列分析というと、SARIMAモデルや状態空間モデルなどがよく使われているかと思います。 私自身、これらのモデルについて一つの系列データについてモデルを適用したことはありますが、複数の系列データが影響するようなモデルについては扱ってきませんでし…