Re:ゼロから始めるML生活

どちらかといえばエミリア派です

LlamaIndexを使ったサンプルRAGアプリケーションを動かす

2023年くらいからLLMがブームになってますが、自分はというとChatGPTをそのまま使っていたくらいで、それ以上はLLMに特に触っていませんでした。 正直そんなに興味はなかったんですが、まったく知らないのはそれはそれでまずいと思うようになりました。 とい…

Feature Storeってどんなもん?Feastを使ってみる

この記事はMLOps Advent Calendar 2023の23日目の記事です。 以前、Feature Storeに関する記事を書いていました。 www.nogawanogawa.com この記事を書いた当時は「Feature Storeってこんな感じかー」って思って終わってしまい、どんな感じに使うのかは触って…

【参加録】CommonLit - Evaluate Student Summaries

雑記です。 2023/10/12 09:00 JSTまで行われてたCommonLitコンペにひっそりと参加していました。 久しぶりにkaggleコンペを最後まで完走してちょっとだけ気分が良いので、振り返りを書いていこうと思います。

Twitterの推薦機能について調べたり眺めたりしたメモ

先日、Twitterの推薦アルゴリズムがGitHubで公開されました。 Twitter recommendation source code now available to all on GitHub https://t.co/9ozsyZANwa— Elon Musk (@elonmusk) 2023年3月31日 Twitter上で非常に盛り上がっており、すでにいろんな方が…

Push通知改善に関して調べたことをまとめる

最近Push通知についてあれこれ考えたり調べたりすることがあったんですが、これについて何の気無しにTweetしたら、普段より多めの反応がありました。 プッシュ通知の頻度最適化https://t.co/409dLClFbv— 野川の側 (@nogawanogawa) 2023年2月2日 思いの外反応…

PyTorch Metric Learningの使い方を眺める

良質なEmbeddingを作成したくなることがあって、Deep Metric Learningを試してみることにしました。 やってみたら意外と使い方にハマったので、備忘の意味で記録していこうと思います。

PyTorch Lightningでcross validationを書こうと思ったら失敗した話

前にこんな感じのことをつぶやいていました。 pytorch lightningでcross validation書くときって、こんな感じに書かなきゃダメなの?もっとシンプルに書けるもんなのか?(全然わかってない顔)https://t.co/R3OzpZC0lq— 野川の側 (@nogawanogawa) 2022年11…

ランク学習の推薦モデルについて解釈してみる

この記事は (1人で)基礎から学ぶ推薦システム Advent Calendar 2022の20日目の記事です。 機械学習の解釈性・説明性が注目され始めてから久しく現在では、回帰や分類タスクに関するXAIへの取り組み方は調べれば文献が得られるようになってきたなと思ってい…

EASEを使ってみる

この記事は (1人で)基礎から学ぶ推薦システム Advent Calendar 2022の13日目の記事です。 今回は、EASEというアルゴリズムを試してみようと思います。 ※見様見真似で書いてみたものの、スコアが低すぎてなんかおかしいので多分後で実装し直します。

iALSを使ってみる

この記事は (1人で)基礎から学ぶ推薦システム Advent Calendar 2022の12日目の記事です。 最近iALSという、暗黙的FBを使った協調フィルタリングのアルゴリズムに関する記事を見かけました。 engineering.visional.inc このアルゴリズムは結構昔からあるの…

基本的な推薦アルゴリズムを書いて眺める

この記事は (1人で)基礎から学ぶ推薦システム Advent Calendar 2022の11日目の記事です。 推薦関係のアルゴリズムは現在でも新しいアルゴリズムがありますが、古典的なアルゴリズムとして協調フィルタリング〜Factorization Machineが挙げられると思います…

BigQueryでサッと試す推薦アルゴリズム

この記事は (1人で)基礎から学ぶ推薦システム Advent Calendar 2022の10日目の記事です。 前回までで、推薦システムを考える上でのさわりの部分は確認できたと思うので、ちょっとずつ実務っぽい話にシフトしていこうと思います。 実務で難しい推薦アルゴリ…

推薦アルゴリズムの評価について考える

この記事は (1人で)基礎から学ぶ推薦システム Advent Calendar 2022の9日目の記事です。 前回、(あってるかどうかはわかりませんが)推薦システム開発の大まかな流れを書き出しました。 今回は「推薦精度の評価」をどうするかについて考えていきたいと思…

推薦システム開発ひとめぐり

この記事は (1人で)基礎から学ぶ推薦システム Advent Calendar 2022の8日目の記事です。 昨日まで「とりあえずやってみよう!」というテンションでの準備体操は終わったので、今日は一歩下がって推薦システム開発の大まかな全体像を一巡りしていこうと思い…

recsys-pythonをやる (第13章 推薦順位に基づく正確性)

この記事は (1人で)基礎から学ぶ推薦システム Advent Calendar 2022の7日目の記事です。 前回に引き続きrecsys-pythonをやっていきます。 www.nogawanogawa.com 今回は13章をやっていきたいと思います。

recsys-pythonをやる (第11章 嗜好予測の正確性・第12章 好き嫌い分類に基づく評価指標)

この記事は (1人で)基礎から学ぶ推薦システム Advent Calendar 2022の6日目の記事です。 前回に引き続きrecsys-pythonをやっていきます。 www.nogawanogawa.com 今回は11章からやっていきたいと思います。

recsys-pythonをやる (第9章 単純ベイズ分類器・第10章 決定木)

この記事は(1人で)基礎から学ぶ推薦システム Advent Calendar 2022の5日目の記事です。 前回に引き続きrecsys-pythonをやっていきます。 www.nogawanogawa.com 今回は9章・10章をやっていきたいと思います。

recsys-pythonをやる (第7章 評価履歴の次元削減・第8章 評価値行列の次元削減)

この記事は (1人で)基礎から学ぶ推薦システム Advent Calendar 2022の4日目の記事です。 前回に引き続きrecsys-pythonをやっていきます。 www.nogawanogawa.com 今回は7章からやっていきたいと思います。

recsys-pythonをやる (第5章 ユーザベース協調フィルタリング・第6章 アイテムベース協調フィルタリング)

この記事は (1人で)基礎から学ぶ推薦システム Advent Calendar 2022の3日目の記事です。 前回に引き続きrecsys-pythonをやっていきます。 www.nogawanogawa.com 前回は4章までだったので、今回は5章からやっていきたいと思います。

recsys-pythonをやる (第3章 類似度に基づく推薦・第4章 k近傍法)

この記事は (1人で)基礎から学ぶ推薦システム Advent Calendar 2022の2日目の記事です。 前回に引き続きrecsys-pythonをやっていきます。 www.nogawanogawa.com 今回は3章からやっていきたいと思います。

recsys-pythonをやる (第1章 評価履歴・第2章 評価値行列)

この記事は (1人で)基礎から学ぶ推薦システム Advent Calendar 2022の1日目の記事です。 2022年に、こちらの問題集が公開されました。 recsyslab.github.io こちらは下記の書籍に関連する問題集らしく、下記の文献を読みながらやってみたのでそのメモです…

Recsim NGを使ってみる(その2)

この前、RecSim NGのチュートリアルをやってました。 www.nogawanogawa.com このときは特に強化学習っぽいところまで行きませんでした。 今回は確率的シミュレーションに関するチュートリアルをやってみたいと思います。

RecSim NGを使ってみる

先日とあるチュートリアルを聞いていたところ、RecSimというライブラリが使用されていました。 どうやら、推薦を行うエージェントがコーパスやユーザーと対話する推薦システム環境をシミュレーションするライブラリのようでした。 こちらのライブラリが2019…

「オンラインテスト後の長期的な介入効果」について考える

A/Bテストなどのオンラインテストを行っている事例はネットで探せば沢山見つかります。 ただ、そのオンラインテスト後の介入効果の長期影響について分析については、あまり見かけない気がします。 いざ実務でオンラインテストを行うと、「A/Bテストが良かっ…

Rで時系列の疑似データを作る

最近時系列データを使ってゴニョゴニョしたいことがありました。 定期的に状態空間モデルとか使って時系列モデリングしたくなるけど、だいたいのケースで何も覚えてなくて詰む。— 野川の側 (@nogawanogawa) 2022年8月29日 時系列データだと、Rが使われること…

形態素解析器をいろいろ試す

日本語自然言語処理を行う際に、形態素解析をどうするかという問題はいつもつきまとってきます。 今回記事を書こうと思ったのは、Vaporettoなる形態素解析器を見かけたからです。 こちらに興味が湧いたのと、他の形態素解析器と比較してみたくなったので、や…

MLFlowでLightGBMの学習結果をtrackingしてみる

結構前にMLFlowをいろいろ触ってみていたんですが、最近全然触っていなかったので色々見てみました。 www.nogawanogawa.com 前に自分が触っていたときよりだいぶ使いやすくなってたので、今回は最近の自分の用途に合わせて改めてMLFlowを使ってみます。

推薦システムにおけるニューラルネットワークの活用について読んだ論文をゆるくまとめる

ここ数ヶ月くらい、推薦システムにおけるNNの活用というテーマで論文をちょこちょこ読んでいました。 推薦システムにNNを適用・応用するという守備範囲も広いテーマではありますが、せっかく良い機会なので自分用にまとめてみたいと思います。 理解が曖昧な…

協調フィルタリングとMatrix Factorizationについてこっそり勉強する

matrix で検索したらこっちのmatrixの画像が出てきた あんまり大きな声では言えませんが、協調フィルタリングって実はあんまり理解してないんですよね… Matrix Factorizationなんて、全くわかっていませんし。 これを言うと、いろんな人にシバかれそうなので…

推薦"システム"が一般的にどう動いているかを調べる

最近、システムという観点での推薦システムって、一般的にどうやって作られてるんだろう?って考えることがありました。 そんなことを考えていたところ、最近こちらのブログを拝見しました。 medium.com 今回はこちらのブログを読んで、考えてみたことをまと…