Re:ゼロから始めるML生活

どちらかといえばエミリア派です

LlamaIndexでGemini 1.5 Flashを使う

最近諸事情がありまして、プライベートでLLMをガチャガチャいじっていたんですがChatGPTの請求がとんでもないことになっていました。 流石にコストかかり過ぎだということで、コストが安いGemini 1.5 Flashを使うことを検討しています。

LlamaIndexでGemini 1.5 Flashを使うという文献があまり見つからなかったので、今回はLlamaIndexでGemini 1.5 Flashを使ってみたやり方の備忘録です。

続きを読む

続:RAGの評価をいい感じにできるようにしたい

前にRAGの評価をいい感じにできないか試行錯誤してみてました。

www.nogawanogawa.com

ただ、その後使ってみてやっぱりArize Phoenixに依存するとなにかとしんどい感じがしたので、特にツールを使用せず普通のコードだけで評価をいい感じにできるように色々やってみようと思います。

続きを読む

LlamaTraceを使ってみる

以前Arize Phoenixを使ってたりしました。

www.nogawanogawa.com

www.nogawanogawa.com

そんなArize Phoenixですが、どうやらLlamaCloudでLlamaTraceという名前で使えるようになっているらしいです。

ということで使ってみたいと思います。

続きを読む

RAGの評価をいい感じにできるようにしたい

最近こんな記事を見かけました。

zenn.dev

zenn.dev

zenn.dev

自分もRAGとかちょろっと勉強してたりしてLLMアプリケーションの評価周りはずっと気になるところではあったので、上記の記事を見てちょっと勉強してみる気になりました。

せっかくなので、色々作りながら評価について自分で考えてみようかと思います。

続きを読む

テキスト間の一致度を評価したい

「2つのテキストが一致していること」を判定しようとすると結構苦労することがあります。 "わかりやすく", "微妙に"違ってる、くらいだと良いんですが、現実の問題を考えるとそんなわかりやすい状況のほうが珍しいということに気が付きます。

今回はそんな意外と大変なテキスト間の一致度を評価する方法についてあれこれ考えてみたのでそのメモです。

続きを読む

RAGのお試しテストケース用データセット作成

RAGをやっていて精度検証用データセットの作成で困ったことはないですか?

精度評価用のデータセットなんて作成することだけでも超めんどくさそうじゃないですか? ということで、今回はこの簡易精度評価に使うデータセット作成をやってみようと思います。

続きを読む