TabMの使い方のメモ

Python

軽めのネタです。ちょっと前にCMIコンペに出てまして、そこでテーブルデータに大してNNを適用させる実験をしていました。 www.nogawanogawa.com この実験で色々試しているときに、なにやら別のコンペでTabMというNNの手法が効いたという話を耳にしたのでCMI…

2024-12-24

Unslothの覚書き

Python NLP

これまでLLMはChatGPTとかを使うくらいの関わり方をしていたんですが、最近重い腰上げてLLMについてキャッチアップしようと勉強したりしていたりします。 LLMをfine tuneしようとしたときにどうやらUnslothというライブラリが便利らしいという話を小耳に挟み…

2024-12-21

【参加録】Child Mind Institute — Problematic Internet Use

kaggle

雑記です。 2024/12/20 09:00 JSTまで行われてたCMI-Ⅱコンペにひっそりと参加していました。一応、最後までやりきりはしたので振り返りを書いていこうと思います。

2024-09-23

LlamaIndexでGemini 1.5 Flashを使う

RAG Python

最近諸事情がありまして、プライベートでLLMをガチャガチャいじっていたんですがChatGPTの請求がとんでもないことになっていました。流石にコストかかり過ぎだということで、コストが安いGemini 1.5 Flashを使うことを検討しています。 LlamaIndexでGemini …

2024-09-16

続：RAGの評価をいい感じにできるようにしたい

RAG Python

前にRAGの評価をいい感じにできないか試行錯誤してみてました。 www.nogawanogawa.com ただ、その後使ってみてやっぱりArize Phoenixに依存するとなにかとしんどい感じがしたので、特にツールを使用せず普通のコードだけで評価をいい感じにできるように色々…

2024-09-14

LlamaTraceを使ってみる

RAG Python

以前Arize Phoenixを使ってたりしました。 www.nogawanogawa.com www.nogawanogawa.com そんなArize Phoenixですが、どうやらLlamaCloudでLlamaTraceという名前で使えるようになっているらしいです。 We’re excited to feature LlamaTrace - a collaborative…

2024-08-24

Geminiで安全性属性に関するエラーが出たときの対応メモ

Python

小ネタです。 Gemini-ProやGemini-flashを使っているときに、安全性に関するメッセージとともにエラーになることがあります。このときの対処方法について調べてみたのでそのメモです。

2024-08-13

RAGの評価をいい感じにできるようにしたい

Python RAG

最近こんな記事を見かけました。 zenn.dev zenn.dev zenn.dev 自分もRAGとかちょろっと勉強してたりしてLLMアプリケーションの評価周りはずっと気になるところではあったので、上記の記事を見てちょっと勉強してみる気になりました。せっかくなので、色々作…

2024-08-12

Arize PhoenixのTraceを永続化させてColabで読み出す

Python RAG

前にArize Phoenixを使ってみてました。 www.nogawanogawa.com Arize Phoenixを使うときに実験の記録が永続化できると非常に便利なんで、試しにやってみたのでそのメモです。

2024-08-11

LlamaIndexでHybrid Searchを試す

Python RAG

前回はLlamaIndexのvector searchでFaissを使ってみました。今回は、検索部分についてメジャーな改善手法であるHybrid SearchをLlamaIndexで試してみたいと思います。

2024-08-10

LlamaIndexでFaissを使う

RAG Python

この前は、LlamaIndexのプロンプトテンプレートを日本語にしてたりしました。 www.nogawanogawa.com 今回はretrivalの部分をちょっとカスタマイズをしようと思い、デフォルトの検索方法を変えてFaissを使うようにしたいと思います。

2024-08-06

テキスト間の一致度を評価したい

Python NLP

「2つのテキストが一致していること」を判定しようとすると結構苦労することがあります。 "わかりやすく", "微妙に"違ってる、くらいだと良いんですが、現実の問題を考えるとそんなわかりやすい状況のほうが珍しいということに気が付きます。今回はそんな意…

2024-08-05

RAGのお試しテストケース用データセット作成

RAG Python

RAGをやっていて精度検証用データセットの作成で困ったことはないですか？精度評価用のデータセットなんて作成することだけでも超めんどくさそうじゃないですか？ということで、今回はこの簡易精度評価に使うデータセット作成をやってみようと思います。

2024-08-04

LlamaIndexの裏で動いてるプロンプトを日本語にする覚書き

Python RAG

以前LlamaIndexを使っていました。 www.nogawanogawa.com LlamaIndexで質問を入力するとき、デフォルトだと英語のプロンプトが混じっています。これをすべて日本語で動かすときにいつもやり方を忘れてしまうので今回はそのメモです。

2024-06-08

GPT-4oをOCRとして使う

OpenAI Python

OpenAIからChatGPT-4oが発表されましたが、皆さんガンガンつかっていますでしょうか？さて、このChatGPT-4oですが、テキスト以外のデータも使用できるようになっているという特徴があります。普通にテキストでのやり取りをしつつも画像データを扱えるとい…

2024-05-05

Arizeを使ってRAGの性能管理をする

MLOps RAG

このまえArize Phoenixを使ってトラッキングを試してみました。 www.nogawanogawa.com PhoenixにはSaaS版のArizeがあるので、今回はそっちを使ってみたいと思います。

2024-05-04

Naive RAGからModular RAGまで

RAG Python

RAGの評価についてちょこちょこ調べたりしてましたが、今回はRAGの改善方法について調べたいと思います。正直、今でもいたるところで手法が提案されているので追いかけきれませんが、包括的なレポートで言及されている考え方くらいは調べてみたいと思います…

2024-05-03

いまさらLlamaIndexの使い方について勉強する

RAG Python

最近、というかこのGW中はRAGしかやってません。 www.nogawanogawa.com www.nogawanogawa.com www.nogawanogawa.com www.nogawanogawa.com そんなRAGをやっているんですが、実はLlamaIndexについてはちゃんと勉強してなかったことに気がついたので、今更なが…

2024-05-02

RAGにおけるMetrics-Driven Developmentを調べる

RAG MLOps

最近RAGについて勉強しています。 www.nogawanogawa.com www.nogawanogawa.com www.nogawanogawa.com www.nogawanogawa.com 今回はRAGアプリケーションの開発フローについて勉強してみようと思います。

2024-05-01

Langfuse + RagasでRAGの精度管理

RAG MLOps

最近RAGをいじっています。 www.nogawanogawa.com www.nogawanogawa.com www.nogawanogawa.com 大体評価周りに関して何したら良いかはわかってきた気がするので、今度は精度に関するトラッキングをしていきたいと思います。というわけで前回までのRagasやLl…