小さいMLOpsってこんなもんかと思ってやってみる

この間はMetaflowを使ってみました。

www.nogawanogawa.com

ワークフロー管理+実験管理が可能なように、Metaflow + MLFlowを使ってコードを書いてみたいと思います。多分、これだけでもMLOpsのごくごく一部は対応できていると思うので、今回はそのメモです。

参考
お題
- 文書生成
今回の主な技術要素
- ワークフロー管理：MetaFlow
- 実験管理：MLFlow
やってみる
- Metaflow
- MLFlow
考察
書いたもの
感想

参考

下記の記事で、小さく始めて大きく育てるMLOpsという内容が紹介されていました。

こちらの記事では、「Hydra、MLflow Tracking、Kedro、Optunaを導入するところから始めてみては？」といった趣旨になっていました。

Hydraを使ってハイパーパラメータの管理、Optunaを使ってハイパーパラメータの探索を行うという事になっています。ハイパーパラメータの管理は、規模が大きくなるに連れて管理の重要度が上がってきますので、ということなんでしょう。 Optunaも、使えるなら使ったほうが良いと思います。

今回は、~~めんどくさかったので~~最低限でいいと思ったので使っていませんが、これを読んでいる方は上の記事に習うのが良いと思います。三流エンジニアの私より、その道のプロが言っていることの方が正しいと思いますので。

今回は上の記事を読んで、実際に自分でガチャガチャいじっててみようと思ったのがこの記事を書くモチベーションになります。

お題

文書生成

最近文書生成を題材に遊んでみていたので、今回もそちらを題材にやってみたいと思います。

www.nogawanogawa.com

こちらをベースに色々作っていきたいと思います。

今回の主な技術要素

本当はハイパーパラメータ管理や自動チューニングなども導入したほうが良いということは重々承知しつつ、簡単のため今回はワークフロー管理と実験管理に絞って導入することを考えます。

ワークフロー管理：MetaFlow

ワークフローライブラリについてはそれぞれ特徴がありますので、正直人それぞれ好みのものを使ったら良いと思っています。今回はたまたま最近調べたMetaflowをそのまま使おうと思います。

www.nogawanogawa.com

実験管理：MLFlow

時々議論になっていたりするんですが、Metaflowでも実験管理はできないことはなく、「MLFlow v.s. Metaflow」という構図の記事をたまに見かけます。

git-academy.com

Metaflowでも、一応実行時の結果などを保存しており、それをJupyter-notebookなどで参照することで実験管理ができます。ただ、個人的には、SaaS以外で実験管理するならMLFlow一択だと思っているので、ここについては特に選定理由はそんなもんです。

「餅は餅屋」、それぞれの特色をうまく組み合わせて使ったらいいと思うので、MetaflowとMLFlowを共存して使うのも良いと思います。 MLFlow自体、特に使用が難しいものでもないのですんなり使えるかと思いますし、ダッシュボードなどもデフォルトで使えるのでその点でも良いかと思います。

www.nogawanogawa.com

やってみる

Metaflow

Metaflowを導入すること自体はそこまで難しくないです。処理の流れごとにメソッドを切って上げるだけなので、main.pyの記述を変更します。

# -*- coding: utf-8 -*-
from metaflow import FlowSpec, step

from readfile import readfile, prepareData
from encoder import EncoderRNN
from attnDecoderRNN import AttnDecoderRNN
from trainer import Trainer

INPUT = "INPUT"
OUTPUT = "OUTPUT"

class TextGenFlow(FlowSpec):

    @step
    def start(self):  
        print("Reading File...")
        text_df = readfile("data/entail_evaluation_set.txt")
        self.src, self.target, self.pairs = prepareData(INPUT, OUTPUT, text_df)
        self.next(self.init_network)

    @step
    def init_network(self):
        print("Initializing Network...")
        hidden_size = 256
        self.encoder = EncoderRNN(self.src.n_words, hidden_size)
        self.attn_decoder = AttnDecoderRNN(hidden_size, self.target.n_words, dropout_p=0.1)
        self.next(self.train)

    @step
    def train(self):
        print("Training...")
        self.trainer = Trainer(src=self.src, target=self.target, pairs=self.pairs)
        self.encoder, self.decoder = self.trainer.trainIters(encoder=self.encoder, decoder=self.attn_decoder, n_iters=75000)
        self.next(self.end)

    @step
    def end(self):
        print("Evaluation...")
        self.trainer.evaluateRandomly(encoder=self.encoder, decoder=self.attn_decoder)

if __name__ == '__main__':
    TextGenFlow()

ちょこちょこっと書き直しただけですが、大筋は前回とそこまで変わりません。

これだけで、