Re:ゼロから始めるML生活

どちらかといえばエミリア派です

A/Bテストで使用される検定を試してみる

最近A/Bテストについて勉強してました。*1 この前、こちらの記事を拝見しました。 www.rco.recruit.co.jp この手の検定の話は結構苦手意識があり、良い機会だったので勉強してみたので今回はそのメモです。 *1:https://www.nogawanogawa.com/entry/ab_testing

A/Bテスト初心者のメモ

世間でA/Bテストについて調べると、結構あっさり書かれていたり、逆にとんでもなく突っ込んで書かれた記事に出会ったりします。 自分のような初心者には、帯に短し襷に長しという感じだったので、こちらの書籍を読んでA/Bテストについて勉強してみました。 …

【参加録】atmaCup #11 (画像編)

7/22まで行われていた「#11 [初心者歓迎! / 画像編] atmaCup」に参加してました。 それに取り組む中で勉強した事を備忘として記録していきたいと思います。 www.guruguru.science

【論文メモ:DINO】Emerging Properties in Self-Supervised Vision Transformers

タイトルの論文を読んでみたので、内容に関する雑なメモです。

【論文メモ】SimClusters: Community-Based Representations for Heterogeneous Recommendations at Twitter

タイトルの論文を読んでみたので、内容に関する雑なメモです。

SHAPを使ってみた

先日こちらの記事を見かけました。 towardsdatascience.com 機械学習モデルの解釈についてあまり勉強したことがなく、いい機会だったので上記の記事を参考に勉強してみたので、今回はそのメモです。

【論文メモ】PinnerSage: Multi-Modal User Embedding Framework for Recommendations at Pinterest

タイトルの論文を読んでみたので、内容に関する雑なメモです。

【論文メモ】Efficient Deep Learning: A Survey on Making Deep Learning Models Smaller, Faster, and Better

こちらの記事を拝見しました。 stmind.hatenablog.com こちらで紹介されている論文が、結構きれいまとめられているように見えたので、この論文を読んだメモを書いてみたいと思います。

xfeatを使ってみる

pfn-researchから公開されているxfeatという特徴量エンジニアリングのライブラリがあります。 【リリース】特徴量エンジニアリングのライブラリ xfeat を公開しました。データフレームから特徴量を作成するための各種エンコーダーを実装しています。cuDF を…

【論文メモ: Latent Cross】Latent Cross: Making Use of Context in Recurrent Recommender Systems

タイトルの論文を読んでみたので、内容に関する雑なメモです。

【論文メモ: Google Drive Recommendation】Improving Recommendation Quality in Google Drive

タイトルの論文を読んでみたので、内容に関する雑なメモです。

時系列クラスタリングってやつをやってみる

複数の時系列データがあるとき、これらを傾向に従ってクラスタリングしたくなることがあります。 そういった手法を、時系列クラスタリングと呼ぶらしいです。 ちょっと調べてみると、こちらの記事を見かけました。 時系列クラスタリングの研究サーベイ論文を…

ベイズ構造時系列モデルってやつをやってみる

時系列分析というと、SARIMAモデルや状態空間モデルなどがよく使われているかと思います。 私自身、これらのモデルについて一つの系列データについてモデルを適用したことはありますが、複数の系列データが影響するようなモデルについては扱ってきませんでし…

k-meansのいい感じのクラスタ数を自動で設定したい

教師なし分類の代表的な手法として、k-meansがあります。 k-meansは分類自体は自動で出来るんですが、その際のクラス数はマニュアルで設定する必要があります。 そのため、どう分類されるかはここで指定するクラス数に強く依存するわけです。 この辺は人間の…

画像検索のwebアプリを雑に作ってみる

可愛かったのでアイキャッチ画像にしました ちょっと画像検索が必要になることがあり、良い機会なので復習しようということになりました。 過去にはこんなのをやってみたりしました。 www.nogawanogawa.com 今回は改めて、主にこちらの資料を参考に画像検索…

【参加録:🐤🐸】Rainforest Connection Species Audio Detection

コンペのロゴはこんな感じでした 2/18までKaggleで行われていたRainforest Connection Species Audio Detectionに参加してました。 それに取り組む中で勉強した事を備忘として記録していきたいと思います。

Microsoft Vision Model ResNet-50 を使ってみる

先日、こちらのツイートを拝見しました。 https://t.co/LUuVrYQo7nMicrosoftが非常に高性能な学習済みResNet50のモデルを公開。複数の大規模なデータセットでマルチタスク学習を行なっている。GoogleのBig Transfer, OpenAIのClipを超える転移学習の性能をし…

EfficientNetを使ってみたメモ

普段あまり画像をデータを取り扱うことがないんですが、最近ちょっといじってたりします。 www.nogawanogawa.com そんなことをやってるところに、何やらEfficientNetなどという代物があるということを見かけました。 更に調べてみると結構すごいやつというこ…

ResNetのPyTorch学習済みモデルをfine tuneして使うときのメモ

普段画像データを使って機械学習をすることがあまりないんですが、色々あって最近ちょくちょく触っています。 そんなわけで、画像認識で使うニューラルネットワークの勉強をしていて、最近では画像認識のベースラインとして使用されることもあるResNetについ…

nlplotを使ってみた

最近、昨年書かれたこちらの記事を見かけました。 www.takapy.work なんだか非常に良さそうな感じで実際に使ってみたので、今回は使ってみたときのメモです。

Transformer周りを勉強するときの情報源のメモ

自然言語処理の世界から登場したTransformerですが、最近では自然言語処理以外のところでも使用されるようになっていると個人的に感じています。 そんなTransformerですが、細かいところをあんまり知らなかったのでチョットずつ勉強してました。 Transformer…

「情報検索:検索エンジンの実装と評価」14章 並列情報検索

この記事は「情報検索:検索エンジンの実装と評価」(Buttcher本) Advent Calendar 2020の19日目の記事です。 こちらのアドベントカレンダーでは「情報検索:検索エンジンの実装と評価」(Buttcher本)を読んで、1日1章ずつまとめるといった内容になってい…

「情報検索:検索エンジンの実装と評価」10章 分類とフィルタ

この記事は「情報検索:検索エンジンの実装と評価」(Buttcher本) Advent Calendar 2020の12日目の記事です。 こちらのアドベントカレンダーでは「情報検索:検索エンジンの実装と評価」(Buttcher本)を読んで、1日1章ずつまとめるといった内容になってい…

「情報検索:検索エンジンの実装と評価」9章 言語モデルと関連分野

この記事は「情報検索:検索エンジンの実装と評価」(Buttcher本) Advent Calendar 2020の8日目の記事です。 こちらのアドベントカレンダーでは「情報検索:検索エンジンの実装と評価」(Buttcher本)を読んで、1日1章ずつまとめるといった内容になっていま…

実験管理について考える

この記事はMLOps Advent Calendar 2020 - Qiita7日目の記事です。 機械学習では、データサイエンティストは実に多くの実験を行い、膨大な数の実験からより良いモデルへと繋がる着想を得ていきます。 逆に言えば、機械学習に関する開発においては非常に多くの…

Prophetでお手軽時系列分析をやる

最近時系列分析を勉強し直してました。 www.nogawanogawa.com この過程で調べてると、何やらProphetなるライブラリがあるようで、今回はそれを使ってみたのでそのメモです。

Pythonで時系列分析をやりながら復習する

最近時系列系のデータについて扱う機会があって、その関係でちょっと勉強してました。 世の中に時系列分析の本はそこそこ出ている印象ですが、多くの場合でR言語での実装が紹介されており、Pythonでの実装が紹介されている文献はあまり多くない印象です。 と…

Optunaを使ってみる

結構前にmlflowを使ってOptunaのチューニングの過程を可視化することをやってみてました。 その時はmlflowの勉強の意図だったので、Optunaについてはあんまりわかってませんでした。 今回は、Optunaの使い方を中心に勉強してみたいと思います。

タスク固有に追加学習したBERTのEmbeddingをLightGBMに突っ込んで使用する

この前は学習済みのBERTをから取り出したEmbeddigを使ってLightGBMに突っ込んでみるところまでやってみました。 その時は特にタスク個別にBERTを学習させていなかったので、今回はタスク向けに転移学習させたBERTをモデルを使用して、そのEmbeddingをLightGB…

学習済みのBERTからEmbeddingを取得する

最近はちょいちょいBERTとかを使って遊んでたりします。 今回は、学習済みのBERTのモデルを使って、文書Embedgingを取得してみたいと思います。 参考にさせていただいたのはこちらの記事です。 yag-ays.github.io 毎度のことながら、やることは上の記事とほ…