Python

LightGBM分類モデル

LightGBMは簡単に作れるわりに精度が高いのでおすすめです。今回は分類モデルを作る方法を解説します。分類ではなく回帰をやってみたい方は以下の記事を参考にしてください。>>Lig...
Python

ロジスティック回帰で2値分類

機械学習で分類をやってみたいけど、何から勉強したらいいかわからない。。。 という方は、ロジスティック回帰からやってみましょう。簡単に実装できるので初心者におすすめです。 データセッ...
Python

SHAP値で特徴量の影響度を可視化

SHAP値(シャープレイ値)を計算すると、各特徴量がどれだけ予測に影響するか見ることができます。もともとはゲームにおいてどのプレイヤーが貢献しているかを確かめるために使ってたみたい...
Python

交差検証でよく使うデータ分割法4つ

今回紹介する手法で、だいたいの分割パターンに対応できると思います。 交差検証をする理由 ・過学習を防ぐため・未知のデータで性能を評価したいためです。 機械学習モデルを作るとき、デー...
Python

手書き数字を画像分類

機械学習で画像分類をやってみたいけど、初心者すぎてなにしたらいいかわからない。。。 という方は、手書き数字のデータを使って分類してみましょう。すごく簡単なないようなので、初心者でも...
Python

TabNetで回帰, 分類する方法

TabNetで機械学習モデルを作る方法を解説します。Kaggleでもちょいちょい見かける、表形式データで使えるモデルです。 回帰モデル データセット import pandas a...
Python

Google Colaboratoryの使い方と有料or無料の違い

Pythonを勉強したいけど、どこでコードを書いたらいいのかわからない。。。 という方は、Google Colaboratoryを使いましょう。 私は有料のColab Pro, C...
Python

pytorchで機械学習モデルを作る方法

pytorchはtimmやBERT(transformers)が使えるので、非常に優秀なライブラリです。>>pytorchとtimmで画像分類モデルを作る方法>>pytorchとB...
Python

pytorchとBERTで文章分類

BERTは文章を使ったタスクで主流のモデルです。BERTの計算は非常に重いので、通常のノートPCに入っているようなCPUの計算だけではほとんど実装できません。Google Cola...
Python

LightGBMとtf-idfで文章分類

LightGBMとtf-idfを使った簡単な分類からやってみましょう。最近の主流はBERTですが、こちらは計算が重くGPUが必要なので、とりあえず文章分類を勉強してみたいなら今回の...