Python

Optunaチューニング

LightGBMの最適なパラメータを求める際にOptunaが便利です。指定した条件内で最も精度が良くなるパラメータを設定してくれます。Optunaチューニングデータセットimpor...
Python

Gradient Accumulation(勾配累積)

Gradient Accumulationを使えば、サイズの大きいモデルでもバッチサイズを確保しながら学習できます。考え方としては、設定できるバッチサイズの最大が2だとしても、ac...
Python

1次元CNNで波形データを分類

Pythonで波形データを分類する方法を解説します。データセットload_japanese_vowelsデータセットは、scikit-learnにあるload_japanese_v...
Python

LightGBM分類モデル

LightGBMは簡単に作れるわりに精度が高いのでおすすめです。今回は分類モデルを作る方法を解説します。分類ではなく回帰をやってみたい方は以下の記事を参考にしてください。>>Lig...
Python

ロジスティック回帰で2値分類

機械学習で分類をやってみたいけど、何から勉強したらいいかわからない。。。という方は、ロジスティック回帰からやってみましょう。簡単に実装できるので初心者におすすめです。データセットs...
Python

SHAP値で特徴量の影響度を可視化

SHAP値(シャープレイ値)を計算すると、各特徴量がどれだけ予測に影響するか見ることができます。もともとはゲームにおいてどのプレイヤーが貢献しているかを確かめるために使ってたみたい...
Python

交差検証でよく使うデータ分割法4つ

今回紹介する手法で、だいたいの分割パターンに対応できると思います。交差検証をする理由・過学習を防ぐため・未知のデータで性能を評価したいためです。機械学習モデルを作るとき、データを入...
Python

手書き数字を画像分類

機械学習で画像分類をやってみたいけど、初心者すぎてなにしたらいいかわからない。。。という方は、手書き数字のデータを使って分類してみましょう。すごく簡単なないようなので、初心者でも取...
Python

TabNetで回帰, 分類する方法

TabNetで機械学習モデルを作る方法を解説します。Kaggleでもちょいちょい見かける、表形式データで使えるモデルです。回帰モデルデータセットimport pandas as p...
Python

Google Colaboratoryの使い方と有料or無料の違い

Pythonを勉強したいけど、どこでコードを書いたらいいのかわからない。。。という方は、Google Colaboratoryを使いましょう。私は有料のColab Pro, Col...