ToMo

Python

[Pandas]データのグルーピング

pandasを使ってカテゴリごとにグルーピングし、平均や合計などを計算できます。データのグルーピングデータセットimport pandas as pdfrom sklearn.da...
Python

[Pandas]データを縦または横につなげる

concatをするとデータを縦または横にくっつけることができます。データを縦または横につなげるデータセットimport pandas as pdfrom sklearn.datas...
Python

[Pandas]読み込みと書き込み

pandasでデータの読み書きをする方法を解説します。pandasの読み込みと書き込みテーブル作成import pandas as pdfrom sklearn.datasets ...
Python

Optunaチューニング

LightGBMの最適なパラメータを求める際にOptunaが便利です。指定した条件内で最も精度が良くなるパラメータを設定してくれます。Optunaチューニングデータセットimpor...
Python

Gradient Accumulation(勾配累積)

Gradient Accumulationを使えば、サイズの大きいモデルでもバッチサイズを確保しながら学習できます。考え方としては、設定できるバッチサイズの最大が2だとしても、ac...
Python

1次元CNNで波形データを分類

Pythonで波形データを分類する方法を解説します。データセットload_japanese_vowelsデータセットは、scikit-learnにあるload_japanese_v...
Python

LightGBM分類モデル

LightGBMは簡単に作れるわりに精度が高いのでおすすめです。今回は分類モデルを作る方法を解説します。分類ではなく回帰をやってみたい方は以下の記事を参考にしてください。>>Lig...
Python

ロジスティック回帰で2値分類

機械学習で分類をやってみたいけど、何から勉強したらいいかわからない。。。という方は、ロジスティック回帰からやってみましょう。簡単に実装できるので初心者におすすめです。データセットs...
Python

SHAP値で特徴量の影響度を可視化

SHAP値(シャープレイ値)を計算すると、各特徴量がどれだけ予測に影響するか見ることができます。もともとはゲームにおいてどのプレイヤーが貢献しているかを確かめるために使ってたみたい...
Python

交差検証でよく使うデータ分割法4つ

今回紹介する手法で、だいたいの分割パターンに対応できると思います。交差検証をする理由・過学習を防ぐため・未知のデータで性能を評価したいためです。機械学習モデルを作るとき、データを入...