Explore "Full-Stack" in depth!

情報系の専門学校で、今は機械学習に的を絞って学習中。プログラミングを趣味でやりつつ、IT系のあらゆる知識と技術を身に付けるべく奮闘中。

機械学習

最近知った深層学習系の知識(一部)をまとめる

目次 目次 概要 Conditioning Augmentation MSGAN(mode seeking GAN) バッチ正規化 AttnGANの優位性-word-level features- Gated Linear Units Residual Block 総評 概要 Cybozu Labs Youth 8th 研究生として、 今は深層生成モデルをテーマに勉強をしています…

生成モデルにおけるKL DivergenceとInception scoreについて調べた。

目次 目次 概要 TL;DR 前提知識・エントロピー 本題1:カルバック・ライブラー情報量とIS カルバック・ライブラー情報量 具体例 参考:StackGAN-v1における正則化項 Inception Score おまけ: Image distributionという表現 総評 概要 久しぶりの機械学習系記事で…

「Python機械学習プログラミング」はまさに"理論と実践"を学ぶのに最適な本

Python機械学習プログラミングの書評を熱く語りました。

入門者に捧ぐ機械学習の勉強法&決定木の内部解説

目次 目次 概要 機械学習における理論と実践 本題:決定木 参考:実行できないcreate_png()の解決策 決定木の理論的側面 ジニ不純度 エントロピー 総評 概要 昨日このようなツイートをしました。 単純に凄い気になるのだけれど、機械学習系の記事書く時って・数…

決定木のmax_depthを直感的に理解する@ミニ記事

目次 目次 概要 基本 おまけ:実装 総評 概要 ※かなり短い記事です。 今更ながら決定木のやっていることがわかってきたので簡単にまとめておきます。

Fashion MNISTになけなしの知識でアプローチする。

目次 目次 概要 前提 何故Fashion MNISTなのか? 本題 ベースライン 最適化関数を幾つか試してみる Adadelta Adagrad エポック数、バッチサイズを変えてみる batch_size = 32 batch_size = 128 nepoch = 10 nepoch = 30 総評 概要 最近はPyTorchの実装の勉強に…

2018年を振り返る+2019年の目標を立てる

目次 目次 概要 今年のプログラミング総まとめ Ruby BookManage WeatherReport Drumapi HubAPI Python スクレイピングで画像一括取得 C言語 総評 来年の課題 機械学習・データ分析総まとめ 始まりはマイナビコンペ サラマンダー本で基礎固め そしてKaggle 総…

(第二回)PyTorchの公式ドキュメント翻訳ハンズオン

目次 目次 概要 実行環境 はじめに DATASET CLASS Transform データロードに関するTips 総評 概要 昨今、ディープラーニングのフレームワークはさながら戦国時代とも言えるべき程増えてきています。 私はなんとなくPyTorchが気に入ったので使い方をいろいろ見…

1日1カーネルのススメ(サンプルあり)

目次 目次 概要 カーネルを読む意義 実例:Porto Seguro 概要 ライブラリのインポート カテゴリ変数のエンコード バイナリエンコード モデル構築 RandomForest Logistic Regression ナイーブベイズ XGBとLGBM Level1 Level2 その他アルゴリズム Level3 総評 …

(第一回)PyTorchの公式ドキュメント翻訳ハンズオン

目次 目次 概要 実行環境 始めるPyTorch 追記 Torch Tensor Numpyとの連携 自動微分 Neural Network 分類器の訓練 CNNの定義 損失関数、最適化関数の定義 ネットワークの訓練 テストデータを用いて性能評価 総評 概要 昨今、ディープラーニングのフレームワー…

Kaggleに入門したい人におすすめするアプローチ法

目次 目次 概要 簡単な経歴 Kaggleに対するアプローチ 結果よりもプロセスを意識する Python、R関係無く読む コミュニティに入る オススメ環境 高スペックマシンを扱えるカーネル NoteBookの管理にGit 実際の流れ 参加するコンペを選ぶ Kernelを見る 高スパン…

4月からの8ヶ月間を振り返った+取り組んだ技術書総紹介

目次 目次 概要 お礼 ここまでの記録 取り組んだ技術書 C Git HTML&CSS JavsScript 資格 統計学 Python セキュリティ Ruby ML 総評 概要 専門学校に入学した4月から、今日まで実に8ヶ月余りが経過しました。 Rubyを知りとにかくプログラミングを頑張った最初期…

記述統計の基礎を復習した(for統計学未学習者を含む)

目次 目次 概要 一章まとめ 記述統計と統計的推定 量的変数と質的変数 度数分布表とヒストグラム 2章まとめ 4つの尺度 代表値 平均値 中央値 最頻値 3章まとめ 散らばりの尺度 四分位偏差 分散 回帰と相関 データの関係を見る 相関係数 相関の落とし穴 総評 …

2Dデータの可視化に最適なSeabornのチュートリアルを作成した

目次 目次 概要 環境設定 Jupyter Notebookの場合 使用するデータセット 基本 統計的推定 カテゴリ変数の可視化 応用編 relplot()による統計データの関係 箱ひげ図 分布(ヒストグラム) 終わりに 余談 概要 データ分析系コンペでは、EDAやDataが重要なプロセス…

データ分析コンペのガイダンスを作成した。

概要 概要 記事のタイトルの割にはあまり内容の無い記事になります。 機械学習に興味を持っている人が結構多くなってきた印象があります。 かく言う私も機械学習をやろうとしてから一ヶ月程度が経ち、 いろんな事に挑戦し始めました。 そのうちの1つにデータ分析…

ガバッと買った本紹介:2018/11月版

概要 買った本 画像認識(MLPシリーズ) これなら分かる最適化数学 前処理大全 来月は? 概要 私は基本的に書籍を用いた学習をしています。 ネットにある誰かが書いた記事は勿論参照しますが、 やっぱり体系的にやりたいという場合には、 書籍というアプローチはと…

SVMについて簡単に理解する。

概要 SVMの基本概念 線形識別モデルとSVMの比較 SVMの特徴 スケールの重要性 実装、SVM 非線形SVM分類器 多項式カーネル カーネル関数とは ガウスRBFカーネル SVM回帰 終わりに 概要 サラマンダー本は数式もガンガン出てきて、それなり難しい話が続きますが、 …

非ソフトウェアエンジニアも使えるべき最低限Git

概要 当記事の目的 対象読者 First Impact gitlab設定 Git初期設定 何故GitHubじゃないの? 更にセットアップを続ける いざ実践 リモートリポジトリの取得(git clone) ステージ領域への登録(git add) ローカルへのコミット、リモートへのプッシュ ここまでのま…

正則化された線形回帰三種をまとめる。

概要 使用するデータ 似た言葉(正規化、標準化) 正規化 標準化 本題:正則化 Ridge回帰 Ridge回帰の閉形式解 Lasso回帰 Elastic Net 終わりに 余談 概要 サラマンダー本の4章は数式もガンガン出てきて、それなり難しい話が続きますが、 その中でも正則化について…

線形回帰モデルの訓練手法について。

目次 目次 概要 対象読者 線形回帰モデルの定義とコスト関数MSE 使用するデータ 正規方程式 正規方程式の使い所と長短 正規方程式メリット 正規方程式デメリット 勾配降下法(Gradient Descent…GD) 勾配降下法と学習率 CASE:学習率低 CASE:学習率高 バッチ勾…

機械学習の為に数学の復習をした。

概要 人工知能プログラミングのための数学が分かる本と、 やさしく学ぶ 機械学習を理解するための数学のきほんを読みました(ほぼ)。

アルゴリズムや実装を深く理解する?

TL;DR 機械学習アルゴリズムや統計学並びに数学は理解すべき?の考察 結論は、「しなくても実装出来るが知らなきゃ場当たり的」 Kaggle等のコンペと理論の勉強の二本立てを並行学習でフィニッシュです。 概要 機械学習の勉強をしようと思った時、 「KerasやScikit-l…

「自動車の走行距離予測」に挑戦した話+上手く行かなかった事。

概要 SIGNATEというサイトがあります。 和製Kaggleのようなサイトで、コンペをいくつか開催しています。日本語なので、私達日本人にとってはKaggleより親しみやすいかもしれません。 また、練習問題や入門講座もあるので、より初心者にフォーカスしたサイトになって…

"scikit-learnとTensorFlowのよる実践機械学習" のガイダンス

概要 scikit-learnとTensorFlowのよる実践機械学習 を購入しました。 2018年に出版されたオライリーの本で、 機械学習の概論を網羅的に解説していて、 サンプルコードもとても豊富だと話題です。 機械学習に対する取っ掛かりのアプローチとして 勉強方法を探して…

機械学習の勉強法を模索してみた。

当面の勉強方針(機械学習とセキュリティ) 長いようであっという間に終わりそうな学生生活では、 日々の学習を効率的に行う事を検討するべきだと常々思っています。 私はIT業界の勉強を始めてから最近まで、自分が本当にやりたいことがわかっていませんでした。 …

TensorFlowのチュートリアルを頑張って読んだので所感。

TL;DR 英語のドキュメントもGoogle翻訳に逃げずに頑張って読むことは大事だと痛感した。 単語だけは翻訳した。語彙力がついてむしろいいかもしれない…? TensorFlowのチュートリアルは機械学習のチュートリアルではない。 概要 だらだらとTwitterを眺めていたと…