Explore "Full-Stack" in depth!

情報系の専門学校で、今は機械学習に的を絞って学習中。プログラミングを趣味でやりつつ、IT系のあらゆる知識と技術を身に付けるべく奮闘中。

Python

exec関数で作るMarkdown内スニペット実行のアイディア

目次 目次 概要 前提知識 exec関数 本題 総評 注意点 概要 ブログを書く立場上、 プログラムとその実行結果を見せながら解説するというケースはよく発生します。 例えば、 n = 1 print(['even','odd'][n%2]) n = 0 print(['even','odd'][n%2]) #実行結果 odd ev…

私の思うRubyのメリットデメリット&プログラミング言語に対するあれこれ

目次 目次 概要 注意 何故このような記事を? 本題:Rubyのいいところ 組み込み関数が強い・簡潔に書ける 動的型付けならではのコーディング プロトタイプが特に強い 本題2:Rubyの悪いところ 書き方が自由すぎる 本題3:Rubyは初心者に向いているか? 静的型付け…

決定木のmax_depthを直感的に理解する@ミニ記事

目次 目次 概要 基本 おまけ:実装 総評 概要 ※かなり短い記事です。 今更ながら決定木のやっていることがわかってきたので簡単にまとめておきます。

最近人気なNumbaを深く考察する。

目次 目次 概要 まずはコードの書き方を変える 参考:実行時間の計測 各要素全てを合計する。 組み込み関数sum()を使う(速度:普通) np.sum()を使う(速度:高速) フィボナッチ数列を求める。 非JIT(実行速度:遅い) JIT(実行速度:爆速) 明示的型付けJIT(実行速度:…

メモリアドレスの観点からPythonオブジェクトに対する破壊的操作を見てみる@ミニ記事

目次 目次 概要 前提 まずはGoで復習 本題:Pythonのスライスとアドレス? Pythonの破壊的操作? 総評 概要 内容はタイトルの通りです。 前回の記事からもう少し視野を広げて、 Pythonでの変数の挙動を見てみようと思います。 結構短い記事なのですぐ理解できるか…

Fashion MNISTになけなしの知識でアプローチする。

目次 目次 概要 前提 何故Fashion MNISTなのか? 本題 ベースライン 最適化関数を幾つか試してみる Adadelta Adagrad エポック数、バッチサイズを変えてみる batch_size = 32 batch_size = 128 nepoch = 10 nepoch = 30 総評 概要 最近はPyTorchの実装の勉強に…

Pipenvの使い方を簡単にまとめる。

目次 目次 概要 Quick Start インストール 環境変数 何故環境をファイル化? 環境の可視化、統一 一貫した環境構築のパイプライン 仮想環境に入る Pythonのバージョンを指定した仮想環境の切り出し なんとなく作った環境 総評 概要 機械学習の勉強をしていても…

局所領域に対して一次微分でエッジ検出する(ノイズの有無も)

目次 目次 概要 前提知識 一次微分によるエッジ検出 本題:実装 局所領域に対して一次微分でエッジ検出(withノイズ無し) 局所領域に対して一次微分でエッジ検出(withノイズあり) ノイズに弱いか検証 総評 概要 画像認識 (機械学習プロフェッショナルシリーズ)…

自身のTwitterデータを分析して、WordCloud生成までを行った!

目次 目次 概要 実装 月別ツイート数 前処理・EDA 日付の切り分け 参考 split()の仕組み データが綺麗じゃない時の「表記ゆれ」を考慮する リプライのIDを消す ツイート長を特徴量に加える ツイート長とImpressionの関係 ツイート長の分布 時間別に分析 本題:To…

Pythonのアノテーションを使ったアイディアの提案

目次 目次 概要 ->とは、:とは 戻り値のアノテーション 引数のアノテーション アノテーションを__annotations__で取得する 実用例 総評 概要 ちっちゃめの記事です。 この前過去コンペのWinners Solutionを見ていたら、 気になる関数定義の方法を見つけました。 …

外れ値検出の恩恵を知りたかったが「失敗」した。

目次 目次 概要 注意:必ず読んでください 前提 本題 余談:外れ値を予測するモデル? いざ実装(失敗) 普通に学習 非外れ値のみを対象に 外れ値分類モデル 失敗 総評 概要 Kaggle等のコンペでは複数のモデルの予測結果をアンサンブルするという手法は頻繁に用い…

2018年を振り返る+2019年の目標を立てる

目次 目次 概要 今年のプログラミング総まとめ Ruby BookManage WeatherReport Drumapi HubAPI Python スクレイピングで画像一括取得 C言語 総評 来年の課題 機械学習・データ分析総まとめ 始まりはマイナビコンペ サラマンダー本で基礎固め そしてKaggle 総…

(第二回)PyTorchの公式ドキュメント翻訳ハンズオン

目次 目次 概要 実行環境 はじめに DATASET CLASS Transform データロードに関するTips 総評 概要 昨今、ディープラーニングのフレームワークはさながら戦国時代とも言えるべき程増えてきています。 私はなんとなくPyTorchが気に入ったので使い方をいろいろ見…

1日1カーネルのススメ(サンプルあり)

目次 目次 概要 カーネルを読む意義 実例:Porto Seguro 概要 ライブラリのインポート カテゴリ変数のエンコード バイナリエンコード モデル構築 RandomForest Logistic Regression ナイーブベイズ XGBとLGBM Level1 Level2 その他アルゴリズム Level3 総評 …

ABC 115に参加しました。

目次 目次 概要 A問題 Christmas Eve Eve Eve B問題 Christmas Eve Eve C問題 Christmas Eve D問題 Christmas 総評 余談 概要 AtCoder Beginner Contest 115に参加しました! beta.atcoder.jp 前回から成長して、A,B,C問題を解くことが出来ました! また、D問題…

(第一回)PyTorchの公式ドキュメント翻訳ハンズオン

目次 目次 概要 実行環境 始めるPyTorch 追記 Torch Tensor Numpyとの連携 自動微分 Neural Network 分類器の訓練 CNNの定義 損失関数、最適化関数の定義 ネットワークの訓練 テストデータを用いて性能評価 総評 概要 昨今、ディープラーニングのフレームワー…

Kaggleに入門したい人におすすめするアプローチ法

目次 目次 概要 簡単な経歴 Kaggleに対するアプローチ 結果よりもプロセスを意識する Python、R関係無く読む コミュニティに入る オススメ環境 高スペックマシンを扱えるカーネル NoteBookの管理にGit 実際の流れ 参加するコンペを選ぶ Kernelを見る 高スパン…

ABC 114に参加しました。

目次 目次 概要 A問題 B問題 総評 余談 概要 競プロのコンテスト初参加しました。 beta.atcoder.jp に参加しました。 A,B問題しか解けませんでしたが、 とてもいい経験が出来たので載せておきます。 以下A,B問題に対する解法を載せるので 知りたくない人はブラウ…

4月からの8ヶ月間を振り返った+取り組んだ技術書総紹介

目次 目次 概要 お礼 ここまでの記録 取り組んだ技術書 C Git HTML&CSS JavsScript 資格 統計学 Python セキュリティ Ruby ML 総評 概要 専門学校に入学した4月から、今日まで実に8ヶ月余りが経過しました。 Rubyを知りとにかくプログラミングを頑張った最初期…

ABCのA,B問題にひたすら頭を打ち続ける(50~55)

目次 目次 概要 ABC050-A ABC050-B ABC051-A ABC051-B ABC052-A ABC052-B ABC053-A ABC053-B ABC054-A ABC054-B ABC055-A ABC055-B 総評 概要 データ処理のコードは軒並み複雑になりがち(KaggleのKernel参照)ですし、 単純にプログラミングにおいてより綺麗な…

2Dデータの可視化に最適なSeabornのチュートリアルを作成した

目次 目次 概要 環境設定 Jupyter Notebookの場合 使用するデータセット 基本 統計的推定 カテゴリ変数の可視化 応用編 relplot()による統計データの関係 箱ひげ図 分布(ヒストグラム) 終わりに 余談 概要 データ分析系コンペでは、EDAやDataが重要なプロセス…

データ分析コンペのガイダンスを作成した。

概要 概要 記事のタイトルの割にはあまり内容の無い記事になります。 機械学習に興味を持っている人が結構多くなってきた印象があります。 かく言う私も機械学習をやろうとしてから一ヶ月程度が経ち、 いろんな事に挑戦し始めました。 そのうちの1つにデータ分析…

ガバッと買った本紹介:2018/11月版

概要 買った本 画像認識(MLPシリーズ) これなら分かる最適化数学 前処理大全 来月は? 概要 私は基本的に書籍を用いた学習をしています。 ネットにある誰かが書いた記事は勿論参照しますが、 やっぱり体系的にやりたいという場合には、 書籍というアプローチはと…

SVMについて簡単に理解する。

概要 SVMの基本概念 線形識別モデルとSVMの比較 SVMの特徴 スケールの重要性 実装、SVM 非線形SVM分類器 多項式カーネル カーネル関数とは ガウスRBFカーネル SVM回帰 終わりに 概要 サラマンダー本は数式もガンガン出てきて、それなり難しい話が続きますが、 …

正則化された線形回帰三種をまとめる。

概要 使用するデータ 似た言葉(正規化、標準化) 正規化 標準化 本題:正則化 Ridge回帰 Ridge回帰の閉形式解 Lasso回帰 Elastic Net 終わりに 余談 概要 サラマンダー本の4章は数式もガンガン出てきて、それなり難しい話が続きますが、 その中でも正則化について…

線形回帰モデルの訓練手法について。

目次 目次 概要 対象読者 線形回帰モデルの定義とコスト関数MSE 使用するデータ 正規方程式 正規方程式の使い所と長短 正規方程式メリット 正規方程式デメリット 勾配降下法(Gradient Descent…GD) 勾配降下法と学習率 CASE:学習率低 CASE:学習率高 バッチ勾…

「自動車の走行距離予測」に挑戦した話+上手く行かなかった事。

概要 SIGNATEというサイトがあります。 和製Kaggleのようなサイトで、コンペをいくつか開催しています。日本語なので、私達日本人にとってはKaggleより親しみやすいかもしれません。 また、練習問題や入門講座もあるので、より初心者にフォーカスしたサイトになって…