サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
2024年ランキング
cvml-expertguide.net
1. ReLU (Rectified Linear Units) 型の活性化関数 とは [概要] ReLU (Rectified Linear Units, 整流化線形ユニット)は,ディープニューラルネットワークにおいて広く用いられる,主に中間層向けの活性化関数である [Nair and Hinton, 2010].それまでの3層MLP時代に隠れ層活性化目的で使用されてきた「シグモイド形の活性化関数(tanh関数, シグモイド関数)」と比べて,ReLUは深いCNNやDNNの学習を速めることができ,安定した最適解への収束も促すことができる. この記事では,ReLU型の活性化関数について,紹介・整理する.まず元のReLUの解説を行ったのちに(1, 2節),主なReLUと似た関数型の発展版 (PReLU, GELU, Swish, Mish)についてまとめる (3節). ReLUは,max関数を
1. CNNバックボーン(backbone)とは [概要] CNNバックボーン (backbone) とは,CNN(畳み込みニューラルネットワーク)のネットワーク構造のうち,序盤から終盤まで層の範囲全体のことをさす.脊椎生物に見立てた場合にの背骨(backbone)に,CNNの序盤から中盤の部分をたとえる(図1). ※ 終盤の予測器部分の層は頭部(head)とよぶ.またFPNなどは,ヘッドとバックボーンの間に挿入する拡張機構なので首(neck)と呼ぶ. この記事では,CNNバックボーンの代表的な設計を,登場順に概要・特徴を列挙することで,歴史のまとめを行う.より具体的には,ImageNetを用いた「物体認識向けの代表的CNNバックボーンについて,「(1年ごとの)グループ分類」 と「 時系列順の列挙」の2つを同時にまとめた「グループ化 + 年表化」の節構成とした. 親記事:畳み込みニューラル
1. Transformer とは [概要] Transformer とはアテンションを主要部品として用いた,深層学習むけの(トークン)系列変換モデルである.従来の系列変換モデルの定番であった「seq2seq with attention」の改善案として,Transformerは最初は機械翻訳むけに提案された.マルチヘッドアテンションを採用したことによる「計算効率性」と「高性能性・スケール性」から,seq2seq with attentionの後継の系列変換モデルとして,Transformerは各モーダル分野に広く普及した. この記事では,機械翻訳むけのTransformer [Vaswani et al., 2017] にフォーカスして,図も豊富に使いながら解説していく(1.1節).各層・ブロック(2節)と全体構造(3節)を順に紹介していく.記事を読了後には,Transformerの「系
1. マルチヘッドアテンション (Multi-head Attention) とは [概要] マルチヘッドアテンション (Multi-head Attention) とは,Transformerで提案された,複数のアテンションヘッドを並列実行して,系列中の各トークン表現の変換を行うブロック部品である [Vaswani et al., 2017].端的に言うと「並列型アテンション」である. この記事では,Transformerの主部品としての「マルチヘッドアテンション」について,処理の詳細や利点についてみていく(2節).旧来の系列対系列変換でも用いられていた「ソース・ターゲット系列間の相互アテンション」の役割も引き続きTransformerで担当するが,それに加えて,自己アテンションとしての役割もTransformerで担当する点が,特に重要である(3節). 親記事:Transformer:
1. 残差接続 (residual connection)とは [概要] 残差接続 (residual connection)とは,CNNの1種である ResNet [He et al., 2016a], [He et al., 2016b] の構成部品である残差ブロックにおいて,毎ブロックに配置される「スキップ接続 + そのあとの2経路の出力の足し算」の部品のことである. 要は 「残差接続 ≒ スキップ接続」ではあるが,スキップ接続のうち,ResNetの場合の残差ブロックを形成する形を,特に残差接続と呼ぶ.ResNetで,提案された「残差ブロックの多層化」の文脈では,スキップ接続を「残差接続」と別途呼び分けたほうが「残差ブロックを反復して構成しているネットワーク構造である」ことが伝わりやすくなる. 関連記事:ResNetの,従来のCNNと最も異なる点は? 【Q and A記事】 この記事
ニュース | 管理人からのお知らせ 2024年2月27日:このサイトの総アクセス数が100万PVを超えました. 2023年9月21日:仕事術・マネジメント術・組織改善のおすすめ書籍 のページを新規追加しました. 2023年4月30日: Pythonで学ぶ画像認識の著者陣とやりとりをし,Githubページから当サイトの推選リンクを張って頂きました.本書の紹介記事にもリンクしていただきました. 2023年3月14日: 用語集から📚用語Wikiという名称に変更しました 1. 概要 :探求型の学習支援の「拠点」サイト コンピュータビジョンやディープラーニングを専門とする中級レベル以上の研究開発者を対象を,強力に支援するポータル型サイトが「CVMLエキスパートガイド」です.管理人が厳選した,最重要な標準的スキル(プロとして熟練させたい基礎)の,徹底的な習熟に的をしぼっています. 以下のサイト内・サ
このページを最初にブックマークしてみませんか?
『CVMLエキスパートガイド | ホーム – コンピュータビジョン中級者を支援する「探求...』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く