u++の備忘録

画像処理

【書籍メモ】『コンピュータビジョン最前線 Summer 2024』(共立出版)

2024 年 6 月 7 日に共立出版から発売された『コンピュータビジョン最前線 Summer 2024』を読んだので、感想を綴ります。なお本書は、寄稿者の一人である清野舜さんのご厚意でご恵贈いただきました。 www.kyoritsu-pub.co.jp コンピュータビジョン最前線 「…

【書籍メモ】『Kaggleに挑む深層学習プログラミングの極意』(講談社)

※ 「Kaggle Advent Calendar 2022」の 25 日目の記事です ご縁があって、講談社から共著で『Kaggleに挑む深層学習プログラミングの極意』を出版します。 画像・自然言語処理の機械学習コンテストを題材として、深層学習ライブラリ「PyTorch」での実装を交え…

ProbSpace「YouTube動画視聴回数予測」コンペ参加録

ProbSpaceで開催されていた「YouTube動画視聴回数予測」コンペに参加しました。Lain.さんとチームを組み、public 4位・private 6位でした。 prob.space コンペ概要 YouTube APIで取得できるメタデータを入力として、動画の視聴回数を予測するタスクでした。…

【論文メモ】Self-training with Noisy Student improves ImageNet classification

twitterで流れてきたGoogleの論文が、最近のKaggleでも頻繁に使われる「Pseudo Labeling」を拡張した興味深いものでした。本記事では、簡単にこの論文を紹介します。 Last week we released the checkpoints for SOTA ImageNet models trained by NoisyStude…

XGBoostやCNNを用いた「Data Journalism Awards 2019」受賞作

「Data Journalism Awards 2019」を受賞した全12作の中で、特に機械学習など高度なデータサイエンスを活用した事例があったので、簡単に概要を紹介します。 Radmesser 作品URL 受賞概要 概要 課題背景 目的 データ収集 データ分析 追い越しイベントの検出 地…

AI×愛知の「AIchi勉強会」でKaggleの魅力について発表しました

愛知県名古屋市で開催された「AIchi勉強会」で、Kaggleの魅力について発表しました。愛知県出身という縁でお声がけいただいた形です。 愛知県の製造業の異なる会社で働く、AI・機械学習に興味を持つメンバー3人中心に「愛知県で会社を越えてAIに興味ある人、…

Djangoで「名古屋/東京」の画像分類アプリを作った

Djangoで簡単な画像分類アプリを作ってみた。Flickrから「名古屋」「東京」で画像を400枚ずつ収集して、KerasのVGG16使って分類器を学習。推論したい画像を渡して、結果を表示するところまで。分類器が適当でAUCが.65くらいなのはご愛嬌。 pic.twitter.com/E…

2年前にAutoencoderをChainerで実装したときの発表資料とコード

Google Driveを整理していたら発掘された。研究室での「Deep Learning勉強会」での発表資料。当時もDeep Learning流行ってた気がするけど、ここまでブーム続くとは思っていなかった。 GitHub github.com

Googleの「CNNで糖尿病性網膜症を判定する」研究の論文紹介

はじめに 某所で、下記でまとめた論文について紹介をしてきた。upura.hatenablog.com 所感 Googleの論文ではあるが、掲載誌が情報系ではなく米医師会による医学系のものであるため、数式が一つも出てこない。むしろ、Deep Learningアルゴリズムを医療適用す…

【論文メモ】Development and Validation of a Deep Learning Algorithm for Detection of Diabetic Retinopathy in Retinal Fundus Photographs

Development and Validation of a Deep Learning Algorithm for Detection of Diabetic Retinopathy in Retinal Fundus Photographs Varun Gulshan et al. JAMA. 2016;316(22):2402-2410. doi:10.1001/jama.2016.17216 December 13, 2016 https://jamanetwor…

「スタバなう」ツイートの画像は本当にスタバか、CNNで判定してみた

はじめに Twitterで1日に一度くらいは「スタバなう」という投稿を目にする気がします。ただし大抵はキラキラ女子大生などを揶揄しており、ラーメンなどの画像とともに投稿されることが多いです。今回は、画像分類に秀でたConvolutional Neural Network (CNN)…

【Twitter】特定キーワード&アカウントの画像を一括ダウンロードできるウェブサービス"timg"が便利

timg.azurewebsites.netTwitterにおける特定キーワード&アカウントの画像を一括ダウンロードできるウェブサービス"timg"が大変便利だった。例えば「スタバなう」を検索すると、以下のように直近ツイートから画像を表示してくれる(最大3200件)。右上から一…

『画像認識』(機械学習プロフェッショナルシリーズ)第5章まとめ

某所にて、『画像認識』(機械学習プロフェッショナルシリーズ)の勉強会(輪読形式)があり、第5章「分類」を担当しました。参考書の内容に加え、『パターン認識と機械学習 上』の内容も盛り込み、包括的に「分類」を扱いました。www.kspub.co.jp下記の記事…

【論文メモ】Sushi Dish - Object detection and classification from real images

論文名 Yeongjin Oh, Seunghyun Son, Gyumin Sim: Sushi Dish - Object detection and classification from real images, arXiv:1709.00751v2 [cs.CV], 2017. https://arxiv.org/abs/1709.00751 どんなもの? 回転寿司の会計では、店員が目視で皿の枚数を数…

カーネル密度推定による分類方法をPythonで可視化

『画像認識』(機械学習プロフェッショナルシリーズ)*1の第5章pp.143-144に載っていた、カーネル密度推定による分類方法を可視化。 data1(青)は0を中心とした正規分布の乱数、data2(黄)は3を中心とした正規分布の乱数。カーネル密度推定により確率密度…

画像認識におけるKMeansによるBoVW

『画像認識』(機械学習プロフェッショナルシリーズ)*1の第4章pp.92-95に載っていた、KMeansによるBag of Visual Words(BoVW)を実装。 import numpy as np from sklearn.cluster import KMeans ## KMeansによるBoVW def coding(X_ap): bovw = np.zeros((len…

画像データセット「CIFAR-10」からのSIFT特徴量の取得

CIFAR-10とは 以下のブログが詳しい。aidiary.hatenablog.com SIFT特徴量とは 『画像認識』(機械学習プロフェッショナルシリーズ)*1の第2章などを参照のこと。 ライブラリのインストール 以下のライブラリを準備する。 from chainer import datasets impor…

『画像認識』第4章「コーディングとプーリング」の要点まとめ

『画像認識』(機械学習プロフェッショナルシリーズ)*1の第4章が、サラッと読もうとしたところ結構骨の折れる内容だったので、自分用の備忘録として要点まとめを作ることにしました。『画像認識』第4章、難しいンゴ(゚∀゚)— u++ (@upura0) 2017年8月5日 第4章…

"「いいね!」増えるハッシュタグ、AIが提案、東大が新技術"という記事の補足

以下のようなキャッチーな科学ニュースがありましたが、いかんせん「東大が新技術」だけでどの部局の誰が発表したかなど情報が欠落していたので、備忘録としての補足。www.itmedia.co.jp 科学技術振興機構(JST)からのプレスリリース www.jst.go.jp 研究…

正準相関分析に関する文献

『画像認識』(機械学習プロフェッショナルシリーズ)の第3章「統計的特徴抽出」に登場した正準相関分析について、更なる理解の参考になりそうな文献。以下は書籍における説明を抜粋した。 正準相関分析(canonical correlation analysis, CCA)は,複数の情…

『画像認識』における統計的特徴抽出手法の可視化 Pythonでの実装

『画像認識』(機械学習プロフェッショナルシリーズ)の第3章「統計的特徴抽出」に登場した手法について、Pythonで実装しようと思います。www.kspub.co.jp この章で紹介されている手法は、以下の5つです。 主成分分析 白色化 フィッシャー線形判別分析 正準…

ヒアリの画像識別分類器を作るのに良さげな「AntWeb」

最近、強い毒を持つ南米原産のアリ「ヒアリ」が日本国内で数例発見され、注目が集まっています。 www.nikkei.com暇な時にでも画像からアリの種類を分類するアルゴリズムを実装しようかと思い、最初にデータを探していたところ、良さげなデータベースを見つけ…

『画像認識』(機械学習プロフェッショナルシリーズ)第1章まとめ

某所にて、『画像認識』(機械学習プロフェッショナルシリーズ)の勉強会(輪読形式)がありました。www.kspub.co.jp 第1章を担当し、以下の資料にまとめました。第1章では画像認識の概要がまとめられており、その後の章で具体的に解説していく構成になって…