ラベル logoGuillo の投稿を表示しています。 すべての投稿を表示
ラベル logoGuillo の投稿を表示しています。 すべての投稿を表示

2022/08/12

製作物保管場所のページを追加しました

今まで製作物はGoogle Driveにて公開していましたが、2021年9月13日以降はリソースキーがついていない古い共有リンクURLが無効化されてしまいました。 当Blog内の全ての共有リンクを修正することができないため、各製作物を格納したGoogle Driveディレクトリへの新共有リンクをまとめたページを追加しました。 

製作物保管場所 

以下のソフトウェアを公開しています。
  • NeuronDoubler
  • logoGuillo
  • LLMIDI Player
  • setTsTitle

2016/04/03

ロゴ検出型自動CMカットプログラム logoGuillo v2.12 を公開しました

logoGuilloの更新版をリリースしました。
マイナーバグFIXです。

変更点(v2.10 -> v2.12)

 ・処理完了後に、avs2yuv又はMOD(avs2yuv.exe/avs2pipe.exe/avs2pipemod.exe)の標準出力パイプにデータが残っているか確認せずに閉じていたのを修正
  *"プロセスが、存在しないパイプに書き込もうとしました。"のエラーが出る場合があるので対策

 ・その他細かい実装上の問題点を修正

 ・32bit版を廃止

 ・開発環境をVS2008からVS2015に変更

*GUIフロントエンドの設定ファイル含め、v2.00-v2.10とは後方互換性があります。
*また、特に検出パラメータを再調整する必要はありません。
*GUIフロントエンドはv2.07から同じ物です。


入手先

Googleドライブ(旧Googleドキュメント)に置いておきます。リンク先のダウンロードボタンを押してください。

logoGuillo_v212_r1.zip

2014/04/11

ロゴ検出型自動CMカットプログラム logoGuillo v2.10 を公開しました

v2.12を公開しました。

logoGuilloの更新版をリリースしました。
要望が数件あった対応動画形式の拡張です。

変更点(v2.09 -> v2.10)

 ・任意のAvisynthスクリプト経由での動画読み込みに対応
  入力プラグインとして付属のUSE_AVSを指定し、動画ファイルとしてAvsファイルを指定してください。
  *Avsファイルの最後でlogoGuilloが対応している形式のクリップを返す必要があります。

 ・DirectShow Filterでの動画読み込みに正式対応
  入力プラグインとして付属のUSE_DSFを指定してください。

*GUIフロントエンドの設定ファイル含め、v2.00-v2.09とは後方互換性があります。
*また、特に検出パラメータを再調整する必要はありません。
*GUIフロントエンドはv2.07から同じ物です。


理論上はDirectShow Filter又はAvisynthで使用できる各種デコーダーさえ対応していれば、どんな動画形式でも読み込む事が可能ですが、デコーダーの動作がlogoGuilloの想定通りである事が大前提です。

そのためfpsや総フレーム数が正しく報告されなかったり、シーク動作が行えない、アスペクト、インターレース、YC伸張、色空間の変換等がデコーダー側で勝手に処理される場合には正常に動作しない場合があります。また、動作しても実用的なパフォーマンスが出ない場合があります。


入手先

Googleドライブ(旧Googleドキュメント)に置いておきます。リンク先の左上のボタンのFile->Downloadを選択してください。

logoGuillo_v210_r1.zip

2014/04/05

ロゴ検出型自動CMカットプログラム logoGuillo v2.09 を公開しました

v2.10を公開しました。

logoGuilloの更新版をリリースしました。

変更点(v2.08b -> v2.09)

・動画のfpsを強制変換する機能を追加
  (-fpsChg f) fpsの指定と強制変換(f = 小数[frame/sec])
   ・動画のfpsを任意の値で指定します。内部でAvisynthのChangeFPS(Linear=true)が呼び出されます。
    デコーダーが出力するビデオのフレームレートが正常では無い場合に使用します。通常は指定する必要はありません。

    29.97fpsを指定すると厳密な値(30000/1001)fpsに補正されます。
    同様に以下のfpsを指定した場合も補正されます。
     (23.98/25.00/29.97/30.00/50.00/59.94/60.00fps)

*GUIフロントエンドの設定ファイル含め、v2.00-v2.08bとは後方互換性があります。
*また、特に検出パラメータを再調整する必要はありません。
*GUIフロントエンドはv2.07から同じ物です。


入手先

Googleドライブ(旧Googleドキュメント)に置いておきます。リンク先の左上のボタンのFile->Downloadを選択してください。

logoGuillo_v209_r1.zip

2013/08/02

ロゴ検出型自動CMカットプログラム logoGuillo v2.08beta を公開しました

v2.10を公開しました。

logoGuilloの更新版をリリースしました。
パワーユーザー向けですが、ロゴ・シーンチェンジ・字幕に加えて無音情報を利用してのCMカットが可能になります。

全機能のデバッグが出来ていないのでβ版としました。オプションのデフォルト値も余り調整していないので必要なら変更して下さい。

シーンチェンジ検出への無音フレーム情報の利用

変更点(v2.07b -> v2.08beta)

・無音フレームリストの外部読み込みに対応(CMカットモード)

  無音フレーム情報を利用してシーンチェンジの検出精度を向上させます。
  シーンチェンジが検出されても無音でなければシーンチェンジとして扱いません。

  (-useSil "path") 無音フレームリストのフルパスを指定
   ・フォーマットは学習時に使用するフレームリストと同じです。
   例:
   3
   5
   10
   12
   *3-5、10-12フレームが無音区間

  (-silRawFmt)
   無音フレームリストのフォーマットが無音フレーム番号の列挙形式(1行1フレーム)の場合に指定します。
   例:
   3
   4
   5
   10
   11
   12

  (-silMrg int) 無音区間の拡張マージンを指定する
   ・値域 0 <= n <= 9999 (デフォルト:1)
   *1を指定すると上記の例では2-6、9-13フレームが無音として扱われます。
   *拡張処理は-silMinの処理後に行われます。

  (-silMin int) 指定長さ未満の無音区間を無視する
   ・値域 0 <= n <= 9999 (デフォルト:4)

*GUIフロントエンドの設定ファイル含め、v2.00-v2.07bとは後方互換性があります。
*また、特に検出パラメータを再調整する必要はありません。
*GUIのフロントエンドはv2.07と同じ物です。


無音フレームリストの作り方

基本的にAvisynthからMinMaxAudioで音量が閾値以下のフレームを判定して書き出せば作成可能です。但し音ズレ等には注意して下さい。

具体的なコマンドの記述方法等はChikuzen氏の記事、Ch's barn:CM検出マクロ for AvsP等を参考にして下さい。


入手先

Googleドライブ(旧Googleドキュメント)に置いておきます。リンク先の左上のボタンのFile->Downloadを選択してください。

logoGuillo_v208beta_r4.zip

2013/04/07

ロゴ検出型自動CMカットプログラム logoGuillo v2.07b を公開しました

v2.08betaを公開しました。

今でも応援して下さっている方々、有り難う御座います。
logoGuilloの保守更新をリリースしました。

GUIフロントエンドの設定ファイル含め、v2.00-v2.07とは後方互換性があります。
また、特に検出パラメータを再調整する必要はありません。


変更点(v2.07 -> v2.07b)

・L-SMASH-Works/LSMASHSource.dll/LWLibavVideoSourceに対応しました。
  *GUIフロントエンド側の表記はそのままです。

  LSMASHSource.dllはPOP氏のビルド(r540)で確認しました。
  内部でコマンド" LWLibavVideoSource("source file", dr=True) "を使用します。
  fpsが正常に取得できない場合は -fps f オプションを指定して下さい。

  高速な動作の為に事前にインデックスファイルを生成してください。
  またlogoGuilloはシングルスレッドなので律速する可能性があります。
  *SSE4.2に対応したintel製CPUでのみSIMD拡張命令が使用されます。
  より高速に動作させたい場合は複数本同時処理してください。

・入力最大解像度を1920x1080から1920x1088に変更しました。


ベンチマーク結果

インデックスファイルが生成された状態でのfps比較結果。

m2v.vfp ver. 0.7.5 ( 53943 frame ,211.04 sec ,255.61 fps)
LSMASHSource.dll r540 ( 53947 frame ,113.07 sec ,477.12 fps)


m2v.vfp比で約87%高速化しました。まともにデバッグしていませんが動くと思います。


logoGuilloが動作しない方へ

基本的にAvisynthのプラグインはAvisynth直下のpluginsディレクトリ
 Program Files\AviSynth 2.x\plugins
 Program Files(x86)\AviSynth 2.x\plugins

等に配置して下さい。
またUAC無効の管理者権限推奨です。(開発環境と同じ)


入手先

Googleドライブ(旧Googleドキュメント)に置いておきます。リンク先の左上のボタンのFile->Downloadを選択してください。

logoGuillo_v207b.zip

2012/11/04

L字テロップを自動検出する方法を考える

・L字テロップが多い

最近の番組は結構な頻度でL字テロップが入ります。そこでL字テロップを自動検出出来ないか考えてみる事にしました。

そのテロップ、本当に必要ですか?

・パターン認識で検出出来ないか考える

L字テロップは局や番組によってL字の向き・背景色・幅・表示内容の動静もまちまちです。
さらにコの字テロップやコの字ワイプテロップ(一部が半透明で映像部分に被る)も存在し、加えてテロップが2重3重の入れ子になる場合もあるようです。
これをまともに認識させるのは難易度が高そうなので没案に。認識出来ても劇中劇のような演出で枠が付いていると誤動作しそうです。

・ロゴ検出(logoGuillo)を利用してL字テロップを検出する

と言う訳で、安直な方法ですが現行技術の延長で解決を図ります。

2012/09/23

著作権法改正案の施行に伴う当サイトの対応について

*当記事には法律に関する記載がありますが、当方は専門家ではない為誤認識や推測が含まれる場合があります。

2012年10月1日より著作権法の一部を改正する法律の下記項目が施行されるようです。
・公文書管理法等に基づく利用に係る規定の整備
・技術的保護手段に係る規定の整備並びに違法ダウンロードの刑事罰化に係る規定の整備(の一部)

参考:平成24年通常国会 著作権法改正について(文化庁)

PCでの録画に関する技術や開発には以下の項目が関係していると思われます。
・技術の開発又は実用化のための試験の用に供するための利用
・著作権等の技術的保護手段に係る規定の整備

しかし一体何が違法で何が合法なのかは私には判別できませんでした。とはいえ何もしない訳にはいきませんのでLoggia Logic(当サイト)においては以下の対応を行いました。
・一部ソフトウェアに関する記述の削除
・一部表現の修正及び削除

*一般的な技術であるMPEG2/H264の動画処理やロゴ認識等の画像処理、BATコマンドのTips、ファイル名の成形等に関する記事や記載は残してあります。

また上記対応に加えて当方の開発環境でも9月末より大幅に縮退運転及び使用中止をする事にしました。つきましては下記内容に関する問題や不具合、Out of date等の対応は基本的に行えませんのでご了承ください。
ロゴ検出型自動CMカットプログラム logoGuillo
setTsTitle(TSファイル名の成形)
・その他一部の記事

上記法律の内容及び影響範囲が認識できない為に過剰な対応を行っている部分もあるとは思いますが、公序良俗と法を遵守し常に安全側に行動する為ですのでご了承下さい。
本件に関しまして未だ対応不十分な点などが御座いましたら、御手数ですがご指摘頂ければ幸いです。

Wirewriggle

2012/09/09

並列処理を行うBATでエンコードやCMカットを高速化する

はじめに

エンコード等の処理を高速化する手段としてはマルチスレッド化が一般的だと思います。

しかしAvisynthでのフィルタ処理をMT等でマルチスレッド化してもそれほど効果がない場合も多く、またx264はスレッド数を増やすと(僅かですが)ファイルサイズが増加したり画質が低下したりします。
デュアルコアの時代は簡単にCPUを使い切る事ができましたが、最近のCPUでは8スレッドや12スレッドを実行できるのでスレッドを埋めるだけでも大変です。

そこで、古典的ですがメモリやHDD等のリソースの限り何本も同時に処理する事で高速化を図ります。一本あたりのスレッド数を極端に増やす必要がないので効率が良いです。またlogoGuillo等のシングルスレッドアプリも高速化します。
では以下にBATの機能とサンプルを記載します。

主な機能と処理内容

・指定本数(2本以上)毎にペアを作成し並列エンコードする
・m2vファイルを探し、bat,aac,CMカットファイル(txt)があるか確認
・既にmp4ファイルやlogが生成されている場合は処理しない
・フォルダ名に"noenc"が含まれるディレクトリは処理しない

以下のように処理する動画毎にBATファイルが生成されている状態を想定しています。
*私の環境ではマスタBATとAVSを動画毎に自動コピーして処理しています。

・動画A.m2v
・動画A.bat
・動画B.m2v
・動画B.bat

このBATをn本ずつ纏めてパイプで繋いで実行することで並列処理します。

(call 動画A.bat) | (call 動画B.bat)

片方が早く終わるとパイプが存在しないとの警告が出ますが、今のところ100本以上処理した中では正常に動作しています。
また、組み合わせる動画の長さに差があると効率が落ちますが、ファイル名順に処理する場合は大抵同じ番組でペアが生成されるので問題ないと思います。

サンプルBATコード

2012/06/24

logoGuillo開発休止のお知らせ

環境の変化及び諸般の事情により、残念ながら今後の研究開発の継続が困難となったため、logoGuilloの開発を無期限休止する事と致しました。


logoGuilloの公開について

現行版であるlogoGuillo v2.07の公開は継続します。
v1.00からご利用の方はご存じとは思いますが、logoGuilloには非圧縮画像(YV12形式)を画像処理する機能しか実装されていません。
MPEG-2/MPEG-4/H.264等のデコードは外部のAvisynthのプラグインの対応状況に依存します。
また、logoGuilloの出力はテキスト形式によるフレーム番号や時間位置の表示出力のみ可能となっています。入力された動画を編集する機能は実装されていません。

2012/05/06

logoGuilloのオプション一覧

(2014/04/11更新、v2.10準拠)

logoGuilloのオプション一覧です。

*詳細が各バージョンのリリースノート中にも含まれている場合があります。
2.05での隠しオプションも含んでいます。

[引数について]

f : 小数
n : 整数
"path" : ファイルへのフルパス

***以下、オプション一覧です***

ロゴ検出型自動CMカットプログラム logoGuillo v2.07 を公開しました

v2.07bを公開しました。

logoGuilloのv2.07を公開しました。
β版での更新内容の統合と小改良です。大体の機能は実装できたので、概ね完成したと思います。

GUIフロントエンドの設定ファイル含め、v2.00-v2.06β2とは後方互換性があります。
また、特に検出パラメータを再調整する必要はありません。

主な変更点は以下の通りです。

・CMカットモードでフレーム毎のロゴ検出値等をCSV出力するようにした
・ログ出力を無効化する機能を追加
・チャプター出力を無効化する機能を追加
・後番組混入防止機能のデフォルト値を修正
・指定ファイルのフルパスをクリップボードにコピーする機能を追加(GUI)

また、下記のv2.06β及びv2.06β2での変更点も含んでいます。
・Dynamic Threshold Control 機能を追加
・CM出力モードの追加
・字幕データに対するネガティブ/ポジティブワード処理の実装
・外部フレームリストとの論理演算機能を追加
・アンチウイルスでの誤検出対策

2012/05/04

logoGuilloの出力を加工してくれるスクリプトが登場

logoGuilloの出力を加工してくれるperlスクリプトが公開されていました。有り難う御座います。

つれづれ~努力と根性?~:続・TDFM2EVFR的な何か

logoGuilloの出力をシーンチェンジ検出と自動VFR用のfps判定を考慮して加工してくれるようです。
15秒単位でのシーンチェンジ検出を行う事で、本編->提供->CMの流れでのロゴ無し提供画面の取りこぼしを防止しているらしい。

*詳細はリンク先で確認して下さい。

ニュースや映画等では提供画面がCMの途中に単独で存在したりCM明け前に挿入されていたりする場合もあるので、アニメ向けでしょうか。
私はどんな番組でも妥協して24fpsか30fpsのCFRに押し込んでしまいますが、VFRを使えば自動で完成度の高いファイルを作成できそうです。

2012/05/02

logoGuilloの仕様と動作環境及び制限事項

logoGuilloの仕様と動作環境及び制限事項です。(v2.12準拠)

logoGuilloは32bit版と64bit版がありますが、特に理由がない限り64bit版を推奨します。

 * v2.12以降は、32bit版は廃止しました。

●動作環境(ハードウェア)

[CPU(最低条件)]
・x64 CPU (v2.10まではx86 CPU)
・対応拡張命令:MMX/SSE/SSE2

[CPU(推奨条件)]
・x64 CPU
・対応拡張命令:MMX/SSE/SSE2/SSE3/SSSE3/SSE4.1/SSE4.2 (≠ SSE4A)
・Intel製CPU(Nehalem以降)
*Nehalem以降のCPUではSIMD演算が使用されるので高速化されます。

2012/04/30

logoGuilloの動作精度を上げる為の注意点

一部FAQと重複する内容もありますが、logoGuilloの動作精度の向上に関係する事を書いておきます。

ロゴの検出精度を向上させる

ロゴの検出精度を向上させる事は全体的な精度の底上げに繋がります。

[ロゴデータを作成する際の注意事項]

ロゴデータの出来は重要です。目安としてはロゴが綺麗に消せる程度の精度が必要となります。

・MPEG-2 VIDEO VFAPI Plug-In で余計な処理が行われない設定にします。
・AviUtlでのリサイズを無効にします。
・AviUtlでのフィルタを無効にします。
・AviUtlでのインターレース解除を無効にします。
・ソースにはアニメ等、単色ベタが多い物を使用します。
・ブロックノイズの多いソースはロゴの品質低下の原因となります。
・ロゴの含まれないシーンが紛れ込まないように削除しておきます。
・ロゴ解析の閾値は低めの値にしておきます。(16等、サンプル数が少なくなりすぎない程度に設定)
・ロゴ解析の選択範囲はロゴのエッジから3~4ピクセル程度にします。

2012/04/29

ロゴ検出型自動CMカットプログラム logoGuillo v2.06β2 を公開しました

v2.07を公開したのでそちらを使用して下さい。旧版は削除しました。

前回に続きlogoGuilloのβ版、v2.06β2を公開しました。またβ版につき、配布内容はバイナリのみですのでv2.05の配布パッケージと合わせてご利用下さい。

v2.06βからの主な変更点は、Dynamic Threshold Control 機能の実装です。

高輝度でロゴが見えない局でロゴの背景に高輝度のテロップ等が長期間表示されるとロゴが認識できず本編の一部が欠落する事がありますが、その場合は本編の割合が減少します。
通常は8割程度は本編の筈なので、本編が7割以下しか検出出来なかった場合にはDTCが検出漏れがあると判断しロゴ検出閾値を自動で下げます(増感します)。

また、今回の配布パッケージから実行ファイル名は全て"logoGuillo.exe"としてx64/x86それぞれをディレクトリ分けする事にしました。

2012/04/25

logoGuillo開発近況(2012/04/25)

現状でのlogoGuilloの開発ToDo等。下記のうちDTCは優先的に実装中なのでGW中頃には完成させたいと思います。

●Dynamic Threshold Control (仮) *v2.06β2に実装予定

番組中の本編の割合が規定値以下の場合、ロゴ検出閾値を下げます。

ロゴの背景にテロップや複雑なパターンが長期間表示されるとロゴが認識できず本編の一部が欠落する事がありますが、その場合は本編の占める割合が減少します。通常ですと7割ぐらいは本編があるはずなので、例えば6割しか本編が検出出来なかった場合には何かしら検出漏れがあると見なしてロゴ検出閾値を下げます。
つまりロゴ検出感度を自動で増感する事になるので、当然CMの誤検出発生とはトレードオフの関係にあるわけですが、一部のシーンが丸ごと抜けるような事故の発生を防ぐ事が出来ます。この機能は感度が落ちる方向には制御されない為、常に安全側に動作します。

他にも時間辺りのパート数等も利用できそうですが、あまり放送のお作法に依存すると汎用性が下がるので当面は本編の割合のみを考慮する予定です。

2012/04/22

ロゴ検出型自動CMカットプログラム logoGuillo v2.06β を公開しました

v2.07を公開したのでそちらを使用して下さい。旧版は削除しました。

そろそろlogoGuilloを初公開してから半年です。ほぼ実証実験に近いv1.00の頃から利用されている方は少ないとは思いますが、今までお付き合い頂き有り難う御座います。

さて、今回logoGuilloのv2.06βを公開しました。v2.05からはポスト処理系の機能追加がメインの小改良ですが、あまりデバッグが出来ていないので人柱向けのβ版となっています。またβ版につき、配布内容はバイナリのみですのでv2.05の配布パッケージと合わせてご利用下さい。

主な変更点は以下の通りです。

・字幕データに対するネガティブ/ポジティブワード処理の実装
・外部フレームリストとの論理演算機能を追加

logoGuilloは自動的に不要なシーン(CM)を判定する事で、視聴時間と容量を節約する事を目指してきました。なるべく本編が欠けないよう安全側に設計してあるので、全自動で任せても不完全ながらそれなりの結果を得られるようにはなったと思います。
今回は更に一歩、字幕情報を元に内容にまで踏み込んで不愉快なシーンを取り除く実験です。某社のレコーダーのダイジェスト再生とは逆の発想です。

ネガティブワード機能は、不愉快なキーワード等を登録して、特定の話題周辺のシーンを削除する機能です。
嫌なら見るな、という言葉に習い番組内の興味のない話題を自動で排除してみましょう。


2012/03/19

logoGuillo v2.05の隠しオプションと隠し機能

logoGuillo v2.05の隠しオプションと隠し機能です。基本的にデバッグ用ですが、色々と試してみたい方の為に公開しておきます。

使用すると予期せぬ不具合や誤動作を招く危険性があります。
また、今後予告無く機能及び効果やデフォルト値等が変更される場合があります。下記オプション・機能を使用する場合は十分に注意して下さい。


隠しオプション


-fstStep n

初回読み込み時の間隔(frame)を設定する
デフォルト値:57

logoGuilloはCMと本編を判別する為、動画を読み込んで分析する処理を2段階で行っています。Phase1で大まかに、Phase2で詳細な分析をしています。このオプションを使用する事でPhase1でのフレームの読み込み間隔を変更できます。
エンドカードや次回予告、提供等の短い本編が無い番組(映画やバラエティ、ニュース等)ではある程度大きな値にする事で、Phase1での処理の高速化が期待できます。但し、極端に大きい値を設定した場合はPhase2での処理時間が増加したり、-strict オプションを併用しないと不正な結果になる可能性があります。
また、15の倍数を指定すると毎回特定位置のB/Pフレームのみ読み込むケースもあり得る為、何らかの影響が出る可能性があります。

2012/03/09

logoGuilloの誤検出の件でカスペルスキーから回答が来た

2012/05/06追記:*アンチウイルスの誤検出はv2.07でほぼ解決しました。(実行ファイルにファイル名などのプロパティ情報を追加しました。)

先日Kasperskyの日本法人に問い合わせした、カスペルスキー インターネットセキュリティ 2012でのlogoGuilloの誤検出について回答が来ていました。

カスペルスキーによると、調査の結果logoGuillo v2.05のウイルス検出は誤検知であり既に修正済との事でした。少なくともv2.05に関しては2012/03/02以降での定義ファイルでは修正されているはずです。

オンラインスキャンサービスで確認

( 2012/03/09現在 、VirusTotalでv2.05の配布アーカイブをスキャンした結果を一部抜粋)