注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
2007年7月3日(火) ■ PDF spam _ 先週ごろから画像を JPEG やなんかの画像フォーマットではなく、PDF に... 2007年7月3日(火) ■ PDF spam _ 先週ごろから画像を JPEG やなんかの画像フォーマットではなく、PDF につっこんでくる spam が届いてる。OCR なテクニックで画像から文字列を抽出するフィルタでも、そもそも画像ファイルじゃなければ効果なし、という発想かな。最近のかっちょええ spam フィルタは使ってないので spammer の目論見があたってるのどうかはわからんけど。 _ PDF って Postscript に毛の生えたようなもので、つまり一種のスクリプト言語なわけなのですよ。画像が1枚張りつけてあるだけの単純な PDF であってもいきなり画像本体のデータからはじまるわけではなく、書式設定とか初期化とか必要なのね、たぶん(よく知らんのでてきとーに書いてる)。この PDF spam は画像の中身は例のごとく毎回異なってるんだけど、ありがたいことに画像データにたど
2008/03/17 リンク