



Gregory Craneさんは、前にも紹介した論文で、

As digital libraries mature and become better able to extract information (e.g., personal and place names), each word and automatically identifiable chunk of words becomes a discrete object. In a sample 300 volume, 55 million word collection of nineteenth-century American English, automatic named entity identification has added 12,000,000 tags. While this collection focuses on name rich historical materials and includes several reference works, this system already discovers thousands of references to named entities in most book length documents. We thus move from single catalogue entries with a few hundred words to thousands of tagged objects – an increase of at least one order of magnitude with named entities and of at least two orders of magnitude when we consider each individual word as an object.


そんで、今紹介している"Image Coordinates"は、その単語さえも分割して、文字単位での管理を可能にするわけさ。

というわけで、「今、みんなが争っている単位レベル("Granularity of objects")」ってのをちゃんと理解しとかんといけんわけ。そんで、当面、文字レベルを超えることはなさそうなので、そこが「いろんな商品・サービス」の激戦区になるわけさ。

ただ、この記が言いたいのは、「GoogleもAmazonもすごいこと考えてるね〜」って側の話じゃない。そんなことは、Google好きやAmazon好きな人なら、もっと詳しく話をしてくれるはず。そっちじゃなくて、「"Image Coordinates"ってそんなに可能性を秘めたもんなのに、UCにあげちゃうんだね、びっくりだね、それと引き換えにGoogleが獲得したのは・・・」ってこと。