注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
DeepSeek-OCRが、普通のOCRとはちょっと違う文脈で話題になっていたので触ってみた。 これのミソは、単... DeepSeek-OCRが、普通のOCRとはちょっと違う文脈で話題になっていたので触ってみた。 これのミソは、単にOCR(光学文字認識)ができることではなく、光学的(視覚的)に文章を理解することでより長い文脈に対応できると主張されているところ。 なので、わざと長い文章を画像にして読み取れるか試してみるという意地悪なことをしないとこのモデルの真価は分からない。 今回はKaraageさんの記事を参考にuvにして試してみた。 使用したのはDGX Sparkではなく普通のA100で試した。そんなにVRAM使わないと思うけど。 $ git clone https://github.com/deepseek-ai/DeepSeek-OCR.git $ cd DeepSeek-OCR $ uv venv -p=3.12.9 $ uv pip install torch==2.6.0 torchvisio
2025/11/02 リンク