DeepSeek-OCRを試す｜shi3z

テクノロジーカテゴリーの変更を依頼記事元:

note.com/shi3zblog

59users がブックマークコメント

コメント

5

記事へのコメント5件

注目コメント
新着コメント

readmemo “これは、君たちが毎日使っているスマートフォンやゲーム、SNS、そして君たち自身の「風説」と「心」に深く関わる、とてもイキイキイクイクな雰囲気が生まれる。” イキイキイクイクのパンチがすごい。

2025/11/02 リンク

misshiki “というわけでDeepSeek-OCRはvLLM版じゃないと本気出してくれなさそう。ただ、vLLM版は呼び出し方が煩雑で自分でラッパー書かないと暴れ馬のように暴れ回りそう。”

2025/11/04 リンク

tidei むさしの救急病院

2025/11/02 リンク

Kmusiclife 結論。使える

2025/11/02 リンク

readmemo “これは、君たちが毎日使っているスマートフォンやゲーム、SNS、そして君たち自身の「風説」と「心」に深く関わる、とてもイキイキイクイクな雰囲気が生まれる。” イキイキイクイクのパンチがすごい。

2025/11/02 リンク

yarumato “DeepSeek-OCRはvLLM版なら本気出してくれる。ただ、vLLM版は呼び出し方が煩雑。HuggingFace版は、画像で文字のコンテキストを追うから長いコンテキストも安心、というほどの識別能力がない”

2025/11/02 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

{{ total_bookmarks_with_user_postfix }}{{ root_title }}

DeepSeek-OCRを試す｜shi3z

DeepSeek-OCRが、普通のOCRとはちょっと違う文脈で話題になっていたので触ってみた。これのミソは、単... DeepSeek-OCRが、普通のOCRとはちょっと違う文脈で話題になっていたので触ってみた。これのミソは、単にOCR(光学文字認識)ができることではなく、光学的(視覚的)に文章を理解することでより長い文脈に対応できると主張されているところ。なので、わざと長い文章を画像にして読み取れるか試してみるという意地悪なことをしないとこのモデルの真価は分からない。今回はKaraageさんの記事を参考にuvにして試してみた。使用したのはDGX Sparkではなく普通のA100で試した。そんなにVRAM使わないと思うけど。 $ git clone https://github.com/deepseek-ai/DeepSeek-OCR.git $ cd DeepSeek-OCR $ uv venv -p=3.12.9 $ uv pip install torch==2.6.0 torchvisio

ブックマークしたユーザー

naggg2025/11/05
misshiki2025/11/04
midas365452025/11/03
yuuki55552025/11/03
nitamago_monster2025/11/03
sora_h2025/11/03
imabayashi2025/11/03
ducky199992025/11/03
hush_in2025/11/03
mathtonica2025/11/03
tidei2025/11/02
satetsu_s2025/11/02
ys00002025/11/02
dounokouno2025/11/02
aneet2025/11/02
t07159ko2025/11/02
tamachan4292025/11/02
pontatanpo2025/11/02

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

いま人気の記事 - 企業メディア

企業メディアをもっと読む

設定を変更しましたx