ã¯ã˜ã‚ã«

å…ˆæ—¥Xã§ä»¥ä¸‹ã®ã‚ˆã†ãªãƒã‚¹ãƒˆã‚’è¦‹ã‹ã‘ã¾ã—ãŸã€‚

Open Source LLM Tools

If you are looking for useful open-source LLM tools, this is a really useful resource.

It includes different categories like tutorials, AI engineering, and applications, among others. You can also see the # of GitHub stars. pic.twitter.com/v6IGibvgBZ
— elvis (@omarsar0) 2024å¹´9æœˆ11æ—¥

å°‘ãªãã¨ã‚‚ç§ã®TLã¯æ•°å¹´å‰ã‹ã‚‰ChatGPTã‚’ã¯ã˜ã‚ã¨ã™ã‚‹LLMé–¢é€£ã®è©±é¡Œã§æŒã¡ãã‚Šã§ã™ã€‚ã—ã‹ã—ã€æ–°ã—ã„ãƒ„ãƒ¼ãƒ«ã®åå‰ã‚’ç›®ã«ã™ã‚‹æ©Ÿä¼šã¯ã‚ã£ã¦ã‚‚ã€Œã©ã®ã‚ˆã†ãªç‰¹å¾´ãŒã‚ã‚‹ã‹ã€ã€Œã©ã®ã‚ˆã†ã«åˆ©ç”¨ã§ãã‚‹ã‹ã€ã‚’æ‰‹å…ƒã§å‹•ã‹ã—ãªãŒã‚‰å¦ã¶æ™‚é–“ã¯ç¢ºä¿ã§ãã¦ã„ã¾ã›ã‚“ã§ã—ãŸã€‚

æœ¬è¨˜äº‹ã§ã¯å…ˆè¿°ã®ãƒ©ãƒ³ã‚ãƒ³ã‚°ã‚µã‚¤ãƒˆã‚’å‚è€ƒã«ã€å¯èƒ½ãªé™ã‚Šæ‰‹å…ƒã§LLMé–¢é€£ã®OSSã‚’å‹•ã‹ã—ã¦æ„Ÿæƒ³ã‚’æ®‹ã—ãŸã„ã¨æ€ã„ã¾ã™ã€‚

huyenchip.com

ï¼ˆæ³¨ï¼‰2024å¹´9æœˆ20æ—¥æ™‚ç‚¹ã§ã®star_7dã™ãªã‚ã¡7æ—¥é–“ã®ã‚¹ã‚¿ãƒ¼æ•°ãŒå¤šã„é †ã«ç´¹ä»‹ã—ã¾ã™ã€‚

1. Mintplex-Labs/anything-llm

github.com

æ¦‚è¦ï¼šclosed LLMï¼ˆOpenAIã‚„Anthropicãªã©ï¼‰ã‚„ã‚ªãƒ¼ãƒ—ãƒ³ã‚½ãƒ¼ã‚¹LLMï¼ˆOllamaãªã©ï¼‰ã¨ãƒ™ã‚¯ãƒˆãƒ«ãƒ‡ãƒ¼ã‚¿ãƒ™ãƒ¼ã‚¹ã‚’è‡ªç”±ã«çµ„ã¿åˆã‚ã›ã‚‹ã“ã¨ãŒã§ãã€ChatGPTã®ã‚ˆã†ãªãƒãƒ£ãƒƒãƒˆUIã‚’æä¾›ã—ã¦ã„ã‚‹ã€‚

æ‰‹é †ï¼š

Desktopç‰ˆã‚’Macbookã«ãƒ€ã‚¦ãƒ³ãƒãƒ¼ãƒ‰ã™ã‚‹ã¨ã€ä¸‹å›³ã®ã‚ˆã†ãªãƒãƒ£ãƒƒãƒˆUIãŒåˆ©ç”¨ã§ãã‚‹ã‚ˆã†ã«ãªã£ãŸã€‚

LLMã‚’ã‚»ãƒƒãƒˆã‚¢ãƒƒãƒ—ã—ã¦ã„ãªã‹ã£ãŸã®ã§ã‚¨ãƒ©ãƒ¼ãƒ¡ãƒƒã‚»ãƒ¼ã‚¸ãŒå‡ºç¾

Workspaceå†…ã§ã¯ãƒ‰ã‚ãƒ¥ãƒ¡ãƒ³ãƒˆãŒã‚³ãƒ³ãƒ†ãƒŠåŒ–ã•ã‚Œã¦ã„ã‚‹ãŸã‚ã€ã‚³ãƒ³ãƒ†ã‚ã‚¹ãƒˆã‚’ã‚¯ãƒªãƒ¼ãƒ³ã«ä¿ã¦ã‚‹ã¨ã®ã“ã¨ã€‚

ãƒãƒ¼ã‚«ãƒ«LLMã¨ã—ã¦Ollamaã‚’åˆ©ç”¨ã—ãŸã„ã®ã§ã€GitHubã®ãƒ‰ã‚ãƒ¥ãƒ¡ãƒ³ãƒˆã‚’å‚è€ƒã«ã—ã¤ã¤ã€Ollamaã¨ã‚³ãƒ³ãƒ†ãƒŠé–“é€šä¿¡ã‚’è¿½åŠ ã—ã¦Dockerç‰ˆã§ã‚»ãƒƒãƒˆã‚¢ãƒƒãƒ—ã—ç›´ã—ãŸã€‚ä»Šå›žã¯LLMã¨ã—ã¦Llama 3 8Bã‚’ä½¿ç”¨ã—ãŸã€‚

# compose.yaml
services:
  anythingllm:
    image: mintplexlabs/anythingllm
    container_name: anythingllm
    ports:
    - "3001:3001"
    cap_add:
      - SYS_ADMIN
    environment:
    # Adjust for your environment
      - STORAGE_DIR=/app/server/storage
      - JWT_SECRET="************************"  # openssl rand -base64 24
      - LLM_PROVIDER=ollama
      - OLLAMA_BASE_PATH=http://ollama:11434
      - OLLAMA_MODEL_PREF=llama3
      - OLLAMA_MODEL_TOKEN_LIMIT=4096
      - EMBEDDING_ENGINE=ollama
      - EMBEDDING_BASE_PATH=http://ollama:11434
      - EMBEDDING_MODEL_PREF=nomic-embed-text:latest
      - EMBEDDING_MODEL_MAX_CHUNK_LENGTH=8192
      - VECTOR_DB=lancedb
      - WHISPER_PROVIDER=local
      - TTS_PROVIDER=native
      - PASSWORDMINCHAR=8
      # Add any other keys here for services or settings
      # you can find in the docker/.env.example file
    volumes:
      - anythingllm_storage:/app/server/storage
    restart: always

  ollama:
    image: ollama/ollama
    container_name: ollama
    ports:
      - "11434:11434"
    volumes:
      - ollama_storage:/root/.ollama
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: all
              capabilities: [gpu]

volumes:
  anythingllm_storage:
    driver: local
    driver_opts:
      type: none
      o: bind
      device: $HOME/.anythingllm  # mkdir ~/.anythingllm
  ollama_storage:
    driver: local
    driver_opts:
      type: none
      o: bind
      device: $HOME/.ollama  # mkdir ~/.ollama

èµ·å‹•ã•ã›ãŸã‚‰ã€ollama runã§ãƒ¢ãƒ‡ãƒ«ã‚’ãƒ€ã‚¦ãƒ³ãƒãƒ¼ãƒ‰ã—ã¤ã¤ãƒ—ãƒãƒ³ãƒ—ãƒˆã‚’å…¥åŠ›ã—ã¦ã¿ã‚‹ï¼ˆã‚‚ã¡ã‚ã‚“ollama pullã§ã‚‚OKï¼‰ã€‚

$ docker compose up -d
# çœç•¥
[+] Running 2/2
 âœ” Container anythingllm  Started                                                                                                                                                     0.8s
 âœ” Container ollama       Started

$ docker exec -it ollama ollama run llama3
pulling manifest
# çœç•¥
verifying sha256 digest
writing manifest
success
>>> Hello!
Hello! It's nice to meet you. Is there something I can help you with, or would you like to chat?

>>> /bye

Webãƒ–ãƒ©ã‚¦ã‚¶ã§<ã‚µãƒ¼ãƒãƒ¼ã®IPã‚¢ãƒ‰ãƒ¬ã‚¹>:3001ã«ã‚¢ã‚¯ã‚»ã‚¹ã™ã‚‹ã¨ã€Anything LLMã‚’åˆ©ç”¨ã§ãã‚‹ã€‚

ãƒ¦ãƒ¼ãƒ¢ã‚¢ã‚’ç†è§£ã§ãã‚‹ã‹è©¦ã—ã¦ã¿ã‚‹

GPU *1ã‚’ä½¿ç”¨ã—ãŸå ´åˆã€ä¸Šå›³ã®ã‚ˆã†ãªç°¡å˜ãªè³ªå•ã«å¯¾ã—ã¦ã¯1~2ç§’ãã‚‰ã„ã§å›žç”ãŒè¿”ã£ã¦ããŸã€‚

GitHub ãƒªãƒã‚¸ãƒˆãƒªã‚’ä¸¸ã”ã¨ã‚¤ãƒ³ãƒãƒ¼ãƒˆã—ã¦Workspaceã«ãƒ‰ã‚ãƒ¥ãƒ¡ãƒ³ãƒˆã¨ã—ã¦ç§»å‹•ã•ã›ã¤ã¤ã€ç‰¹å®šã®ãƒ•ã‚¡ã‚¤ãƒ«ã‚’ãƒ”ãƒ³ç•™ã‚ã—ã¦è³ªå•ã™ã‚‹ã“ã¨ã‚‚ã§ããŸã€‚

ä»»æ„ã®GitHub ãƒªãƒã‚¸ãƒˆãƒªåã¨ãƒ¬ãƒ¼ãƒˆåˆ¶é™å¯¾ç–ã®PATã‚’å…¥åŠ›

ãƒ”ãƒ³ç•™ã‚ã‚’è¡Œã†ã“ã¨ã§ã‚³ãƒ³ãƒ†ã‚ã‚¹ãƒˆã‚¦ã‚£ãƒ³ãƒ‰ã‚¦ã«å…¨æ–‡æŒ¿å…¥ã•ã‚Œã‚‹ã‚‰ã—ã„

ãƒ„ãƒ¼ãƒ«ã®ç‰¹å¾´ã«ã¤ã„ã¦å•ã†ãƒ¡ãƒ³ãƒ†ãƒŠãƒ¼ã¨æ¦‚ãæ£ã—ãç”ãˆã‚‹LLM with RAG

ã€ŒMy Documentsã€ãƒ¢ãƒ¼ãƒ€ãƒ«ã‹ã‚‰ãƒ•ã‚¡ã‚¤ãƒ«ã‚’ã‚¢ãƒƒãƒ—ãƒãƒ¼ãƒ‰ã™ã‚‹å ´åˆã¯å•é¡Œãªã‹ã£ãŸãŒã€ChatGPTã®ã‚ˆã†ã«ãƒãƒ£ãƒƒãƒˆç”»é¢ã®ðŸ“Žãƒœã‚¿ãƒ³ã‹ã‚‰ãƒ•ã‚¡ã‚¤ãƒ«ã‚’ã‚¢ãƒƒãƒ—ãƒãƒ¼ãƒ‰ã™ã‚‹ã¨ãªãœã‹æ£ã—ãé€ä¿¡ã§ããªã‹ã£ãŸã€‚

æ„Ÿæƒ³ï¼šãƒžãƒ«ãƒãƒ¦ãƒ¼ã‚¶ãƒ¼ã‚‚ã‚µãƒãƒ¼ãƒˆã•ã‚Œã¦ãŠã‚Šã€ï¼ˆãƒžã‚·ãƒ³ãƒªã‚½ãƒ¼ã‚¹ãŒã‚ã‚Œã°ï¼‰ç ”ç©¶å®¤ã§ã‚»ãƒ«ãƒ•ãƒ›ã‚¹ãƒˆã™ã‚‹ã®ã«æœ€é©ã ã¨æ„Ÿã˜ãŸã€‚

2. lobehub/lobe-chat

github.com

æ¦‚è¦ï¼šãƒ¢ãƒ€ãƒ³ãªãƒ‡ã‚¶ã‚¤ãƒ³ãŒç‰¹å¾´ã§ã‚ã‚‹AIãƒãƒ£ãƒƒãƒˆãƒ•ãƒ¬ãƒ¼ãƒ ãƒ¯ãƒ¼ã‚¯ã§ã€æ¤œç´¢ãƒ»è¦ç´„ãªã©ã®ä¾¿åˆ©ãªãƒ—ãƒ©ã‚°ã‚¤ãƒ³ã‚·ã‚¹ãƒ†ãƒ ã‚„ã€ã€‡ã€‡ã‚¢ã‚·ã‚¹ã‚¿ãƒ³ãƒˆãƒ»Ã—Ã—ã‚¨ã‚ã‚¹ãƒ‘ãƒ¼ãƒˆãªã©ãŒæƒã†ï¼ˆGPTsãƒ©ã‚¤ã‚¯ãªï¼‰ã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆã‚¹ãƒˆã‚¢ãŒåˆ©ç”¨ã§ãã‚‹ã€‚

æ‰‹é †ï¼š

Google AIç”¨ã®ç’°å¢ƒå¤‰æ•°ã‚’æŒ‡å®šã—ã¦Dockerã§ãƒ‡ãƒ—ãƒã‚¤ã—ã¦ã¿ã‚‹ã€‚äº‹å‰ã«Google AI Studioã§ç„¡æ–™ã®APIã‚ãƒ¼ã‚’å–å¾—ã—ã¦ãŠãå¿…è¦ãŒã‚ã‚‹ã€‚

1åˆ†ã»ã©ã§APIã‚ãƒ¼ãŒä½œæˆã§ãã¦ã€æ‰‹è»½ã«curlã§è©¦ã›ã‚‹ã®ã‚‚é…åŠ›

å–å¾—ã—ãŸAPIã‚ãƒ¼ã‚’åˆ©ç”¨ã—ã¦ã€Macbookã§ä»¥ä¸‹ã®ã‚³ãƒžãƒ³ãƒ‰ã‚’å®Ÿè¡Œã—ã‚³ãƒ³ãƒ†ãƒŠã‚’èµ·å‹•ã™ã‚‹ã€‚

$ docker run -d -p 3210:3210 \
-e ENABLED_OPENAI=0 \
-e GOOGLE_API_KEY=*************************************** \
--name lobe-chat \
lobehub/lobe-chat

localhost:3210ã«ã‚¢ã‚¯ã‚»ã‚¹ï¼ˆå¯æ„›ã„...ï¼Ÿï¼‰

gemini-1.5-flash-latestã‚’ä½¿ç”¨ã—ã¦Pythonã‚³ãƒ¼ãƒ‰ã‚’æ›¸ã‹ã›ã‚‹æ§˜å

ãƒ—ãƒ©ã‚°ã‚¤ãƒ³ã‚¹ãƒˆã‚¢ã§è©¦ã—ã«ã€ŒGit OSS Statsã€ã‚’ã‚¤ãƒ³ã‚¹ãƒˆãƒ¼ãƒ«

lobehub/lobe-chatã‚’åˆ†æžã•ã›ãŸçµæžœï¼ˆã‹ãªã‚Šä¾¿åˆ©ï¼‰

ã‚¢ã‚·ã‚¹ã‚¿ãƒ³ãƒˆã¨ã—ã¦è©¦ã—ã«ã€ŒFitness AI Trainerã€ã‚’è¿½åŠ

ãƒãƒ¼ãƒ«æŒ‡å®šãªã—ã§ã€ã„ããªã‚Šè¸ã¿è¾¼ã‚“ã è³ªå•ãŒã§ãã‚‹ã®ã¯ä¾¿åˆ©

æ„Ÿæƒ³ï¼šãƒ—ãƒ©ã‚°ã‚¤ãƒ³ã¨ã‚¢ã‚·ã‚¹ã‚¿ãƒ³ãƒˆã¯ãŠæ°—ã«å…¥ã‚Šã‚’æŽ¢ã—ãŸããªã‚‹ã—ã€å…¨ä½“çš„ã«UIãŒæ´—ç·´ã•ã‚Œã¦ã„ã¦éžå¸¸ã«ä½¿ã„ã‚„ã™ã‹ã£ãŸã€‚

3. OpenBMB/MiniCPM

github.com

æ¦‚è¦ï¼šãƒžãƒ«ãƒãƒ¢ãƒ¼ãƒ€ãƒ«LLMï¼ˆå…¥åŠ›ï¼šç”»åƒï¼†å‹•ç”»ï¼†ãƒ†ã‚ã‚¹ãƒˆã€å‡ºåŠ›ï¼šãƒ†ã‚ã‚¹ãƒˆï¼‰ã§ã‚ã‚Šã€ç”»åƒç†è§£ã§GPT-4o miniã‚„Gemini 1.5 Proãªã©ã‚’ä¸Šå›žã‚‹ã€‚

æ‰‹é †ï¼š

NVIDIA GPUã®å ´åˆã€ä»¥ä¸‹ã®æ‰‹é †ã§å®Ÿè¡Œã™ã‚Œã°READMEãŒå‰æã¨ã—ã¦ã„ã‚‹æœ€ä½Žé™ã®ç’°å¢ƒæ§‹ç¯‰ãŒã§ãã‚‹ã€‚

$ docker run -it --rm --gpus all nvidia/cuda:12.6.1-cudnn-devel-ubuntu22.04 /bin/bash
$ apt-get update && apt-get install -y git vim wget
$ mkdir -p ~/miniconda3 && wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh -O ~/miniconda3/miniconda.sh && bash ~/miniconda3/miniconda.sh -b -u -p ~/miniconda3 && rm ~/miniconda3/miniconda.sh && ~/miniconda3/bin/conda init bash && source ~/.bashrc

ãŸã ã—ã€[Install]ã®æ‰‹é †ã ã‘ã§ã¯FlashAttentionãŒå…¥ã£ã¦ã„ãªã„ã¨ã‚¨ãƒ©ãƒ¼ãŒå‡ºã¦ã—ã¾ã†ã®ã§ã€[Multi-turn Conversation]ã‚’å®Ÿè¡Œã™ã‚‹å‰ã«pip install flash-attn --no-build-isolationã™ã‚‹å¿…è¦ãŒã‚ã‚‹ã€‚ å®Ÿéš›ã«ç´„17GBã®GPUãƒ¡ãƒ¢ãƒªã§1ç•ªé«˜æ€§èƒ½ãªãƒ¢ãƒ‡ãƒ«ãŒå‹•ã‹ã›ã¦ã€æŽ¨è«–è‡ªä½“ã¯ç”»åƒï¼†è³ªå•ã‚’å…¥åŠ›ã™ã‚‹å ´åˆ5ç§’ã»ã©ã€ãã‚Œã‚’å±¥æ´ã¨ã—ã¦è¿½åŠ è³ªå•ã‚’ã™ã‚‹å ´åˆã«3ç§’ã»ã©ã ã£ãŸã€‚

PhotoACã‹ã‚‰é©å½“ã«æ‹¾ã£ãŸå…¥åŠ›ç”»åƒï¼ˆãƒªãƒ£ãƒžï¼‰

æ„Ÿæƒ³ï¼šiPad Proã§ãƒ¢ãƒ‡ãƒ«ã‚’å‹•ã‹ã—ã¦ã„ã‚‹ãƒ‡ãƒ¢å‹•ç”»ãŒå°è±¡çš„ã ã£ãŸã€‚

4. ollama/ollama

github.com

æ¦‚è¦ï¼šGoã§æ›¸ã‹ã‚ŒãŸè¨€ã‚ãšã¨çŸ¥ã‚ŒãŸãƒãƒ¼ã‚«ãƒ«LLMã®å®Ÿè¡Œãƒ„ãƒ¼ãƒ«ã€‚

æ‰‹é †ï¼š

ä»Šå›žã¯Gemma 2 27Bï¼ˆ16GBï¼‰ã‚’NVIDIA GPUã¨Dockerã§å‹•ã‹ã—ã¦ã¿ãŸã€‚è³ªå•ã¯LLM Benchmarksã‚’å‚è€ƒã«ã—ãŸã€‚

$ mkdir ollama
$ docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
$ docker exec -it ollama ollama run gemma2:27b
# çœç•¥
success
>>> Argue for and against the use of kubernetes in the style of a haiku.
## For Kubernetes:

Orch, scale, deploy fast.
Containers dance, self-healing.
Power flows, unbound.

## Against Kubernetes:

Complex beast to tame.
Learning curve, steep as a cliff.
Simpler paths exist?


>>> Sally (a girl) has 3 brothers. Each brother has 2 sisters. How many sisters does Sally have?
Sally has **2** sisters.

Here's why:

All three of Sally's brothers share the same two sisters â€“ Sally and her other sister.


Let me know if you'd like to try another riddle!

ãƒãƒ¼ã‚«ãƒ«LLMã¨ã—ã¦ååˆ†ã™ãŽã‚‹æ€§èƒ½ã¨é€Ÿåº¦ãŒå‡ºãŸã€‚8Kãƒˆãƒ¼ã‚¯ãƒ³ã®Gemma 2ã‚ˆã‚Šã‚‚é•·ã„ã‚³ãƒ³ãƒ†ã‚ã‚¹ãƒˆã‚’æ‰±ãˆã‚‹128Kãƒˆãƒ¼ã‚¯ãƒ³ã®Qwen2.5ãªã©ã‚’å«ã‚€ã€éžå¸¸ã«å¤šãã®ãƒ¢ãƒ‡ãƒ«ã‚’ã‚µãƒãƒ¼ãƒˆã—ã¦ã„ã‚‹ï¼ˆlibraryï¼‰ã€‚

GGUFå½¢å¼ã‚„Safetensorså½¢å¼ã®ãƒ¢ãƒ‡ãƒ«ã®ã‚¤ãƒ³ãƒãƒ¼ãƒˆã‚‚ã‚µãƒãƒ¼ãƒˆã•ã‚Œã¦ã„ã‚‹ã€‚

Modelfileã¨ã„ã†ãƒ•ã‚¡ã‚¤ãƒ«ã‚’ä½œæˆã—ã¦ãƒ—ãƒãƒ³ãƒ—ãƒˆã‚’ã‚«ã‚¹ã‚¿ãƒžã‚¤ã‚ºã™ã‚‹ã“ã¨ã‚‚ã§ãã‚‹ã®ã§ã€ä»¥ä¸‹ã®ã‚ˆã†ãªãƒ•ã‚¡ã‚¤ãƒ«ã‚’ä½œæˆã—ã¦ãƒ¢ãƒ‡ãƒ«ã‚’å‹•ã‹ã—ã¦ã¿ãŸã€‚

FROM gemma2:27b

# set the temperature to 1 [higher is more creative, lower is more coherent]
PARAMETER temperature 1

# set the system message
SYSTEM """
You are Goku from Dragon Ball. Answer as Goku, the assistant, only, and respond exclusively in Japanese.
"""

ä»Šå›žã¯æ‰±ã‚ãªã‹ã£ãŸãŒã€ADAPTERã‚’æŒ‡å®šã™ã‚Œã°ï¼ˆQï¼‰LoRAã‚¢ãƒ€ãƒ—ã‚¿ãƒ¼ã‚’ãƒ¢ãƒ‡ãƒ«ã«é©ç”¨ã§ãã‚‹ã€‚

$ docker cp Modelfile ollama:/tmp/
$ docker exec -it ollama /bin/bash

$ cd /tmp
$ ollama create goku -f ./Modelfile
$ ollama run goku
>>> ãŒã‚“ã°ã‚Œã‚«ã‚«ãƒãƒƒãƒˆ...ãŠã¾ãˆãŒãƒŠãƒ³ãƒãƒ¼1ã ï¼ï¼
ãŠãŠãŠãŠï¼ã‚ã‚ŠãŒã¨ã†ï¼ãŠå‰ã‚‚é ‘å¼µã‚Œï¼ Saiyanã®ãƒ—ãƒ©ã‚¤ãƒ‰ã‚’èƒ¸ã«ã€æœ€å¼·ã‚’ç›®æŒ‡ã—ã¦çªãé€²ã‚€ãœï¼ðŸ”¥ðŸ’ª

æ„Ÿæƒ³ï¼šå˜ç´”ã«ãƒ¢ãƒ‡ãƒ«ã‚’å‹•ã‹ã™ä»¥å¤–ã«ã‚‚ã€ã‚¤ãƒ³ãƒãƒ¼ãƒˆã‚„è±Šå¯Œãªã‚«ã‚¹ã‚¿ãƒžã‚¤ã‚ºãŒã§ãã¦ä¾¿åˆ©ãªã®ã§ã‚‚ã£ã¨æ·±æŽ˜ã‚Šã—ã¦ã¿ãŸã„ã€‚

5. f/awesome-chatgpt-prompts

github.com

æ¦‚è¦ï¼šChatGPTã‚’ã‚ˆã‚Šè‰¯ãä½¿ã†ãŸã‚ã®ãƒ—ãƒãƒ³ãƒ—ãƒˆé›†ã€‚

æ‰‹é †ï¼š

READMEã«ã€ŒAct as a ã€‡ã€‡ã€ã®ãƒ—ãƒãƒ³ãƒ—ãƒˆä¾‹ãŒå¤§é‡ã«ä¸¦ã‚“ã§ã„ã‚‹ã€‚

ã€‡ã€‡ã¨ã—ã¦ã€Linux Terminalã€English Translator and Improverã€Math Teacherã€Prompt Generatorã€Prompt Enhancerã€Python interpreterãªã©æ™®æ®µã‹ã‚‰åˆ©ç”¨ã§ããã†ãªã‚‚ã®ã‹ã‚‰ç‰¹å®šã®è·æ¥ãƒ»ãƒ‰ãƒ¡ã‚¤ãƒ³ã«æˆã‚Šåˆ‡ã‚‹ã‚‚ã®ã¾ã§æƒã£ã¦ã„ãŸã€‚

ã€ŒAct as a Regex Generatorã€ã‚’æ¤œè¨¼ã—ã¦ã¿ã‚‹ã€‚

ã©ã¡ã‚‰ã‚‚å¾—ã‚‰ã‚Œã‚‹æ£è¦è¡¨ç¾ã¯åŒã˜ã ãŒã€ã‚µãƒ¼ãƒ“ã‚¹ã®ä¸ã«LLMã‚’çµ„ã¿è¾¼ã‚€éš›ã«ã¯ã€ŒDo not write explanations or examples of how the regular expressions work; simply provide only the regular expressions themselves.ã€ã®ã‚ˆã†ãªãƒ—ãƒãƒ³ãƒ—ãƒˆãŒå¿…è¦ã§ã‚ã‚Šã€ã‚±ãƒ¼ã‚¹ã‚¹ã‚¿ãƒ‡ã‚£ã‚’é€šã—ã¦ãã®é›°å›²æ°—ã‚’æ„Ÿã˜ã‚‹ã“ã¨ãŒã§ããŸã€‚

ãŠæ°—ã«å…¥ã‚Šâ‘ ã€ŒAct as a Emoji Translatorã€

ãŠæ°—ã«å…¥ã‚Šâ‘¡ ã€ŒAct as a Linux Terminalã€

æ„Ÿæƒ³ï¼šéŠã‚“ã§ã„ã‚‹ã ã‘ã§é¢ç™½ã‹ã£ãŸã—ã€ãƒ—ãƒãƒ³ãƒ—ãƒˆã‚¨ãƒ³ã‚¸ãƒ‹ã‚¢ãƒªãƒ³ã‚°ã®ãƒ¢ãƒãƒ™ãƒ¼ã‚·ãƒ§ãƒ³ãŒä¸ŠãŒã£ãŸã€‚

6. mem0ai/mem0

github.com

æ¦‚è¦ï¼šãƒ¦ãƒ¼ã‚¶ãƒ¼ãƒ»ã‚»ãƒƒã‚·ãƒ§ãƒ³ãƒ»ã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆãƒ¬ãƒ™ãƒ«ã§è¨˜æ†¶ã‚’ä¿æŒã—ã€ãƒ¦ãƒ¼ã‚¶ãƒ¼ã¨ã®å¯¾è©±ã‚’é€šã—ã¦é©å¿œçš„ã«ãƒ‘ãƒ¼ã‚½ãƒŠãƒ©ã‚¤ã‚¼ãƒ¼ã‚·ãƒ§ãƒ³ã‚’å®Ÿç¾ã§ãã‚‹AIã®ãƒ¡ãƒ¢ãƒªãƒ¬ã‚¤ãƒ¤ãƒ¼ã€‚

æ‰‹é †ï¼š

ãƒ‰ã‚ãƒ¥ãƒ¡ãƒ³ãƒˆã«ã‚ã‚‹ã‚«ã‚¹ã‚¿ãƒžãƒ¼ã‚µãƒãƒ¼ãƒˆã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆã®ä¾‹ã‚’ã‚¢ãƒ¬ãƒ³ã‚¸ã—ã¦æ¤œè¨¼ã—ãŸã€‚

æ§˜ã€…ãªLLMã‚„Embeddierï¼ˆLLMã®ç¨®é¡žã‚ˆã‚Šã‚‚ã‚„ã‚„å°‘ãªã„ï¼Ÿï¼‰ã‚’ã‚µãƒãƒ¼ãƒˆã—ã¦ã„ã‚‹ãŒã€ä»Šå›žã¯OpenAIã‚’ä½¿ç”¨ã—ãŸã€‚

$ docker run -d -p 6333:6333 qdrant/qdrant
$ python -m venv venv
$ . ./venv/bin/activate
$ pip install openai mem0ai
$ vim main.py  # ãƒ‰ã‚ãƒ¥ãƒ¡ãƒ³ãƒˆã®ã‚³ãƒ¼ãƒ‰ä¾‹ã‚’ã‚³ãƒ”ãƒ¼ï¼†ãƒšãƒ¼ã‚¹ãƒˆ
$ python main.py
I'm sorry to hear that your order hasn't arrived yet. I'd be happy to assist you in resolving this issue. Could you please provide me with your order number and any other relevant details?%

ã‚³ãƒ¼ãƒ‰ä¾‹ã®ã‚¯ã‚¨ãƒªã‚’å®Ÿè¡Œã—ã¦ã‚‚ãƒ¦ãƒ¼ã‚¶ãƒ¼ãƒ¬ãƒ™ãƒ«ã§éŽåŽ»ã®è¨˜æ†¶ãŒä¿æŒã•ã‚Œã¦ã„ã‚‹ã‹åˆ†ã‹ã‚Šã«ãã‹ã£ãŸã®ã§ã€Pythonã®å¯¾è©±ãƒ¢ãƒ¼ãƒ‰ã‚’ä½¿ç”¨ã—ã¦2äººãŒãã‚Œãžã‚Œé€”ä¸ã§åˆ¥ã®ã‚³ãƒ³ãƒ†ã‚ã‚¹ãƒˆã‚’æŒŸã¿ãªãŒã‚‰ã‚µãƒãƒ¼ãƒˆã‚’å—ã‘ã‚‹ã‚·ãƒŸãƒ¥ãƒ¬ãƒ¼ã‚·ãƒ§ãƒ³ã‚’è¡Œã£ãŸã€‚

Results of the Multiple Customer Queries Version â€¦

Jane DoeãŒæœ€åˆã«#12345ã®æ³¨æ–‡ãŒå±Šã‹ãªã„ã¨å•ã„åˆã‚ã›ã¦ã„ã‚‹ãŒã€æœ€å¾Œã«#12345ã«ã¤ã„ã¦å•ã„åˆã‚ã›ã‚‹ã¨ã€ŒHow can I assist you with your order today, Jane?ã€ã¨èžãè¿”ã•ã‚Œã¦ãŠã‚Šè¨˜æ†¶ãŒä¸ååˆ†ã ã£ãŸã€‚

Claude 3.5 Sonnetã«æ›¸ã„ã¦ã‚‚ã‚‰ã£ãŸMermaidã®ãƒ—ãƒ¬ãƒ“ãƒ¥ãƒ¼

ã¾ãŸã€ãƒ¡ãƒ¢ãƒªã®å†…å®¹ã‚’ç¢ºèªã—ãŸã¨ã“ã‚äºˆæƒ³ã‚ˆã‚Šã‚‚å°‘ãªãã€ã‚µã‚¤ã‚ºã‚’èª¿æ•´ã§ãã‚‹ã®ã‹æ°—ã«ãªã£ãŸã€‚

ChatGPT 4oã«æ•´å½¢ã—ã¦ã‚‚ã‚‰ã£ãŸJane Doeã®ãƒ¡ãƒ¢ãƒªã®ä¸èº«

æ„Ÿæƒ³ï¼šãƒ¦ãƒ¼ã‚¹ã‚±ãƒ¼ã‚¹ã¨ã—ã¦ã‚«ã‚¹ã‚¿ãƒžãƒ¼ã‚µãƒãƒ¼ãƒˆã‚„ãƒ˜ãƒ«ã‚¹ã‚±ã‚¢ã€ç”Ÿç”£æ€§ç®¡ç†ãªã©ãŒæŒ™ã’ã‚‰ã‚Œã¦ã„ã¦éœ€è¦ãŒå¤§ãã„ã¨æ„Ÿã˜ãŸåé¢ã€ä»Šå›žã®ã‚ˆã†ãªè¤‡é›‘ãªã‚¯ã‚¨ãƒªã«å¯¾ã™ã‚‹ä¾‹ã¯ãƒ‰ã‚ãƒ¥ãƒ¡ãƒ³ãƒˆã§ã‚‚ç´¹ä»‹ã•ã‚Œã¦ãŠã‚‰ãšæ€§èƒ½è©•ä¾¡ãŒé‡è¦ã ã¨è€ƒãˆãŸã€‚

7. ComposioHQ/composio

github.com

æ¦‚è¦ï¼šAIã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆã¨100ä»¥ä¸Šã®ã‚¢ãƒ—ãƒªã‚±ãƒ¼ã‚·ãƒ§ãƒ³ï¼ˆGitHubã€Slackã€Gmailãªã©ï¼‰ã‚’é€£æºã™ã‚‹ãŸã‚ã®ãƒ—ãƒ©ãƒƒãƒˆãƒ•ã‚©ãƒ¼ãƒ ï¼ˆãƒ„ãƒ¼ãƒ«ã‚»ãƒƒãƒˆï¼‰ã€‚

æ‰‹é †ï¼š

🚀 Quick Start - Composioã§Pythonã‚’é¸æŠžã—ã€GitHub ãƒªãƒã‚¸ãƒˆãƒªã«ã‚¹ã‚¿ãƒ¼ã‚’ä»˜ã‘ã¦ã¿ã‚‹ã€‚

$ python -m venv venv
$ . ./venv/bin/activate
$ pip install composio_core composio_openai
$ composio add github
#çœç•¥
âœ” Authenticated successfully!
> Adding integration: Github...
#çœç•¥
âš  Waiting for github authentication...
âœ” github added successfully with ID: ********-****-****-****-************

Composioã®ã‚¢ã‚«ã‚¦ãƒ³ãƒˆï¼ˆç„¡æ–™ï¼‰ã‚’æŒã£ã¦ã„ãªã‹ã£ãŸã®ã§ä½œæˆã—ã¦ã‹ã‚‰ã€GitHubã®èªè¨¼ã‚’è¡Œã£ãŸã€‚

ä»¥ä¸‹ã®ã‚³ãƒžãƒ³ãƒ‰ã§ä½¿ç”¨ã™ã‚‹COMPOSIO_API_KEYã¯ãƒã‚°ã‚¤ãƒ³ã—ãŸçŠ¶æ…‹ã§https://app.composio.dev/settingsã‹ã‚‰å–å¾—ã§ãã‚‹ã€‚

$ vim main.py  # å…¬å¼ãƒ‰ã‚ãƒ¥ãƒ¡ãƒ³ãƒˆé€šã‚Š
$ COMPOSIO_API_KEY=*** OPENAI_API_KEY=sk-*** python main.py
[2024-09-24 12:57:47,298][INFO] Logging is set to INFO, use `logging_level` argument or `COMPOSIO_LOGGING_LEVEL` change this
[2024-09-24 12:57:52,519][INFO] Executing `GITHUB_ACTIVITY_STAR_REPO_FOR_AUTHENTICATED_USER` with params={'owner': 'composiohq', 'repo': 'composio'} and metadata={} connected_account_id=None
[2024-09-24 12:57:53,919][INFO] Got response={'successfull': True, 'data': {'details': 'Action executed successfully'}, 'error': None} from action=<composio.client.enums._action.Action object at 0x112a780e0> with params={'owner': 'composiohq', 'repo': 'composio'}
[{'successfull': True, 'data': {'details': 'Action executed successfully'}, 'error': None}]

è‡ªç„¶è¨€èªžã®æŒ‡ç¤ºã§GitHub ãƒªãƒã‚¸ãƒˆãƒªã«ã‚¹ã‚¿ãƒ¼ã‚’ä»˜ã‘ã‚‰ã‚Œã‚‹

Quick Startã®2ã¯Google Calendarã€3ã¯Gmailã ãŒã€æ™‚é–“ã®éƒ½åˆã§ã‚¹ã‚ãƒƒãƒ—ã—ãŸã€‚

æ„Ÿæƒ³ï¼šèªè¨¼ã‚„ãƒ•ãƒ¬ãƒ¼ãƒ ãƒ¯ãƒ¼ã‚¯ãŒæŠ½è±¡åŒ–ã•ã‚Œã¦ã„ã¦ãƒ„ãƒ¼ãƒ«ã”ã¨ã®é–‹ç™ºã‚’è¡Œã‚ãªãã¦è‰¯ã„ãŸã‚å¤§å¹…ãªã‚¹ãƒ”ãƒ¼ãƒ‰ã‚¢ãƒƒãƒ—ã«ã¤ãªãŒã‚‹ã¨æ„Ÿã˜ãŸã€‚

8. langflow-ai/langflow

github.com

æ¦‚è¦ï¼šPythonãƒ™ãƒ¼ã‚¹ã®ãƒãƒ¼ã‚³ãƒ¼ãƒ‰ã‚¢ãƒ—ãƒªã‚±ãƒ¼ã‚·ãƒ§ãƒ³æ§‹ç¯‰ãƒ„ãƒ¼ãƒ«ã§ã€RAGã‚„ãƒžãƒ«ãƒã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆAIã‚’ãƒ‰ãƒ©ãƒƒã‚°ï¼†ãƒ‰ãƒãƒƒãƒ—ã§ä½œæˆã§ãã‚‹ã€‚

æ‰‹é †ï¼š

å…¬å¼ãƒ‰ã‚ãƒ¥ãƒ¡ãƒ³ãƒˆã«å¾“ã£ã¦pipã§ã‚¤ãƒ³ã‚¹ãƒˆãƒ¼ãƒ«ã—ã¦Langflowã‚µãƒ¼ãƒãƒ¼ã‚’èµ·å‹•ã™ã‚‹ã€‚

$ pip install langflow -U
$ langflow run
Starting Langflow v1.0.18...
# çœç•¥
â•â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â•®
â”‚ Welcome to â›“ Langflow                                             â”‚
â”‚                                                                   â”‚
â”‚                                                                   â”‚
â”‚ Collaborate, and contribute at our GitHub Repo ðŸŒŸ                 â”‚
â”‚                                                                   â”‚
â”‚ We collect anonymous usage data to improve Langflow.              â”‚
â”‚ You can opt-out by setting DO_NOT_TRACK=true in your environment. â”‚
â”‚                                                                   â”‚
â”‚ Access http://127.0.0.1:7860                                      â”‚
â•°â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â•¯

ãƒªãƒƒãƒãªãƒ†ãƒ³ãƒ—ãƒ¬ãƒ¼ãƒˆãŒç”¨æ„ã•ã‚Œã¦ã„ã‚‹ï¼ˆã‚¢ã‚¤ã‚³ãƒ³ã®é›°å›²æ°—ãŒå¥½ã¿ï¼‰

Vector Store RAGãƒ†ãƒ³ãƒ—ãƒ¬ãƒ¼ãƒˆã‚’é¸æŠžã—ãŸå ´åˆ

OpenAIã®APIã‚ãƒ¼ã‚’å…¥åŠ›ã™ã‚‹ã ã‘ã§è©¦ã›ã‚‹ã¨æ€ã£ãŸãŒã€ãƒ‡ãƒ•ã‚©ãƒ«ãƒˆã®ãƒ™ã‚¯ãƒˆãƒ«DBã«AstraDBã¨ã„ã†ã‚µãƒ¼ãƒãƒ¼ãƒ¬ã‚¹ã‚µãƒ¼ãƒ“ã‚¹ãŒã‚»ãƒƒãƒˆã•ã‚Œã¦ã„ã¦é¢å€’ã«ãªã£ã¦ã—ã¾ã£ãŸã®ã§ã‚¹ã‚ãƒƒãƒ—ã—ãŸã€‚

æ„Ÿæƒ³ï¼šDifyã«ä¼¼ã¦ã„ã‚‹ã‚‚ã®ã®ã€ãƒãƒ£ãƒƒãƒˆã®ãƒ¡ãƒ¢ãƒªç®¡ç†å‘¨ã‚Šã®ãƒ‰ã‚ãƒ¥ãƒ¡ãƒ³ãƒˆãŒæ•´å‚™ã•ã‚Œã¦ã„ã¦ä»–ã®ãƒ„ãƒ¼ãƒ«ã¨å·®åˆ¥åŒ–ã§ãã¦ã„ã‚‹å°è±¡ã ã£ãŸã€‚

9. comfyanonymous/ComfyUI

github.com

æ¦‚è¦ï¼šStable Diffusionãªã©ã®æ‹¡æ•£ãƒ¢ãƒ‡ãƒ«ã®ãƒ‘ã‚¤ãƒ—ãƒ©ã‚¤ãƒ³ã‚’å®Ÿè¡Œã§ãã‚‹ãƒãƒƒã‚¯ã‚¨ãƒ³ãƒ‰ã‚’å«ã‚€GUIãƒ„ãƒ¼ãƒ«ã€‚

æ„Ÿæƒ³ï¼šå…¨ç„¶ãƒ‰ã‚ãƒ¥ãƒ¡ãƒ³ãƒˆã‚’èªã‚ã¦ã„ãªã„ãŒã€ãƒãƒƒã‚¯ã‚¨ãƒ³ãƒ‰ã‚’GPUãƒžã‚·ãƒ³ã€GUIã‚’MacBookã§è§¦ã‚‹ã“ã¨ãŒã§ãã‚Œã°ç†æƒ³çš„ã ã¨æ€ã£ãŸã€‚

10. langgenius/dify

github.com

æ¦‚è¦ï¼šç›´æ„Ÿçš„ãªã‚¤ãƒ³ã‚¿ãƒ¼ãƒ•ã‚§ã‚¤ã‚¹ã§AIãƒ¯ãƒ¼ã‚¯ãƒ•ãƒãƒ¼ã‚„RAGãƒ‘ã‚¤ãƒ—ãƒ©ã‚¤ãƒ³ã€ã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆæ©Ÿèƒ½ãªã©æ§‹ç¯‰ã§ãã‚‹LLMã‚¢ãƒ—ãƒªé–‹ç™ºãƒ—ãƒ©ãƒƒãƒˆãƒ•ã‚©ãƒ¼ãƒ ã€‚

æ‰‹é †ï¼š

READMEã«ã—ãŸãŒã£ã¦ã€ä»¥ä¸‹ã®ã‚³ãƒžãƒ³ãƒ‰ã§ãƒãƒ¼ã‚«ãƒ«Difyã‚µãƒ¼ãƒãƒ¼ã‚’ç«‹ã¦ãŸï¼ˆdocker-compose.yamlã®ä¸èº«ã«ã¯ã€ãƒ•ãƒãƒ³ãƒˆã‚¨ãƒ³ãƒ‰ã€ãƒãƒƒã‚¯ã‚¨ãƒ³ãƒ‰ã€DBã€Redisã€Nginxã€ãƒ™ã‚¯ãƒˆãƒ«ãƒ‡ãƒ¼ã‚¿ãƒ™ãƒ¼ã‚¹ã€MinIOãªã©ãŒå«ã¾ã‚Œã¦ã„ãŸï¼‰ã€‚

$ git clone https://github.com/langgenius/dify.git
$ cd dify/docker
$ cp .env.example .env
$ docker compose up -d

http://localhost/installã‹ã‚‰Web UIã®ã€Œç®¡ç†è€…ã‚¢ã‚«ã‚¦ãƒ³ãƒˆã®è¨å®šã€ã«æ¡ˆå†…ã•ã‚ŒãŸã€‚Getting Startedã¨ã—ã¦ã¯å…¬å¼ãƒ‰ã‚ãƒ¥ãƒ¡ãƒ³ãƒˆã‚ˆã‚Šã‚‚ä»¥ä¸‹ã®è¨˜äº‹ãŒåˆ†ã‹ã‚Šã‚„ã™ã‹ã£ãŸã€‚

Dify で RAG を試す｜npaka

æ³¨æ„ç‚¹ã¨ã—ã¦ã€è¨˜äº‹ã§ã¯Rerankãƒ¢ãƒ‡ãƒ«ã¨ã—ã¦Cohereã®APIï¼ˆæœ‰æ–™ï¼‰ãŒåˆ©ç”¨ã•ã‚Œã¦ã„ãŸãŸã‚ã€ä»£ã‚ã‚Šã«ãƒãƒ¼ã‚«ãƒ«GPUãƒžã‚·ãƒ³ã§XInferenceã‚µãƒ¼ãƒãƒ¼ã‚’Dockerã§ã‚»ãƒƒãƒˆã‚¢ãƒƒãƒ—ã—ã¦bge-reranker-v2-m3ã¨ã„ã†ãƒ¢ãƒ‡ãƒ«ã‚’èµ·å‹•ã—ãŸã€‚

$ mkdir ~/.xinference
$ docker run --name xinference -d -p 9997:9997 -e XINFERENCE_HOME=/data -v $HOME/.xinference:/data --gpus all xprobe/xinference:latest xinference-local -H 0.0.0.0
# <å®Ÿè¡Œã—ãŸã‚µãƒ¼ãƒãƒ¼ã®IPã‚¢ãƒ‰ãƒ¬ã‚¹>:9997 ã‹ã‚‰èµ·å‹•ã™ã‚‹ãƒ¢ãƒ‡ãƒ«ã‚’é¸æŠžã™ã‚‹

å®Ÿè¡Œä¸ã®Rerankãƒ¢ãƒ‡ãƒ«ä¸€è¦§ï¼ˆ1ã‚¯ãƒªãƒƒã‚¯ã§ãƒ‡ãƒ—ãƒã‚¤å¯èƒ½ï¼‰

Difyã«ãƒ¢ãƒ‡ãƒ«ãƒ—ãƒãƒã‚¤ãƒ€ã¨ã—ã¦Xorbits Inferenceã‚’è¿½åŠ

LLMã¨Text Embeddingã«OpenAIã€Rerankã«Xorbits Inferenceã‚’ä½¿ç”¨

è¨˜äº‹ã®ã‚ˆã†ã«ã‚¼ãƒã‹ã‚‰ãƒ¯ãƒ¼ã‚¯ãƒ•ãƒãƒ¼ã‚’æ§‹ç¯‰ã—ã¦ã‚‚è‰¯ã„ãŒã€ä¾¿åˆ©ãªãƒ†ãƒ³ãƒ—ãƒ¬ãƒ¼ãƒˆãŒå¤šæ•°ç”¨æ„ã•ã‚Œã¦ã„ã‚‹ã®ã§ä»Šå›žã¯ã€ŒKnowledge Retreival + Chatbotã€ã‚’ä½¿ç”¨ã—ãŸã€‚

è±Šå¯Œãªãƒ†ãƒ³ãƒ—ãƒ¬ãƒ¼ãƒˆä¸€è¦§ã‹ã‚‰ã€ŒKnowledge Retreival + Chatbotã€ã‚’é¸æŠž

è¨˜äº‹ã®é€šã‚Šã«ãƒŠãƒ¬ãƒƒã‚¸ã‚’ä½œæˆï¼ˆä»Šå›žã¯DetaGemmaã®ãƒ†ã‚¯ãƒ‹ã‚«ãƒ«ãƒšãƒ¼ãƒ‘ãƒ¼ã‚’ä½¿ç”¨ï¼‰ã—ã¦ã€ã€ŒKnowledge Retrievalã€ãƒŽãƒ¼ãƒ‰ã®ã€ŒãƒŠãƒ¬ãƒƒã‚¸ã€ã¨ã—ã¦è¿½åŠ ã™ã‚‹ã“ã¨ã§ç°¡å˜ã«RAGã‚’æ§‹ç¯‰ã™ã‚‹ã“ã¨ãŒã§ããŸã€‚

å¼•ç”¨ã‚’ç¤ºã—ãªãŒã‚‰ãƒŠãƒ¬ãƒƒã‚¸ã‚’ãƒ™ãƒ¼ã‚¹ã«ã—ã¦LLMãŒå›žç”ã™ã‚‹æ§˜å

Difyã¯ã“ã®æ™‚ç‚¹ã§ã€ã€Œã‚¢ãƒ—ãƒªä¸Šã§ã®ç›´æŽ¥å®Ÿè¡Œã€ã€Œã‚¦ã‚§ãƒ–ã‚µã‚¤ãƒˆåŸ‹ã‚è¾¼ã¿ã€ã€ŒAPIã‚¢ã‚¯ã‚»ã‚¹ã®ã‚»ãƒƒãƒˆã‚¢ãƒƒãƒ—ã€ãŒå®Œäº†ã—ã¦ã„ã‚‹ã ã‘ã§ãªãã€ãƒ¢ãƒ‹ã‚¿ãƒªãƒ³ã‚°ç”¨ã®ãƒ€ãƒƒã‚·ãƒ¥ãƒœãƒ¼ãƒ‰ã‚‚æ—¢ã«ç”¨æ„ã•ã‚Œã¦ã„ãŸã€‚

# APIãƒªã‚¯ã‚¨ã‚¹ãƒˆã®ä¾‹
$ curl -X POST 'http://localhost/v1/chat-messages' \
--header 'Authorization: Bearer <YOUR_API_KEY>' \
--header 'Content-Type: application/json' \
--data-raw '{
    "inputs": {},
    "query": "What is Data Commons?",
    "response_mode": "streaming",
    "user": "azuma"
}';
#çœç•¥
data: {"event": "node_finished", "conversation_id": "acecb1f4-cc0a-4d16-8ced-f66956e19c67", "message_id": "540c1696-3511-494f-97ab-b177d2bad0ca", "created_at": 1727147646, "task_id": "ed4b7547-7b65-4117-9823-f94df5fc8b2f", "workflow_run_id": "44919eb1-2702-41a8-81cf-2df1a7c24748", "data": {"id": "51693827-de76-40ad-b292-2b32d3126cf4", "node_id": "1711528915811", "node_type": "knowledge-retrieval", "title": "Knowledge Retrieval", "index": 2, "predecessor_node_id": "1711528914102", "inputs": {"query": "What is Data Commons?"}, "process_data": null, "outputs": {"result": [{"metadata": {"_source": "knowledge", "position": 1, "dataset_id": "536a3abe-8392-488f-b65d-178ed227f256", "dataset_name": "DataGemma-FullPape...", "document_id": "2efb709e-b967-4cab-88ef-c9f6005a9f1d", "document_name": "DataGemma-FullPaper.pdf", "document_data_source_type": "upload_file", "segment_id": "7ebae28e-ff12-495f-9b99-34c70a897cd7", "retriever_from": "workflow", "score": 0.9980077147483826, "segment_hit_count": 1, "segment_word_count": 1725, "segment_position": 7, "segment_index_node_hash": "ca757a7b80f202a20e26684e64a07655096ff2384ccda5ccab83b1ef8606cb3e"}, "title": "DataGemma-FullPaper.pdf", "content": "formats from only a handful of examples in training data.\r\n9 This paper builds upon LIMA utilizing\r\nsmall set training for RIG and RAG explorations with Data Commons KGs. #çœç•¥
#çœç•¥

æ„Ÿæƒ³ï¼šãƒ¯ãƒ¼ã‚¯ãƒ•ãƒãƒ¼ã«ã¯ä»–ã®ãƒŽãƒ¼ãƒ‰ã‚‚ã‚ã‚Šã€å¤‰æ•°ã¨çµ„ã¿åˆã‚ã›ã‚‹ã“ã¨ã§Difyã ã‘ã§ã•ã‚‰ã«è¤‡é›‘ãªã‚·ã‚¹ãƒ†ãƒ ã‚’æ§‹ç¯‰ã§ãã‚‹ã®ãŒé…åŠ›ã ã¨æ„Ÿã˜ãŸã€‚

ã¾ã¨ã‚

ãƒˆãƒ¬ãƒ³ãƒ‰ã®ä¸Šä½ã‚’ä¸å¿ƒã«ã€æ‰‹å…ƒã§LLMé–¢é€£ã®OSSã‚’å‹•ã‹ã—ã¦ã¿ã¾ã—ãŸã€‚

LLMã®ç†è«–ã¯ã€Žå¤§è¦æ¨¡è¨€èªžãƒ¢ãƒ‡ãƒ«å…¥é–€ã€ã¨ã„ã†æœ¬ã‚’èªã‚“ã§ç†è§£ã™ã‚‹ã“ã¨ãŒã§ãã¾ã—ãŸãŒã€ãƒ—ãƒãƒ€ã‚¯ãƒˆè¦–ç‚¹ã¯å…¨ãæŒã£ã¦ã„ãªã‹ã£ãŸã®ã§å¤§ã¾ã‹ã«é›°å›²æ°—ã‚’æŽ´ã‚€ã“ã¨ãŒã§ãã¦è‰¯ã‹ã£ãŸã§ã™ã€‚

ç‰¹ã«ollama/ollamaã¯ã‚²ãƒ¼ãƒ ãƒã‚§ãƒ³ã‚¸ãƒ£ãƒ¼ã ã¨æ€ã„ã¾ã—ãŸã€‚Goå®Ÿè£…ãªã®ã§è¿‘ã„ã†ã¡ã«ã‚½ãƒ¼ã‚¹ã‚³ãƒ¼ãƒ‰ã‚‚èªã‚“ã§ã¿ãŸã„ã§ã™ã€‚

ã‚¨ãƒ³ã‚¸ãƒ‹ã‚¢ã¨ã—ã¦æµè¡Œã¯å¸¸ã«ã‚ãƒ£ãƒƒãƒã‚¢ãƒƒãƒ—ã—ãŸã„ã®ã§ã€10å€‹ã¨ã¯è¨€ã‚ãš3å€‹ãã‚‰ã„å®šæœŸçš„ã«è§¦ã‚‹ç¿’æ…£ã‚’ã¤ã‘ãŸã„ã§ã™ã€‚

*1:NVIDIA GPUã¨ã—ã¦ã€ä»Šå›žã¯NVIDIA RTX 6000 Ada Generationã‚’æœ€å¤§3æžšä½¿ç”¨ã—ã¾ã—ãŸã€‚

ã¦ã£ããƒ»ã–ãƒ»ã¶ã‚ãï¼

LLMé–¢é€£OSSã®ã‚ãƒ£ãƒƒãƒã‚¢ãƒƒãƒ—ï¼ˆ#7ï¼‰

ã¯ã˜ã‚ã«

1. Mintplex-Labs/anything-llm

2. lobehub/lobe-chat

3. OpenBMB/MiniCPM

4. ollama/ollama

5. f/awesome-chatgpt-prompts

6. mem0ai/mem0

7. ComposioHQ/composio

8. langflow-ai/langflow

9. comfyanonymous/ComfyUI

10. langgenius/dify

ã¾ã¨ã‚

ã¯ã˜ã‚ã«

1. Mintplex-Labs/anything-llm

2. lobehub/lobe-chat

3. OpenBMB/MiniCPM

4. ollama/ollama

5. f/awesome-chatgpt-prompts

6. mem0ai/mem0

7. ComposioHQ/composio

8. langflow-ai/langflow

9. comfyanonymous/ComfyUI

10. langgenius/dify

ã¾ã¨ã‚

ã¯ã˜ã‚ã«

ã¾ã¨ã‚