Amazon Bedrockã®åŸºæœ¬æƒ…å ±ã¨Runtime APIã®å®Ÿè¡Œä¾‹ã¾ã¨ã‚ ï¼ å‚è€ƒè³‡æ–™ã€ãƒ¢ãƒ‡ãƒ«ã®ç‰¹å¾´ã€ä¾¡æ ¼ã€ä½¿ç”¨æ–¹æ³•ã€ãƒˆãƒ¼ã‚¯ãƒ³ã¨æŽ¨è«–ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®èª¬æ˜Ž

å°è¥¿ç§€å’Œã§ã™ã€‚
ä»Šå›žã¯2023-09-28ã«General Availability(GA)ã«ãªã£ãŸAmazon Bedrockã®åŸºæœ¬æƒ…å ±ã€Runtime APIã®å®Ÿè¡Œä¾‹ã«ã¤ã„ã¦ã¾ã¨ã‚ã¾ã—ãŸã€‚ã¾ãŸã€ãƒˆãƒ¼ã‚¯ãƒ³ã‚„ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®ã‚¤ãƒ¡ãƒ¼ã‚¸ã‚’ã¤ã‹ã‚€ãŸã‚ã®å¿…è¦æœ€å°é™ã®ç”¨èªžèª¬æ˜Žã‚‚æ‰€ã€…å…¥ã‚Œã¦ã„ã¾ã™ã€‚
æœ€çµ‚æ›´æ–°æ—¥ï¼š2024/06/21

â€»æœ¬è¨˜äº‹ãŠã‚ˆã³å½“åŸ·ç†è€…ã®ãã®ä»–ã®è¨˜äº‹ã§æŽ²è¼‰ã•ã‚Œã¦ã„ã‚‹ã‚½ãƒ¼ã‚¹ã‚³ãƒ¼ãƒ‰ã¯è‡ªä¸»ç ”ç©¶æ´»å‹•ã®ä¸€è²«ã¨ã—ã¦ä½œæˆã—ãŸã‚‚ã®ã§ã‚ã‚Šã€å‹•ä½œã‚’ä¿è¨¼ã™ã‚‹ã‚‚ã®ã§ã¯ã‚ã‚Šã¾ã›ã‚“ã€‚ä½¿ç”¨ã™ã‚‹å ´åˆã¯è‡ªå·±è²¬ä»»ã§ãŠé¡˜ã„è‡´ã—ã¾ã™ã€‚ã¾ãŸã€äºˆå‘Šãªãä¿®æ£ã™ã‚‹ã“ã¨ã‚‚ã‚ã‚Šã¾ã™ã®ã§ã”äº†æ‰¿ãã ã•ã„ã€‚

ä»Šå›žã®è¨˜äº‹ã®å†…å®¹ã¯æ¬¡ã®ã‚ˆã†ãªæ§‹æˆã«ãªã£ã¦ã„ã¾ã™ã€‚

Amazon Bedrockã®åŸºæœ¬æƒ…å ±

Amazon Bedrockã®å‚è€ƒè³‡æ–™ãƒ»å¦ç¿’ãƒªã‚½ãƒ¼ã‚¹

Amazon Bedrockã®ç†è§£ã«å½¹ç«‹ã¤ä¸»ãªå‚è€ƒè³‡æ–™ãƒ»å¦ç¿’ãƒªã‚½ãƒ¼ã‚¹ã«ã¯æ¬¡ã®ã‚‚ã®ãŒæŒ™ã’ã‚‰ã‚Œã¾ã™ã€‚
ã“ã®è¨˜äº‹ã®å†…å®¹ã¯ã“ã‚Œã‚‰ã®å‚è€ƒè³‡æ–™ãƒ»å¦ç¿’ãƒªã‚½ãƒ¼ã‚¹ã«ã‚ã‚‹æƒ…å ±ã‚’åŸºã¨ã—ã¦ã„ã¾ã™ã€‚

What's Newï¼š Amazon Bedrock is now generally available
AWS Blog: Amazon Bedrock Is Now Generally Available â€“ Build and Scale Generative AI Applications with Foundation Models
ãƒ¢ãƒ‡ãƒ«ã”ã¨ã®ä¾¡æ ¼ï¼š Amazon Bedrock Pricing
Workshopï¼š GitHub - aws-samples/amazon-bedrock-workshop: This is a workshop designed for Amazon Bedrock a foundational model service.
AWS Documentation(User Guide)ï¼š What is Amazon Bedrock? - Amazon Bedrock
AWS Documentation(API Reference)ï¼š Bedrock API Reference - Amazon Bedrock
AWS SDK for Python(Boto3) Documentation(Bedrock)ï¼š Bedrock - Boto3 documentation
AWS SDK for Python(Boto3) Documentation(BedrockRuntime)ï¼š BedrockRuntime - Boto3 documentation
AWS CLI Command Reference(bedrock)ï¼š bedrock â€” AWS CLI Command Reference
AWS CLI Command Reference(bedrock-runtime)ï¼š bedrock-runtime â€” AWS CLI Command Reference
AWS Management Console(Amazon Bedrock Model Providers): Amazon Bedrock Model Providers - AWS Management Console

Amazon Bedrockã¨ã¯

Amazon Bedrockã¯AI21 Labsã®Jurassic-2, Amazonã®Titan, Anthropicã®Claude, Cohereã®Command, Metaã®Llama 2, Stability AIã®Stable Diffusionã¨ã„ã£ãŸåŸºç›¤ãƒ¢ãƒ‡ãƒ«(Foundation Models:FMs)ã‚’ä½¿ç”¨ã™ã‚‹ãŸã‚ã®APIçµŒç”±ã®ã‚¢ã‚¯ã‚»ã‚¹ã‚„ç‹¬è‡ªãƒ‡ãƒ¼ã‚¿ã‚’ä½¿ç”¨ã—ã¦FMsã‚’ãƒ—ãƒ©ã‚¤ãƒ™ãƒ¼ãƒˆã«ã‚«ã‚¹ã‚¿ãƒžã‚¤ã‚ºã™ã‚‹æ©Ÿèƒ½ã‚’æä¾›ã™ã‚‹ã‚µãƒ¼ãƒ“ã‚¹ã§ã™ã€‚
ãƒ†ã‚ã‚¹ãƒˆç”Ÿæˆã€ãƒãƒ£ãƒƒãƒˆãƒœãƒƒãƒˆã€æ¤œç´¢ã€ãƒ†ã‚ã‚¹ãƒˆè¦ç´„ã€ç”»åƒç”Ÿæˆã€ãƒ‘ãƒ¼ã‚½ãƒŠãƒ©ã‚¤ã‚ºã—ãŸãƒ¬ã‚³ãƒ¡ãƒ³ãƒ‡ãƒ¼ã‚·ãƒ§ãƒ³ãªã©ã®ãƒ¦ãƒ¼ã‚¹ã‚±ãƒ¼ã‚¹ã«å¿œã˜ã¦åŸºç›¤ãƒ¢ãƒ‡ãƒ«ã‚’é¸æŠžã—ã¦Generative AIã‚¢ãƒ—ãƒªã‚±ãƒ¼ã‚·ãƒ§ãƒ³ã®æ§‹ç¯‰ã‚„æ‹¡å¼µãŒã§ãã¾ã™ã€‚

ãƒ†ã‚ã‚¹ãƒˆã‚’æ‰±ã†Generative AIã«ãŠã‘ã‚‹ãƒˆãƒ¼ã‚¯ãƒ³(tokens)ã¨ã¯

Amazon Bedrockã®ãƒ¢ãƒ‡ãƒ«ä¸€è¦§ã‚„ä¾¡æ ¼è¡¨ã‚’è¦‹ã¦ã„ãå‰ã«åˆ¶é™ã‚„èª²é‡‘ã®å˜ä½ã¨ãªã£ã¦ã„ã‚‹ãƒˆãƒ¼ã‚¯ãƒ³(tokens)ã«ã¤ã„ã¦ç°¡å˜ã«èª¬æ˜Žã—ã¾ã™ã€‚
ãŸã ã—ã€ã“ã“ã§ã¯ã‚¤ãƒ¡ãƒ¼ã‚¸ã®ã—ã‚„ã™ã•ã‚’é‡è¦–ã—ãŸãŸã‚åŽ³å¯†ãªå®šç¾©ã¨ã¯ç•°ãªã‚‹å¯èƒ½æ€§ãŒã‚ã‚‹ã“ã¨ã‚’ã”æ‰¿çŸ¥ãŠããã ã•ã„ã€‚

ãƒ†ã‚ã‚¹ãƒˆã‚’æ‰±ã†Generative AIã«ãŠã‘ã‚‹ãƒˆãƒ¼ã‚¯ãƒ³(tokens)ã¨ã¯ã€ãƒ†ã‚ã‚¹ãƒˆã‚’æ„å‘³ã®ã‚ã‚‹éƒ¨åˆ†ã«åˆ†å‰²ã—ãŸå˜ä½ã®ã“ã¨ã§ã™ã€‚
ãƒˆãƒ¼ã‚¯ãƒ³ã¯å˜èªžã«è©²å½“ã™ã‚‹å ´åˆã‚‚ã‚ã‚Šã¾ã™ãŒã€å¿…ãšã—ã‚‚å˜èªžã¨åŒç¾©ã§ã¯ãªãæ–‡å—ã€ã‚µãƒ–ãƒ¯ãƒ¼ãƒ‰ãªã©ã«åˆ†å‰²ã•ã‚Œã‚‹å ´åˆã‚‚ã‚ã‚Šã¾ã™ã€‚

ä¾‹ãˆã°Amazon Bedrock is amazing!ã¨ã„ã†æ–‡å—åˆ—ã‚’å˜èªžãƒ™ãƒ¼ã‚¹ã«ãƒˆãƒ¼ã‚¯ãƒ³åŒ–ã™ã‚‹ã¨æ¬¡ã®ã‚ˆã†ã«ãªã‚Šã¾ã™ã€‚
["Amazon", "Bedrock", "is", "amazing", "!"]

ã—ã‹ã—ã€å˜èªžãƒ™ãƒ¼ã‚¹ã§ã¯ãªã„åˆ¥ã®ãƒˆãƒ¼ã‚¯ãƒ³åŒ–æ‰‹æ³•(Tokenization)ã‚’ä½¿ç”¨ã™ã‚‹ã¨æ¬¡ã®ã‚ˆã†ã«ã‚¹ãƒšãƒ¼ã‚¹ã‚‚å«ã‚ã¦åˆ†å‰²ã•ã‚Œã‚‹å ´åˆãŒã‚ã‚Šã¾ã™ã€‚
["Amazon", " ", "Bedrock", " ", "is", " ", "amazing", "!"]

ãƒˆãƒ¼ã‚¯ãƒ³åŒ–æ‰‹æ³•ã«ã¯å˜èªžãƒ™ãƒ¼ã‚¹ä»¥å¤–ã«Unigram Tokenizationã€WordPieceã€SentencePieceã€Byte Pair Encoding(BPE)ãªã©é«˜åº¦ãªã‚‚ã®ãŒã‚ã‚Šã€ãƒ¢ãƒ‡ãƒ«ã”ã¨ã«æŽ¡ç”¨ã—ã¦ã„ã‚‹æ‰‹æ³•ã¯æ§˜ã€…ãªã®ã§ã€ãã®ç‚¹ã¯æ„è˜ã—ã¦ãŠãå¿…è¦ãŒã‚ã‚Šã¾ã™ã€‚

ç‰¹ã«ã€ãƒˆãƒ¼ã‚¯ãƒ³ãƒ™ãƒ¼ã‚¹ã®æ–™é‡‘è¨ˆç®—ã‚’è¡Œã†éš›ã«ã¯ã€å¯¾è±¡ã¨ãªã‚‹ãƒ¢ãƒ‡ãƒ«ã®ãƒˆãƒ¼ã‚¯ãƒ³åŒ–æ‰‹æ³•ã«å¾“ã£ã¦ã€å®Ÿéš›ã«ä½¿ç”¨ã™ã‚‹æ¡ä»¶ã«è¿‘ã„ã‚·ãƒŠãƒªã‚ªã§ãƒˆãƒ¼ã‚¯ãƒ³æ•°ã‚’ç®—å‡ºã™ã‚‹ã®ãŒæœ€è‰¯ã ã¨æ€ã„ã¾ã™ã€‚
ã—ã‹ã—å€‹äººçš„ã«ã¯ã€è‡ªåˆ†ãŒåˆ©ç”¨ã—ã¦ã„ã‚‹Generative AIã‚µãƒ¼ãƒ“ã‚¹ã®æœˆé¡äºˆç®—ã‚’è€ƒãˆã‚‹ã¨ããªã©ãƒˆãƒ¼ã‚¯ãƒ³æ•°ã®è©³ã—ã„äºˆæ¸¬ã«æ™‚é–“ã¨ä½œæ¥é‡ã‚’ã‹ã‘ãŸããªã„å ´åˆã«ã¯ã€Generative AIãã®ã‚‚ã®ã‚’ä½¿ç”¨ã—ã¦è¨ˆç®—ã—ãŸã‚Šã€è¨ˆç®—ã—ã‚„ã™ã„ã‚ˆã†ã«1æ–‡å—ï¼1ãƒˆãƒ¼ã‚¯ãƒ³ã¨ã—ã¦é«˜ã‚ã«æ–™é‡‘ã‚’è¦‹ç©ã‚‚ã£ãŸã‚Šã—ã¦ã„ã¾ã™ã€‚

ç”¨æ„ã•ã‚Œã¦ã„ã‚‹ãƒ¢ãƒ‡ãƒ«ã®ä¸€è¦§

è£½å“ãƒšãƒ¼ã‚¸ã®Amazon Bedrock â€“ AWSã¾ãŸã¯AWS Management Consoleã®Amazon Bedrock Model Providersã‚’å‚è€ƒã«æœ¬è¨˜äº‹åŸ·ç†æ™‚ç‚¹ã®ãƒ‡ãƒ¼ã‚¿ã‚’ã¾ã¨ã‚ã¾ã—ãŸã€‚

â€»Embeddings (Embed)ã‚’ã‚µãƒãƒ¼ãƒˆã—ã¦ã„ã‚‹ãƒ¢ãƒ‡ãƒ«ã¯ã€ãƒ†ã‚ã‚¹ãƒˆå…¥åŠ›(å˜èªžã€ãƒ•ãƒ¬ãƒ¼ã‚ºã€å¤§ããªãƒ†ã‚ã‚¹ãƒˆå˜ä½ãªã©)ã‚’ãƒ†ã‚ã‚¹ãƒˆã®æ„å‘³å†…å®¹ã‚’å«ã‚€æ•°å€¤è¡¨ç¾(Embedding: åŸ‹ã‚è¾¼ã¿)ã«å¤‰æ›ã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚

Model Provider	Model	Model ID	Max tokens	Modality (Data Type)	Languages	Supported use cases
AI21 Labs	Jurassic-2 Ultra (v1)	ai21.j2-ultra-v1	8191	Text	English Spanish French German Portuguese Italian Dutch	Open book question answering summarization draft generation information extraction ideation
AI21 Labs	Jurassic-2 Mid (v1)	ai21.j2-mid-v1	8191	Text	English Spanish French German Portuguese Italian Dutch	Open book question answering summarization draft generation information extraction ideation
Amazon	Titan Embeddings G1 - Text (v1.2)	amazon.titan-embed-text-v1	8k	Embedding	English, Arabic, Chinese (Sim.), French, German, Hindi, Japanese, Spanish, Czech, Filipino, Hebrew, Italian, Korean, Portuguese, Russian, Swedish, Turkish, Chinese (trad), Dutch, Kannada, Malayalam, Marathi, Polish, Tamil, Telugu and others.	Translate text inputs (words, phrases or possibly large units of text) into numerical representations (known as embeddings) that contain the semantic meaning of the text.
Amazon	Titan Text G1 - Lite	amazon.titan-text-lite-v1	4k	Text	English	Summarization and copywriting.
Amazon	Titan Text G1 - Express	amazon.titan-text-express-v1	8k	Text	English (GA), Multilingual in 100+ languages (Preview)	Open ended text generation brainstorming summarization code generation table creation data formatting paraphrasing chain of though rewrite extraction Q&A chat
Amazon	Titan Image Generator G1	amazon.titan-image-generator-v1	77	Image	English	Text to image generation image editing image variations
Amazon	Titan Multimodal Embeddings G1	amazon.titan-embed-image-v1	128	Embedding	English	Search recommendation personalization
Anthropic	Claude 3.5 Sonnet	anthropic.claude-3-5-sonnet-20240620-v1:0	200k	Text	English and multiple other languages	Complex tasks like customer support Coding Data Analysis and Visual Processing. Streamlining of Workflows Generation of Insights and Production of High-Quality Natural-Sounding Content.
Anthropic	Claude 3 Opus	anthropic.claude-3-opus-20240229-v1:0	200k	Text	English and multiple other languages	Task automation: plan and execute complex actions across APIs and databases, interactive coding R&D: research review, brainstorming and hypothesis generation, drug discovery Strategy: advanced analysis of charts & graphs, financials and market trends, forecasting
Anthropic	Claude 3 Sonnet	anthropic.claude-3-sonnet-20240229-v1:0	200k	Text	English and multiple other languages	Data processing: RAG or search & retrieval over vast amounts of knowledge Sales: product recommendations, forecasting, targeted marketing Time-saving tasks: code generation, quality control, parse text from images
Anthropic	Claude 3 Haiku	anthropic.claude-3-haiku-20240307-v1:0	200k	Text	English and multiple other languages	Customer interactions: quick and accurate support in live interactions, translations Content moderation: catch risky behavior or customer requests Cost-saving tasks: optimized logistics, inventory management, extract knowledge from unstructured data
Anthropic	Claude v2.1	anthropic.claude-v2:1	200k	Text	English and multiple other languages	Question answering information extraction removing PII content generation multiple choice classification Roleplay comparing text summarization document Q&A with citation
Anthropic	Claude v2	anthropic.claude-v2	100k	Text	English and multiple other languages	Question answering information extraction removing PII content generation multiple choice classification Roleplay comparing text summarization document Q&A with citation
Anthropic	[Legacy version] Claude v1.3	anthropic.claude-v1	100k	Text	English and multiple other languages	Question answering information extraction removing PII content generation multiple choice classification Roleplay comparing text summarization document Q&A with citation
Anthropic	Claude Instant v1.2	anthropic.claude-instant-v1	100k	Text	English and multiple other languages	Question answering information extraction removing PII content generation multiple choice classification Roleplay comparing text summarization document Q&A with citation
Cohere	Command R+ (v1)	cohere.command-r-plus-v1:0	128k	Text	English, French, Spanish, Italian, German, Portuguese, Japanese, Korean, Arabic, and Chinese	Complex RAG on large amounts of data Q&A Multi-step tool use chat text generation text summarization
Cohere	Command R (v1)	cohere.command-r-v1:0	128k	Text	English, French, Spanish, Italian, German, Portuguese, Japanese, Korean, Arabic, and Chinese	Chat text generation text summarization RAG on large amounts of data Q&A function calling
Cohere	Command (v14.7)	cohere.command-text-v14	4000	Text	English	Summarization copywriting dialogue extraction question answering
Cohere	Command Light (v14.7)	cohere.command-light-text-v14	4000	Text	English	Summarization copywriting dialogue extraction question answering
Cohere	Embed English (v3)	cohere.embed-english-v3	512	Embedding	English	Semantic search retrieval-augmented generation (RAG) classification clustering
Cohere	Embed Multilingual (v3)	cohere.embed-multilingual-v3	512	Embedding	108 Languages	Semantic search retrieval-augmented generation (RAG) classification clustering
Meta	Llama 3 70B Instruct	meta.llama3-70b-instruct-v1:0	8k	Text	English	Language modeling Dialog systems Code generation Following instructions Sentiment analysis with nuances in reasoning Text classification with improved accuracy and nuance Text summarization with accuracy and nuance
Meta	Llama 3 8B Instruct	meta.llama3-8b-instruct-v1:0	8k	Text	English	Text summarization Text classification Sentiment analysis
Meta	Llama 2 Chat 13B	meta.llama2-13b-chat-v1	4096	Text	English	Text generation Conversation Chat based applications
Meta	Llama 2 Chat 70B	meta.llama2-70b-chat-v1	4096	Text	English	Text generation Conversation Chat based applications
Mistral AI	Mistral 7B Instruct	mistral.mistral-7b-instruct-v0:2	32K	Text	English	Classification Text generation Code generation
Mistral AI	Mixtral 8x7B Instruct	mistral.mixtral-8x7b-instruct-v0:1	32K	Text	English, French, Italian, German and Spanish	Complex reasoning & analysis Text generation Code generation
Mistral AI	Mistral Large	mistral.mistral-large-2402-v1:0	32K	Text	English, French, Italian, German and Spanish	Complex reasoning & analysis Text generation Code generation RAG Agents
Mistral AI	Mistral Small	mistral.mistral-small-2402-v1:0	32K	Text	English, French, Italian, German and Spanish	Text generation Code generation Classification RAG Conversation
Stability AI	[Legacy version] Stable Diffusion XL (v0.8)	stability.stable-diffusion-xl-v0	77	Image	English	image generation image editing
Stability AI	Stable Diffusion XL (v1.0)	stability.stable-diffusion-xl-v1	77	Image	English	image generation image editing

ç”¨æ„ã•ã‚Œã¦ã„ã‚‹ãƒ¢ãƒ‡ãƒ«ã®ä¾¡æ ¼

Amazon Bedrock Pricingã‚’å‚è€ƒã«æœ¬è¨˜äº‹åŸ·ç†æ™‚ç‚¹ã®ãƒ‡ãƒ¼ã‚¿ã‚’ã¾ã¨ã‚ã¾ã—ãŸã€‚

ä¾¡æ ¼ãŒè¨˜è¼‰ã•ã‚Œã¦ã„ãªã„ãƒ¢ãƒ‡ãƒ«ã®é …ç›®ã¯ãã®ä¾¡æ ¼ã‚ªãƒ—ã‚·ãƒ§ãƒ³ãŒæä¾›ã•ã‚Œã¦ã„ãªã„ã€ã¾ãŸã¯ãƒ¢ãƒ‡ãƒ«ã®ã‚«ã‚¹ã‚¿ãƒžã‚¤ã‚ºã®æ©Ÿèƒ½ãã®ã‚‚ã®ãŒã‚µãƒãƒ¼ãƒˆã•ã‚Œã¦ã„ãªã„ã“ã¨ã‚’ç¤ºã—ã¦ã„ã¾ã™ã€‚

ãƒ†ã‚ã‚¹ãƒˆã‚’æ‰±ã†ãƒ¢ãƒ‡ãƒ«ã®ä¾¡æ ¼

ãƒ†ã‚ã‚¹ãƒˆã‚’æ‰±ã†ãƒ¢ãƒ‡ãƒ«ã®ä¾¡æ ¼ã¯æ¬¡ã®é …ç›®ã§ä¾¡æ ¼ãŒè¨å®šã•ã‚Œã¦ã„ã¾ã™ã€‚

On-Demand
On-Demandã¯1,000ã”ã¨ã®å…¥åŠ›ãƒˆãƒ¼ã‚¯ãƒ³ã¨1,000ã”ã¨ã®å‡ºåŠ›ãƒˆãƒ¼ã‚¯ãƒ³ã§ä¾¡æ ¼è¨ˆç®—ã•ã‚Œã¾ã™(æ™‚é–“ãƒ™ãƒ¼ã‚¹ã®æ”¯æ‰•ã„ã§ã¯ã‚ã‚Šã¾ã›ã‚“)ã€‚
Provisioned Throughput
Provisioned Throughputã¯æŒ‡å®šã—ãŸæœŸé–“ã«ãŠã‘ã‚‹æ™‚é–“ãƒ™ãƒ¼ã‚¹ã®æ”¯æ‰•ã„ã‚’ç¢ºç´„(commitment)ã™ã‚‹ã“ã¨ã§ã€å¤§è¦æ¨¡åˆ©ç”¨ãªã©è¦ä»¶ã‚’æº€ãŸã™ãŸã‚ã®ååˆ†ãªã‚¹ãƒ«ãƒ¼ãƒ—ãƒƒãƒˆã‚’ãƒ—ãƒãƒ“ã‚¸ãƒ§ãƒ‹ãƒ³ã‚°ã—ã¾ã™ã€‚
commitmentã®æœŸé–“ã«ã¯ã€ç„¡ã—ã€1ãƒ¶æœˆã€6ãƒ¶æœˆãŒã‚ã‚Šé•·æœŸé–“ã§ã‚ã‚‹ã»ã©å‰²å¼•ãŒã•ã‚Œã¾ã™ã€‚
Model customization(Fine-tuning)
Fine-tuningã‚’ä½¿ç”¨ã—ãŸã‚«ã‚¹ã‚¿ãƒ ãƒ¢ãƒ‡ãƒ«ã‚’ä½œæˆã™ã‚‹å ´åˆã¯ã€1,000ãƒˆãƒ¼ã‚¯ãƒ³ã”ã¨ã®ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°æ–™é‡‘ã€ã‚«ã‚¹ã‚¿ãƒ ãƒ¢ãƒ‡ãƒ«ã”ã¨ã®æœˆé¡ä¿å˜æ–™é‡‘ãŒç™ºç”Ÿã—ã¾ã™ã€‚

Model Provider	Model	On-Demand (per 1000 input tokens)	On-Demand (per 1000 output tokens)	Provisioned Throughput (per hour per model)	Model customization through Fine-tuning
AI21 Labs	Jurassic-2 Ultra	0.0188 USD	0.0188 USD	-	-
AI21 Labs	Jurassic-2 Mid	0.0125 USD	0.0125 USD	-	-
Amazon	Titan Text Lite(Titan Text G1 - Lite)	0.0003 USD	0.0004 USD	no commitment: 7.10 USD 1-month commitment: 6.40 USD 6-month commitment: 5.10 USD	Train(per 1000 tokens): 0.0004 USD Store each custom model(per month): 1.95 USD
Amazon	Titan Text Express(Titan Text G1 - Express)	0.0008 USD	0.0016 USD	no commitment: 20.50 USD 1-month commitment: 18.40 USD 6-month commitment: 14.80 USD	Train(per 1000 tokens): 0.008 USD Store each custom model(per month): 1.95 USD
Amazon	Titan Embeddings(Titan Embeddings G1 - Text)	0.0001 USD	N/A	no commitment: N/A 1-month commitment: 6.40 USD 6-month commitment: 5.10 USD	-
Anthropic	Claude 3.5 Sonnet	0.00300 USD	0.01500 USD	no commitment: N/A 1-month commitment: N/A 6-month commitment: N/A	-
Anthropic	Claude 3 Opus	0.01500 USD	0.07500 USD	no commitment: N/A 1-month commitment: N/A 6-month commitment: N/A	-
Anthropic	Claude 3 Sonnet	0.00300 USD	0.01500 USD	no commitment: N/A 1-month commitment: N/A 6-month commitment: N/A	-
Anthropic	Claude 3 Haiku	0.00025 USD	0.00125 USD	no commitment: N/A 1-month commitment: N/A 6-month commitment: N/A	-
Anthropic	Claude(v2.0, v2.1)	0.00800 USD	0.02400 USD	no commitment: N/A 1-month commitment: 63.00 USD 6-month commitment: 35.00 USD	-
Anthropic	Claude Instant(v1.2)	0.00080 USD	0.00240 USD	no commitment: N/A 1-month commitment: 39.60 USD 6-month commitment: 22.00 USD	-
Cohere	Command R+	0.0030 USD	0.0150 USD	-	-
Cohere	Command R	0.0005 USD	0.0015 USD	-	-
Cohere	Command	0.0015 USD	0.0020 USD	no commitment: 49.50 USD 1-month commitment: 39.60 USD 6-month commitment: 23.77 USD	Train(per 1000 tokens): 0.004 USD Store each custom model(per month): 1.95 USD
Cohere	Command-Light	0.0003 USD	0.0006 USD	no commitment: 8.56 USD 1-month commitment: 6.85 USD 6-month commitment: 4.11 USD	Train(per 1000 tokens): 0.001 USD Store each custom model(per month): 1.95 USD
Cohere	Embed â€“ English	0.0001 USD	N/A	no commitment: 7.12 USD 1-month commitment: 6.76 USD 6-month commitment: 6.41 USD	-
Cohere	Embed â€“ Multilingual	0.0001 USD	N/A	no commitment: 7.12 USD 1-month commitment: 6.76 USD 6-month commitment: 6.41 USD	-
Meta	Llama 3 Instruct 8B	0.0003 USD	0.0006 USD	-	-
Meta	Llama 3 Instruct 70B	0.00265 USD	0.0035 USD	-	-
Meta	Llama 2 Chat 13B	0.00075 USD	0.00100 USD	no commitment: N/A 1-month commitment: 21.18 USD 6-month commitment: 13.08 USD	Train(per 1000 tokens): 0.00149 USD Store each custom model(per month): 1.95 USD
Meta	Llama 2 Chat 70B	0.00195 USD	0.00256 USD	no commitment: N/A 1-month commitment: 21.18 USD 6-month commitment: 13.08 USD	Train(per 1000 tokens): 0.00799 USD Store each custom model(per month): 1.95 USD
Mistral AI	Mistral 7B Instruct	0.00015 USD	0.0002 USD	-	-
Mistral AI	Mixtral 8x7B Instruct	0.00045 USD	0.0007 USD	-	-
Mistral AI	Mistral Small	0.001 USD	0.003 USD	-	-
Mistral AI	Mistral Large	0.004 USD	0.012 USD	-	-

ãƒžãƒ«ãƒãƒ¢ãƒ¼ãƒ€ãƒ«ãƒ¢ãƒ‡ãƒ«ã®ä¾¡æ ¼

ç”»åƒã‚„ãã®ä»–ã®ãƒ¡ãƒ‡ã‚£ã‚¢ã‚’å‡¦ç†ã™ã‚‹ãƒžãƒ«ãƒãƒ¢ãƒ¼ãƒ€ãƒ«ãƒ¢ãƒ‡ãƒ«ã®ä¾¡æ ¼è¨å®šã¯ã€ç”»åƒã®æ•°ã€è§£åƒåº¦ãªã©æ§˜ã€…ãªåŸºæº–ã«åŸºã¥ã„ã¦ãŠã‚Šã€ãã‚Œãžã‚Œã®ãƒ¢ãƒ‡ãƒ«ã”ã¨ã«ã¾ã¨ã‚ã¾ã—ãŸã€‚

Model Provider	Model	Standard quality(<51 steps) (per image)	Premium quality(>51 steps) (per image)	Provisioned Throughput (per hour per model)	Model customization through Fine-tuning
Stability AI	Stable Diffusion XL (v0.8)	512x512 or smaller: 0.018 USD Larger than 512x512: 0.036 USD	512x512 or smaller: 0.036 USD Larger than 512x512: 0.072 USD	-	-
Stability AI	Stable Diffusion XL (v1.0)	Up to 1024 x 1024: 0.04 USD	Up to 1024 x 1024: 0.08 USD	no commitment: N/A 1-month commitment: 49.86 USD 6-month commitment: 46.18 USD	-

Model Provider	Model	Standard quality (per image)	Premium quality (per image)	Provisioned Throughput (per hour per model)	Model customization through Fine-tuning
Amazon	Titan Image Generator	512x512: 0.008 USD 1024X1024: 0.01 USD	512x512: 0.01 USD 1024X1024: 0.012 USD	no commitment: N/A 1-month commitment: 16.20 USD 6-month commitment: 13.00 USD	Train(per image seen): 0.005 USD Store each custom model(per month): 1.95 USD
Amazon	Titan Image Generator(custom models)	512x512: 0.018 USD 1024X1024: 0.02 USD	512x512: 0.02 USD 1024X1024: 0.022 USD	no commitment: 23.40 USD 1-month commitment: 21.00 USD 6-month commitment: 16.85 USD	-

Model Provider	Model	On-Demand (per 1000 input tokens)	On-Demand (per 1000 input image)	Provisioned Throughput (per hour per model)	Model customization through Fine-tuning
Amazon	Titan Multimodal Embeddings	0.0008 USD	0.00006 USD	no commitment: 9.38 USD 1-month commitment: 8.45 USD 6-month commitment: 6.75 USD	Train(per image seen): 0.0002 USD Store each custom model(per month): 1.95 USD

Amazon Bedrockã®åŸºæœ¬çš„ãªä½¿ã„æ–¹

Amazon Bedrockã®å§‹ã‚æ–¹ãƒ»æº–å‚™

Amazon Bedrockã‚’å§‹ã‚ã‚‹ã«ã¯AWS Management Consoleã§Amazon Bedrockã®Model accessç”»é¢ã«é·ç§»ã—ã€Editã‚’ã‚¯ãƒªãƒƒã‚¯ã—ã—ã¦ä½¿ç”¨ã™ã‚‹ãƒ¢ãƒ‡ãƒ«ã‚’é¸æŠžã—ã€Save changesã§ãƒ¢ãƒ‡ãƒ«ã¸ã®ã‚¢ã‚¯ã‚»ã‚¹ã‚’ãƒªã‚¯ã‚¨ã‚¹ãƒˆã—ã¾ã™ã€‚
Amazon Bedrock > Model access - AWS Management Console
â€»Anthropicã®ãƒ¢ãƒ‡ãƒ«ã¯ä¼šç¤¾æƒ…å ±ã‚„ç›®çš„ãªã©ã‚’å…¥åŠ›ã—ã¦ãƒªã‚¯ã‚¨ã‚¹ãƒˆã™ã‚‹å¿…è¦ãŒã‚ã‚Šã¾ã™ã€‚

ãƒªã‚¯ã‚¨ã‚¹ãƒˆãŒæ‰¿èªã•ã‚Œã‚‹ã¨ãƒ¢ãƒ‡ãƒ«ã®ã‚¢ã‚¯ã‚»ã‚¹ãŒæœ‰åŠ¹ã«ãªã‚Šä½¿ç”¨ã§ãã‚‹ã‚ˆã†ã«ãªã‚Šã¾ã™ã€‚

Amazon Bedrock Runtime APIã®InvokeModelã€InvokeModelWithResponseStreamã¨ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿

å®Ÿéš›ã«Amazon Bedrockã‚’ä½¿ç”¨ã™ã‚‹ãŸã‚ã®APIã«ã¤ã„ã¦èª¬æ˜Žã—ã¾ã™ã€‚
Amazon Bedrockã«é–¢ã™ã‚‹APIã«ã¯å¤§ããåˆ†ã‘ã¦Bedrock APIã¨Bedrock Runtime APIãŒã‚ã‚Šã¾ã™ã€‚

Bedrock APIã¯Fine-tuningã«ã‚ˆã‚‹ã‚«ã‚¹ã‚¿ãƒ ãƒ¢ãƒ‡ãƒ«ã®ä½œæˆã‚„ãƒ¢ãƒ‡ãƒ«ã®Provisioned Throughputã®è³¼å…¥ãªã©AWSãƒªã‚½ãƒ¼ã‚¹ã®æ“ä½œã«ä½¿ç”¨ã—ã¾ã™ã€‚

ä¸€æ–¹ã®Bedrock Runtime APIã¯ãƒ™ãƒ¼ã‚¹ãƒ¢ãƒ‡ãƒ«ã‚„ã‚«ã‚¹ã‚¿ãƒ ãƒ¢ãƒ‡ãƒ«ã‚’æŒ‡å®šã—ã¦å…¥åŠ›ãƒ‡ãƒ¼ã‚¿(Prompt)ã‚’ãƒªã‚¯ã‚¨ã‚¹ãƒˆã—ã€ãƒ¬ã‚¹ãƒãƒ³ã‚¹ã‹ã‚‰å‡ºåŠ›ãƒ‡ãƒ¼ã‚¿(Completions)ã‚’å–å¾—ã™ã‚‹å®Ÿéš›ã®å®Ÿè¡Œã«ä½¿ç”¨ã—ã¾ã™ã€‚

Amazon Bedrock Runtime APIã«ã¯å®Ÿéš›ã«ãƒ¢ãƒ‡ãƒ«ã‚’å‘¼ã³å‡ºã—ã¦ä½¿ç”¨ã™ã‚‹ãŸã‚ã®InvokeModelã¨InvokeModelWithResponseStreamãŒã‚ã‚Šã¾ã™ã€‚

Amazon Bedrock Runtime APIã®InvokeModelã¯ãƒªã‚¯ã‚¨ã‚¹ãƒˆã«å¯¾ã™ã‚‹ãƒ¬ã‚¹ãƒãƒ³ã‚¹ã®å†…å®¹ã‚’ä¸€åº¦ã«ã™ã¹ã¦å–å¾—ã™ã‚‹APIã§ã™ã€‚

ä¸€æ–¹ã§Amazon Bedrock Runtime APIã®InvokeModelWithResponseStreamã¯ãƒªã‚¯ã‚¨ã‚¹ãƒˆã«å¯¾ã™ã‚‹ãƒ¬ã‚¹ãƒãƒ³ã‚¹ã®å†…å®¹ã‚’å°‘é‡ã®æ–‡å—ãšã¤å¾ã€…ã«ã‚¹ãƒˆãƒªãƒ¼ãƒ ã¨ã—ã¦å–å¾—ã™ã‚‹APIã§ã™ã€‚
ã™ã§ã«ãƒãƒ£ãƒƒãƒˆå½¢å¼ã®Generative AIã‚µãƒ¼ãƒ“ã‚¹ã‚’ä½¿ã£ãŸã“ã¨ãŒã‚ã‚‹æ–¹ã¯Promptã«å¯¾ã™ã‚‹çµæžœãŒæ•°æ–‡å—ãšã¤è¡¨ç¤ºã•ã‚Œã‚‹ç”»é¢ã‚’è¦‹ãŸã“ã¨ãŒã‚ã‚‹ã¨æ€ã„ã¾ã™ãŒã€ãã®è¡¨ç¤ºæ–¹æ³•ã«ä½¿ç”¨ã§ãã‚‹ã®ãŒInvokeModelWithResponseStreamã§ã™ã€‚

Amazon Bedrock Runtime APIã®InvokeModelã¨InvokeModelWithResponseStreamã®ãƒªã‚¯ã‚¨ã‚¹ãƒˆã§æŒ‡å®šã™ã‚‹ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ãƒ¼ã¯å…±é€šã§æ¬¡ã®ã‚‚ã®ã‚’ä½¿ç”¨ã—ã¾ã™ã€‚

accept: ãƒ¬ã‚¹ãƒãƒ³ã‚¹ã®æŽ¨è«–Bodyã®MIMEã‚¿ã‚¤ãƒ—ã€‚(Default: application/json)
contentType: ãƒªã‚¯ã‚¨ã‚¹ãƒˆã®å…¥åŠ›ãƒ‡ãƒ¼ã‚¿ã®MIMEã‚¿ã‚¤ãƒ—ã€‚(Default: application/json)
modelId: [Required]ãƒ¢ãƒ‡ãƒ«ã®è˜åˆ¥åã€‚(ä¾‹ï¼š ai21.j2-ultra-v1)
body: [Required]contentTypeã§æŒ‡å®šã—ãŸå½¢å¼ã®å…¥åŠ›ãƒ‡ãƒ¼ã‚¿ã€‚å„ãƒ¢ãƒ‡ãƒ«ã§ã‚µãƒãƒ¼ãƒˆã•ã‚Œã¦ã„ã‚‹æŽ¨è«–ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ãƒ¼ã«ã‚ã‚ã›ã¦bodyã®ãƒ•ã‚£ãƒ¼ãƒ«ãƒ‰ã®ãƒ•ã‚©ãƒ¼ãƒžãƒƒãƒˆã‚’æŒ‡å®šã™ã‚‹ã€‚

ä¸€èˆ¬çš„ãªæŽ¨è«–ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®æ„å‘³

ä»¥é™ã§ã¯Amazon Bedrock Runtime APIã®å®Ÿè¡Œä¾‹ã‚’ç´¹ä»‹ã—ã¾ã™ãŒã€ãã®å‰ã«ãƒ¢ãƒ‡ãƒ«ã¸ã®ãƒªã‚¯ã‚¨ã‚¹ãƒˆã®Bodyå†…ã§ã‚ˆãä½¿ç”¨ã™ã‚‹ä¸€èˆ¬çš„ãªæŽ¨è«–ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ãƒ¼ã«ã¤ã„ã¦ç°¡å˜ã«èª¬æ˜Žã—ã¾ã™ã€‚
ãŸã ã—ã€ã“ã“ã§ã¯ã‚¤ãƒ¡ãƒ¼ã‚¸ã®ã—ã‚„ã™ã•ã‚’é‡è¦–ã—ãŸãŸã‚åŽ³å¯†ãªå®šç¾©ã¨ã¯ç•°ãªã‚‹å¯èƒ½æ€§ãŒã‚ã‚‹ã“ã¨ã‚’ã”æ‰¿çŸ¥ãŠããã ã•ã„ã€‚

temperature
ãƒ¢ãƒ‡ãƒ«ã®å‡ºåŠ›ç¢ºçŽ‡åˆ†å¸ƒã®ãƒ©ãƒ³ãƒ€ãƒ æ€§ã¨å¤šæ§˜æ€§ã‚’èª¿æ•´ã™ã‚‹ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã§ã€å€¤ãŒå¤§ãã„ã¨ãƒ©ãƒ³ãƒ€ãƒ æ€§ã¨å¤šæ§˜æ€§ã®é«˜ã„æ„å¤–ãªå›žç”ã‚’è¿”ã™å‚¾å‘ã«ãªã‚Šã€å€¤ãŒå°ã•ã„ã¨ã‚ˆã‚Šé«˜ã„ç¢ºçŽ‡ã§æŽ¨å®šã•ã‚Œã‚‹å›žç”ã‚’è¿”ã™å‚¾å‘ã«ãªã‚Šã¾ã™ã€‚temperatureã®é€šå¸¸ã®ç¯„å›²ã¯0 - 1ã®é–“ã§ã™ãŒã€1ã‚’è¶…ãˆã‚‹å€¤ã‚’è¨å®šã§ãã‚‹ãƒ¢ãƒ‡ãƒ«ã‚‚ã‚ã‚Šã¾ã™ã€‚ä¾‹ãˆã°ã€temperature=1.0ã¨temperature=0.1ã§ã¯temperature=1.0ã®æ–¹ãŒãƒ©ãƒ³ãƒ€ãƒ æ€§ã¨å¤šæ§˜æ€§ãŒé«˜ã„å›žç”ã‚’ã€temperature=0.1ã®æ–¹ãŒã‚ˆã‚Šé«˜ã„ç¢ºçŽ‡ã§æŽ¨å®šã•ã‚Œã‚‹å›žç”ã‚’è¿”ã™å‚¾å‘ã«ãªã‚Šã¾ã™ã€‚
topK
ãƒ¢ãƒ‡ãƒ«ãŒè€ƒæ…®ã™ã‚‹ãƒˆãƒ¼ã‚¯ãƒ³ã®ä¸Šä½Kå€‹ã‚’åˆ¶é™ã™ã‚‹ã“ã¨ã§ãƒ©ãƒ³ãƒ€ãƒ æ€§ã¨å¤šæ§˜æ€§ã‚’èª¿æ•´ã™ã‚‹ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã§ã™ã€‚topKã®æœ€é©ãªç¯„å›²ã¯ä½¿ç”¨ã™ã‚‹ãƒ¢ãƒ‡ãƒ«ã«ã‚ˆã£ã¦ç•°ãªã‚Šã¾ã™ã€‚ã“ã®å€¤ã‚’ã‚»ãƒƒãƒˆã™ã‚‹ã¨å‡ºåŠ›ãƒˆãƒ¼ã‚¯ãƒ³ã¯ã“ã®ä¸Šä½Kã®ä¸ã‹ã‚‰é¸æŠžã•ã‚Œã¾ã™ã€‚ä¾‹ãˆã°ã€topK=10ã®å ´åˆã¯ãƒ¢ãƒ‡ãƒ«ãŒå›žç”ç”Ÿæˆæ™‚ã«ç¢ºçŽ‡ã®é«˜ã„ä¸Šä½10ã®ãƒˆãƒ¼ã‚¯ãƒ³ã®ã¿ã‚’è€ƒæ…®ã™ã‚‹ã‚ˆã†ã«ãªã‚Šã¾ã™ã€‚ç°¡å˜ã«è¨€ãˆã°ã€topKã¯é¸æŠžå¯èƒ½ãªãƒˆãƒ¼ã‚¯ãƒ³ã®ç¯„å›²ã‚’å‡ºåŠ›ãƒˆãƒ¼ã‚¯ãƒ³ã®æ•°ã§åˆ¶é™ã—ã€ãã®çµæžœã¨ã—ã¦å¤šæ§˜æ€§ã‚‚èª¿æ•´ã—ã¾ã™ã€‚
topP
ãƒˆãƒ¼ã‚¯ãƒ³ã®ç´¯ç©ç¢ºçŽ‡ãŒæŒ‡å®šã—ãŸPã‚’è¶…ãˆã‚‹å‰ã®ãƒˆãƒ¼ã‚¯ãƒ³ã®é›†åˆã‹ã‚‰ã‚µãƒ³ãƒ—ãƒªãƒ³ã‚°ã™ã‚‹ã“ã¨ã§ãƒ©ãƒ³ãƒ€ãƒ æ€§ã¨å¤šæ§˜æ€§ã‚’èª¿æ•´ã™ã‚‹ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã§ã™ã€‚é€šå¸¸ã®topPã®ç¯„å›²ã¯0 - 1ã®é–“ã§ã™ã€‚ä¾‹ãˆã°topP=0.9ã®å ´åˆã¯ãƒ¢ãƒ‡ãƒ«ãŒå›žç”ç”Ÿæˆæ™‚ã«ç¢ºçŽ‡ãŒé«˜ã„ãƒˆãƒ¼ã‚¯ãƒ³ã‹ã‚‰é †ã«ç´¯è¨ˆç¢ºçŽ‡ãŒ0.9ã‚’è¶…ãˆã‚‹å‰ã®ãƒˆãƒ¼ã‚¯ãƒ³ã¾ã§ã‚’è€ƒæ…®ã™ã‚‹ã‚ˆã†ã«ãªã‚Šã¾ã™ã€‚ç°¡å˜ã«è¨€ãˆã°ã€topPã¯é¸æŠžå¯èƒ½ãªãƒˆãƒ¼ã‚¯ãƒ³ã®ç¯„å›²ã‚’å‡ºåŠ›ãƒˆãƒ¼ã‚¯ãƒ³ã®ç¢ºçŽ‡ã®ç´¯è¨ˆã«åŸºã¥ã„ã¦åˆ¶é™ã—ã€ãã®çµæžœã¨ã—ã¦ãƒ©ãƒ³ãƒ€ãƒ æ€§ã¨å¤šæ§˜æ€§ã‚‚èª¿æ•´ã—ã¾ã™ã€‚
maxTokens
ç”Ÿæˆã•ã‚Œã‚‹ãƒˆãƒ¼ã‚¯ãƒ³ã®æœ€å¤§æ•°ã‚’åˆ¶é™ã—ã€ç”Ÿæˆã•ã‚Œã‚‹ãƒ†ã‚ã‚¹ãƒˆã®é•·ã•ã‚’ã‚³ãƒ³ãƒˆãƒãƒ¼ãƒ«ã™ã‚‹ãŸã‚ã®ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã§ã™ã€‚ä¾‹ãˆã°maxTokens=800ã®å ´åˆã¯ãƒ¢ãƒ‡ãƒ«ãŒ800ãƒˆãƒ¼ã‚¯ãƒ³ã‚’è¶…ãˆã‚‹ãƒ†ã‚ã‚¹ãƒˆã‚’ç”Ÿæˆã—ãªã„ã‚ˆã†ã«ãªã‚Šã¾ã™ã€‚

APIã¸ã®ãƒªã‚¯ã‚¨ã‚¹ãƒˆã§ã¯temperatureã€topKã€topPã®ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã‚’çµ„ã¿åˆã‚ã›ã¦ç¢ºä¿¡åº¦ã¨å¤šæ§˜æ€§ã®ãƒãƒ©ãƒ³ã‚¹ã‚’èª¿æ•´ã—ã€maxTokensã§å‡ºåŠ›ã•ã‚Œã‚‹ãƒˆãƒ¼ã‚¯ãƒ³æ•°ã‚’åˆ¶é™ã—ã¾ã™ã€‚

Amazon Bedrockã«ã‚ã‚‹å„ãƒ¢ãƒ‡ãƒ«ã®è©³ç´°ãªæŽ¨è«–ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã«ã¤ã„ã¦ã¯ã€ŒInference parameters for foundation models - Amazon Bedrockã€ã‚’å‚ç…§ã—ã¦ãã ã•ã„ã€‚

AWS SDK for Python(Boto3)ã«ã‚ˆã‚‹Amazon Bedrock Runtimeã®invoke_modelå®Ÿè¡Œä¾‹

ã“ã“ã§ã¯AWS SDK for Python(Boto3)ã«ã‚ˆã‚‹Amazon Bedrock Runtimeã®invoke_modelã‚’AWS Lambdaé–¢æ•°ã§å®Ÿè¡Œã—ãŸä¾‹ã‚’ç´¹ä»‹ã—ã¾ã™ã€‚
æœ¬è¨˜äº‹åŸ·ç†æ™‚ç‚¹ã§ã¯AWS Lambdaé–¢æ•°ã®ãƒ‡ãƒ•ã‚©ãƒ«ãƒˆã®AWS SDK for Python(Boto3)ã§ã¯bedrockã€bedrock-runtimeã®ClientãŒã¾ã å‘¼ã³å‡ºã›ã¾ã›ã‚“ã§ã—ãŸã€‚
ãã®ãŸã‚ã€ä»¥ä¸‹ã¯æœ€æ–°ã®AWS SDK for Python(Boto3)ã‚’Lambda Layerã«è¿½åŠ ã—ã¦bedrock-runtimeã®Clientã‚’ä½¿ç”¨ã—ãŸä¾‹ã§ã™ã€‚

ãƒ»å®Ÿè¡Œä¾‹(AWS Lambdaé–¢æ•°)

import boto3
import json
import os

region = os.environ.get('AWS_REGION')
bedrock_runtime_client = boto3.client('bedrock-runtime', region_name=region)

def lambda_handler(event, context):
    modelId = 'ai21.j2-ultra-v1'
    contentType = 'application/json'
    accept = 'application/json'
    body = json.dumps({
        "prompt": "Please tell us all the states in the U.S.",
        "maxTokens": 800,
        "temperature": 0.7,
        "topP": 0.95
    })

    response = bedrock_runtime_client.invoke_model(
        modelId=modelId,
        contentType=contentType,
        accept=accept, 
        body=body
    )
    response_body = json.loads(response.get('body').read())
    return response_body

ãƒ»å®Ÿè¡Œçµæžœä¾‹(ä¸Šè¨˜AWS Lambdaé–¢æ•°ã®è¿”å´å€¤)

{
    "id": 1234,
    "prompt": {
        "text": "Please tell us all the states in the U.S.",
        "tokens": [
            ã€œçœç•¥ã€œ
        ]
    },
    "completions": [
        {
            "data": {
                "text": "\nUnited States of America is a federal republic consisting of 50 states, a federal district (Washington, D.C., the capital city of the United States), five major territories, and various minor islands. The 50 states are Alabama, Alaska, Arizona, Arkansas, California, Colorado, Connecticut, Delaware, Florida, Georgia, Hawaii, Idaho, Illinois, Indiana, Iowa, Kansas, Kentucky, Louisiana, Maine, Maryland, Massachusetts, Michigan, Minnesota, Mississippi, Missouri, Montana, Nebraska, Nevada, New Hampshire, New Jersey, New Mexico, New York, North Carolina, North Dakota, Ohio, Oklahoma, Oregon, Pennsylvania, Rhode Island, South Carolina, South Dakota, Tennessee, Texas, Utah, Vermont, Virginia, Washington, West Virginia, Wisconsin, and Wyoming.",
                "tokens": [
                    ã€œçœç•¥ã€œ
                ]
            },
            "finishReason": {
                "reason": "endoftext"
            }
        }
    ]
}

â€»æœ¬è¨˜äº‹åŸ·ç†æ™‚ç‚¹ã§æœ€æ–°ã®AWS SDK for Python(Boto3)ã«ã¯Amazon Bedrock Runtimeã®invoke_model_with_response_streamã‚³ãƒžãƒ³ãƒ‰ãŒç”¨æ„ã•ã‚Œã¦ã„ã¾ã™ã€‚
ãŸã ã€åˆ¥è¨˜äº‹ã§è©³ç´°ã«ã¤ã„ã¦èª¬æ˜Žã™ã‚‹äºˆå®šã®ãŸã‚ã€ä»Šå›žã®è¨˜äº‹ã§ã¯å‰²æ„›ã—ã¾ã™ã€‚

AWS CLIã«ã‚ˆã‚‹Amazon Bedrock Runtimeã®invoke-modelå®Ÿè¡Œä¾‹

ã“ã“ã§ã¯ã€AWS CLIã«ã‚ˆã‚‹Amazon Bedrock Runtimeã®invoke-modelå®Ÿè¡Œä¾‹ã‚’ç´¹ä»‹ã—ã¾ã™ã€‚
æœ¬è¨˜äº‹åŸ·ç†æ™‚ç‚¹ã§ã¯Amazon Bedrock Runtime APIã¯AWS CLI Version 2ç³»ã«ã¯ã¾ã å¯¾å¿œã—ã¦ã„ã¾ã›ã‚“ã§ã—ãŸã€‚
ãã®ãŸã‚ã€ä»¥ä¸‹ã¯Amazon Bedrock Runtime APIãŒå¯¾å¿œã—ã¦ã„ãŸAWS CLI Version 1ç³»ã‚’åˆ¥é€”ã‚¤ãƒ³ã‚¹ãƒˆãƒ¼ãƒ«ã—ã¦å®Ÿè¡Œã—ãŸä¾‹ã§ã™ã€‚

aws bedrock-runtime invoke-model \
    --region [Region] \
    --model-id "[modelId]" \
    --content-type "[contentType]" \
    --accept "[accept]" \
    --body "[body]" [Output FileName]

ãƒ»å®Ÿè¡Œä¾‹

aws bedrock-runtime invoke-model \
    --region us-east-1 \
    --model-id "ai21.j2-ultra-v1" \
    --content-type "application/json" \
    --accept "application/json" \
    --body "{\"prompt\": \"Please tell us all the states in the U.S.\", \"maxTokens\": 800,\"temperature\": 0.7,\"topP\": 0.95}" invoke-model-output.txt

ãƒ»ãƒ¬ã‚¹ãƒãƒ³ã‚¹ä¾‹

* ç”»é¢è¡¨ç¤º  
{"contentType": "application/json"}

* ãƒ•ã‚¡ã‚¤ãƒ«å†…å®¹(invoke-model-output.txt)  
{"id": 1234,"prompt": {"text": "Please tell us all the states in the U.S.","tokens": [ã€œçœç•¥ã€œ]},"completions": [{"data": {"text": "\nUnited States of America is a federal republic consisting of 50 states, a federal district (Washington, D.C., the capital city of the United States), five major territories, and various minor islands. The 50 states are Alabama, Alaska, Arizona, Arkansas, California, Colorado, Connecticut, Delaware, Florida, Georgia, Hawaii, Idaho, Illinois, Indiana, Iowa, Kansas, Kentucky, Louisiana, Maine, Maryland, Massachusetts, Michigan, Minnesota, Mississippi, Missouri, Montana, Nebraska, Nevada, New Hampshire, New Jersey, New Mexico, New York, North Carolina, North Dakota, Ohio, Oklahoma, Oregon, Pennsylvania, Rhode Island, South Carolina, South Dakota, Tennessee, Texas, Utah, Vermont, Virginia, Washington, West Virginia, Wisconsin, and Wyoming.","tokens": [ã€œçœç•¥ã€œ]},"finishReason": {"reason": "endoftext"}}]}

â€»æœ¬è¨˜äº‹åŸ·ç†æ™‚ç‚¹ã§AWS CLIã«Amazon Bedrock Runtimeã®invoke-model-with-response-streamã‚³ãƒžãƒ³ãƒ‰ã¯ç”¨æ„ã•ã‚Œã¦ã„ã¾ã›ã‚“ã€‚

å‚è€ƒï¼š
Amazon Bedrock is now generally available
Amazon Bedrock Is Now Generally Available â€“ Build and Scale Generative AI Applications with Foundation Models
Amazon Bedrock Pricing
GitHub - aws-samples/amazon-bedrock-workshop: This is a workshop designed for Amazon Bedrock a foundational model service.
What is Amazon Bedrock? - Amazon Bedrock
Bedrock API Reference - Amazon Bedrock
Bedrock - Boto3 documentation
BedrockRuntime - Boto3 documentation
bedrock â€” AWS CLI Command Reference
bedrock-runtime â€” AWS CLI Command Reference
Amazon Bedrock Model Providers - AWS Management Console
Tech Blog with related articles referenced

ã¾ã¨ã‚

ä»Šå›žã¯Amazon Bedrockã®å‚è€ƒè³‡æ–™ã€ãƒ¢ãƒ‡ãƒ«ä¸€è¦§ã€ä¾¡æ ¼ã€ä½¿ã„æ–¹ã€ãƒˆãƒ¼ã‚¯ãƒ³ã‚„ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®ç”¨èªžèª¬æ˜Žã€Runtime APIã®å®Ÿè¡Œä¾‹ã«ã¤ã„ã¦ç´¹ä»‹ã—ã¾ã—ãŸã€‚
æƒ…å ±ã‚’ã¾ã¨ã‚ã¦ã„ãä¸ã§Amazon Bedrockã¯æ§˜ã€…ãªç¨®é¡žã®ãƒ¢ãƒ‡ãƒ«ã‹ã‚‰ãƒ¦ãƒ¼ã‚¹ã‚±ãƒ¼ã‚¹ã«å¿œã˜ãŸã‚‚ã®ã‚’é¸æŠžã§ãã€ä»–ã®AWSã‚µãƒ¼ãƒ“ã‚¹ã¨è¦ªå’Œæ€§ã®é«˜ã„AWS SDKã‚„AWS CLIã®ã‚¤ãƒ³ã‚¿ãƒ•ã‚§ãƒ¼ã‚¹ã§å‘¼ã³å‡ºã™ã›ã‚‹ã“ã¨ãŒã‚ã‹ã‚Šã¾ã—ãŸã€‚
ã“ã‚Œã‹ã‚‰ã‚‚Amazon Bedrockã‚’ã‚¢ãƒƒãƒ—ãƒ‡ãƒ¼ãƒˆã€å®Ÿè£…æ–¹æ³•ã€ä»–ã®ã‚µãƒ¼ãƒ“ã‚¹ã¨ã®çµ„ã¿åˆã‚ã›ãªã©ã®è¦³ç‚¹ã§ã‚¦ã‚©ãƒƒãƒã—ã¦ã„ããŸã„ã¨æ€ã„ã¾ã™ã€‚

[English Edition] Basic Information about Amazon Bedrock with API Examples - Model Features, Pricing, How to Use, Explanation of Tokens and Inference Parameters

Written by Hidekazu Konishi

Amazon Bedrockã®åŸºæœ¬æƒ…å ±

Amazon Bedrockã®å‚è€ƒè³‡æ–™ãƒ»å­¦ç¿’ãƒªã‚½ãƒ¼ã‚¹

Amazon Bedrockã¨ã¯

ãƒ†ã‚­ã‚¹ãƒˆã‚’æ‰±ã†Generative AIã«ãŠã‘ã‚‹ãƒˆãƒ¼ã‚¯ãƒ³(tokens)ã¨ã¯

ç”¨æ„ã•ã‚Œã¦ã„ã‚‹ãƒ¢ãƒ‡ãƒ«ã®ä¸€è¦§

ç”¨æ„ã•ã‚Œã¦ã„ã‚‹ãƒ¢ãƒ‡ãƒ«ã®ä¾¡æ ¼

ãƒ†ã‚­ã‚¹ãƒˆã‚’æ‰±ã†ãƒ¢ãƒ‡ãƒ«ã®ä¾¡æ ¼

ãƒžãƒ«ãƒãƒ¢ãƒ¼ãƒ€ãƒ«ãƒ¢ãƒ‡ãƒ«ã®ä¾¡æ ¼

Amazon Bedrockã®åŸºæœ¬çš„ãªä½¿ã„æ–¹

Amazon Bedrockã®å§‹ã‚æ–¹ãƒ»æº–å‚™

Amazon Bedrock Runtime APIã®InvokeModelã€InvokeModelWithResponseStreamã¨ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿

ä¸€èˆ¬çš„ãªæŽ¨è«–ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®æ„å‘³

AWS SDK for Python(Boto3)ã«ã‚ˆã‚‹Amazon Bedrock Runtimeã®invoke_modelå®Ÿè¡Œä¾‹

AWS CLIã«ã‚ˆã‚‹Amazon Bedrock Runtimeã®invoke-modelå®Ÿè¡Œä¾‹

ã¾ã¨ã‚