[B! secure][ai] masterqã®ãƒ–ãƒƒã‚¯ãƒžãƒ¼ã‚¯

masterq id:masterq

secureã¨aiã«é–¢ã™ã‚‹masterqã®ãƒ–ãƒƒã‚¯ãƒžãƒ¼ã‚¯ (2)

${{author_name}}$

{{{comment_expanded}}}

{{label}}

{{#is_bookmark}}ãƒªã‚¹ãƒˆ{{/is_bookmark}}{{^is_bookmark}}ãƒªãƒ³ã‚¯{{/is_bookmark}}

${{author_name}}$
{{author_name}}{{created}}
{{ #comment }}{{ comment }}{{ /comment }}
- {{ label }}

${{author_name}}$

{{{comment_expanded}}}

{{label}}

{{#is_bookmark}}ãƒªã‚¹ãƒˆ{{/is_bookmark}}{{^is_bookmark}}ãƒªãƒ³ã‚¯{{/is_bookmark}}

å¤§é‡ã®è³ªå•ã‚’ã¶ã¤ã‘ã¦æœ€å¾Œã®æœ€å¾Œã«å•é¡Œã®ã‚ã‚‹è³ªå•ã‚’ã™ã‚‹ã¨AIã®å€«ç†è¦³ãŒå£Šã‚Œã‚‹ã¨ã„ã†è„†å¼±æ€§ã‚’çªã„ãŸæ”»æ’ƒæ‰‹æ³•ã€Œãƒ¡ãƒ‹ãƒ¼ã‚·ãƒ§ãƒƒãƒˆãƒ»ã‚¸ã‚§ã‚¤ãƒ«ãƒ–ãƒ¬ã‚¤ã‚ãƒ³ã‚°ã€ãŒç™ºè¦‹ã•ã‚Œã‚‹
ã€ŒChatGPTã€ãªã©åºƒãä½¿ã‚ã‚Œã¦ã„ã‚‹AIã‚µãƒ¼ãƒ“ã‚¹ã¯ã€é€šå¸¸ã§ã‚ã‚Œã°ã‚»ãƒ¼ãƒ•ãƒ†ã‚£ãŒã‹ã‘ã‚‰ã‚Œã¦ã„ã¦ã€ã€Œäººã‚’æ®ºã™æ–¹æ³•ã€ã€Œçˆ†å¼¾ã‚’ã¤ãã‚‹æ–¹æ³•ã€ã¨ã„ã£ãŸå€«ç†çš„ã«å•é¡Œã®ã‚ã‚‹è³ªå•ã«ã¯ç”ãˆãªã„ã‚ˆã†ã«ãªã£ã¦ã„ã¾ã™ã€‚ã¨ã“ã‚ãŒã€ã‚ã¾ã‚Šã«ã‚‚å¤šã„è³ªå•ã‚’ä¸€åº¦ã«ã¶ã¤ã‘ã¦ã—ã¾ã†ã“ã¨ã«ã‚ˆã‚Šã‚»ãƒ¼ãƒ•ãƒ†ã‚£ãŒå¤–ã‚Œã€AIãŒå•é¡Œã®ã‚ã‚‹å›žç”ã‚’è¡Œã£ã¦ã—ã¾ã†å¯èƒ½æ€§ãŒã‚ã‚‹ã“ã¨ãŒã‚ã‹ã‚Šã¾ã—ãŸã€‚ Many-shot jailbreaking \ Anthropic https://www.anthropic.com/research/many-shot-jailbreaking å¤§è¦æ¨¡è¨€èªžãƒ¢ãƒ‡ãƒ«(LLM)ã¯ã€ãƒ¢ãƒ‡ãƒ«ã®åˆ·æ–°ã¨å…±ã«ã‚³ãƒ³ãƒ†ã‚ã‚¹ãƒˆã‚¦ã‚£ãƒ³ãƒ‰ã‚¦(æ‰±ãˆã‚‹æƒ…å ±é‡)ã‚‚å¢—åŠ ã—ã¦ãŠã‚Šã€è¨˜äº‹ä½œæˆæ™‚ç‚¹ã§ã¯é•·ç·¨å°èª¬æ•°å†Šåˆ†(100ä¸‡ãƒˆãƒ¼ã‚¯ãƒ³ä»¥ä¸Š)ã‚’å–ã‚Šæ‰±ãˆã‚‹ãƒ¢ãƒ‡ãƒ«ã‚‚å˜åœ¨ã—ã¾ã™ã€‚ å¤§é‡ã®æƒ…å ±ã‚’æ‰±ãˆã‚‹ã¨ã„ã†ã®ã¯ãƒ¦ãƒ¼ã‚¶ãƒ¼ã«ã¨ã£ã¦åˆ©ç‚¹ã«ãªã‚Šã¾ã™ãŒã€å¤§é‡ã®æƒ…å ±ã‚’æ‰±ã†ã“ã¨ã«ã‚ˆ
masterq 2024/04/03
"å¯¾è©±ã®æ•°ãŒã‚ã‚‹ä¸€ç‚¹ã‚’è¶…ãˆã‚‹ã¨ã€ãƒ¢ãƒ‡ãƒ«ãŒæœ‰å®³ãªå¿œç”ã‚’ç”Ÿæˆã™ã‚‹å¯èƒ½æ€§ãŒé«˜ããªã‚‹ã“ã¨ã‚’ç¤ºã—ã¾ã—ãŸ"

chatgpt

ai

llm

secure

security
ãƒªãƒ³ã‚¯
ãƒžã‚¤ã‚¯ãƒã‚½ãƒ•ãƒˆã€AIã§ã‚½ãƒ•ãƒˆã‚¦ã‚§ã‚¢ã®ãƒã‚°ã‚„è„†å¼±æ€§ã‚’æŽ¢ã‚‹ã€ŒMicrosoft Security Risk Detectionã€ã‚’ç™ºè¡¨
ãƒžã‚¤ã‚¯ãƒã‚½ãƒ•ãƒˆã€AIã§ã‚½ãƒ•ãƒˆã‚¦ã‚§ã‚¢ã®ãƒã‚°ã‚„è„†å¼±æ€§ã‚’æŽ¢ã‚‹ã€ŒMicrosoft Security Risk Detectionã€ã‚’ç™ºè¡¨ ãƒã‚°ã‚„è„†å¼±æ€§ã‚’ç™ºè¦‹ã™ã‚‹æœ‰åãªæ‰‹æ³•ã®ã²ã¨ã¤ã«ã€ŒFuzzing Testã€ãŒã‚ã‚Šã¾ã™ã€‚Fuzzing Testã¨ã¯ã€æ¤œæŸ»å¯¾è±¡ã®ã‚½ãƒ•ãƒˆã‚¦ã‚§ã‚¢ã«å•é¡Œã‚’å¼•ãèµ·ã“ã—ãã†ãªãƒ‡ãƒ¼ã‚¿ï¼ˆã“ã‚ŒãŒã€ŒFuzzã€ã¨å‘¼ã°ã‚Œã‚‹ï¼‰ã‚’å¤§é‡ã«é€ã‚Šè¾¼ã¿ã€ãã®å¿œç”ã‚„æŒ™å‹•ã‚’ç›£è¦–ã™ã‚‹ã€ã¨ã„ã†ã‚‚ã®ã§ã™ã€‚ ã“ã‚Œã¾ã§Fuzzing Testã¯ä¸€èˆ¬ã«ã‚»ã‚ãƒ¥ãƒªãƒ†ã‚£ãƒ†ã‚¹ãƒˆã®å°‚é–€å®¶ãªã©ãŒãƒ†ã‚¹ãƒˆãƒ‡ãƒ¼ã‚¿ã‚’ä½œæˆã—ã€å®Ÿè¡Œã—ã€ãã®æŒ™å‹•ã‚’ç›£è¦–ã™ã‚‹ä½œæ¥ã‚’è¡Œã£ã¦ãã¾ã—ãŸã€‚ã¾ãŸã€ã™ã§ã«ä¸€éƒ¨ã®ãƒªã‚¹ã‚¯æ¤œå‡ºã‚µãƒ¼ãƒ“ã‚¹ã§ã¯ã“ã†ã—ãŸä½œæ¥ã«AIã®åˆ©ç”¨ã‚‚å§‹ã¾ã£ã¦ã„ã‚‹ã¨ã®ã“ã¨ã€‚ Microsoft Security Risk Detectionã¯ã€AIã‚’ä½¿ã£ã¦ã“ã†ã—ãŸä½œæ¥ã‚’è‡ªå‹•åŒ–ã—ã€ã‚¯ãƒ©ã‚¦ãƒ‰ã«ã‚ˆã£ã¦å¤§é‡ã«å®Ÿè¡Œã™ã‚‹ã¨ã€ãƒžã‚¤ã‚¯ãƒã‚½ãƒ•ãƒˆãƒªã‚µãƒ¼ãƒã®David M
masterq 2017/07/25
ã©ã‚Œãã‚‰ã„å¼•ã£æŽ›ã‘ã‚‰ã‚Œã‚‹ã®ã‹æ°—ã«ãªã‚Šã¾ã™ãã€‚ã€‚ã€‚

microsoft

fuzzing

test

bug

ai

secure

security
ãƒªãƒ³ã‚¯
1

ãŠçŸ¥ã‚‰ã›

ã‚‚ã£ã¨èªã‚€

å…¬å¼Twitter

@hatebu
æœ€æ–°ã®äººæ°—ã‚¨ãƒ³ãƒˆãƒªãƒ¼ã®é…ä¿¡

ã‚ãƒ¼ãƒœãƒ¼ãƒ‰ã‚·ãƒ§ãƒ¼ãƒˆã‚«ãƒƒãƒˆä¸€è¦§

jæ¬¡ã®ãƒ–ãƒƒã‚¯ãƒžãƒ¼ã‚¯

kå‰ã®ãƒ–ãƒƒã‚¯ãƒžãƒ¼ã‚¯

lã‚ã¨ã§èªã‚€

eã‚³ãƒ¡ãƒ³ãƒˆä¸€è¦§ã‚’é–‹ã

oãƒšãƒ¼ã‚¸ã‚’é–‹ã

è¨å®šã‚’å¤‰æ›´ã—ã¾ã—ãŸx

ã¯ã¦ãªãƒ–ãƒƒã‚¯ãƒžãƒ¼ã‚¯

ã‚¿ã‚°

é–¢é€£ã‚¿ã‚°ã§çµžã‚Šè¾¼ã‚€ (7)

secureã¨aiã«é–¢ã™ã‚‹masterqã®ãƒ–ãƒƒã‚¯ãƒžãƒ¼ã‚¯ (2)

ãŠçŸ¥ã‚‰ã›

ä»Šé€±ã®ã¯ã¦ãªãƒ–ãƒƒã‚¯ãƒžãƒ¼ã‚¯æ•°ãƒ©ãƒ³ã‚ãƒ³ã‚°ï¼ˆ2026å¹´1æœˆç¬¬4é€±ï¼‰

ä»Šé€±ã®ã¯ã¦ãªãƒ–ãƒƒã‚¯ãƒžãƒ¼ã‚¯æ•°ãƒ©ãƒ³ã‚ãƒ³ã‚°ï¼ˆ2026å¹´1æœˆç¬¬3é€±ï¼‰

ã€å®Œäº†ã€‘ã¯ã¦ãªãƒ–ãƒƒã‚¯ãƒžãƒ¼ã‚¯ã®è¨ˆç”»ãƒ¡ãƒ³ãƒ†ãƒŠãƒ³ã‚¹ã®ãŠçŸ¥ã‚‰ã›ï¼ˆ2026å¹´1æœˆ23æ—¥(é‡‘) æ·±å¤œ1:30ã€œ3:00ï¼‰

å…¬å¼Twitter

ã‚ãƒ¼ãƒœãƒ¼ãƒ‰ã‚·ãƒ§ãƒ¼ãƒˆã‚«ãƒƒãƒˆä¸€è¦§

ã¯ã¦ãªãƒ–ãƒƒã‚¯ãƒžãƒ¼ã‚¯

å…¬å¼Twitter

ã¯ã¦ãªã®ã‚µãƒ¼ãƒ“ã‚¹

ã‚¿ã‚°

é–¢é€£ã‚¿ã‚°ã§çµžã‚Šè¾¼ã‚€ (7)

secureã¨aiã«é–¢ã™ã‚‹masterqã®ãƒ–ãƒƒã‚¯ãƒžãƒ¼ã‚¯ (2)

ãƒžã‚¤ã‚¯ãƒ­ã‚½ãƒ•ãƒˆã€AIã§ã‚½ãƒ•ãƒˆã‚¦ã‚§ã‚¢ã®ãƒã‚°ã‚„è„†å¼±æ€§ã‚’æŽ¢ã‚‹ã€ŒMicrosoft Security Risk Detectionã€ã‚’ç™ºè¡¨

ãŠçŸ¥ã‚‰ã›

ä»Šé€±ã®ã¯ã¦ãªãƒ–ãƒƒã‚¯ãƒžãƒ¼ã‚¯æ•°ãƒ©ãƒ³ã‚­ãƒ³ã‚°ï¼ˆ2026å¹´1æœˆç¬¬4é€±ï¼‰

ä»Šé€±ã®ã¯ã¦ãªãƒ–ãƒƒã‚¯ãƒžãƒ¼ã‚¯æ•°ãƒ©ãƒ³ã‚­ãƒ³ã‚°ï¼ˆ2026å¹´1æœˆç¬¬3é€±ï¼‰

ã€å®Œäº†ã€‘ã¯ã¦ãªãƒ–ãƒƒã‚¯ãƒžãƒ¼ã‚¯ã®è¨ˆç”»ãƒ¡ãƒ³ãƒ†ãƒŠãƒ³ã‚¹ã®ãŠçŸ¥ã‚‰ã›ï¼ˆ2026å¹´1æœˆ23æ—¥(é‡‘) æ·±å¤œ1:30ã€œ3:00ï¼‰

å…¬å¼Twitter

ã‚­ãƒ¼ãƒœãƒ¼ãƒ‰ã‚·ãƒ§ãƒ¼ãƒˆã‚«ãƒƒãƒˆä¸€è¦§

ã¯ã¦ãªãƒ–ãƒƒã‚¯ãƒžãƒ¼ã‚¯

å…¬å¼Twitter

ã¯ã¦ãªã®ã‚µãƒ¼ãƒ“ã‚¹

é–¢é€£ã‚¿ã‚°ã§çµžã‚Šè¾¼ã‚€ (7)

secureã¨aiã«é–¢ã™ã‚‹masterqã®ãƒ–ãƒƒã‚¯ãƒžãƒ¼ã‚¯ (2)

ãƒžã‚¤ã‚¯ãƒã‚½ãƒ•ãƒˆã€AIã§ã‚½ãƒ•ãƒˆã‚¦ã‚§ã‚¢ã®ãƒã‚°ã‚„è„†å¼±æ€§ã‚’æŽ¢ã‚‹ã€ŒMicrosoft Security Risk Detectionã€ã‚’ç™ºè¡¨

ãŠçŸ¥ã‚‰ã›

ä»Šé€±ã®ã¯ã¦ãªãƒ–ãƒƒã‚¯ãƒžãƒ¼ã‚¯æ•°ãƒ©ãƒ³ã‚ãƒ³ã‚°ï¼ˆ2026å¹´1æœˆç¬¬4é€±ï¼‰

ä»Šé€±ã®ã¯ã¦ãªãƒ–ãƒƒã‚¯ãƒžãƒ¼ã‚¯æ•°ãƒ©ãƒ³ã‚ãƒ³ã‚°ï¼ˆ2026å¹´1æœˆç¬¬3é€±ï¼‰

ã€å®Œäº†ã€‘ã¯ã¦ãªãƒ–ãƒƒã‚¯ãƒžãƒ¼ã‚¯ã®è¨ˆç”»ãƒ¡ãƒ³ãƒ†ãƒŠãƒ³ã‚¹ã®ãŠçŸ¥ã‚‰ã›ï¼ˆ2026å¹´1æœˆ23æ—¥(é‡‘) æ·±å¤œ1:30ã€œ3:00ï¼‰

å…¬å¼Twitter

ã‚ãƒ¼ãƒœãƒ¼ãƒ‰ã‚·ãƒ§ãƒ¼ãƒˆã‚«ãƒƒãƒˆä¸€è¦§

ã¯ã¦ãªãƒ–ãƒƒã‚¯ãƒžãƒ¼ã‚¯

å…¬å¼Twitter

ã¯ã¦ãªã®ã‚µãƒ¼ãƒ“ã‚¹