Snowflakeã§JSONã‚’æ‰±ã†æ™‚ã¯json_extract_path_textã‚’ä½¿ã†ã®ã§ã¯ãªãã€åŠæ§‹é€ åŒ–ãƒ‡ãƒ¼ã‚¿ã‚’ä½¿ãŠã†

æ·±æ¾¤ (@qluto) ã§ã™ã€‚

ç§ã¯ç¾åœ¨ã€ãƒã‚¯ãƒ©ã‚¯ã®AI-OCRãƒãƒ¼ãƒ ã§ãƒžãƒãƒ¼ã‚¸ãƒ£ãƒ¼ã¨ã—ã¦é–‹ç™ºã‚’é€²ã‚ã¦ã„ã¾ã™ã€‚

ãƒ—ãƒãƒ€ã‚¯ãƒˆã®é€²åŒ–ã‚„ã‚¹ã‚±ãƒ¼ãƒªãƒ³ã‚°ã‚’å›³ã‚‹ã†ãˆã§ã€ãƒ‡ãƒ¼ã‚¿åŸºç›¤ã®æ”¹å–„ã‚‚ã©ã‚“ã©ã‚“ã¨é€²ã‚“ã§ãŠã‚Šã€æ—¥ã€…ãã®æ©æµã‚’æŽˆã‹ã‚ŠãªãŒã‚‰é–‹ç™ºã‚’ã—ã¦ã„ã¾ã™ã€‚ æœ€è¿‘ã¯BigQueryã‹ã‚‰Snowflakeã¸ã®ç§»è¡ŒãŒé€²è¡Œä¸ã§ã™ã€‚

Google BigQueryã‹ã‚‰Snowflakeã¸ã€‚ãƒã‚¯ãƒ©ã‚¯ã®ãƒ‡ãƒ¼ã‚¿åŸºç›¤æŠ€è¡“ç§»ç®¡äº‹ä¾‹ - Findy Tools

æœ¬è¨˜äº‹ã§ã¯ã€ç§»è¡Œä½œæ¥ã®ä¸ã§å¦ã‚“ã Snowflakeã®åŠæ§‹é€ åŒ–ãƒ‡ãƒ¼ã‚¿ã«ã¤ã„ã¦ç´¹ä»‹ã—ã¾ã™ã€‚

åŠæ§‹é€ åŒ–ãƒ‡ãƒ¼ã‚¿ã‚’çŸ¥ã‚‰ãªã‹ã£ãŸç§

Snowflakeã‚’è§¦ã‚Šå§‹ã‚ãŸå½“åˆã¯ã€çŸ¥ã‚‰ãšã«json_extract_path_textãªã©ã‚’ä½¿ã£ãŸé…ã„ã‚¯ã‚¨ãƒªã‚’é‡ç”£ã—ã¦ã„ãŸã®ã§ã™ãŒã€Snowflakeã®åŠæ§‹é€ åŒ–ãƒ‡ãƒ¼ã‚¿ã‚’ç†è§£ã—æ´»ç”¨ã™ã‚‹ã¨æ ¼æ®µã«åŠ¹çŽ‡ãŒä¸ŠãŒã‚‹ã“ã¨ã«æ°—ã¥ãã¾ã—ãŸã€‚

åŠæ§‹é€ ãƒ‡ãƒ¼ã‚¿åž‹ã¨ã—ã¦æ ¼ç´æ¸ˆã¿ã®JSONãƒ‡ãƒ¼ã‚¿ãŒå…¥ã£ãŸãƒ•ã‚£ãƒ¼ãƒ«ãƒ‰ã«å¯¾ã—ã¦ã€ä»¥ä¸‹ã®ã‚ˆã†ãªã‚¯ã‚¨ãƒªã‚’æ›¸ã„ã¦ã„ã¾ã—ãŸã€‚

with extracted as (
    select
        json_extract_path_text(json_data, 'payload.a_nested_value_list')
    from my_table
)
select
-- ä»¥ä¸‹æŠ½å‡ºã—ãŸãƒ‡ãƒ¼ã‚¿ã«å¯¾ã™ã‚‹åŠ å·¥ãƒ»é›†è¨ˆå‡¦ç†ãªã©

ã“ã‚Œã¯ç¢ºã‹ã«å‹•ä½œã¯ã—ã¾ã™ãŒã€ä½•ã‚‚çŸ¥ã‚‰ãšã—ã¦json_extract_path_textã‚’ä½¿ã†ã®ã¯ã ã„ã¶å‹¿ä½“ç„¡ã„ã§ã™ã€‚ ãƒ‡ãƒ¼ã‚¿é‡ã«ã‚ˆã£ã¦ã¯ã‚¯ã‚¨ãƒªå®Ÿè¡Œæ™‚é–“ã‚‚ã‹ã‹ã‚Šã¾ã™ã—ã€ãŠè²¡å¸ƒã«ã‚‚å„ªã—ããªã„ã§ã™ã€‚

ã“ã‚ŒãŒãªãœã‚ˆããªã„ã®ã‹ã¨ã„ã†ã“ã¨ã‚’ã€åŠæ§‹é€ åŒ–ãƒ‡ãƒ¼ã‚¿ã‚’è§£èª¬ã—ãªãŒã‚‰è§£ãæ˜Žã‹ã—ã¦ã„ãã¾ã™ã€‚

BigQueryã«ã‚‚json_extract_scalarã¨ã„ã†ä¼¼ãŸã‚ˆã†ãªé–¢æ•°ãŒã‚ã‚Šã€Snowflakeã§ã‚‚åŒã˜ã‚ˆã†ãªè€ƒãˆæ–¹ã§è¦‹ã¤ã‘ãŸjson_extract_path_textã‚’ä½¿ã£ã¦ã—ã¾ã£ã¦ã„ã¾ã—ãŸã€‚ BigQueryã«ã¯ãƒã‚¤ãƒ†ã‚£ãƒ–JSONåž‹ãŒã‚ã‚Šã€ãã‚Œã‚’é§†ä½¿ã™ã‚Œã°ã‚¯ã‚¨ãƒªé‡ã‚‚å°‘ãªãè¨ˆç®—åŠ¹çŽ‡ã‚‚è‰¯ãJSONãƒ‡ãƒ¼ã‚¿ã‚’å‡¦ç†ã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ãŒã€Snowflakeã«ã¯ãã‚Œä»¥ä¸Šã«æŸ”è»Ÿã‹ã¤è¨ˆç®—åŠ¹çŽ‡ã‚’é«˜ãã™ã‚‹ã“ã¨ãŒã§ãã‚‹å·¥å¤«ãŒã‚ã‚Šã¾ã™ã€‚

ãã‚Œã¯åŠæ§‹é€ åŒ–ãƒ‡ãƒ¼ã‚¿åž‹ã§ã™ã€‚

Snowflakeã«ãŠã‘ã‚‹åŠæ§‹é€ åŒ–ãƒ‡ãƒ¼ã‚¿

ä¸€èˆ¬çš„ãªæ§‹é€ åŒ–ãƒ‡ãƒ¼ã‚¿ã¯ã‚‚ã¡ã‚ã‚“ã®ã“ã¨ã€Snowflakeã§ã¯ åŠæ§‹é€ åŒ–ãƒ‡ãƒ¼ã‚¿ã‚’æ‰±ã†ãŸã‚ã®å°‚ç”¨ã®åž‹ï¼ˆVARIANT, OBJECT, ARRAYï¼‰ãŒæä¾›ã•ã‚Œã¦ã„ã¾ã™ã€‚ã“ã‚Œã‚‰ã®åž‹ã‚’ä½¿ã†ã“ã¨ã§ã€JSONã€XMLã€Avroã€Parquetãªã©ã®ã„ã‚ã‚†ã‚‹ã€ŒåŽ³å¯†ãªã‚¹ã‚ãƒ¼ãƒžã‚’æŒãŸãªã„ï¼ˆã‚‚ã—ãã¯ç·©ã‚„ã‹ãªï¼‰ãƒ‡ãƒ¼ã‚¿ã€ã‚’ãã®ã¾ã¾æ‰±ãˆã‚‹ã®ã§ã™ã€‚

åŠæ§‹é€ åŒ–ãƒ‡ãƒ¼ã‚¿ã®ãƒãƒ¼ãƒ‰ã®æ¦‚è¦ | Snowflake Documentation

Snowflakeã§ã¯ä¸Šè¨˜ãƒ•ã‚¡ã‚¤ãƒ«å½¢å¼ã®æ§‹é€ ã‚’å…¨ãæ˜Žç¤ºçš„ã«æŒ‡å®šã›ãšã¨ã‚‚ã€ãã®ã¾ã¾éžæ§‹é€ åŒ–ãƒ‡ãƒ¼ã‚¿ã¨ã—ã¦å–ã‚Šè¾¼ã‚€ã“ã¨ãŒå¯èƒ½ã§ã™ã€‚ å–ã‚Šè¾¼ã¾ã‚ŒãŸãƒ‡ãƒ¼ã‚¿ã¯ã€ä¸»ã«VARIANT, OBJECT, ARRAYã®3ç¨®é¡žã®ãƒ‡ãƒ¼ã‚¿åž‹ã§è¡¨ç¾ã•ã‚Œã‚‹åŠæ§‹é€ ãƒ‡ãƒ¼ã‚¿ã¨ãªã‚Šã¾ã™ã€‚

åŠæ§‹é€ åŒ–ãƒ‡ãƒ¼ã‚¿ã®åˆ©ç‚¹

åˆ—æŒ‡å‘ x ãƒžã‚¤ã‚¯ãƒãƒ‘ãƒ¼ãƒ†ã‚£ã‚·ãƒ§ãƒ³ã§é«˜é€ŸåŒ–

Snowflakeã¯å†…éƒ¨ã§ãƒ‡ãƒ¼ã‚¿ã‚’åˆ—æŒ‡å‘ã‹ã¤ã‚µã‚¤ã‚ºæœ€å¤§16MBã®ãƒžã‚¤ã‚¯ãƒãƒ‘ãƒ¼ãƒ†ã‚£ã‚·ãƒ§ãƒ³å˜ä½ã§ç®¡ç†ã—ã¦ã„ã¾ã™ã€‚

ãƒžã‚¤ã‚¯ãƒãƒ‘ãƒ¼ãƒ†ã‚£ã‚·ãƒ§ãƒ³ã¨ãƒ‡ãƒ¼ã‚¿ã‚¯ãƒ©ã‚¹ã‚¿ãƒªãƒ³ã‚° | Snowflake Documentation

æ§‹é€ åŒ–ãƒ‡ãƒ¼ã‚¿ã®éš›ã¯ã‚‚ã¡ã‚ã‚“ãªãŒã‚‰ã€åŠæ§‹é€ åŒ–ãƒ‡ãƒ¼ã‚¿ã®ãƒãƒ¼ãƒ‰æ™‚ã«ã¯ã€JSONã‚„XMLãªã©ã®åŠæ§‹é€ åŒ–ãƒ‡ãƒ¼ã‚¿ã‚’è§£æžã—ã€ãƒ„ãƒªãƒ¼æ§‹é€ çš„ã«æŒã¤ã‚ãƒ¼ã‚„ãƒ‘ã‚¹ã‚’ãƒ¡ã‚¿ãƒ‡ãƒ¼ã‚¿ã¨ã—ã¦åˆ—æŒ‡å‘å½¢å¼ã§ãƒžã‚¤ã‚¯ãƒãƒ‘ãƒ¼ãƒ†ã‚£ã‚·ãƒ§ãƒ³ã«æ ¼ç´ã—ã¾ã™ã€‚ ã‚¯ã‚¨ãƒªå®Ÿè¡Œæ™‚ã«ã¯ã€å¿…è¦ãªãƒ‘ã‚¹ã ã‘ã‚’å‚ç…§ã—ã€ä¸è¦ãªãƒ‘ãƒ¼ãƒ†ã‚£ã‚·ãƒ§ãƒ³ã‚’ã‚¹ã‚ãƒƒãƒ—ã™ã‚‹ã“ã¨ã§é«˜é€ŸåŒ–ãŒå¯èƒ½ã«ãªã‚‹ã®ã§ã™ã€‚

ä»¥ä¸‹ã®ã‚ˆã†ãªã‚¯ã‚¨ãƒªã§ã€JSONã®ãƒã‚¹ãƒˆæ§‹é€ ã‚’ç›´æŽ¥æŒ‡å®šã—ã¦å–ã‚Šå‡ºã›ã¾ã™ã€‚ ãƒãƒ¼ãƒ‰ã•ã‚ŒãŸæ®µéšŽã§SnowflakeãŒå†…éƒ¨çš„ã«åˆ—ã¨ã—ã¦ãƒ¡ã‚¿æƒ…å ±ã‚’ç®¡ç†ã—ã¦ã„ã‚‹ãŸã‚ã€æ–‡å—åˆ—ã‹ã‚‰éƒ½åº¦JSONã¨ã—ã¦ãƒ‘ãƒ¼ã‚¹ã™ã‚‹å¿…è¦ãŒã‚ã‚Šã¾ã›ã‚“ã€‚

select
    data:object.key1::varchar as col1,
    data:object.key2::varchar as col2
from my_table;

ã“ã‚Œã«ã‚ˆã‚Šã€ãƒ‘ãƒ¼ã‚¹å‡¦ç†ã‚„ãƒ•ãƒ«ã‚¹ã‚ãƒ£ãƒ³ã‚’å›žé¿ã—ãªãŒã‚‰åŠ¹çŽ‡çš„ã«ãƒ‡ãƒ¼ã‚¿ã¸ã‚¢ã‚¯ã‚»ã‚¹ã§ãã¾ã™ã€‚

json_extract_path_textã¯ãƒ€ãƒ¡ãªã®ã‹ï¼Ÿ

SnowflakeãŒæä¾›ã™ã‚‹json_extract_path_textã¯ã€å®Ÿã¯ä¸‹è¨˜ã®ã‚ˆã†ãªå‹•ä½œã«ç›¸å½“ã—ã¾ã™ã€‚

TO_VARCHAR(
    GET_PATH(
        PARSE_JSON(JSONæ–‡å—åˆ—), 'PATH'
    )
)

ã¤ã¾ã‚Šã€æ¯Žå›žã‚¯ã‚¨ãƒªã®å®Ÿè¡Œæ™‚ã«æ–‡å—åˆ—ã‚’JSONã¨ã—ã¦ãƒ‘ãƒ¼ã‚¹ã—ã€ãã®å¾Œã«ãƒ‘ã‚¹ã‚’ãŸã©ã£ã¦å€¤ã‚’å–ã‚Šå‡ºã—ã¦ã„ã‚‹ã®ã§ã™ã€‚ã“ã‚Œã§ã¯ã€ã›ã£ã‹ãSnowflakeãŒæŒã¤ â€œåŠæ§‹é€ åŒ–ãƒ‡ãƒ¼ã‚¿ã‚’åˆ—æŒ‡å‘ã‚¹ãƒˆã‚¢ã§æ ¼ç´ã™ã‚‹åˆ©ç‚¹â€ ã‚’ã¾ã£ãŸãæ´»ã‹ã›ã¾ã›ã‚“ã€‚

åŸºæœ¬çš„ã«ã¯æœ€åˆã‹ã‚‰ VARIANTåž‹ã«ãƒãƒ¼ãƒ‰ã™ã‚‹è¨è¨ˆã«ã—ã¦ã€Snowflakeã®åˆ—æŒ‡å‘ã‚¨ãƒ³ã‚¸ãƒ³ã‚’ãƒ•ãƒ«ã«æ´»ç”¨ã™ã‚‹ã»ã†ãŒåœ§å€’çš„ã«åŠ¹çŽ‡çš„ã§ã—ã‚‡ã†ã€‚

variantåž‹ã‚’ä½¿ç”¨ã™ã‚‹ã«ã‚ãŸã£ã¦ã€åˆ—æŒ‡å‘ã‚¹ãƒˆã‚¢ã«æŠ½å‡ºã•ã‚Œã‚‹ã‹ã©ã†ã‹ã¯ã€å°‘ã—æ¡ä»¶ãŒã‚ã‚‹ã®ã§æ³¨æ„ãŒå¿…è¦ã§ã™ã€‚

å…¨ã¦ã«ã‚ãŸã£ã¦nullå€¤ã—ã‹å˜åœ¨ã—ãªã„é …ç›®ã‚„ã€æ–‡å—åˆ—ã¨æ•°å€¤ã¨ãŒæ··åœ¨ã™ã‚‹é …ç›®ã€200ä»¥ä¸Šã®é …ç›®ã‚’è¶…ãˆã‚‹ã‚‚ã®ãªã©ã¯åˆ—æŒ‡å‘å½¢å¼ã§æŠ½å‡ºã•ã‚Œã¾ã›ã‚“ãŒã€ä¸€èˆ¬çš„ãªå¤šãã®ã‚±ãƒ¼ã‚¹ã§ã¯é©ç”¨ã•ã‚Œã‚‹ã§ã—ã‚‡ã†ã€‚

VARIANT ã«æ ¼ç´ã•ã‚Œã¦ã„ã‚‹åŠæ§‹é€ åŒ–ãƒ‡ãƒ¼ã‚¿ã«é–¢ã™ã‚‹è€ƒæ…®äº‹é … | Snowflake Documentation

ã¾ã¨ã‚

json_extract_path_text ã®ã‚ˆã†ãªé–¢æ•°ã¯æ–‡å—åˆ—ã‹ã‚‰æ¯Žå›žJSONã‚’ãƒ‘ãƒ¼ã‚¹ã™ã‚‹ãŸã‚ã€ãƒ‘ãƒ•ã‚©ãƒ¼ãƒžãƒ³ã‚¹ãƒ»ã‚³ã‚¹ãƒˆé¢ã§éžåŠ¹çŽ‡ã€‚
å…¥åŠ›ãƒ•ã‚¡ã‚¤ãƒ«ã‚’ã§ãã‚‹ã ã‘æœ€åˆã‹ã‚‰ VARIANT åž‹ã«ãƒãƒ¼ãƒ‰ã—ã€ãƒ‘ãƒ¼ãƒ†ã‚£ã‚·ãƒ§ãƒ³ã‚¹ã‚ãƒƒãƒ—ãªã©ã®Snowflakeã®å¼·ã¿ã‚’æ´»ã‹ã™è¨è¨ˆãŒæœ›ã¾ã—ã„ã€‚

Snowflakeã§JSONã‚„XMLãªã©ã‚’æ‰±ã†éš›ã¯ã€ãœã² VARIANT/OBJECT/ARRAY ãªã©ã®åŠæ§‹é€ åŒ–ãƒ‡ãƒ¼ã‚¿åž‹ã‚’ç©æ¥µçš„ã«æ¤œè¨Žã—ã¦ã¿ã¦ãã ã•ã„ã€‚ ãã®ã†ãˆã§ã€ã‚¯ã‚¨ãƒªãƒ‘ãƒ•ã‚©ãƒ¼ãƒžãƒ³ã‚¹ã®çŠ¶æ³ã‚„ãƒžã‚¤ã‚¯ãƒãƒ‘ãƒ¼ãƒ†ã‚£ã‚·ãƒ§ãƒ³ã®åˆ†å‰²çŠ¶æ³ã‚’è¦³æ¸¬ã—ã€å¿…è¦ã«å¿œã˜ã¦ãƒ†ãƒ¼ãƒ–ãƒ«ã®ã‚¯ãƒ©ã‚¹ã‚¿ãƒªãƒ³ã‚°ã‚„ãƒ‘ãƒ¼ãƒ†ã‚£ã‚·ãƒ§ãƒ‹ãƒ³ã‚°ã‚’æœ€é©åŒ–ã™ã‚‹ã“ã¨ã§ã€Snowflakeã®å¼·åŠ›ãªå‡¦ç†èƒ½åŠ›ã‚’æœ€å¤§é™å¼•ãå‡ºã›ã‚‹ã¯ãšã§ã™ã€‚

ãŠã‚ã‚Šã«

LayerXã§ã¯ã€ãƒ‡ãƒ¼ã‚¿ã¨æ©Ÿæ¢°å¦ç¿’æŠ€è¡“ã‚’æœ€å¤§é™é§†ä½¿ã—ã¦ãŠå®¢æ§˜ã®ä½“é¨“ã‚’ãƒã‚¯ãƒ©ã‚¯ã«ã™ã‚‹ãŸã‚ã®ä»²é–“ãŒã¾ã ã¾ã å¿…è¦ã§ã™ã€‚ ä¸€ç·’ã«åƒã„ã¦ãã‚Œã‚‹ä»²é–“ã‚’å¤§å‹Ÿé›†ã—ã¦ãŠã‚Šã¾ã™ï¼

å°‘ã—ã§ã‚‚èˆˆå‘³ã‚’æŒã£ã¦ãã ã•ã£ãŸæ–¹ï¼ã”å¿œå‹Ÿãƒ»ã‚«ã‚¸ãƒ¥ã‚¢ãƒ«é¢è«‡ã‚’ãŠå¾…ã¡ã—ã¦ãŠã‚Šã¾ã™ï¼

jobs.layerx.co.jp