Snowflakeä¸Šã®ãƒ‡ãƒ¼ã‚¿åˆ©ç”¨çŠ¶æ³ã‚’å¯è¦–åŒ–ã™ã‚‹ãƒ„ãƒ¼ãƒ«ã‚’Streamlitã§è©¦ä½œã—ãŸè©± - DWANGOï¼ˆæ—§KADOKAWA Connectedäº‹æ¥ï¼‰

KADOKAWA Connected / ãƒ‰ãƒ¯ãƒ³ã‚´ã® @saka1 ã§ã™ã€‚æœ€è¿‘ã¯ãƒ‡ãƒ¼ã‚¿åŸºç›¤ã®ä¿å®ˆç‰ã«æºã‚ã£ã¦ã„ã¾ã™ã€‚

ä»Šå›žã¯Streamlitã¨ã„ã†Webã‚¢ãƒ—ãƒªã‚±ãƒ¼ã‚·ãƒ§ãƒ³ãƒ•ãƒ¬ãƒ¼ãƒ ãƒ¯ãƒ¼ã‚¯ã‚’ä½¿ã„ã€Snowflakeä¸Šã®ãƒ†ãƒ¼ãƒ–ãƒ«ã®åˆ©ç”¨çŠ¶æ³ã‚’æ¸¬å®šã™ã‚‹ãƒ€ãƒƒã‚·ãƒ¥ãƒœãƒ¼ãƒ‰ã‚’ä½œã£ã¦ã¿ã¾ã—ãŸã€‚

ãƒ‡ãƒ¼ã‚¿ã®éœ€è¦ã¯ã„ã¤ã®é–“ã«ã‹å¤‰åŒ–ã—ã¦ã„ã‚‹å•é¡Œ

ãƒ‡ãƒ¼ã‚¿æ´»ç”¨ã‚’é€²ã‚ã‚‹ãŸã‚ã«ã¯ã€ãƒ‡ãƒ¼ã‚¿ã®æ•´å‚™ãŒå¿…è¦ã§ã™ã€‚ç„¡ã„ãƒ‡ãƒ¼ã‚¿ã¯åˆ†æžã§ããªã„ã®ã§â€¦â€¦ã€‚ä¸€æ–¹ã§ã€ãŸã ãƒ‡ãƒ¼ã‚¿ã‚’åŸºç›¤ä¸Šã«æ•´å‚™ã™ã‚‹ã ã‘ã ã¨ã€ãã®ãƒ‡ãƒ¼ã‚¿ãŒã©ã‚Œãã‚‰ã„æœ‰ç”¨ãªã®ã‹ã¯åˆ¤æ–ãŒé›£ã—ã„ã§ã™ã€‚

æ•´å‚™å½“åˆã¯æœ‰ç”¨ã§ã¿ã‚“ãªãŒè¦‹ã¦ã„ãŸï¼ˆã‹ã‚‚ã—ã‚Œãªã„ï¼‰ãƒ†ãƒ¼ãƒ–ãƒ«ã‚‚ã€ã—ã°ã‚‰ãçµŒã¤ã¨äººæ°—ãŒãªããªã£ã¦ã„ã‚‹ã“ã¨ãŒã‚ã‚Šã¾ã™ã€‚ ã²ã©ã„æ™‚ã«ã¯ã€å®Ÿã¯èª°ã‚‚è¦‹ã¦ã„ãªã„ãƒ‡ãƒ¼ã‚¿ã‚’å°Žå‡ºã™ã‚‹ãŸã‚ã®ãƒ‡ãƒ¼ã‚¿ãƒ‘ã‚¤ãƒ—ãƒ©ã‚¤ãƒ³ã‚’ã€ã‚¨ãƒ³ã‚¸ãƒ‹ã‚¢ãŒå¿…æ»ã§ãŠå®ˆã‚Šã—ã¦ã„ã‚‹äº‹ã•ãˆã‚ã‚‹ã‹ã‚‚ã—ã‚Œã¾ã›ã‚“ã€‚

ãƒ‡ãƒ¼ã‚¿ã®æ•´å‚™ã¨ã„ã†ã¨ãã€ãŸã ãƒ‡ãƒ¼ã‚¿ã‚’å¢—ã‚„ã—ã¦ãƒ“ã‚¸ãƒã‚¹ã‚µã‚¤ãƒ‰ã®è¦æœ›ã«å¿œãˆç¶šã‘ã‚‹ä¸€æ–¹ã ã¨ã€ã„ãšã‚Œç ´ç¶»ã—ã¾ã™ã€‚ä¿å®ˆã‚³ã‚¹ãƒˆã®å¢—å¤§ã«ãƒ‡ãƒ¼ã‚¿ã®ä¾¡å€¤ãŒè¿½ã„ã¤ã‹ãªããªã‚‹¹ã‹ã‚‰ã§ã™ï¼ˆæˆ‘ã€…è‡ªèº«ã‚ã‚“ã¾ã‚Šä»–äººäº‹ã§ã¯ãªã„ã§ã™ï¼‰ã€‚

ç ´ç¶»ã‚’é˜²ãã«ã¯ã€æœ‰ç”¨ãªãƒ‡ãƒ¼ã‚¿ã‚’å¢—ã‚„ã™ä¸€æ–¹ã§ä½¿ã‚ã‚Œãªããªã£ãŸãƒ‡ãƒ¼ã‚¿ã®å»ƒæ¢ã‚’é€²ã‚ã‚‹ãªã©ã€ãƒ©ã‚¤ãƒ•ã‚µã‚¤ã‚¯ãƒ«ã‚’è¨ˆç”»ã—ã¦ã„ãå¿…è¦ãŒã‚ã‚Šã¾ã™ã€‚ãã®ãŸã‚ã®åŸºç¤Žã«ãªã‚‹ã®ãŒæ¸¬å®šã§ã™ã€‚

â€» ã‚„ã‚„ä½™è«‡ã§ã™ãŒã€ã“ã®è¾ºã‚Šã¯æ™®é€šã®Webã‚µãƒ¼ãƒ“ã‚¹ãªã©ã¨ã‚‚ä¼¼ã¦ã„ã‚‹æ°—ãŒã—ã¾ã™ã€‚ãƒ“ã‚¸ãƒã‚¹ã®æ”¹å–„ã®ãŸã‚ã«ãƒ•ã‚£ãƒ¼ãƒ‰ãƒãƒƒã‚¯ã‚µã‚¤ã‚¯ãƒ«ã‚’ä½œã‚Šå¼·åŒ–ã™ã‚‹å¿…è¦ãŒã‚ã‚‹ä¸€æ–¹ã§ã€ãƒ‡ãƒ¼ã‚¿æ•´å‚™è‡ªä½“ã‚‚ä¸€ç¨®ã®ï¼ˆå…¸åž‹çš„ã«ã¯ç¤¾å†…å‘ã‘ã®ï¼‰ã‚µãƒ¼ãƒ“ã‚¹ã¨ã—ã¦ç¶™ç¶šçš„ãªæ”¹å–„ã‚’ã‹ã‘ã‚‹å¿…è¦ãŒã‚ã‚‹ã®ã§ã™ã€‚

å‚è€ƒä¾‹: ç¾å®Ÿã®åˆ©ç”¨çŠ¶æ³ã‚’ãƒ‡ãƒ¼ã‚¿ãƒžãƒã‚¸ãƒ¡ãƒ³ãƒˆã«æ´»ã‹ã™

ãƒ¡ãƒ«ã‚«ãƒªã® @__hiza__ ã•ã‚“ã¯ã€ã“ã®è¾ºã‚Šã®ãƒ‡ãƒ¼ã‚¿ãƒžãƒã‚¸ãƒ¡ãƒ³ãƒˆã«ã¤ã„ã¦ã€å®Ÿéš›ã®åˆ©ç”¨çŠ¶æ³ã‚’INFORMATION_SCHEMAã‹ã‚‰å–å¾—å¯è¦–åŒ–ã™ã‚‹ã‚¢ãƒ—ãƒãƒ¼ãƒã‚’ææ¡ˆãªã•ã£ã¦ã„ã¾ã™ã€‚ ãƒ‡ãƒ¼ã‚¿ãƒžãƒã‚¸ãƒ¡ãƒ³ãƒˆè‡ªä½“ã‚’ãƒ‡ãƒ¼ã‚¿ãƒ‰ãƒªãƒ–ãƒ³ã«è¡Œã†ã®ã¯ã€ã¨ã¦ã‚‚ç‹ãŒè‰¯ã•ãã†ã«æ„Ÿã˜ã¾ã—ãŸã€‚

speakerdeck.com

ã“ã®è¨˜äº‹ã®ãŠé¡Œ

ã“ã®è¨˜äº‹ã§ã‚‚ã»ã¼åŒæ§˜ã®ã“ã¨ã‚’ã—ã¦ã¿ã‚ˆã†ã¨æ€ã„ã¾ã™ã€‚ã¤ã¾ã‚Šã€ãƒ†ãƒ¼ãƒ–ãƒ«å˜ä½ã§åˆ©ç”¨çŠ¶æ³ã‚’æ¸¬å®šã—ã¦ã¿ã‚‹ã“ã¨ã§ã€å„ãƒ‡ãƒ¼ã‚¿ã®ãƒ¦ãƒ¼ã‚¶åˆ©ç”¨çŠ¶æ³ã‚’å¯è¦–åŒ–ã—ã¾ã™ã€‚ ã‚‚ã£ã¨ã‚‚ã€åŒã˜ã“ã¨ã‚’ã‚„ã£ã¦ã‚‚é¢ç™½ããªã„ã®ã§ã€ã¡ã‚‡ã£ã¨ã ã‘ãŠé¡Œã‚’æ”¹å¤‰ã—ã¾ã—ãŸã€‚

BigQueryã§ã¯ãªãSnowflakeã§ã®æ¸¬å®šã‚’è¡Œã†
- ã“ã‚Œã¯å˜ã«æˆ‘ã€…ã®ãƒ‡ãƒ¼ã‚¿åŸºç›¤ã§æŽ¡ç”¨ã—ã¦ã„ã‚‹ã®ãŒSnowflakeã ã‹ã‚‰ã§ã™
Streamlitã«ã‚ˆã£ã¦ãƒ€ãƒƒã‚·ãƒ¥ãƒœãƒ¼ãƒ‰ã®å½¢ã«ã¾ã¨ã‚ã¦ã¿ã‚‹
- ãƒ¦ãƒ‹ãƒ¼ã‚¯ãƒ¦ãƒ¼ã‚¶æ•°ï¼ˆUUï¼‰ã‚’ã‚°ãƒ©ãƒ•åŒ–ã—ã¦ã¿ã‚‹ã“ã¨ã«ã—ã¾ã™

Pythonã¯ã‚ã¾ã‚Šè©³ã—ããªã„ã®ã§é›°å›²æ°—ã§æ›¸ã„ã¦ã‚‹ã¨ã“ã‚ãŒã‚ã‚Šã¾ã™ã€‚è¨±ã—ã¦ãã ã•ã„â€¦â€¦ã€‚

Streamlit

Streamlitã¯ã€ãƒ€ãƒƒã‚·ãƒ¥ãƒœãƒ¼ãƒ‰ã®ã‚ˆã†ãªã‚‚ã®ã‚’Pythonã§è¡¨ç¾ã™ã‚‹ãŸã‚ã®Webã‚¢ãƒ—ãƒªã‚±ãƒ¼ã‚·ãƒ§ãƒ³ãƒ•ãƒ¬ãƒ¼ãƒ ãƒ¯ãƒ¼ã‚¯ã§ã™ã€‚ ã“ã®ãƒ•ãƒ¬ãƒ¼ãƒ ãƒ¯ãƒ¼ã‚¯ã®å‹•ãã¯èˆˆå‘³æ·±ã„ã‚‚ã®ã§ã€ã„ã‚ã‚†ã‚‹ãƒªã‚¢ã‚¯ãƒ†ã‚£ãƒ–ãƒ—ãƒã‚°ãƒ©ãƒŸãƒ³ã‚°ã®ã‚ˆã†ãªç™ºæƒ³ãŒå…¥ã£ã¦ã„ã‚‹ã‚ˆã†ã§ã™ã€‚

Streamlitã®APIã‚’å‘¼ã¶ã“ã¨ã§ã€å…¥å‡ºåŠ›ã®ã‚¦ã‚£ã‚¸ã‚§ãƒƒãƒˆã‚’Webãƒšãƒ¼ã‚¸ä¸Šã«è¨ç½®ã§ãã‚‹
å…¥åŠ›å€¤ãŒå¤‰åŒ–ã™ã‚‹ã¨Pythonã‚³ãƒ¼ãƒ‰å…¨ä½“ãŒå†è©•ä¾¡ã•ã‚Œã‚‹ã€‚ãã‚Œã«ã‚ˆã£ã¦å‡ºåŠ›çµæžœã‚’å¤‰ãˆã‚‹ã“ã¨ãŒã§ãã‚‹
å…¥åŠ›ã‚¦ã‚£ã‚¸ã‚§ãƒƒãƒˆã¨ã—ã¦ã¯ä¾‹ãˆã°ã‚¹ãƒ©ã‚¤ãƒ€ãƒ¼ã€å‡ºåŠ›ã‚¦ã‚£ã‚¸ã‚§ãƒƒãƒˆã¨ã—ã¦ã¯è¡¨ã‚„å›³ãªã©ãŒæ¨™æº–ã§æä¾›ã•ã‚Œã¦ã„ã‚‹

å†è©•ä¾¡ã®éƒ¨åˆ†ã¯StreamlitãŒè‡ªå‹•çš„ã«ã‚„ã£ã¦ãã‚Œã‚‹ã®ã§ã€ã‚¢ãƒ—ãƒªé–‹ç™ºè€…ã¯å…¥åŠ›ã‚¦ã‚£ã‚¸ã‚§ãƒƒãƒˆã®å€¤ã«å¿œã˜ã¦è¨ˆç®—ã‚’è¡Œã„å‡ºåŠ›ã«ã¤ãªãã“ã¨ã«æ³¨åŠ›ã§ãã¾ã™ã€‚ãƒ€ãƒƒã‚·ãƒ¥ãƒœãƒ¼ãƒ‰è¨˜è¿°ã«ç‰¹åŒ–ã—ã¦ã„ã‚‹ã®ã‚‚ã‚ã‚Šã€ä¾‹ãˆã°HTMLã‚„CSSã‚’è§¦ã‚‹å¿…è¦ã¯ãªãã€ã‚·ãƒ³ãƒ—ãƒ«ãªè¨˜è¿°ã§ã™ã€‚

ç°¡å˜ãªä¾‹ã¨ã—ã¦ãƒ¢ãƒ³ãƒ†ã‚«ãƒ«ãƒæ³•ã‚’ä½¿ã£ãŸå††å‘¨çŽ‡è¨ˆç®—ã‚’å®Ÿè£…ã—ã¦ã¿ã¾ã—ãŸ²ã€‚ä»¥ä¸‹ã®Pythonã‚³ãƒ¼ãƒ‰ã‚’Streamlitã§å®Ÿè¡Œã—ã¾ã™ã€‚

import itertools
import random

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import seaborn as sns
import streamlit as st


def generate_sample_df(n):
    def r():
        while True:
            yield random.random()

    return pd.DataFrame(
        {
            "x": itertools.islice(r(), 0, n),
            "y": itertools.islice(r(), 0, n),
        },
        dtype=np.float32,
    )


# å…¥åŠ›ï¼ˆã“ã®å ´åˆã¯ã‚¹ãƒ©ã‚¤ãƒ€ãƒ¼ï¼‰ã®è¨å®š
n = st.slider("Sample size", 0, 1000, 200)

# nç‚¹ã‹ã‚‰ãªã‚‹ã‚µãƒ³ãƒ—ãƒ«ã‚’ç”Ÿæˆã—ã€ãã‚Œãžã‚ŒãŒå††ã®å†…å´ã«ã‚ã‚‹ã‹ã©ã†ã‹ã‚’åˆ¤å®šã—ã¦ãŠã
df = generate_sample_df(n)
df["is_in_circle"] = (df["x"] ** 2 + df["y"] ** 2) < 1**2

# ãƒ†ã‚ã‚¹ãƒˆã®è¡¨ç¤º
st.write("Pi â‰’ ", 4 * len(df[df["is_in_circle"]]) / len(df))

# matplotlibã§ã®æç”»çµæžœã®è¡¨ç¤º
fig = plt.figure()
sns.scatterplot(x="x", y="y", data=df, hue="is_in_circle")
st.pyplot(fig)

# DataFrameã®è¡¨ç¤º
st.write("Head of df")
st.dataframe(df.head(10))

å®Ÿè¡Œã¯å˜ç´”ã§ã€ãƒãƒ¼ã‚«ãƒ«ã§ streamlit run monte.py ãªã©ã¨ã‚„ã‚‹ã¨ã‚¢ãƒ—ãƒªã‚±ãƒ¼ã‚·ãƒ§ãƒ³ã‚µãƒ¼ãƒãŒç«‹ã¡ä¸ŠãŒã‚Šã¾ã™ã€‚ã™ã‚‹ã¨ã€ã“ã‚“ãªWebãƒšãƒ¼ã‚¸ãŒå¾—ã‚‰ã‚Œã¾ã™ã€‚

ãƒ¢ãƒ³ãƒ†ã‚«ãƒ«ãƒæ³•ã‚³ãƒ¼ãƒ‰ã®å®Ÿè¡Œä¾‹

StreamlitãŒã‚„ã£ã¦ã„ã‚‹ã“ã¨ã¯ st.slider ã§è¨å®šã—ãŸã‚¹ãƒ©ã‚¤ãƒ€ãƒ¼ã®å€¤ãŒãƒ¦ãƒ¼ã‚¶ã®æ“ä½œã§å¤‰ã‚ã‚‹ãŸã³ã«ã€ãƒ—ãƒã‚°ãƒ©ãƒ å…¨ä½“ã‚’å†å®Ÿè¡Œã™ã‚‹ã“ã¨ã§ã™ã€‚çµæžœçš„ã« n ã«ä¾å˜ã™ã‚‹ç®‡æ‰€ã‚‚ã™ã¹ã¦ãŒå†è©•ä¾¡ã•ã‚Œã‚‹ã®ã§å†æç”»ãŒå®Œäº†ã—ã¾ã™ã€‚ ãã“ã•ãˆæŠ¼ã•ãˆã‚Œã°ï¼ˆPandasã‚’çŸ¥ã£ã¦ã„ã‚‹å‰æã«ã¯ãªã‚Šã¾ã™ãŒï¼‰ãªã‚“ã¨ãªãèªã‚ã¡ã‚ƒã†ã‚“ã˜ã‚ƒãªã„ã§ã—ã‚‡ã†ã‹ã€‚

Snowflakeã«ãŠã‘ã‚‹åˆ©ç”¨çŠ¶æ³ã®å–å¾—

Snowflakeã§ã¯ã€INFORMATION_SCHEMAã¨åˆ¥ã«ã€ACCOUNT_USAGEãƒ“ãƒ¥ãƒ¼ãŒæä¾›ã•ã‚Œã¦ã„ã¾ã™ã€‚ https://docs.snowflake.com/ja/sql-reference/account-usage.html

ã“ã“ã§ã„ã†ã‚¢ã‚«ã‚¦ãƒ³ãƒˆã¨ã¯SnowflakeãŒå¥‘ç´„è€…ã«æ‰•ã„å‡ºã™ãƒ†ãƒŠãƒ³ãƒˆã§ã€ä»–ã®ã‚‚ã®ã§ä¾‹ãˆã‚‹ãªã‚‰AWSã‚¢ã‚«ã‚¦ãƒ³ãƒˆã¨ã‹ã«è¿‘ã„ã‚‚ã®ã§ã™ã€‚ ACCOUNT_USAGEã‹ã‚‰ã¯ã‚¢ã‚«ã‚¦ãƒ³ãƒˆå…¨ä½“ã§ã®æ§˜ã€…ãªæƒ…å ±ãŒå–å¾—ã§ãã¾ã™ãŒã€ä»Šå›žã®ãŠé¡Œã§åˆ©ç”¨ã§ããã†ãªã®ã¯ACCESS_HISTORYãƒ“ãƒ¥ãƒ¼ã§ã™ã€‚

docs.snowflake.com

ã“ã®ãƒ“ãƒ¥ãƒ¼ã¯ã‚¢ã‚«ã‚¦ãƒ³ãƒˆå…¨ä½“ã§

èª°ãŒ
ã©ã‚“ãªã‚¯ã‚¨ãƒªã‚’ç™ºè¡Œã—
ã©ã®ãƒ†ãƒ¼ãƒ–ãƒ«ã®ã©ã®ã‚«ãƒ©ãƒ ã«ã‚¢ã‚¯ã‚»ã‚¹ã—ãŸã‹

ã“ã‚Œã‚‰ã«ã¤ã„ã¦ã®æƒ…å ±ã‚’æä¾›ã—ã¾ã™ã€‚ä»Šå›žã®ç”¨é€”ã«ã´ã£ãŸã‚Šã§ã™ã€‚

Streamlitã‹ã‚‰Snowflakeã®SQLã‚’ç™ºè¡Œã™ã‚‹

ã•ã¦ã€å‰è¿°ã®2ã¤ã‚’çµ„ã¿åˆã‚ã›ã¦Streamlitã‚¢ãƒ—ãƒªã‚±ãƒ¼ã‚·ãƒ§ãƒ³ã‚’ä½œã‚Šã¾ã™ã€‚ã¨ã„ã£ã¦ã‚‚ã€æŠ€è¡“çš„ã«ãã‚Œã»ã©è¤‡é›‘ãªã“ã¨ã¯ã‚ã‚Šã¾ã›ã‚“ã€‚ãªãœãªã‚‰Streamlitã¯Pythonã§ä»»æ„ã®ã‚³ãƒ¼ãƒ‰ãŒå®Ÿè¡Œã§ãã€ãã—ã¦Pythonã‚³ãƒ¼ãƒ‰ä¸Šã‹ã‚‰ã¯Snowflakeã¯ã”ãæ™®é€šã®RDBMSã®ã‚ˆã†ã«æ‰±ãˆã‚‹ã‹ã‚‰ã§ã™ã€‚

å…¥åŠ›ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã¨ã—ã¦å¤šå°‘å®Ÿç”¨æ„ŸãŒã‚ã‚‹ã‹ãªã¨æ€ã„ä»Šå›žé¸ã‚“ã ã®ã¯æŠ½å‡ºå¯¾è±¡åŒºé–“ã§ã™ã€‚ã“ã®æœŸé–“ã«ãƒ†ãƒ¼ãƒ–ãƒ«ã‚’åˆ©ç”¨ã—ãŸãƒ¦ãƒ‹ãƒ¼ã‚¯ãƒ¦ãƒ¼ã‚¶æ•°ã§äººæ°—ãƒ†ãƒ¼ãƒ–ãƒ«ãƒ©ãƒ³ã‚ãƒ³ã‚°ã‚’å‡ºåŠ›ã—ã¦ã¿ã‚‹ã“ã¨ã«ã—ã¾ã™ã€‚

ä»Šå›žã¯ä»¥ä¸‹ã®ã‚ˆã†ãªã‚³ãƒ¼ãƒ‰ã‚’æ›¸ãã¾ã—ãŸã€‚

import datetime
import os
from pathlib import Path

import matplotlib.pyplot as plt
import seaborn as sns
import snowflake.connector
import streamlit as st
from dotenv import load_dotenv

load_dotenv()

ACCOUNT = os.getenv("SNOWFLAKE_ACCOUNT")
USERNAME = os.environ.get("SNOWFLAKE_USERNAME")
PASSWORD = os.environ.get("SNOWFLAKE_PASSWORD")
assert ACCOUNT is not None
assert USERNAME is not None
assert PASSWORD is not None


def fetch_data(since=datetime.date(2022, 1, 1), until=datetime.date(2022, 2, 1)):
    try:
        ctx = snowflake.connector.connect(
            account=ACCOUNT,
            user=USERNAME,
            password=PASSWORD,
            network_timeout=30,
        )
        sql = Path("./uu_query.sql").read_text()
        cur = ctx.cursor()
        cur.execute(
            sql,
            (
                since,
                until,
            ),
        )
        df = cur.fetch_pandas_all()
        return df
    finally:
        cur.close()


with st.form(key="uu_form"):
    query_start_since = st.date_input("UUè¨ˆç®—ï¼ˆå§‹ç‚¹ï¼‰", datetime.date(2023, 1, 1))
    query_start_until = st.date_input("UUè¨ˆç®—ï¼ˆçµ‚ç‚¹ï¼‰", datetime.date(2023, 1, 7))
    submit = st.form_submit_button(label="UUæŠ½å‡º")

if submit:
    df = fetch_data(since=query_start_since, until=query_start_until)

    fig = plt.figure(figsize=(6, 18))
    sns.set_theme()
    sns.set(font_scale=0.8)
    sns.barplot(x="UU", y="TABLE_NAME", data=df)
    st.pyplot(fig)

    # DataFrameã‚’è¡¨å½¢å¼ã§è¡¨ç¤º
    st.write("Top5")
    st.dataframe(df.head(5))

åŸºæœ¬çš„ã«ã¯ãƒ‡ãƒ¼ã‚¿ã‚’å¼•ã£å¼µã£ã¦ãã¦ç°¡å˜ã«åŠ å·¥ã—ã¦å¯è¦–åŒ–ã—ã¦ã„ã‚‹ã ã‘ã§ã™ãŒã€ã„ãã¤ã‹ã®ç‚¹ã‚’è£œè¶³ã—ã¾ã™ã€‚

Streamlitã®form

ã¾ãšã¯formã«ã¤ã„ã¦ã§ã™ã€‚formã¯Streamlitã®æ¯”è¼ƒçš„æœ€è¿‘ã®æ©Ÿèƒ½ã‚‰ã—ãã€è¦ã™ã‚‹ã«ã‚³ãƒ¼ãƒ‰ã®å†è©•ä¾¡ã‚’ãƒœã‚¿ãƒ³ã‚’æŠ¼ã™ã¾ã§é…å»¶ã•ã›ã‚‹ãŸã‚ã®ã‚‚ã®ã§ã™ã€‚

blog.streamlit.io

date_inputã‚’å«ã‚æ™®é€šã®Streamlitã®å…¥åŠ›ç”¨ã‚ªãƒ–ã‚¸ã‚§ã‚¯ãƒˆã¯ã€å…¥åŠ›ã‚’å¤‰ãˆã‚‹ãŸã³ã«ã‚³ãƒ¼ãƒ‰ã®å†è©•ä¾¡ãŒèµ°ã‚Šã¾ã™ã€‚ã—ã‹ã—ã€ã“ã®å‡¦ç†ãŒé‡ã‹ã£ãŸã¨ã™ã‚‹ã¨ãƒ¦ãƒ¼ã‚¶ã¯ä¸å¿«ã§ã™ã—é‡ã„è¨ˆç®—ã‚’ã™ã‚‹ã‚¤ãƒ³ãƒ•ãƒ©ã‚‚å¤§å¤‰ã§ã™ã€‚ã“ã“ã§formã‚’ä½¿ã†ã¨ã€submitã‚’æŠ¼ä¸‹ã—ãŸå¾Œã®ã¿å†è©•ä¾¡ã•ã‚Œã‚‹ã‚ˆã†ã«ã§ãã¾ã™ã€‚ä»Šå›žã®ç”¨é€”ã§ã„ã†ã¨ã€æ—¥ä»˜è¨å®šã‚’å‹•ã‹ã™ãŸã³ã«SQLãŒç™ºè¡Œã•ã‚Œè¨ˆç®—ãƒªã‚½ãƒ¼ã‚¹ã‚’é£Ÿã†æŒ™å‹•ã‚’é¿ã‘ã‚‰ã‚Œã¾ã™ã€‚

UUè¨ˆç®—ç”¨ã®SQL

æ¬¡ã«UUè¨ˆç®—ç”¨ã®SQLã«ã¤ã„ã¦ã§ã™ã€‚Pythonã‹ã‚‰Snowflakeã«SQLã‚’ç™ºè¡Œã™ã‚‹ã«ã¯Pythonã‚³ãƒã‚¯ã‚¿ã‚’ä½¿ã„ã¾ã™ã€‚ https://docs.snowflake.com/ja/user-guide/python-connector.html ã“ã®ã‚³ãƒã‚¯ã‚¿ãƒ©ã‚¤ãƒ–ãƒ©ãƒªã¯PEP-249ã‚’å®Ÿè£…ã—ã¦ã„ã‚‹ã®ã§ã€ä¸€èˆ¬çš„ãªPythonã§ãƒ‡ãƒ¼ã‚¿ãƒ™ãƒ¼ã‚¹ã‚’è§¦ã‚‹ã‚³ãƒ¼ãƒ‰ã¨æ›¸ãã“ã¨ã¯ã»ã¼åŒã˜ã§ã™ã€‚ã¡ã‚‡ã£ã¨ã—ãŸä¾¿åˆ©é–¢æ•°ã¨ã—ã¦ã€SQLã®å®Ÿè¡Œçµæžœã‚’Pandasã®DataFrameã«å¤‰æ›ã—ã¦ãã‚Œã‚‹é–¢æ•°fetch_pandas_allãŒã‚ã‚Šã¾ã™ã€‚ä»Šå›žã¯ã“ã‚Œã‚‚ä½¿ã£ã¦ã¿ã¾ã—ãŸã€‚

å¤–éƒ¨ãƒ•ã‚¡ã‚¤ãƒ«ã«ç½®ã„ã¦ã„ã‚‹uu_query.sqlã¯ã€ãŠãŠã‚€ãä»¥ä¸‹ã®ã‚ˆã†ã«ãªã£ã¦ã„ã¾ã™ã€‚

with summary_table as (
    select table_name
    from account_usage.tables
    where table_schema ilike 'summary'
        and deleted is null
),
table_access_event as (
    select user_name,
        query_start_time,
        split_part(boa.value:objectName, '.', 3) as table_name
    from access_history hist,
        lateral flatten(input => hist.base_objects_accessed) boa
    where boa.value:objectDomain = 'Table'
),
uu_per_table as (
    select table_name,
        count(distinct user_name) as uu
    from table_access_event
    where query_start_time between %s::date and %s::date
    group by table_name
)
select st.table_name as table_name,
    nvl(uu, 0) as uu
from summary_table st
    left join uu_per_table ut on st.table_name = ut.table_name
order by uu desc,
    table_name;

ã“ã®ã‚¯ã‚¨ãƒªãŒä½•ã‚’ã‚„ã£ã¦ã„ã‚‹ã‹ã§ã™ãŒã€ã¾ãštable_access_eventå¼ã§ã¯ACCESS_HISTORYãƒ“ãƒ¥ãƒ¼ã‹ã‚‰ãƒ†ãƒ¼ãƒ–ãƒ«ã¸ã®ã‚¢ã‚¯ã‚»ã‚¹ã‚’å…¨ã¦æŠ½å‡ºã—ã¦ã„ã¾ã™ã€‚ ã‚¢ã‚¯ã‚»ã‚¹å¯¾è±¡ã¯base_objects_accessedã‚«ãƒ©ãƒ ã§ç‰¹å®šã§ãã¾ã™ãŒã€ã“ã®ã‚«ãƒ©ãƒ ã¯VARIANTåž‹ã®é…åˆ—ã«ãªã£ã¦ã„ã¾ã™ã€‚VARIANTã¯Snowflakeã«ãŠã‘ã‚‹åŠæ§‹é€ åŒ–ãƒ‡ãƒ¼ã‚¿åž‹ã§ã™ã€‚ã¤ã¾ã‚ŠJSONã®ã‚ˆã†ãªã‚‚ã®ã§ã™ã€‚1ã¤ã®ã‚¯ã‚¨ãƒªã§ã¯è¤‡æ•°ã®ãƒ†ãƒ¼ãƒ–ãƒ«ã‚„ãƒ“ãƒ¥ãƒ¼ãªã©ï¼ˆSnowflakeã§ã¯ãã‚Œã‚‰ã‚’ã¾ã¨ã‚ã¦ã‚ªãƒ–ã‚¸ã‚§ã‚¯ãƒˆã¨å‘¼ã¶ã‚ˆã†ã§ã™ï¼‰ã«ã‚¢ã‚¯ã‚»ã‚¹ã™ã‚‹ã“ã¨ãŒã‚ã‚‹ã®ã§ã€ãã®æƒ…å ±ã‚’å…¨ã¦é…åˆ—ã®å½¢ã§è©°ã‚è¾¼ã‚“ã§ã„ã‚‹ã‚ˆã†ã§ã™ã€‚

é…åˆ—ã‚’åˆ†è§£ã—ãŸã„ã¨ãã«Snowflakeã§ã¯FLATTENé–¢æ•°ã‚’ä½¿ã„ã¾ã™ã€‚åˆ†è§£ã—ãŸçµæžœã®ã†ã¡ä»Šå›žã¯ãƒ†ãƒ¼ãƒ–ãƒ«ã¸ã®ã‚¢ã‚¯ã‚»ã‚¹ã ã‘ã«é–¢å¿ƒãŒã‚ã‚‹ã®ã§ã€where boa.value:objectDomain = 'Table'ã§ãƒ•ã‚£ãƒ«ã‚¿ã—ã¦ã„ã¾ã™ã€‚

split_part(boa.value:objectName, '.', 3) as table_nameã¯å°‘ã—æ‰‹æŠœãã—ã¾ã—ãŸã€‚Snowflakeã«ãŠã‘ã‚‹å®Œå…¨ä¿®é£¾ã•ã‚ŒãŸã‚ªãƒ–ã‚¸ã‚§ã‚¯ãƒˆåã¯ <ãƒ‡ãƒ¼ã‚¿ãƒ™ãƒ¼ã‚¹å>.<ã‚¹ã‚ãƒ¼ãƒžå>.<ã‚ªãƒ–ã‚¸ã‚§ã‚¯ãƒˆå> ã®å½¢å¼ã‚’ã¨ã‚‹ãŸã‚.ã§åˆ†è§£ã—ã¦3ç•ªç›®ã‚’ã¨ã£ã¦ã„ã¾ã™ãŒã€Snowflakeã¯ã‚¯ã‚ªãƒ¼ãƒˆã™ã‚‹ã“ã¨ã§ã»ã¼ä»»æ„ã®æ–‡å—ã‚’è˜åˆ¥åã«ä½¿ã†ã“ã¨ãŒã§ãã¾ã™ã€‚ã—ãŸãŒã£ã¦.ã§ã®åˆ†å‰²ã¯ä¸æ£ç¢ºã§ã™ãŒã€ä»Šå›žã®ãƒ‡ãƒ¢ã®ç¯„å›²ã§ã¯å•é¡Œã«ãªã‚‰ãªã„ã®ã§ã“ã®ã¾ã¾ã«ã—ã¦ãŠãã¾ã™ã€‚

summary_tableså¼ã§ã¯æŠ½å‡ºå¯¾è±¡ã®ãƒ†ãƒ¼ãƒ–ãƒ«ã‚’æŒ‡å®šã—ã¦ã„ã¾ã™ã€‚ä»Šå›žã¯summaryã¨ã„ã†ã‚¹ã‚ãƒ¼ãƒžã«ã‚ã‚‹ãƒ†ãƒ¼ãƒ–ãƒ«ã®ã†ã¡å‰Šé™¤ã•ã‚Œã¦ã„ãªã„ã‚‚ã®ã‚’å¯¾è±¡ã«ã—ã¾ã™ã€‚

â€» ã“ã®SQLã¯ç¤¾å†…ãƒ‡ãƒ¼ã‚¿ã®éƒ½åˆä¸Šã„ãã¤ã‹ã®æ”¹å¤‰ã‚’è¡Œã£ã¦ã„ã¾ã™ï¼ˆçµæžœã«æœ¬è³ªçš„ãªå½±éŸ¿ã¯ã‚ã‚Šã¾ã›ã‚“ï¼‰ã€‚

ãã®ä»–

ç’°å¢ƒå¤‰æ•°ã®èªã¿å‡ºã—ã«ã¯dotenvã‚’ä½¿ã£ã¦ã„ã¾ã™
%s::dateã¯CASTå¼ã«ã‚ˆã‚‹DATEåž‹ã¸ã®åž‹å¤‰æ›ã®ã‚·ãƒ³ã‚¿ãƒƒã‚¯ã‚¹ã‚·ãƒ¥ã‚¬ãƒ¼ã§ã™ã€‚%sã¯SQLç™ºè¡Œã®ãŸã‚ã®ãƒ—ãƒ¬ãƒ¼ã‚¹ãƒ›ãƒ«ãƒ€ã§ã™ãŒã€ã“ã‚Œã¯PEP-249ã®ä»•æ§˜ã«åŸºã¥ã„ã¦ã„ã¾ã™ã€‚

å‡ºåŠ›ä¾‹

ä¾‹ãˆã°ã“ã†ã„ã£ãŸå‡ºåŠ›ãŒå¾—ã‚‰ã‚Œã¾ã—ãŸã€‚ãƒ†ãƒ¼ãƒ–ãƒ«åã«ã¯å¤–éƒ¨ã«å‡ºã›ãªã„éƒ¨åˆ†ã‚‚ã‚ã£ãŸã®ã§é»’å¡—ã‚Šã«ã—ã€ã‚°ãƒ©ãƒ•ã®ä¸Šã®æ–¹ã ã‘åˆ‡ã‚Šå–ã£ãŸã‚‚ã®ã‚’æŽ²è¼‰ã—ã¦ã„ã¾ã™ã€‚

æ¨ªè»¸ã¯è¦‹åˆ‡ã‚Œã¦ã„ã¾ã™ãŒæœ€å¤§å€¤14ã§ã™ã€‚ã„ãã¤ã‹ã®éƒ¨ç½²ã®åˆ†æžæ‹…å½“è€…ã«æ¯Žæ—¥æ´»ç”¨ã•ã‚Œã¦ã„ãã†ãªãƒ†ãƒ¼ãƒ–ãƒ«ãŒã‚ã‚‹ä¸€æ–¹ã§ã€å‚ç…§ãŒã¾ã‚Œãªãƒ†ãƒ¼ãƒ–ãƒ«ã‚‚è¤‡æ•°è¦‹ã¤ã‹ã‚Šã¾ã—ãŸã€‚

å®Ÿã¯ã“ã®æ‰‹æ³•ã§ã‚«ãƒãƒ¼ã§ããªã„ç‚¹ã«ã¤ã„ã¦

ç†è€…ã®çŸ¥ã‚‹é™ã‚Šã«ãŠã„ã¦ã€ACCESS_HISTORYã‚’ãã®ã¾ã¾ä½¿ã†ã ã‘ã ã¨ã„ãã‚‰ã‹ä¸éƒ½åˆãŒã‚ã‚‹äº‹ãŒã‚ã‹ã£ã¦ã„ã¾ã™ã€‚

ä¸€ã¤ã¯ã‚¿ã‚¹ã‚¯ã§ã™ã€‚Snowflakeã«ã¯SQLã‚’å®šæœŸå®Ÿè¡Œã™ã‚‹ã‚¹ã‚±ã‚¸ãƒ¥ãƒ¼ãƒ©çš„ãªæ©Ÿèƒ½ï¼ˆã‚¿ã‚¹ã‚¯ï¼‰ãŒã‚ã‚‹ã®ã§ã™ãŒã€ã‚¿ã‚¹ã‚¯ã®å®Ÿè¡Œã¯ç‰¹åˆ¥ãªãƒ¦ãƒ¼ã‚¶ã§ã‚ã‚‹SYSTEMã«ã‚ˆã£ã¦å®Ÿè¡Œã•ã‚Œã¾ã™ã€‚ã“ã®ã¨ãACCESS_HISTORYã«ã‚‚SYSTEMãƒ¦ãƒ¼ã‚¶ãŒè¨˜éŒ²ã•ã‚Œã¾ã™ã€‚ã“ã®æŒ™å‹•ã¯ã‚ã‚‹æ„å‘³ã‚‚ã£ã¨ã‚‚ã§ã¯ã‚ã‚‹ã‚‚ã®ã®ã€åˆ©ç”¨å®Ÿæ…‹ã‚’æŠŠæ¡ã—ãŸã„ã¨ã„ã†ä»Šå›žã®ç›®çš„ã«ã¯å‘ãã¾ã›ã‚“ã€‚çŸ¥ã‚ŠãŸã„ã®ã¯ã‚¿ã‚¹ã‚¯ã‚’ç™»éŒ²ã—ã¦ãã®ãƒ†ãƒ¼ãƒ–ãƒ«ã‚’å‚ç…§ã—ãŸã„ã¨è€ƒãˆãŸãƒ¦ãƒ¼ã‚¶æ•°ã§ã‚ã£ã¦ã€SYSTEMãƒ¦ãƒ¼ã‚¶ãŒå®Ÿè¡Œã—ãŸäº‹å®Ÿã§ã¯ãªã„ã‹ã‚‰ã§ã™ã€‚

ã‚‚ã†ä¸€ã¤ã¯Snowsightã§ã™ã€‚Snowsightã®å†…éƒ¨çš„ãªæŒ™å‹•ã¨ã—ã¦ã€WORKSHEETS_APP_USERã¨ã„ã†ãƒ¦ãƒ¼ã‚¶ã‚’çµŒç”±ã—ã¦ã‚¯ã‚¨ãƒªã‚’ç™ºè¡Œã™ã‚‹ã“ã¨ãŒã‚ã‚‹ã‚ˆã†ã§ã™ã€‚

https://community.snowflake.com/s/question/0D53r0000BZaHFgCQN/snowsight-specific-who-is-the-worksheetsappuser

ã“ã“ã®è©±ã«ã‚ˆã‚‹ã¨ã€ã©ã†ã‚‚å†…éƒ¨çš„ãªã‚ãƒ£ãƒƒã‚·ãƒ¥ç‰ã«ä½¿ã£ã¦ã„ã‚‹ã‚‰ã—ã„ã§ã™ãŒã€ãã†ãªã‚‹ã¨å‚ç…§ã‚’ã©ã†æ•°ãˆã‚Œã°ã„ã„ã®ã‹è‡ªæ˜Žã§ã¯ãªããªã£ã¦ã—ã¾ã„ã¾ã™ã€‚

ã¾ã¨ã‚

Streamlitã§ç°¡å˜ãªãƒ‡ãƒ¢ã‚µã‚¤ãƒˆã‚’æ›¸ãã¾ã—ãŸ

ãŸã ã—ã€Snowflakeã®ä½¿ã„æ–¹ã«ã‚ˆã£ã¦ã¯ç´ ç›´ãªåˆ©ç”¨å®Ÿæ…‹èª¿æŸ»ã«é›£ãŒã‚ã‚‹éƒ¨åˆ†ã‚‚ã‚ã‚Šã¾ã—ãŸã€‚ã“ã®è¾ºã‚Šã¯æ‰‹å…ƒã§è»½ãå®Ÿé¨“ã™ã‚‹é™ã‚Šã ã¨æŒ™å‹•ãŒã‚ˆãã‚ã‹ã‚‰ãªã‹ã£ãŸã®ã§ã€ãƒ€ãƒƒã‚·ãƒ¥ãƒœãƒ¼ãƒ‰ã‚’æ•´å‚™ã™ã‚‹ã«ã¯è¦èª¿æŸ»ï¼ˆã‚ã‚‹ã„ã¯Snowflakeç¤¾ã¸ã®å•ã„åˆã‚ã›ãŒå¿…è¦ï¼‰ãªã¨ã“ã‚ã‹ã‚‚ã—ã‚Œã¾ã›ã‚“ã€‚

ã‚‚ã¡ã‚ã‚“ã€è‡ªå‹•åŒ–ã®å¾¹åº•ãªã©ã€å°‘ãªã„äººæ•°ã§åŠ¹çŽ‡çš„ã«æˆæžœã‚’å‡ºã™ãŸã‚ã«ã§ãã‚‹ã“ã¨ã¯ãŸãã•ã‚“ã‚ã‚‹å‰æã§ã¯ã‚ã‚Šã¾ã™ã€‚â†©
ãŸã¶ã‚“æœ¬å½“ã¯å‰¯ä½œç”¨ã‚’æŽ’é™¤ã—ãŸã»ã†ãŒæŒ¯ã‚‹èˆžã„ãŒå˜ç´”ã«ãªã£ã¦ä¾¿åˆ©ãªã¯ãšï¼ˆä¾‹ãˆã°ä¹±æ•°ã®ã‚·ãƒ¼ãƒ‰å€¤ã¯å›ºå®šã—ãŸã»ã†ãŒã„ã„ã‹ã‚‚ã—ã‚Œã¾ã›ã‚“ï¼‰ã§ã™ãŒã€ã“ã®ã‚µãƒ³ãƒ—ãƒ«ã§ã¯æ‰‹æŠœãã—ã¦ã„ã¾ã™ã€‚â†©

ãƒ‡ãƒ¼ã‚¿ã®éœ€è¦ã¯ã„ã¤ã®é–“ã«ã‹å¤‰åŒ–ã—ã¦ã„ã‚‹å•é¡Œ

å‚è€ƒä¾‹: ç¾å®Ÿã®åˆ©ç”¨çŠ¶æ³ã‚’ãƒ‡ãƒ¼ã‚¿ãƒžãƒã‚¸ãƒ¡ãƒ³ãƒˆã«æ´»ã‹ã™

ã“ã®è¨˜äº‹ã®ãŠé¡Œ

Streamlit

Snowflakeã«ãŠã‘ã‚‹åˆ©ç”¨çŠ¶æ³ã®å–å¾—

Streamlitã‹ã‚‰Snowflakeã®SQLã‚’ç™ºè¡Œã™ã‚‹

Streamlitã®form

UUè¨ˆç®—ç”¨ã®SQL

ãã®ä»–