オンライン勉強会「datatech-jp Casual Talks #6ã€ã®ç™»å£‡è³‡æ–™ã§ã™ã€‚ https://datatech-jp.connpass.com/event/337374/ ■採用・カジュアルé¢è«‡ https://kazaneya.com/recruit ■サービスæä¾› …

ã¯ã˜ã‚㫠ドワンゴ教育事æ¥ã§ãƒ‡ãƒ¼ã‚¿ã‚¢ãƒŠãƒªã‚¹ãƒˆã¨ã—ã¦åƒã„ã¦ã„ã‚‹å°æž—ã§ã™ã€‚ ドワンゴ教育事æ¥ã«ãŠã‘るデータアナリストã¯ä¼ç”»é–‹ç™ºçµ„ç¹”ã®ä¸€å“¡ã¨ã—ã¦KPIå¯è¦–化やレãƒãƒ¼ãƒ†ã‚£ãƒ³ã‚°ãªã©ã‚’メインæ¥å‹™ã¨ã—ã¦ã„ã¾ã™ã€‚個人的ã«ã¯æ–°ãŸãªã‚µãƒ¼ãƒ“スãŒç”Ÿã¾ã‚Œã‚‹çž¬é–“ã®ãŠä»•äº‹ãŒä¸€ç•ªå¥½ãã§ã€ã€Œä½•ã®æŒ‡æ¨™ã‚’ã¿ã¦ã„ãã®ã‹ã€ã€Œã©ã‚“ãªãƒ‡ãƒ¼ã‚¿ãŒæµã‚Œã¦ãã‚‹ã®ã‹ã€ãªã©å°‘ã—上æµã®å·¥ç¨‹ã‹ã‚‰ãƒ‡ãƒ¼ã‚¿ã®å–り扱ã„を検討ã™ã‚‹ã¨ã¨ã‚‚ã«ã€æ—¢å˜ã®ãƒ€ãƒƒã‚·ãƒ¥ãƒœãƒ¼ãƒ‰ã‚’ãƒãƒ¼ã‚¸ãƒ§ãƒ³ã‚¢ãƒƒãƒ—ã™ã‚‹è‰¯ã„機会ã«ã—ãŸã‚Šã€æ–°ãŸãªã‚¹ãƒ†ãƒ¼ã‚¯ãƒ›ãƒ«ãƒ€ãƒ¼ã«å¯¾ã—ã¦è‰¯ã„データ分æžã®æ供を考ãˆãŸã‚Šã¨ã€æ¥½ã—ã„日々ãŒç¶šãã¾ã™ã€‚ ç§ãŸã¡ãƒ‰ãƒ¯ãƒ³ã‚´æ•™è‚²äº‹æ¥ã§ã¯å¤§å¦é–‹å¦ã‚„R高ã®é–‹æ ¡ãªã©å¤§ããªã‚µãƒ¼ãƒ“スリリースãŒäºˆå®šã•ã‚Œã¦ã„ã¾ã™ã®ã§ã€ã‚µãƒ¼ãƒ“ス環境ã®å¤‰åŒ–を楽ã—ã¿ãªãŒã‚‰ã‚„ã‚ŠãŒã„ã‚’ãƒã‚¸ãƒ†ã‚£ãƒ–ãªãƒ‘ワーã«å¤‰ãˆã¦ã„ããŸã„ã¨æ€ã£ã¦ã„ã¾ã™ï¼ 課題ã«ã¤ã„ã¦ï¼ˆå°Žå…¥ã«ä»£ãˆã¦ï¼‰ 昨今ã€åˆ†æžå¯¾è±¡ã¨ã—ã¦JSONæ–‡å—列をå–り扱ã†ã“ã¨ãŒå¢—ãˆã¦ãã¾
本記事ã¯ã€ãƒ‰ã‚³ãƒ¢ã‚¢ãƒ‰ãƒ™ãƒ³ãƒˆã‚«ãƒ¬ãƒ³ãƒ€ãƒ¼2024 19日目ã®è¨˜äº‹ã§ã™ðŸŽ„ ã“ã‚“ã«ã¡ã¯ï¼NTTドコモ クãƒã‚¹ãƒ†ãƒƒã‚¯é–‹ç™ºéƒ¨ã®ç•‘å…ƒã§ã™ã€‚æ¥å‹™ã§ã¯ãƒ˜ãƒ«ã‚¹ã‚±ã‚¢é ˜åŸŸã«ãŠã‘るデータ分æžã‚„AI開発を行ã£ã¦ã„ã¾ã™ã€‚ ã“ã®è¨˜äº‹ã§ã¯ãƒ™ã‚¤ã‚ºæŽ¨è«–ã«ã‚ˆã‚‹æ©Ÿæ¢°å¦ç¿’ã¨RStanを用ã„ãŸåˆ†æžä¾‹ã‚’ã”紹介ã—ã¾ã™ã€‚データサイエンス分野ã®æ–¹ã«ã¯é¦´æŸ“ã¿ã®ã‚る話ã‹ã‚‚ã—ã‚Œã¾ã›ã‚“ãŒã€ç§ã¯ã‚ˆã忘れã¦ã—ã¾ã†ã®ã§é ã®æ•´ç†ã‚‚å…¼ãã¦æ›¸ã„ã¦ã„ã“ã†ã¨æ€ã„ã¾ã™ã€‚ ※数å¼ãŒå´©ã‚Œã‚‹æ–¹ã¯ã€æ•°å¼ã®ä¸Šã§å³ã‚¯ãƒªãƒƒã‚¯ã—ã¦ã€Math Settings > Math Renderer > Common HTMLã¸è¨å®šã‚’ã”変更ãã ã•ã„ 1. ã¯ã˜ã‚ã« 2. ベイズ推論ã«ã¤ã„㦠ベイズã®å®šç† ベイズ推論 ベイズ的機械å¦ç¿’ 3. 実際ã«å‹•ã‹ã—ã¦ã¿ã‚‹ 準備 æŽ¢ç´¢çš„ãƒ‡ãƒ¼ã‚¿åˆ†æž ãƒ™ã‚¤ã‚ºç·šå½¢å›žå¸° 階層モデル 4. ãŠã‚ã‚Šã« å‚è€ƒæ›¸ç± 1. ã¯ã˜ã‚ã« è¿‘å¹´ã€AIã«é–¢ã™ã‚‹ç ”究ã¯æ€¥é€Ÿã«é€²æ©ã—ã€ã‚
dbt アドベントカレンダー 2024 11日目ã®è¨˜äº‹ã§ã™ã€‚ å‰ç½®ã 普段ã¯dbt Cloudを使ã£ã¦ã„ã¦ã€Google Cloud ã« BigQueryã¨LookerStudio ãªæŠ€è¡“スタックã§ç¤¾å†…ã®ãƒ‡ãƒ¼ã‚¿åŸºç›¤ã‚’構築・é‹ç”¨ã—ã¦ã„ã¾ã™ã€‚ データ基盤ã§æ‰±ã†Sourceã®æ‹¡å……ã‚’ã™ã‚‹ãŸã‚ã€ETL/ELT ツールをã„ãã¤ã‚‚試ã—ã¦ãŸã©ã‚Šç€ã„ãŸã®ãŒã€dltã¨ã„ã†ãƒ„ールã§ã™ã€‚ 世間ã§ã¯éžã‚¨ãƒ³ã‚¸ãƒ‹ã‚¢ã§ã‚‚ç”»é¢ä¸Šã§ãƒãƒãƒãƒè¨å®šã‚’ã—ã¦ã„ãã ã‘ã§ã€ç°¡å˜ã«ELT パイプラインãŒæ§‹ç¯‰ã§ãるサービスを使ã‚ã‚Œã¦ã„る話をよãèžãã¾ã™ã€‚エンジニアã®ã„ãªã„組織ã§ã‚‚ã€ã™ãã«å„種データをåŽé›†ã—ã¦åˆ†æžã‚’始ã‚られる点ã§ã¯é‡å®ã•ã‚Œã‚‹ã®ã§ã—ょã†ã€‚ã—ã‹ã—ãªãŒã‚‰ã€ãƒãƒ¼ãƒ メンãƒãƒ¼ãŒã‚¨ãƒ³ã‚¸ãƒ‹ã‚¢ä¸»ä½“ã®æˆ‘々ã«ã¨ã£ã¦ã€ã‚³ã‚¹ãƒˆæ„Ÿè¦šãŒãƒžãƒƒãƒã—ãªã‹ã£ãŸã€ã¨ã„ã†ã®ãŒæ£ç›´ãªã¨ã“ã‚ã§ã™ã€‚(ç§ã ã‘?) å„種SaaSã®APIã‚„DB接続をイãƒã‹ã‚‰ç”¨æ„ã—ã¦ELTパイプラ
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
ã€dbt Best Practice】How we structure our dbt projects 2024å¹´12月版 ãƒãƒƒãƒ”ãƒãƒ¼ã‚¹ãƒ‡ãƒ¼ãƒˆã‚¥ãƒŸã€œã€œã€œâ™ªãƒãƒƒãƒ”ãƒãƒ¼ã‚¹ãƒ‡ãƒ¼ãƒˆã‚¥ãƒŸã€œã€œã€œâ™ªã€ãƒãƒƒãƒ”ãƒãƒ¼ã‚¹ãƒ‡ãƒ¼ãƒ‡ã‚£ã‚¢ã‚ãŸã—〜♪ ãƒãƒƒãƒ”ãƒãƒ¼ã‚¹ãƒ‡ãƒ¼ãƒˆã‚¥ãƒŸã€œã€œã€œâ™ª ãŒãï¼ ã¡ã‚…らデータ(50)ã§ã™ã€‚ ã¤ã„ã«å¤©å‘½ã‚’知るã“ã¨ã«ãªã‚Šã¾ã—ãŸã€‚天命ナニソレオイシイノ? 昨年ã¯ã€ã€dbt Best Practice】改ã‚ã¦ã€dbt Style Guide ã‚’èªã‚“ã§ã¿ã‚‹ ã¨ã„ã†è¨˜äº‹ã‚’投稿ã—ã¾ã—ãŸã€‚ 今年ã¯ã€ã¾ãŸåˆ¥ã®Best Practiceã«ã¤ã„ã¦èªã‚“ã§ã¿ã‚ˆã†ã¨æ€ã„ã¾ã—ãŸã€‚ ã“ã®è¨˜äº‹ã¯ã€dbtアドベントカレンダー2024ã®12日目ã®è¨˜äº‹ã§ã™ã€‚ How we structure our dbt projects(dbtプãƒã‚¸ã‚§ã‚¯ãƒˆã®æ§‹é€ ) dbtプãƒã‚¸ã‚§ã‚¯ãƒˆã®æ§‹é€ ãŒãªãœé‡è¦ãªã®ã‹ 人間ãŒå”åƒã™ã‚‹ãŸã‚ã«ã¯ã€ã€Œä¸€è²«æ€§ãŒã‚ã‚Š
ã“ã®è¨˜äº‹ã¯Â ノãƒã‚»ãƒ« Advent Calendar 20日目ã§ã™ã€‚ ã¯ã˜ã‚ã« ã“ã‚“ã«ã¡ã¯ã€‚ノãƒã‚»ãƒ«ã§ãƒ‡ãƒ¼ã‚¿ã‚¨ãƒ³ã‚¸ãƒ‹ã‚¢ã‚’ã—ã¦ã„ã‚‹å°å·ã§ã™ã€‚ Dagsterã®Sensorを使ã£ã¦Timeout時ã®è‡ªå‹•ãƒªãƒˆãƒ©ã‚¤æ©Ÿèƒ½ã‚’作æˆã—ãŸãŸã‚サンプルコードã§ãã®å®Ÿè£…方法ã¨åˆ©ç‚¹ã‚’解説ã—よã†ã¨æ€ã„ã¾ã™ã€‚ 背景 ノãƒã‚»ãƒ«ã§ã¯ã€é¡§å®¢ãŒæ±‚ã‚るデータ(リクエスト)ã«å¿œã˜ã¦ã€dbtã§å®šç¾©ã—ãŸãƒ‡ãƒ¼ã‚¿ãƒ¢ãƒ‡ãƒ«ã‚’Dagster上ã§ãƒžãƒ†ãƒªã‚¢ãƒ©ã‚¤ã‚ºï¼ˆãƒ‡ãƒ¼ã‚¿ç”Ÿæˆãƒ»å¤‰æ›ãƒ»æ ¼ç´ï¼‰ã—ã¦ã„ã¾ã™ã€‚ã“ã®ãƒ•ãƒãƒ¼å…¨ä½“ã‚’Dagsterã§ç®¡ç†ã™ã‚‹ã“ã¨ã§ã€ã‚¹ã‚±ã‚¸ãƒ¥ãƒ¼ãƒ«å®Ÿè¡Œã‚„状態管ç†ã€ãƒªãƒˆãƒ©ã‚¤åˆ¶å¾¡ãªã©ã‚’一元的ã«è¡Œã£ã¦ã„ã¾ã™ã€‚ 大ã¾ã‹ãªå‡¦ç†ã¯ä»¥ä¸‹ã®æµã‚Œã§ã™ã€‚ flowchart LR A([dbtã§ãƒªã‚¯ã‚¨ã‚¹ãƒˆãƒ‡ãƒ¼ã‚¿ã‚’表ã™ãƒ¢ãƒ‡ãƒ«ã‚’作æˆ]) --> B[リクエストデータ] C[外部データ] --> D([Dagster Jobã§å‡¦ç†]) B --> D D -->
2024å¹´12月8æ—¥ã«é–‹å‚¬ã•ã‚ŒãŸISUCON14ã«ã€Œã‚¦ãƒ¼é¦¬å ´ãƒ¼ã‚¤ãƒ¼ãƒ„・ザ・ファイナルã€ã¨ã—ã¦å‚åŠ ã—ã¾ã—ãŸã€‚最終スコアã¯29,386ã§ã—ãŸã€‚実装言語ã¯Goã§ã™ã€‚ ã“ã‚“ãªPostã‚’ã—ã¦ã¾ã—ãŸãŒRustã¯æŽ¡ç”¨ã—ã¾ã›ã‚“ã§ã—ãŸï¼ˆä»Šå›žã¯ä½™è£•ãŒãªã‹ã£ãŸï¼‰ã€‚ 講談社サイエンティフィク様ã‹ã‚‰ã®ã”厚æ„ã§æ›¸ç±ã€ŒRustã«ã‚ˆã‚‹Webアプリケーション開発ã€ã‚’ã”æµè´ˆã„ãŸã ãã¾ã—ãŸã€‚早速èªã¿é€²ã‚ã¦ã¾ã™ã€‚今年ã®ISUCONã¯Rustã§æ±ºã¾ã‚Šã‹ãƒ¼ï¼ï¼Ÿ #PR https://t.co/sOAcWEqE8P pic.twitter.com/cK7V6lPMQk— matsuu (@matsuu) 2024å¹´10月8æ—¥ 今年ã®ãƒãƒ£ãƒ¬ãƒ³ã‚¸ã«ã¤ã„㦠我らãŒãƒãƒ¼ãƒ ã¯ISUCON開催ã®ãŸã³ã«æ–°ãŸãªãƒãƒ£ãƒ¬ãƒ³ã‚¸*1ã‚’ã—ã¦ã‚‹ã®ã§ã™ãŒã€ä»Šå›žã¯ä»¥ä¸‹ã®4ã¤ã«ãƒãƒ£ãƒ¬ãƒ³ã‚¸ã—ã¾ã—ãŸã€‚ ãƒã‚°è§£æžã®è¦‹ç›´ã— 生æˆAIã®å°Žå…¥ rustlsã®å°Žå…¥ bpftune
ã€ã©ã†ã™ã‚Œã°é”人ã®ã‚ˆã†ãªã‚³ãƒ¼ãƒ‰ãŒæ›¸ã‘ã‚‹ã®ã‹ï¼Ÿã€‘ 著書累計20万部を超ãˆã‚‹ã€ãƒ‡ãƒ¼ã‚¿ãƒ™ãƒ¼ã‚¹ï¼ˆDB)界ã®é”人・ミックæ°ãŒã€ 「センスã®è‰¯ã„SQLを書ã技術ã€ã‚’身ã«ã¤ã‘ã‚‹ãŸã‚ã®æ€è€ƒæ³•ã‚„å‹‰å¼·æ³•ã‚’å¤§å…¬é–‹ï¼ ã‚³ãƒ¼ãƒ‡ã‚£ãƒ³ã‚°ã‚„è¨è¨ˆã‚’è¡Œã†ä¸Šã§çŸ¥ã£ã¦ã„ã‚‹ã¨ä¸€ç”Ÿå½¹ã«ç«‹ã¤ã€ SQLã‚„RDBã®ç†è«–や哲å¦ã‚’ã‚ã‹ã‚Šã‚„ã™ã解説ã—ã¦ã„ã¾ã™ã€‚ ã€é”人ãŒè€ƒãˆã‚‹ã‚»ãƒ³ã‚¹ã®è‰¯ã„SQLã¨ã¯ï¼Ÿã€‘ 無駄ãŒãªãã€å¯èªæ€§ãŒé«˜ã„エレガントãªSQLã“ããŒç›®æŒ‡ã™ã¹ã「センスã®è‰¯ã„SQLã€ã§ã™ã€‚ ãã‚ŒãŒã€ãƒ¡ãƒ³ãƒ†ã®ã—ã‚„ã™ã•ã€ãƒ‘フォーマンスã®è‰¯ã•ã«ã¤ãªãŒã‚‹ã‹ã‚‰ã§ã™ 本書ã§ã¯ã€ã‚¨ãƒ¬ã‚¬ãƒ³ãƒˆã§ã‹ã¤ãƒã‚¤ãƒ‘フォーマンスãªSQLを実ç¾ã™ã‚‹æŠ€è¡“ã¨ã—ã¦ã€ã€ SQLã®æ›¸ãã‚„ã™ã„é †åºã€åŠ¹çŽ‡çš„ãªã‚¯ã‚¨ãƒªã®æ›¸ãæ–¹ã€ä¿å®ˆã—ã‚„ã™ã„コード〠é©åˆ‡ãªã‚¤ãƒ³ãƒ‡ãƒƒã‚¯ã‚¹æˆ¦ç•¥ã€å®Ÿè¡Œè¨ˆç”»ã®é‡è¦æ€§ã€ç„¡é™ã®ã‚¹ã‚±ãƒ¼ãƒ©ãƒ“リティ ç‰ã‚’解説ã—ã¦ã„ã¾ã™ã€‚ ã€æœ¬æ›¸ã®ç‰¹å¾´ã€‘ 1テーマã”ã¨ã«ã€ã¾ãšã‚µãƒžãƒªãƒ¼ï¼‹ã‚¤ãƒ¡ãƒ¼ã‚¸å›³ï¼ˆã‚¤
ã“ã‚“ã«ã¡ã¯ã€ Ubie ã§ã‚½ãƒ•ãƒˆã‚¦ã‚§ã‚¢ã‚¨ãƒ³ã‚¸ãƒ‹ã‚¢ã‚’ã—ã¦ã„ã‚‹ syu_cream ã§ã™ã€‚ 最近ã¯ç¤¾å†…ã®ãƒ‡ãƒ¼ã‚¿åˆ†æžåŸºç›¤ã®ãƒªãƒ¼ãƒ‰ãªã©ã‚’ã‚„ã£ã¦ãŠã‚Šã¾ã™ã€‚ 本記事ã§ã¯ã€ã¾ã•ã«ãã®ãƒ‡ãƒ¼ã‚¿åˆ†æžåŸºç›¤ã«ã¤ã„ã¦æ¦‚è¦ã¨æŠ€è¡“的構æˆã€ä»Šå¾Œã«ã¤ã„ã¦ã€æœ€è¿‘ã®äº‹æƒ…ã‚’è¸ã¾ãˆãªãŒã‚‰ç´¹ä»‹ã—ã¾ã™ã€‚社内データ基盤ã«é–¢ã‚る開発・é‹ç”¨ã«é–¢ã‚るソフトウェアエンジニアã®æ–¹ã‚„ã€åˆ†æžãƒ¦ãƒ¼ã‚¹ã‚±ãƒ¼ã‚¹ã§åˆ©ç”¨ã™ã‚‹ãƒ‡ãƒ¼ã‚¿ã‚¢ãƒŠãƒªã‚¹ãƒˆãªã©ã€ç¤¾å†…ã®ãƒ‡ãƒ¼ã‚¿åˆ†æžç’°å¢ƒã«é–¢ã‚る人々ã«ã¨ã£ã¦ä½•ã‹å‚考ã«ãªã‚‹è¨˜äº‹ã¨ãªã‚Œã°å¹¸ã„ã§ã™ã€‚ Ubie ã®ãƒ‡ãƒ¼ã‚¿åˆ†æžåŸºç›¤ã¨ã¯ Ubie ã¯ãƒ‡ãƒ¼ã‚¿ã®ä¼šç¤¾ã§ã™ã€‚ãã‚Œã¯å‹æ‰‹ã«åƒ•ãŒãã†åä¹—ã£ã¦ã„る訳ã§ã¯ãªãã€ç¤¾å†…ã§ã‚‚ãã†ã—ãŸèªè˜ãŒã‚ã‚Šã€äº‹æ¥ã‚’支ãˆã‚‹ã‚³ã‚¢ã«ãƒ‡ãƒ¼ã‚¿ã®è“„ç©ã¨åˆ©æ´»ç”¨ãŒã‚ã‚Šã¾ã™ã€‚データ利活用ã®ã‚·ãƒ¼ãƒ³ã¨ã—ã¦ã¯ã€ãƒ‡ãƒ¼ã‚¿ã«åŸºã¥ã事æ¥ã‚„プãƒãƒ€ã‚¯ãƒˆã®æ–¹å‘性付ã‘ã‚‚ã‚ã‚Šã¾ã™ã—ã€ã‚‚ã£ã¨ Ubie 特有事情ã§è¨€ã†ã¨ã€Œæ‚£è€…ã®ã‚¸ãƒ£ãƒ¼ãƒ‹ãƒ¼ã‚’データã§æ‰ãˆã€è£½è–¬ä¼æ¥
[登壇レãƒãƒ¼ãƒˆ]Data Engineering Study # 27ã§2024å¹´ã®Modern Data Stackã®ã‚¢ãƒƒãƒ—ãƒ‡ãƒ¼ãƒˆæƒ…å ±ã‚’æŒ¯ã‚Šè¿”ã£ã¦ãã¾ã—㟠#DataEngineeringStudy #01pN ã•ãŒã‚‰ã§ã™ã€‚ 2024å¹´12月10æ—¥ã«ã€primeNumber社主催ã®ã‚¤ãƒ™ãƒ³ãƒˆã€Œ01(zeroONE) 2024ã€ãŒé–‹å‚¬ã•ã‚Œã¾ã—ãŸã€‚ ã“ã®ã‚¤ãƒ™ãƒ³ãƒˆã®ä¸ã§Data Engineering Study #27ã‚‚åˆã®ã‚ªãƒ•ãƒ©ã‚¤ãƒ³é–‹å‚¬ã®å½¢å¼ã§è¡Œã‚ã‚Œã€ãã®ä¸ã§ç§ã¯ã€Œã‚¯ãƒ©ãƒ¡ã‚½ã•ãŒã‚‰æ°ãŒèªžã‚‹ï¼2024å¹´ã®Modern Data Stackを振り返ã‚ã†ï½žåˆ†é‡Žåˆ¥ã®ç›®çŽ‰ã‚¢ãƒƒãƒ—ãƒ‡ãƒ¼ãƒˆæƒ…å ±ã¾ã¨ã‚~ã€ã¨ã„ã†ã‚»ãƒƒã‚·ãƒ§ãƒ³ã‚¿ã‚¤ãƒˆãƒ«ã§ç™»å£‡ã‚’ã—ã¦ãã¾ã—ãŸã€‚ 本記事ã§ã¯ã“ã®ç™»å£‡è³‡æ–™ã¨ç™»å£‡ã‚’終ãˆã¦ã®æ‰€æ„Ÿã«ã¤ã„ã¦ã¾ã¨ã‚ã¾ã™ã€‚ 登壇資料 登壇を終ãˆã¦ ã¾ãšã€å¤§å¤‰å¤šãã®æ–¹ã«ç¾åœ°ã§èžã„ã¦é ‚ã‘ã¦ã¨ã¦ã‚‚嬉ã—ã‹ã£ãŸã§ã™ï¼ç¾åœ°ã§è´è¬›é ‚ã„
ã“ã‚“ã«ã¡ã¯ã€‚NTTコミュニケーションズã§ã‚¨ãƒãƒ³ã‚¸ã‚§ãƒªã‚¹ãƒˆã‚’ã‚„ã£ã¦ã„る西塚ã§ã™ã€‚今日ãŒ10å¹´ç›®ã®çµå©šè¨˜å¿µæ—¥ã§ã™ã€‚ ã“ã®è¨˜äº‹ã¯ã€NTT Communications Advent Calendar 2024 6日目ã®è¨˜äº‹ã§ã™ã€‚ æƒ…å ±é€šä¿¡ç™½æ›¸ã«ã‚ˆã‚‹ã¨ã€ãƒ‡ã‚¸ã‚¿ãƒ«ãƒ‡ãƒ¼ã‚¿ã®æ´»ç”¨ãŒä¼æ¥çµŒå–¶ã«å¯¾ã—ã¦åŠ¹æžœãŒã‚ã‚‹ã¨è¤‡æ•°ã®å…ˆè¡Œç ”究ã§æ˜Žã‚‰ã‹ã«ã•ã‚Œã¦ã„ã¾ã™ã€‚ ビッグデータを活用ã—ã¦ã„ã‚‹ä¼æ¥ã¯ãã†ã§ãªã„ä¼æ¥ã«æ¯”ã¹ã¦ã€ã‚¤ãƒŽãƒ™ãƒ¼ã‚·ãƒ§ãƒ³ã®å‰µå‡ºãŒçµ±è¨ˆå¦çš„ã«æœ‰æ„ãªå·®ã§å¤šã„ã¨è¨€ã‚ã‚Œã¦ã„ã¾ã™ã€‚ ç§è‡ªèº«ã‚‚NTTコミュニケーションズã«ãŠã„ã¦å…¨ç¤¾ãƒ‡ãƒ¼ã‚¿åŸºç›¤ã‚’ç«‹ã¡ä¸Šã’ã¦ã€ç¤¾å†…システムã‹ã‚‰ãƒ‡ãƒ¼ã‚¿ã‚’åŽé›†ã—〠データサイエンティストã¨å”力ã—ãªãŒã‚‰ã€è“„ç©ã•ã‚ŒãŸè†¨å¤§ãªãƒ‡ãƒ¼ã‚¿ã‚’活用ã—ã¦ãƒ“ジãƒã‚¹ä¾¡å€¤ã‚’生ã¿å‡ºã™å–り組ã¿ã‚’è¡Œã£ã¦ãã¾ã—ãŸã€‚ ã•ã¦ã€è¿‘å¹´ã®ç”ŸæˆAIブームã«ä¹—ã‚Šã€ãƒ‡ãƒ¼ã‚¿ã‚µã‚¤ã‚¨ãƒ³ãƒ†ã‚£ã‚¹ãƒˆé”ã¯å¾“æ¥ã®æ©Ÿæ¢°å¦ç¿’・AI技術ã«åŠ ãˆã¦ç”ŸæˆAIをデータ活用ã«åˆ©ç”¨
ã“ã‚“ã«ã¡ã¯ã€‚Data Engineeringãƒãƒ¼ãƒ ã®æ²³é‡Ž(@matako1124) ã§ã™ï¼ 今年ã®Data Engineeringæ¥å‹™ã¨ã—ã¦ãƒ‡ãƒ¼ã‚¿ãƒžãƒã‚¸ãƒ¡ãƒ³ãƒˆã‹ã‚‰ãƒ‡ãƒ¼ã‚¿æ´»ç”¨ä¿ƒé€²ã®ä»•çµ„ã¿åŒ–ã¾ã§å¹…広ã活動ã—ã¦ãã¾ã—ãŸãŒã€ãã®ä¸ã§ã‚‚特ã«äº‹æ¥ã«ã‚¤ãƒ³ãƒ‘クトã®å¤§ãã„変é©ã®ãŠè©±ã‚’ã—ã¦ã„ã“ã†ã¨æ€ã„ã¾ã™ã€‚ çµè«–ã‹ã‚‰è¨€ã†ã¨ã€Supersetã®æ–°è¦å°Žå…¥ã¨Redashã‹ã‚‰ã®ä¹—ã‚Šæ›ãˆã‚’試ã¿ã¦ã„ã¾ã™ã€‚ æ³¨æ„ åŸ·ç†ã«å½“ãŸã‚Šç´°å¿ƒã®æ³¨æ„を払ã£ã¦ãŠã‚Šã¾ã™ãŒã€ä¸å分ãªèª¬æ˜Žã‚„誤りãŒã‚ã‚‹å¯èƒ½æ€§ã‚‚ã”ã–ã„ã¾ã™ã€‚ 記事内ã§ç´¹ä»‹ã—ã¦ã„るコードã¯éƒ¨åˆ†çš„ãªã‚‚ã®ã§ã™ã€‚å‚考程度ã«ã”å‚ç…§ãã ã•ã„。 目次 2024年時点ã§ã®Luupã®ãƒ‡ãƒ¼ã‚¿åŸºç›¤ã®ã”紹介 ç¾çŠ¶ã®èª²é¡Œ Supersetå°Žå…¥ã®ç›®çš„ã¨ç†ç”± 構築事例 Superset推ã—機能 Superset改善ã—ãŸã„機能 ã¾ã¨ã‚ã€ä»Šå¾Œã®æ–½ç– 終ã‚ã‚Šã« 2024年時点ã§ã®Luupã®ãƒ‡ãƒ¼ã‚¿åŸºç›¤ã®ã”紹介 本編ã«å…¥
DataOps Night #5 ã®ç™»å£‡è³‡æ–™ã§ã™ã€‚ https://finatext.connpass.com/event/333016/
ã¯ã˜ã‚ã« ã“ã‚“ã«ã¡ã¯ï¼ã€€æ±äº¬å·¥æ¥å¤§å¦ï¼ˆæ±äº¬ç§‘å¦å¤§å¦ç†å·¥å¦ç³»ï¼‰ç†å¦é™¢ç‰©ç†å¦ç³» 修士1å¹´ã®æ¾æœ¬ä¾‘真ã§ã™ã€‚2024å¹´8月26æ—¥ã‹ã‚‰6週間ã€ç§ã¯ã‚¢ãƒŠãƒªãƒ†ã‚£ã‚¯ã‚¹ã‚¨ãƒ³ã‚¸ãƒ‹ã‚¢ãƒªãƒ³ã‚°1(AE1)ãƒãƒ¼ãƒ ã®ã‚¤ãƒ³ã‚¿ãƒ¼ãƒ³ã‚·ãƒƒãƒ—ã«å‚åŠ ã—ã¾ã—ãŸã€‚本記事ã§ã¯ã€ETLパイプラインå†è¨è¨ˆã®å–り組ã¿ã‚’紹介ã—ã¾ã™ã€‚ 背景 AE1ãƒãƒ¼ãƒ ã®ãƒŸãƒƒã‚·ãƒ§ãƒ³ AE1ãƒãƒ¼ãƒ ã®ãƒŸãƒƒã‚·ãƒ§ãƒ³ã®ä¸€ã¤ã¯ã€ã€Œãƒ‡ãƒ¼ã‚¿ãƒ¢ãƒ‡ãƒªãƒ³ã‚°ã‚’活用ã—ãŸETLパイプラインã®å†è¨è¨ˆã«ã‚ˆã‚‹åˆ†æžã‚³ã‚¹ãƒˆå‰Šæ¸›ã¸ã®è²¢çŒ®ã€ã§ã™ã€‚今回ã®ã‚¤ãƒ³ã‚¿ãƒ¼ãƒ³ã‚·ãƒƒãƒ—ã§ã¯ã€ãã®å–り組ã¿ã®ä¸€ç’°ã¨ã—ã¦LINEå…¬å¼ã‚¢ã‚«ã‚¦ãƒ³ãƒˆäº‹æ¥ã«é–¢ä¿‚ã™ã‚‹ETLパイプラインã®å†è¨è¨ˆã‚’è¡Œã„ã¾ã—ãŸã€‚ETLã¯ãƒ‡ãƒ¼ã‚¿åˆ†æžã®åŸºç›¤ã§ã‚ã‚Šã€ãƒ‡ãƒ¼ã‚¿ã®æŠ½å‡ºãƒ»å¤‰æ›ãƒ»æ ¼ç´ã¾ã§ã®é‡è¦ãªå„工程を指ã—ã¾ã™ã€‚ETLパイプラインをé©åˆ‡ã«è¨è¨ˆã™ã‚‹ã“ã¨ã«ã‚ˆã‚Šã€ãƒ‡ãƒ¼ã‚¿æ´»ç”¨ã«ãŠã„ã¦æ¬¡ã®ã‚ˆã†ãªãƒ¡ãƒªãƒƒãƒˆãŒå¾—られã¾ã™ã€‚ å¯ç”¨æ€§ãƒ»è€éšœå®³æ€§ã®é«˜ã„データ分æžåŸºç›¤ã‚’æä¾›ã§ãるメン
dbt-bigquery-monitoring helps you to monitor your BigQuery compute and storage assetsIntroductionI’ve been using BigQuery for eight years, and it’s been an incredible platform for working with data at scale using SQL. Running queries and creating tables for analytics and data products is remarkably easy. The advent of dbt has further simplified creating complex workflows for many data practitioner
ã¾ã¨ã‚ 圧縮ã•ã‚ŒãŸè¤‡æ•°ã® JSON Lines ã‚’èªã¿è¾¼ã‚ã‚‹ S3 ã‹ã‚‰ç›´æŽ¥èªã¿è¾¼ã‚ã‚‹ 好ããªã‚¿ã‚¤ãƒŸãƒ³ã‚°ã§ Parquet ã§å‡ºåŠ› DuckDB ã¨ã¯ ã“ã¡ã‚‰ã‚’ã©ã†ãžã€‚ DuckDB雑紹介(1.1対応版)@DuckDB座談会 - Speaker Deck 圧縮済ã¿ã®ãƒã‚°ã‚’èªã¿è¾¼ã‚€ 解æžå¯¾è±¡ã®ãƒã‚°ãƒ•ã‚¡ã‚¤ãƒ«ã£ã¦ spam-20240501.jsonl.gz ã‚„ egg-20240601.jsonl.zst ã¿ãŸã„ã«åœ§ç¸®ã•ã‚Œã¦ã„ãŸã‚Šã—ã¾ã™ã€‚ 特ã«æ—¥ä»˜å˜ä½ã§åˆ†ã‹ã‚Œã¦ãŸã‚Šã™ã‚‹ã“ã¨ã¯å¤šã„ã§ã™ã€‚ãã“ã‹ã‚‰ç›®çš„ã®ãƒã‚°ã‚’探ã—出ã™ã®ã¯ã€åŸºæœ¬ã¯ã‚¹ã‚¯ãƒªãƒ—トを書ãã“ã¨ãŒå¤šã„ã¨æ€ã„ã¾ã™ã€‚ DuckDB を使ãˆã°è‰²ã€…解決ã—ã¾ã™ã€‚
ã•ãŒã‚‰ã§ã™ã€‚ dbt ver1.9ã®æ–°æ©Ÿèƒ½ã§ã‚ã‚‹microbatch incremental modelsを試ã—ã¦ã¿ãŸã®ã§ã€æœ¬è¨˜äº‹ã§ãã®å†…容をã¾ã¨ã‚ã¦ã¿ã¾ã™ã€‚ microbatch incremental modelsã¨ã¯ ã¾ãšã€incremental modelsã«ã¤ã„ã¦ã§ã™ãŒã€dbtã§å‰å›žæ›´æ–°æ™‚ã‹ã‚‰ã®å·®åˆ†æ›´æ–°ã‚’è¡Œã†ã“ã¨ãŒã§ãã‚‹modelã¨ãªã£ã¦ã„ã¾ã™ã€‚ ãã®ä¸Šã§ã€ã“ã®incremental modelsã§ã¯appendã€mergeã€delete+insertã€insert_overwriteã¨ã„ã†4ã¤ã®å¢—分更新方法ãŒã“ã‚Œã¾ã§æä¾›ã•ã‚Œã¦ã„ã¾ã—ãŸã€‚ ã“ã®å¢—分更新方法ã®æ–°ã—ã„オプションã¨ã—ã¦è¿½åŠ ã•ã‚ŒãŸã®ãŒã€microbatchã¨ãªã‚Šã¾ã™ã€‚ microbatchã§ã®æ›´æ–°æ™‚ã®æŒ™å‹•ã§ã™ãŒã€æŒ‡å®šã—ãŸã‚«ãƒ©ãƒ ã®å€¤ã‚’å…ƒã«æ—¥åˆ¥ã«åˆ†ã‘ã¦ã€è¤‡æ•°ã®æ›´æ–°å‡¦ç†ãŒèµ°ã‚‹ã‚¤ãƒ¡ãƒ¼ã‚¸ã¨ãªã‚Šã¾ã™ã€‚(下図ã¯ä¸Šè¨˜ã®ãƒªãƒ³ã‚¯å…ˆãƒ‰ã‚ュメン
リリースã€éšœå®³æƒ…å ±ãªã©ã®ã‚µãƒ¼ãƒ“スã®ãŠçŸ¥ã‚‰ã›
最新ã®äººæ°—エントリーã®é…ä¿¡
処ç†ã‚’実行ä¸ã§ã™
j次ã®ãƒ–ックマーク
kå‰ã®ãƒ–ックマーク
lã‚ã¨ã§èªã‚€
eコメント一覧を開ã
oページを開ã
{{#tags}}- {{label}}
{{/tags}}