logo

Timetable

Timetable
Timetable background1Timetable background3Timetable background3
10:00
Opening
20F #pyconjp_1
Opening Relay
20F #pyconjp_2
Opening Relay
4F #pyconjp_3
Opening Relay
4F #pyconjp_4
10:20
10:20
30min
【招待講演】PythonのUTF-8化
稲田 直哉
日本語
20F #pyconjp_1
10:20
30min
Re:PandasAI:生成AIがデータ分析業務にもたらすパラダイムシフト【増補改訂版】
Ryosuke Tanno
Data Science, AI
日本語
20F #pyconjp_2
10:20
30min
Pythonで 日本語処理 入門 〜フリガナプログラムを作ろう〜
Takanori Suzuki
Data Science, AI
日本語
4F #pyconjp_3
10:20
30min
Streamlining Testing in a Large Python Codebase
Jimmy Lai
DevOps, Testing, Documentation, Packaging
EN
4F #pyconjp_4
11:10
11:10
30min
Cloudflare Workers in Pythonでサーバーレスアプリケーションを作ろう
Ryuji Tsutsui
Web Applications
日本語
20F #pyconjp_1
11:10
30min
データフレームライブラリ徹底比較
桂川大輝
Others
日本語
20F #pyconjp_2
11:10
30min
Pythonの数学機能を学ぼう!その仕組みも学ぼう!
curekoshimizu
Python Features and Development
日本語
4F #pyconjp_3
11:10
30min
Unlocking Python's Core Magic
Wei Lee
Python Features and Development
EN
4F #pyconjp_4
11:40
Lunch Break
20F, 4F Track 1~4
12:40
12:40
30min
実例から学ぶ型ヒントの活用手法
Rei Suyama
Development Practices Using Python
日本語
20F #pyconjp_1
12:40
30min
「巨人の肩の上」で自作ライブラリを作る技術
石原祥太郎
Development Practices Using Python
日本語
20F #pyconjp_2
12:40
30min
Pythonを活用したLLMによる構造的データ生成の手法と実践
柴内一宏
Data Science, AI
日本語
4F #pyconjp_3
12:40
30min
Sleuthing in Cython: Wrapping and Debugging Legacy C Libraries for Python
Maryanne Wachter
Development Practices Using Python
EN
4F #pyconjp_4
13:30
13:30
30min
SQLModel入門 〜クエリと型〜
Mizuki Sato
Web Applications
日本語
20F #pyconjp_1
13:30
30min
Rustを活用したPythonライブラリの開発
Shota Kokado
DevOps, Testing, Documentation, Packaging
日本語
20F #pyconjp_2
13:30
30min
データサイエンスのフルサイクル開発を実現する機械学習パイプライン
Cristian Kamiya
Data Science, AI
日本語
4F #pyconjp_3
13:30
30min
Playing games in the browser with WASM
Neeraj Pandey, Manoj Pandey
Video, Music, Games, Illustration
EN
4F #pyconjp_4
14:20
14:20
30min
実践Dash - 手を抜きながら本気で作るデータ可視化Webアプリの基本と応用
Shinichi Nakagawa(@shinyorke)
Web Applications
日本語
20F #pyconjp_1
14:20
30min
Pythonによるイベントソーシングへの挑戦と現状に対する考察
Masanobu Naruse
Development Practices Using Python
日本語
20F #pyconjp_2
14:20
30min
PythonとOpenCVで楽しむ物体検出!
Lina Katayose
IoT, Hardware, Network
日本語
4F #pyconjp_3
14:20
30min
The Wheelhouse of Horrors
Laszlo Kiss Kollar
Development Practices Using Python
EN
4F #pyconjp_4
14:50
Coffee Break
20F, 4F Track 1~4
15:30
15:30
30min
WEBアプリケーションにおけるAWS Lambdaを用いた大規模な非同期処理の実践
Masataka Okudera
Web Applications
日本語
20F #pyconjp_1
15:30
30min
Pythonと相互運用可能な静的型付け言語Erg
Shunsuke Shibayama
Creating Libraries and Services
日本語
20F #pyconjp_2
15:30
30min
Pythonで3Dモデリングをしてみよう: CadQuery Basic
Hiroshi Sano
Video, Music, Games, Illustration
日本語
4F #pyconjp_3
15:30
30min
Why Knowing Cython Helps in Understanding Python: A Deep Dive into Cython & PVM
Abhik Sarkar
Python Features and Development
EN
4F #pyconjp_4
16:20
16:20
30min
DjangoとFastAPIによる実践認証技術
大島和輝
Web Applications
日本語
20F #pyconjp_1
16:20
30min
Pythonで3次元CGを作りたい人のためのPyVista入門
Tetsuo Koyama
Creating Libraries and Services
日本語
20F #pyconjp_2
16:20
30min
プロダクションでのPython非同期ユースケース - Trio/Trio-Utilを中心に
Junya Fukuda
IoT, Hardware, Network
日本語
4F #pyconjp_3
16:20
30min
Getting Started with Open Source Contributions
Stefanie Molin
Community, Education
EN
4F #pyconjp_4
17:00
17:00
15min
pytest プラグインを開発して DRY に自動テストを書こう
Atsushi Inutsuka
DevOps, Testing, Documentation, Packaging
日本語
4F #pyconjp_3
#pyconjp_3 Relay
4F #pyconjp_4
17:30
Keynote (Atsuo Ishimoto)
20F Track 1~2
Keynote Relay (English)
4F #pyconjp_3
18:25
PyCon JP Association Report
20F Track 1~2
18:40
Closing
20F Track 1~2
データサイエンスのフルサイクル開発を実現する機械学習パイプライン
Cristian Kamiya
09/28 13:30 - 14:00 (Asia/Tokyo)
4F #pyconjp_3

プロダクト開発に従事するデータサイエンティストは、データパイプラインの構築、実験、PoC、プロダクト実装など、幅広い業務を担当することが多いです。このフルサイクル開発は重要ですが、同時にデータサイエンティストがロジック開発やデータ分析にも集中できる環境が求められます。本トークでは、弊社の広告配信チームがどのようにしてデータサイエンティストがフルサイクル開発を行いながらも、専門業務に集中できる環境を整えたかを紹介します。具体的には、Luigi、SageMaker、Prefectといったワークフローエンジンを活用し、フルサイクルデータサイエンティストにとって効率的な機械学習基盤を開発した過程と、そこで得られた知見を共有します。


description
トーク詳細 / Description

1. はじめに

  • 自己紹介とセッションの目的説明
    • 自己紹介
    • セッションの目的と概要

2. 弊社におけるデータサイエンティストの特徴

  • フルサイクル開発の定義と重要性
  • 弊社(CARTA MARKETING FIRM)におけるフルサイクルデータサイエンティストとは

3. 課題と理想の機械学習基盤

  • フルサイクルデータサイエンティストの責務の曖昧さとその影響
    • 課題の詳細と実際の影響
  • 理想の機械学習基盤とは
    • ロジック開発やデータ分析に集中できる環境の重要性

4. 弊社のデータ分析基盤の歴史

  • Luigiを使った基盤の紹介とその成果
    • Luigiの導入背景
    • Luigiの利点と欠点
  • データ基盤(codename: vision)ができたことによる責務の変化
    • データパイプライン基盤 -> データエンジニア
    • 機械学習基盤 -> データサイエンティスト
  • LuigiからSageMakerへの移行
    • SageMakerの導入背景と利点
    • なぜSageMakerがフルサイクルデータサイエンティストに不向きだったか
  • SageMakerからPrefectへの移行
    • Prefectの導入背景と利点
  • 具体例
    • インフラ構築のためのコード量の削減
    • Pythonのみでの記述が可能
    • 監視や運用がしやすいUIの提供

5. 成果と今後の展望

  • 弊社での現在のデータエンジニア、データサイエンティスト、ソフトウェアエンジニアのそれぞれの責務
  • 今後の計画や改善点

Cristian Kamiya
Cristian Kamiya

株式会社CARTA HOLDINGS(旧:株式会社VOYAGE GROUP)に2020年にデータサイエンスエンジニアとして新卒入社。

主な仕事内容は広告配信プラットフォーム (DSP, アドネットワーク) の開発です。中でも広告表示権利のリアルタイムオークション(Real Time Bidding)の入札ロジックやクリック単価の値付けロジック、広告運用オペレーションの自動化といった予測を利用した意思決定をシステム化する業務が中心となります。