ãƒã‚¤ãƒ‘ãƒ©ç®¡ç†ã®ã™ã™ã‚ -ãƒã‚¤ãƒ‘ãƒ¼ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã‚’Hydra+MLflowã§ç®¡ç†ã—ã‚ˆã†-

æ©Ÿæ¢°å¦ç¿’ã‚’ã‚„ã£ã¦ã„ã‚‹äººãªã‚‰èª°ã‚‚ãŒéé‡ã—ãŸã§ã‚ã‚ã†ã“ã®å…‰æ™¯

f:id:ymym3412:20200208234836p:plain

(â€»å†™çœŸã¯PyTorchã®Language Modelã®Exampleã‚ˆã‚Š)

Pythonã®argparseã§ã‚·ã‚§ãƒ«ã‹ã‚‰å¼•æ•°ã‚’å—ã‘å–ã‚ŠPython ã‚¹ã‚¯ãƒªãƒ—ãƒˆå†…ã§ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã«è¨å®šã™ã‚‹ãƒ‘ã‚¿ãƒ¼ãƒ³ã¯ã€è¨˜è¿°ãŒé•·ããªã‚ŠãŒã¡ãªä¸Šã€ã©ã®ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ãŒmodel/preprocess/optimizerã®ã‚‚ã®ãªã®ã‹åŒºåˆ¥ãŒã¤ãã«ããè¦‹é€šã—ãŒæ‚ªã„ã¨ã„ã£ãŸèª²é¡ŒãŒã‚ã‚Šã¾ã™ã€‚

ç§ã¯å®Ÿé¨“ç”¨ã®ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿é¡žã¯å…¨ã¦YAMLã«è¨˜è¿°ã—ã¦ç®¡ç†ã—ã¦ã„ã¾ã™ã€‚
YAMLã§è¨˜è¿°ã™ã‚‹ã“ã¨ã§ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã‚’éšŽå±¤ç«‹ã¦ã¦æ§‹é€ çš„ã«è¨˜è¿°ã™ã‚‹ã“ã¨ãŒã§ãã€ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®è¦‹é€šã—ãŒãã£ã¨ã‚ˆããªã‚Šã¾ã™ã€‚

preprocess:
  min_df: 3
  max_df: 1
  replace_pattern: \d+
model:
  hidden_size: 256
  dropout: 0.1
optimizer:
  algorithm: Adam
  learning_rate: 0.01
  norm: 0.001

ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ãƒãƒ¥ãƒ¼ãƒ‹ãƒ³ã‚°ã®éš›ã«ã¯ã€ã‚·ã‚§ãƒ«ã‚¹ã‚¯ãƒªãƒ—ãƒˆã‹ã‚‰yqã‚³ãƒžãƒ³ãƒ‰ã§æ›¸ãæ›ãˆãªãŒã‚‰Python ã‚¹ã‚¯ãƒªãƒ—ãƒˆã«æµã™ã¨ã„ã†é‹ç”¨ã‚’ã—ã¦ã„ãŸã®ã§ã™ãŒã€yqã‚³ãƒžãƒ³ãƒ‰ã§ãŒã¡ã‚ƒãŒã¡ã‚ƒæ›¸ãç›´ã—ã¦ã„ã‚‹ã†ã¡ã«ãƒ‡ãƒ•ã‚©ãƒ«ãƒˆå€¤ãŒåˆ†ã‹ã‚‰ãªããªã‚‹ã¨ã„ã†æ‚©ã¿ãŒã‚ã‚Šã¾ã—ãŸã€‚
YAMLã«ã‚ˆã‚‹ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ç®¡ç†ã®ãƒ™ã‚¹ãƒˆãƒ—ãƒ©ã‚¯ãƒ†ã‚£ã‚¹ã‚’æ¨¡ç´¢ã—ã¦ã„ã‚‹æŠ˜ã«ã€Hydraã¨ã„ã†ãƒ„ãƒ¼ãƒ«ãŒç™»å ´ã—ãŸã®ã§ã€å®¶ã®å®Ÿé¨“ç®¡ç†å‘¨ã‚Šã‚’Hydraã‚’ä½¿ã£ã¦æ•´ç†ã—ã¦ã¿ã¾ã—ãŸã€‚

Hydraã¨ã¯

f:id:ymym3412:20200209034506p:plain

Hydraã¯Facebook ResearchãŒæä¾›ã—ã¦ã„ã‚‹è¨å®šãƒ•ã‚¡ã‚¤ãƒ«ã‚’ç®¡ç†ã—ã‚„ã™ãã™ã‚‹ãŸã‚ã®ãƒ„ãƒ¼ãƒ«ã§ã™ã€‚
æ§˜ã€…ãªè¨å®šã‚’YAMLå½¢å¼ã§è¨˜è¿°ã—ã€ãã®YAMLã®è¨å®šç¾¤ã‚’ç°¡å˜ã«Python ã‚¹ã‚¯ãƒªãƒ—ãƒˆå†…ã«æµã—è¾¼ã‚€ã“ã¨ã«ä¸»çœ¼ã‚’ç½®ã„ã¦ã„ã‚‹ãƒ„ãƒ¼ãƒ«ã§ã‚ã‚Šã€Exampleã«ã¯Databaseã®è¨å®šãŒã‚ã‚‹ãªã©æ©Ÿæ¢°å¦ç¿’ä»¥å¤–ã®ç”¨é€”ã§ã®ä½¿ç”¨ã‚‚æƒ³å®šã—ã¦ã„ã‚‹ãƒ„ãƒ¼ãƒ«ã§ã™ã€‚

Hydraã«ã‚ˆã‚‹YAMLã®èªã¿è¾¼ã¿

ä»¥ä¸‹ã®ã‚ˆã†ã«YAMLãƒ•ã‚¡ã‚¤ãƒ«ã«ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã‚’è¨å®šã—ã€Python ã‚¹ã‚¯ãƒªãƒ—ãƒˆã§Hydraã®ãƒ‡ã‚³ãƒ¬ãƒ¼ã‚¿ã‚’ä»˜ä¸Žã—ãŸé–¢æ•°ã‚’ç”¨æ„ã™ã‚‹ã“ã¨ã§Dictã®å½¢å¼ã§ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã‚’èªã¿è¾¼ã‚€ã“ã¨ãŒã§ãã‚‹ã‚ˆã†ã«ãªã‚Šã¾ã™ã€‚

config.yaml

db:
  driver: postgresql
  pass: drowssap
  timeout: 20
  user: postgre_user

my_app.py

@hydra.main(config_path='config.yaml')
def my_app(cfg):
    print(cfg.pretty())

$ python my_app.py
db:
  driver: postgresql
  pass: drowssap
  timeout: 20
  user: postgre_user

ã‚³ãƒžãƒ³ãƒ‰ãƒ©ã‚¤ãƒ³ã§YAMLã®ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã‚’key=valueã®å½¢ã§æ¸¡ã™ã¨ã€å¯¾è±¡ã®å€¤ã‚’æ›¸ãæ›ãˆã¦Python ã‚¹ã‚¯ãƒªãƒ—ãƒˆã«æŒã¡è¾¼ã‚€ã“ã¨ãŒã§ãã¾ã™ã€‚ã‚‚ã¡ã‚ã‚“å…ƒã®YAMLãƒ•ã‚¡ã‚¤ãƒ«ã«ã¯å½±éŸ¿ã¯ã‚ã‚Šã¾ã›ã‚“ã€‚

$ python my_app.py db.user=ymym db.pass=3412
db:
  driver: postgresql
  pass: 3412
  timeout: 20
  user: ymym

è¤‡æ•°ã®YAMLãƒ•ã‚¡ã‚¤ãƒ«ã®ç®¡ç†

Hydraã§ã¯è¨å®šãƒ•ã‚¡ã‚¤ãƒ«ã‚’è¤‡æ•°ã®YAMLãƒ•ã‚¡ã‚¤ãƒ«ã«åˆ†å‰²ã—ã¦é‹ç”¨ã™ã‚‹ã“ã¨ã‚‚æƒ³å®šã—ã¦ã„ã¾ã™ã€‚
ä¾‹ãˆã°ã€NNã¨LightGBMã®ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã‚’åˆ¥ã€…ã®YAMLãƒ•ã‚¡ã‚¤ãƒ«ã«è¨˜è¿°ã—ã¦ä½¿ç”¨ã™ã‚‹ãƒ¢ãƒ‡ãƒ«ã‚’ãƒã‚¤ãƒ‘ãƒ©ã«è¨å®šã—ã¦ãã‚Œã«å¿œã˜ã¦å¯¾å¿œã™ã‚‹ãƒ¢ãƒ‡ãƒ«ã®YAMLã‚’èªã¿è¾¼ã¨ã„ã£ãŸæ„Ÿã˜ã§ã™ã€‚

nn.yaml

model:
  layers: 3
  dropout: 0.5

lightgbm.yaml

model: 
  max_depth: 10
  learning_rate: 0.01

ä»¥ä¸‹ã®ã‚ˆã†ã«ãƒ‡ã‚£ãƒ¬ã‚¯ãƒˆãƒªã‚’åˆ‡ã£ã¦YAMLã‚’é…ç½®ã—ã¦ã€ã©ã®è¨å®šãƒ•ã‚¡ã‚¤ãƒ«ã‚’èªã¿è¾¼ã‚€ã‹ã‚’ config.yaml ã§åˆ¶å¾¡ã—ã¾ã™ã€‚

â”œâ”€â”€ conf
â”‚   â”œâ”€â”€ config.yaml
â”‚   â””â”€â”€ model
â”‚       â”œâ”€â”€ lightgbm.yaml
â”‚       â””â”€â”€ nn.yaml
â””â”€â”€ my_app.py

config.yaml

defaults:
  - model: nn

$ python my_app.py
model:
  layers: 3
  dropout: 0.5

Hydraã®å‡ºåŠ›ãƒ‡ã‚£ãƒ¬ã‚¯ãƒˆãƒª

Hydraã¯Python ã‚¹ã‚¯ãƒªãƒ—ãƒˆãŒæœ€çµ‚çš„ã«ã©ã‚“ãªYAMLãƒ•ã‚¡ã‚¤ãƒ«ã®å†…å®¹ã§å®Ÿè¡Œã•ã‚ŒãŸã‹ã‚’å‡ºåŠ›ãƒ‡ã‚£ãƒ¬ã‚¯ãƒˆãƒª(ãƒ‡ãƒ•ã‚©ãƒ«ãƒˆã§ã¯outputs/)ã‚’ç”Ÿæˆã—ã¦ä¿ç®¡ã—ã¦ãã‚Œã¾ã™ã€‚

â”œâ”€â”€ .hydra
â”‚   â”œâ”€â”€ config.yaml
â”‚   â”œâ”€â”€ hydra.yaml
â”‚   â””â”€â”€ overrides.yaml
â””â”€â”€ my_app.log

ã“ã®å‡ºåŠ›ãƒ‡ã‚£ãƒ¬ã‚¯ãƒˆãƒªã«ã¯å°‘ã—æ³¨æ„ãŒå¿…è¦ã§ã€Python ã‚¹ã‚¯ãƒªãƒ—ãƒˆã§hydraã®ãƒ‡ã‚³ãƒ¬ãƒ¼ã‚¿ã‚’ã¤ã‘ãŸé–¢æ•°ã®ä¸ã§ã¯cwdãŒã“ã®å‡ºåŠ›ãƒ‡ã‚£ãƒ¬ã‚¯ãƒˆãƒªã«ãªã£ã¦ã—ã¾ã„ã¾ã™ã€‚
Pythonã‚³ãƒ¼ãƒ‰ã®ä¸ã§ pd.read_csv('data/train.csv')ã¨ã„ã£ãŸãƒ•ã‚¡ã‚¤ãƒ«èªã¿è¾¼ã¿ã‚’ä½¿ç”¨ã¨ã™ã‚‹ã¨cwdã®é•ã„ã‹ã‚‰äº‹æ•…ã‚‹ã“ã¨ãŒå¤šã„ã®ã§ã€hydraãŒç”¨æ„ã—ã¦ãã‚Œã¦ã„ã‚‹é–¢æ•°ã‚’ä½¿ã£ã¦ã‚ªãƒªã‚¸ãƒŠãƒ«ã®ãƒ—ãƒã‚¸ã‚§ã‚¯ãƒˆãƒ«ãƒ¼ãƒˆã®ãƒ‘ã‚¹ã‚’å–å¾—ã™ã‚‹ã¨ã‚ˆã„ã§ã—ã‚‡ã†ã€‚

import os
from omegaconf import DictConfig
import hydra

@hydra.main()
def my_app(cfg: DictConfig) -> None:
    print(f'Current working directory: {os.getcwd()}')
    print(f'Orig working directory : {hydra.utils.get_original_cwd()}')
    print(f'to_absolute_path("foo") : {hydra.utils.to_absolute_path("foo")}')
    print(f'to_absolute_path("/foo") : {hydra.utils.to_absolute_path("/foo")}')


>>>Current working directory: /home/user/workspace/hydra-exp/outputs/2020-02-09/02-29-26
>>>Orig working directory : /home/user/workspace/hydra-exp
>>>to_absolute_path("foo") : /home/user/workspace/hydra-exp/foo
>>>to_absolute_path("/foo") : /foo

Hydra + MLflowã§ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿/å®Ÿé¨“ã‚’ç®¡ç†ã™ã‚‹

ã§ã¯ã€æ©Ÿæ¢°å¦ç¿’ã®å®Ÿé¨“ã«å¯¾ã—ã¦ã€ŒYAMLã§è¨˜è¿°ã—ãŸãƒã‚¤ãƒ‘ãƒ¼ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®èªã¿è¾¼ã¿ã¨ã‚°ãƒªãƒƒãƒ‰ã‚µãƒ¼ãƒã«Hydraã‚’ã€ã€Œã©ã®ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã§å®Ÿé¨“ã—ã©ã‚“ãªçµæžœã«ãªã£ãŸã‹ã®è¨˜éŒ²ã‚’MLflowã€ã§è¡Œã„ã¾ã™ã€‚

ä»Šå›žã‚‚é¡Œæã¯ä¾‹ã«ã‚ˆã£ã¦Livedoorã®ãƒ‹ãƒ¥ãƒ¼ã‚¹ã‚³ãƒ¼ãƒ‘ã‚¹ã®ãƒ†ã‚ã‚¹ãƒˆåˆ†é¡žã§ã™ã€‚

ã¾ãšã¯ãƒ‡ãƒ¼ã‚¿ã®èªã¿è¾¼ã¿ã€åŠ å·¥ç‰ã®è«¸ã€…ã®é–¢æ•°ã‚’å®šç¾©ã—ã¾ã™ã€‚

# AllenNLPç”¨ã«æ–‡ç« ã‹ã‚‰Instanceã‚’ç”Ÿæˆã™ã‚‹
def text_to_instance(word_list, label):
    tokens = [Token(word) for word in word_list]
    word_sentence_field = TextField(tokens, {"tokens": SingleIdTokenIndexer()})
    fields = {"tokens": word_sentence_field}
    if label is not None:
        label_field = LabelField(label, skip_indexing=True)
        fields["label"] = label_field
    return Instance(fields)


def load_dataset(path, dataset):
    if dataset not in ['train', 'val', 'test']:
        raise ValueError('"dataset" parametes must be train/val/test')

    data, labels = pd.read_csv(f'{path}/{dataset}.csv'), pd.read_csv(f'{path}/{dataset}_label.csv', header=None, squeeze=True)
    return data, labels

def preprocess(X, y, preprocessor=None):
    if preprocessor is None:
        preprocessor = Preprocessor()
        preprocessor\
            .stack(ct.text.UnicodeNormalizer())\
            .stack(ct.Tokenizer("ja"))\
            .fit(X['article'])

    processed = preprocessor.transform(X['article'])
    dataset = [text_to_instance([token.surface for token in document], int(label)) for document, label in zip(processed, y)]
    return dataset, preprocessor

æ¬¡ã«ãƒã‚¤ãƒ‘ãƒ¼ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã‚’è¨˜è¿°ã™ã‚‹YAMLãƒ•ã‚¡ã‚¤ãƒ«ã§ã™ã€‚

config.yaml

# word embeddingã«é–¢ã™ã‚‹ãƒã‚¤ãƒ‘ãƒ¼ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿
w2v:
  model_name: all
  vocab_size: 32000
  norm: 2
# ãƒ¢ãƒ‡ãƒ«ã«é–¢ã™ã‚‹ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿
model:
  hidden_size: 256
  dropout: 0.5
# å®Ÿé¨“æ™‚ã«ä½¿ç”¨ã™ã‚‹ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿
training:
  batch_size: 32
  learning_rate: 0.01
  epoch: 30
  patience: 3

ä»Šå›žã¯YAMLã¯åˆ†å‰²ã›ãšã²ã¨ã¤ã®ãƒ•ã‚¡ã‚¤ãƒ«ã«ã™ã¹ã¦è¨˜è¿°ã—ã¦ã„ã¾ã™ã€‚
å€‹äººçš„ã«ã¯YAMLã‚’ç´°ãåˆ†å‰²ã—ã™ãŽã‚‹ã¨å¤‰æ›´å¿˜ã‚Œã‚„ä¿®æ£ãŒãŠã£ãã†ã«ãªã‚‹ã®ã§ã€ãã‚Œã»ã©è¤‡é›‘ã§ãªã‘ã‚Œã°å˜ä¸€ã®YAMLã«ã¾ã¨ã‚ã¦è¨˜è¿°ã—ã¦ã—ã¾ã£ãŸæ–¹ãŒè‰¯ã„ã¨æ€ã„ã¾ã™ã€‚

ç¶šã„ã¦Train&Testã®é–¢æ•°ã§ã™ã€‚

# å¦ç¿’
def train(train_dataset, val_dataset, cfg):
    # Vocabularyã‚’ç”Ÿæˆ
    VOCAB_SIZE = cfg.w2v.vocab_size
    vocab = Vocabulary.from_instances(train_dataset + val_dataset, max_vocab_size=VOCAB_SIZE)

    BATCH_SIZE = cfg.training.batch_size

    # ãƒ‘ãƒ‡ã‚£ãƒ³ã‚°æ¸ˆã¿ãƒŸãƒ‹ãƒãƒƒãƒã‚’ç”Ÿæˆã—ã¦ãã‚Œã‚‹Iterator
    iterator = BucketIterator(batch_size=BATCH_SIZE, sorting_keys=[("tokens", "num_tokens")])
    iterator.index_with(vocab)

    # æ±åŒ—å¤§ãŒæä¾›ã—ã¦ã„ã‚‹å¦ç¿’æ¸ˆã¿æ—¥æœ¬èªž Wikipedia ã‚¨ãƒ³ãƒ†ã‚£ãƒ†ã‚£ãƒ™ã‚¯ãƒˆãƒ«ã‚’ä½¿ç”¨ã™ã‚‹
    # http://www.cl.ecei.tohoku.ac.jp/~m-suzuki/jawiki_vector/
    model_name = cfg.w2v.model_name
    norm = cfg.w2v.norm
    cwd = hydra.utils.get_original_cwd()
    params = Params({
          'embedding_dim': 200,
          'padding_index': 0,
          'pretrained_file': os.path.join(cwd, f'embs/jawiki.{model_name}_vectors.200d.txt'),
          'norm_type': norm})

    token_embedding = Embedding.from_params(vocab=vocab, params=params)
    HIDDEN_SIZE = cfg.model.hidden_size
    dropout = cfg.model.dropout

    word_embeddings: TextFieldEmbedder = BasicTextFieldEmbedder({"tokens": token_embedding})
    encoder: Seq2SeqEncoder = PytorchSeq2SeqWrapper(nn.LSTM(word_embeddings.get_output_dim(),
                                                    HIDDEN_SIZE, bidirectional=True, batch_first=True))
    model = ClassifierWithAttn(word_embeddings, encoder, vocab, dropout)
    model.train()

    USE_GPU = True

    if USE_GPU and torch.cuda.is_available():
        model = model.cuda(0)

    LR = cfg.training.learning_rate
    EPOCHS = cfg.training.epoch
    patience = cfg.training.patience if cfg.training.patience > 0 else None

    optimizer = optim.Adam(model.parameters(), lr=LR)
    trainer = Trainer(
        model=model,
        optimizer=optimizer,
        iterator=iterator,
        train_dataset=train_dataset,
        validation_dataset=val_dataset,
        patience=patience,
        cuda_device=0 if USE_GPU else -1,
        num_epochs=EPOCHS
    )
    metrics = trainer.train()
    logger.info(metrics)

    return model, metrics


def test(test_dataset, model, writer):
    # æŽ¨è«–
    model.eval()
    with torch.no_grad():
        predicted = [model.forward_on_instance(d)['logits'].argmax() for d in tqdm(test_dataset)]

    # Accuracyã®è¨ˆç®—
    target = np.array([ins.fields['label'].label for ins in test_dataset])
    predict = np.array(predicted)
    accuracy = accuracy_score(target, predict)
    # Precision/Recallã®è¨ˆç®—
    macro_precision = precision_score(target, predict, average='macro')
    micro_precision = precision_score(target, predict, average='micro')
    macro_recall = recall_score(target, predict, average='macro')
    micro_recall = recall_score(target, predict, average='micro')
    # MLflowã«è¨˜éŒ²
    writer.log_metric('accuracy', accuracy)
    writer.log_metric('macro-precision', macro_precision)
    writer.log_metric('micro-precision', micro_precision)
    writer.log_metric('macro-recall', macro_recall)
    writer.log_metric('micro-recall', micro_recall)
    model.cpu()
    writer.log_torch_model(model)

ã“ã“ã§å‡ºã¦ãã‚‹writerã¨ã„ã†ã‚¤ãƒ³ã‚¹ã‚¿ãƒ³ã‚¹ã¯MLflowã®Clientã‚’ãƒ©ãƒƒãƒ—ã—ã¦ãƒã‚°ã®è¨˜éŒ²ã‚„Artifactã®ä¿å˜ã‚’è¡Œã†ã‚¯ãƒ©ã‚¹ã®ã‚¤ãƒ³ã‚¹ã‚¿ãƒ³ã‚¹ã§ã™ã€‚
with mlflow.start_run():ã®ãƒ–ãƒãƒƒã‚¯å¤–ã§ã‚‚MLflowã‚’ä½¿ã†å ´é¢ãŒã‚ã‚Šã€Run IDã‚’å¼•ãå›žã•ãªã„ã¨ã„ã‘ãªã„ãŸã‚ãƒ©ãƒƒãƒ‘ãƒ¼ã‚¯ãƒ©ã‚¹ã‚’ä½œã£ã¦ã„ã¾ã™ã€‚

class MlflowWriter():
    def __init__(self, experiment_name, **kwargs):
        self.client = MlflowClient(**kwargs)
        try:
            self.experiment_id = self.client.create_experiment(experiment_name)
        except:
            self.experiment_id = self.client.get_experiment_by_name(experiment_name).experiment_id

        self.run_id = self.client.create_run(self.experiment_id).info.run_id

    def log_params_from_omegaconf_dict(self, params):
        for param_name, element in params.items():
            self._explore_recursive(param_name, element)

    def _explore_recursive(self, parent_name, element):
        if isinstance(element, DictConfig):
            for k, v in element.items():
                if isinstance(v, DictConfig) or isinstance(v, ListConfig):
                    self._explore_recursive(f'{parent_name}.{k}', v)
                else:
                    self.client.log_param(self.run_id, f'{parent_name}.{k}', v)
        elif isinstance(element, ListConfig):
            for i, v in enumerate(element):
                self.client.log_param(self.run_id, f'{parent_name}.{i}', v)

    def log_torch_model(self, model):
        with mlflow.start_run(self.run_id):
            pytorch.log_model(model, 'models')

    def log_param(self, key, value):
        self.client.log_param(self.run_id, key, value)

    def log_metric(self, key, value):
        self.client.log_metric(self.run_id, key, value)

    def log_artifact(self, local_path):
        self.client.log_artifact(self.run_id, local_path)

    def set_terminated(self):
        self.client.set_terminated(self.run_id)

æœ€å¾Œã«Hydraã®ãƒ‡ã‚³ãƒ¬ãƒ¼ã‚¿ã‚’ä»˜ä¸Žã—ãŸmainé–¢æ•°ã§ã™ã€‚
ãƒ‡ãƒ¼ã‚¿ã‚’ãƒãƒ¼ã‚«ãƒ«ã®csvã‹ã‚‰èªã¿è¾¼ã‚€ãŸã‚ã€Hydraã®utilã‚’ä½¿ã£ã¦ãƒ—ãƒã‚¸ã‚§ã‚¯ãƒˆãƒ«ãƒ¼ãƒˆã®ãƒ‘ã‚¹ã‚’å–å¾—ã—ã¦ã„ã¾ã™ã€‚

@hydra.main(config_path='config.yaml')
def main(cfg: DictConfig):
    # https://medium.com/pytorch/hydra-a-fresh-look-at-configuration-for-machine-learning-projects-50583186b710
    cwd = hydra.utils.get_original_cwd()
    train_X, train_y = load_dataset(os.path.join(cwd, 'data'), 'train')
    val_X, val_y = load_dataset(os.path.join(cwd, 'data'), 'val')
    test_X, test_y = load_dataset(os.path.join(cwd, 'data'), 'test')

    train_dataset, preprocessor = preprocess(train_X, train_y)
    val_dataset, preprocessor = preprocess(val_X, val_y, preprocessor)
    test_dataset, preprocessor = preprocess(test_X, test_y, preprocessor)

    EXPERIMENT_NAME = 'livedoor-news-hydra-exp'
    writer = MlflowWriter(EXPERIMENT_NAME)
    writer.log_params_from_omegaconf_dict(cfg)

    model, metrics = train(train_dataset, val_dataset, cfg)
    test(test_dataset, model, writer)
    # Hydraã®æˆæžœç‰©ã‚’Artifactã«ä¿å˜
    writer.log_artifact(os.path.join(os.getcwd(), '.hydra/config.yaml'))
    writer.log_artifact(os.path.join(os.getcwd(), '.hydra/hydra.yaml'))
    writer.log_artifact(os.path.join(os.getcwd(), '.hydra/overrides.yaml'))
    writer.log_artifact(os.path.join(os.getcwd(), 'main.log'))
    writer.set_terminated()


if __name__ == '__main__':
    main()

Hydraã«ã¯Multi-runã¨ã„ã†æ©Ÿèƒ½ãŒã‚ã‚Šã€ã“ã‚Œã¯ã‚³ãƒžãƒ³ãƒ‰ãƒ©ã‚¤ãƒ³ã‹ã‚‰å‘¼ã¶éš›ã«ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®key=valueã§valueå€¤ã‚’ã‚«ãƒ³ãƒžåŒºåˆ‡ã‚Šã§è¨˜è¿°ã—-mã‚ªãƒ—ã‚·ãƒ§ãƒ³ã‚’ã¤ã‘ã‚‹ã¨ã€å…¨ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®çµ„ã¿åˆã‚ã›ã‚’å®Ÿè¡Œã—ã¦ãã‚Œã‚‹ã¨ã„ã†ã‚‚ã®ã§ã™ã€‚
ã¾ãŸå‡ºåŠ›ã¯å„ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®çµ„ã¿åˆã‚ã›ã®ãŸã³ã«ä¿å˜ã•ã‚Œã‚‹ã®ã§ã€ã“ã®æ©Ÿèƒ½ã‚’ä½¿ã£ã¦ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®ã‚°ãƒªãƒƒãƒ‰ã‚µãƒ¼ãƒã‚’è¡Œã†ã“ã¨ãŒã§ãã¾ã™ã€‚

$ python main.py w2v.model_name=all,entity,word model.hidden_size=32,64,128,256 training.learning_rate=0.01,0.005 -m

ä¸Šè¨˜ã‚’å®Ÿè¡Œã™ã‚Œã°å„å®Ÿé¨“ã®å†…å®¹ãŒMLflowä¸Šã«è¨˜éŒ²ã•ã‚Œã¾ã™ã€‚

f:id:ymym3412:20200209031948p:plain

f:id:ymym3412:20200209032028p:plain

Hydraã§ã‚°ãƒªãƒƒãƒ‰ã‚µãƒ¼ãƒã—ãŸçµæžœã‚’MLflowã«è¨˜éŒ²ã—ã¦ãŠã‘ã°ã€å®Ÿé¨“çµæžœã®æ¯”è¼ƒã‚‚å®¹æ˜“ã§ã™ã€‚
ä»¥ä¸‹ã¯å„å®Ÿé¨“ã®ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã‚’è¡¨ç¤ºã—ãªãŒã‚‰ã€Accuracyã‚’ãƒ—ãƒãƒƒãƒˆã—ã¦ã„ã‚‹ã¨ã“ã‚ã§ã™ã€‚

f:id:ymym3412:20200209032620p:plain

ã¾ã¨ã‚

ä»Šå›žã®è¨˜äº‹ã§ã¯Facebook ResearchãŒé–‹ç™ºã—ã¦ã„ã‚‹è¨å®šç®¡ç†ãƒ„ãƒ¼ãƒ«ã®Hydraã®ä½¿ã„æ–¹ã¨ã€Hydra+MLflowã§ãƒã‚¤ãƒ‘ãƒ¼ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®å…¥å‡ºåŠ›ã‚’ç®¡ç†ã™ã‚‹ã‚„ã‚Šæ–¹ã‚’ç´¹ä»‹ã—ã¾ã—ãŸã€‚

argparseã‚’ä½¿ã£ã¦ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿å…¥åŠ›ã‚’è¡Œã†ã®ã¨æ¯”ã¹ã¦ã€YAMLã§ã®ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ç®¡ç†ã¯è¦‹é€šã—ãŒã‚ˆãHydraã¨çµ„ã¿åˆã‚ã›ã‚‹ã“ã¨ã§è¨å®šã‚’ã„ã˜ã‚ŠãªãŒã‚‰Pythonã¨çµ„ã¿åˆã‚ã›ã‚‹ã“ã¨ã‚‚ç°¡å˜ã«ãªã‚Šã¾ã™ã€‚

ã‚„ã‚€ã‚„ã‚€ã‚‚ã‚„ã‚€ãªã—

è‡ªç„¶è¨€èªžå‡¦ç†ã‚„ã‚¨ãƒ³ã‚¸ãƒ‹ã‚¢ãƒªãƒ³ã‚°ã®ãƒ¡ãƒ¢

ãƒã‚¤ãƒ‘ãƒ©ç®¡ç†ã®ã™ã™ã‚ -ãƒã‚¤ãƒ‘ãƒ¼ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã‚’Hydra+MLflowã§ç®¡ç†ã—ã‚ˆã†-

Hydraã¨ã¯

Hydraã«ã‚ˆã‚‹YAMLã®èªã¿è¾¼ã¿

è¤‡æ•°ã®YAMLãƒ•ã‚¡ã‚¤ãƒ«ã®ç®¡ç†

Hydraã®å‡ºåŠ›ãƒ‡ã‚£ãƒ¬ã‚¯ãƒˆãƒª

Hydra + MLflowã§ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿/å®Ÿé¨“ã‚’ç®¡ç†ã™ã‚‹

ã¾ã¨ã‚

å‚è€ƒæ–‡çŒ®

Hydraã¨ã¯

Hydraã«ã‚ˆã‚‹YAMLã®èª­ã¿è¾¼ã¿

è¤‡æ•°ã®YAMLãƒ•ã‚¡ã‚¤ãƒ«ã®ç®¡ç†

Hydraã®å‡ºåŠ›ãƒ‡ã‚£ãƒ¬ã‚¯ãƒˆãƒª

Hydra + MLflowã§ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿/å®Ÿé¨“ã‚’ç®¡ç†ã™ã‚‹

ã¾ã¨ã‚

å‚è€ƒæ–‡çŒ®

Hydraã¨ã¯

Hydraã«ã‚ˆã‚‹YAMLã®èªã¿è¾¼ã¿

è¤‡æ•°ã®YAMLãƒ•ã‚¡ã‚¤ãƒ«ã®ç®¡ç†

Hydraã®å‡ºåŠ›ãƒ‡ã‚£ãƒ¬ã‚¯ãƒˆãƒª

Hydra + MLflowã§ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿/å®Ÿé¨“ã‚’ç®¡ç†ã™ã‚‹

ã¾ã¨ã‚

å‚è€ƒæ–‡çŒ®