Perlã«ã‚ˆã‚‹CSVãƒ•ã‚¡ã‚¤ãƒ«ã®é«˜é€Ÿé›†è¨ˆ

Perlã«ã‚ˆã‚‹CSVãƒ•ã‚¡ã‚¤ãƒ«ã®é«˜é€Ÿé›†è¨ˆ 2

2ã¤ã®ãƒ•ã‚¡ã‚¤ãƒ«ã®è¡¨çµåˆã¨è¤‡é›‘ãªCSVãƒ•ã‚©ãƒ¼ãƒžãƒƒãƒˆã®å–ã‚Šæ‰±ã„

2007/03/06 00:00

ãƒã‚¹ãƒˆ

ãƒ€ã‚¦ãƒ³ãƒãƒ¼ãƒ‰ ã‚µãƒ³ãƒ—ãƒ«ãƒ‡ãƒ¼ã‚¿ (1.7 MB)

å‰å›žã®è¨˜äº‹ã§Perlã‚’åˆ©ç”¨ã—ãŸCSVãƒ‡ãƒ¼ã‚¿ã®å–ã‚Šæ‰±ã„ã«ã¤ã„ã¦èª¬æ˜Žã—ã¾ã—ãŸã€‚ä»Šå›žã¯ãã®ç¶šãã¨ã—ã¦ã€2ã¤ã®ãƒ•ã‚¡ã‚¤ãƒ«ã®JOINå‡¦ç†ã¨è¤‡é›‘ãªCSVãƒ•ã‚©ãƒ¼ãƒžãƒƒãƒˆã®å–ã‚Šæ‰±ã„ã«ã¤ã„ã¦ã€ç†è€…ãŒåˆ©ç”¨ã—ã¦ã„ã‚‹ãƒŽã‚¦ãƒã‚¦ã‚’ã”ç´¹ä»‹ã—ã¾ã™ã€‚

ãƒã‚¹ãƒˆ

ã¯ã˜ã‚ã«

ã€€å‰å›žã®è¨˜äº‹ã§ã¯ã€Perlã§CSVã‚’æ‰±ã†ãŸã‚ã®åŸºæœ¬çš„ãªè€ƒãˆæ–¹ã‚’èª¬æ˜Žã—ã¾ã—ãŸã€‚æœ¬è¨˜äº‹ã§ã¯å¼•ãç¶šãã€Perlã§CSVãƒ•ã‚¡ã‚¤ãƒ«ã‚’é›†è¨ˆã™ã‚‹ãŸã‚ã®ãƒŽã‚¦ãƒã‚¦ã‚’ç´¹ä»‹ã—ã¾ã™ã€‚

å¯¾è±¡èªè€…

Perlã®ã”ãåˆæ©çš„ãªçŸ¥è˜ï¼ˆé…åˆ—ã€ãƒãƒƒã‚·ãƒ¥ï¼‰ã‚’æœ‰ã—ã¦ã„ã‚‹æ–¹ã€‚
Perlã‚’åˆ©ç”¨ã—ã¦CSVå½¢å¼ã®ãƒ‡ãƒ¼ã‚¿ã‚’é›†è¨ˆã—ãŸã„æ–¹ã€‚

å¿…è¦ãªç’°å¢ƒ

ãƒ†ã‚ã‚¹ãƒˆã‚¨ãƒ‡ã‚£ã‚¿ã€‚
Perl 5.8.Xã€‚ãŸã ã—ã€ã»ã¨ã‚“ã©ã®ã‚³ãƒ¼ãƒ‰ã¯ãã‚Œä»¥ä¸‹ã®ãƒãƒ¼ã‚¸ãƒ§ãƒ³ã§ã‚‚å‹•ãã¾ã™ã€‚

ã€€ç’°å¢ƒã‚’æ•´ãˆã‚‹æ–¹æ³•ã«é–¢ã—ã¦ã¯ã€å‰å›žã®è¨˜äº‹ã‚’å‚ç…§ã—ã¦ä¸‹ã•ã„ã€‚

2ã¤ã®CSVã‚’æ‰±ã†

ã‚ãƒ¼ã«ã‚ˆã£ã¦JOINã™ã‚‹

ã€€é¡§å®¢ã«ã‚¢ãƒ³ã‚±ãƒ¼ãƒˆã‚’ã¨ã£ãŸçµæžœãŒæ ¼ç´ã•ã‚ŒãŸã€æ¬¡ã®ã‚ˆã†ãªã€Œenquate.csvã€ãŒã‚ã‚‹ã¨ã—ã¾ã™ã€‚å·¦ã‹ã‚‰é †ã«ã€

é¡§å®¢ID,è¨å•1ã®å›žç”,è¨å•2ã®å›žç”,è¨å•3ã®å›žç”

ã€€ã¨ã„ã†ã‚ˆã†ãª4ã‚«ãƒ©ãƒ ã®ãƒ‡ãƒ¼ã‚¿ã§ã™ã€‚

enquate.csv

00893,1,4,2
89204,4,2,3
75648,2,2,2
ã€€ï¼š
ã€€ï¼šï¼ˆä»¥ä¸‹ã€30,000ä»¶ï¼‰
ã€€ï¼š

ã€€ã‚ãªãŸã¯ã€ã“ã®ãƒ‡ãƒ¼ã‚¿ã®å„è¡Œã®å¾Œã‚ã«é¡§å®¢ã®æ°åã¨ä½æ‰€ã‚’ç´ã¥ã‘ã€ãƒ—ãƒ¬ã‚¼ãƒ³ãƒˆç™ºé€æ‹…å½“è€…ã«æ¸¡ã•ãªã‘ã‚Œã°ãªã‚Šã¾ã›ã‚“ã€‚ã©ã†ã™ã‚Œã°ã€ã“ã®ã‚ˆã†ãªå‡¦ç†ãŒã§ãã‚‹ã§ã—ã‚‡ã†ã‹ï¼Ÿ é¡§å®¢ã®ãƒ‡ãƒ¼ã‚¿ã¯ã€Œaddress.csvã€ã¨ã„ã†åå‰ã§ã€

é¡§å®¢ID,æ°å,ä½æ‰€

ã€€ã®3ã‚«ãƒ©ãƒ ã‹ã‚‰ãªã£ã¦ã„ã¾ã™ã€‚

address.csv

02547,ä½è—¤å¤§è¼”,åŒ—æµ·é“è‹«å°ç‰§å¸‚XXXXYYYY
15983,ç”°ä¸ä¹…å¿—,æ²–ç¸„çœŒé‚£è¦‡å¸‚XXXXYYYY
00893,æœ¬é–“é›…æ´‹,ç¥žå¥ˆå·çœŒæ¨ªæµœå¸‚XXXXYYYY
ã€€ï¼š
ã€€ï¼šï¼ˆä»¥ä¸‹ã€100,000ä»¶ï¼‰
ã€€ï¼š

çµ¶å¯¾ã«ã‚„ã£ã¦ã¯ã„ã‘ãªã„ã‚³ãƒ¼ãƒ‡ã‚£ãƒ³ã‚°

ã€€ã‚ã‚‹æ–°äººã‚¯ãƒ³ãŒã“ã®ä»•äº‹ã‚’å¼•ãå—ã‘ã€æ¬¡ã®ã‚ˆã†ãªã‚³ãƒ¼ãƒ‰ã‚’æ›¸ã„ã¦å®Ÿè¡Œã—ã¾ã—ãŸã€‚

marge_csv.plï¼ˆçµ¶å¯¾ã«ã‚„ã£ã¦ã¯ã„ã‘ãªã„ï¼‰

open(OUT, '>result.csv');
open(IN1, 'enquate.csv');

# ã‚¢ãƒ³ã‚±ãƒ¼ãƒˆãƒ‡ãƒ¼ã‚¿ã‚’1è¡Œãšã¤å‡¦ç†ã™ã‚‹
while(my $line1 = <IN1>){
    # 1è¡Œã‚’4ã¤ã«åˆ†ã‘ã‚‹
    chomp($line1);
    my ($id, $ans1, $ans2, $ans3) = split(/,/, $line1, 4);

    # ã“ã®è¡Œã«ãƒžãƒƒãƒã™ã‚‹é¡§å®¢ãƒ‡ãƒ¼ã‚¿ã‚’æ¤œç´¢ã™ã‚‹
    my $name    = '';
    my $address = '';
    open(IN2, 'address.csv');
    while(my $line2 = <IN2>){
        chomp($line2);
        my ($tmp_id, $tmp_name, $tmp_address) = split(/,/, $line2, 3);

        if($tmp_id eq $id){
            # å¯¾è±¡ã¨ãªã‚‹é¡§å®¢ãŒè¦‹ã¤ã‹ã£ãŸï¼
            $name    = $tmp_name;
            $address = $tmp_address;
        last;
        }
    }
    close(IN2);

    # å‡ºåŠ›ã™ã‚‹
    print OUT join(',', $id, $ans1, $ans2, $ans3, $name, $address), "\n";
}

close(OUT);
close(IN1);

ã€€çµæžœãŒå‡ºãŸã‚‰ãƒ¡ãƒ¼ãƒ«ã§é€ä¿¡ã—ã¦ã€ä»Šæ—¥ã¯ã•ã£ã•ã¨å®šæ™‚ã§å¸°ã‚ã†ã¨æ€ã£ã¦ã„ãŸæ–°äººã‚¯ãƒ³ã€‚ã¨ã“ã‚ãŒã€ã„ã¤ã¾ã§å¾…ã£ã¦ã‚‚ã“ã®å‡¦ç†ã¯çµ‚ã‚ã‚‹å…†ã—ãŒè¦‹ãˆã¾ã›ã‚“ã€‚å‡¦ç†ãŒçµ‚ã‚ã‚‹ã¾ã§ã®å¾…ã¡æ™‚é–“ã‚’åˆ©ç”¨ã—ã¦ã‚³ãƒ¼ãƒ‰ã‚’1è¡Œãšã¤ä½•åº¦ã‚‚è¦‹ç›´ã—ãŸã®ã§ã™ãŒã€è«–ç†çš„ã«ã¯é–“é•ãˆã¦ã„ãªã„ã‚³ãƒ¼ãƒ‡ã‚£ãƒ³ã‚°ã«è¦‹ãˆã¾ã™ã€‚ã„ã£ãŸã„ãªãœçµ‚ã‚ã‚‰ãªã„ã®ã§ã—ã‚‡ã†ï¼Ÿ

30å„„å›žã®ãƒ«ãƒ¼ãƒ—å‡¦ç†

ã€€æ–°äººã‚¯ãƒ³ã®ã‚¹ã‚¯ãƒªãƒ—ãƒˆãŒãªã‹ãªã‹çµ‚äº†ã—ãªã‹ã£ãŸåŽŸå› ã¯ã€ãƒ•ã‚¡ã‚¤ãƒ«ã®èªã¿è¾¼ã¿å‡¦ç†ãŒ2é‡ã®ãƒ«ãƒ¼ãƒ—ã«ãªã£ã¦ã„ã‚‹ã“ã¨ã«ã‚ã‚Šã¾ã™ã€‚å¤–å´ã®ã€Œenquate.csvã€ã®ä»¶æ•°ãŒ3ä¸‡ä»¶ã§ã€ãã®1è¡Œ1è¡Œã«ã¤ã„ã¦ã€Œaddress.csvã€ã‚’æ¯Žå›žé–‹ã„ã¦ãƒ‡ãƒ¼ã‚¿ã‚’æ¤œç´¢ã—ã¦ã„ã¾ã™ã€‚ã€Œaddress.csvã€ã®è¡Œæ•°ãŒ10ä¸‡è¡Œã§ã™ã®ã§ã€å˜ç´”è¨ˆç®—ã§10ä¸‡è¡Œ×3ä¸‡å›žï¼30å„„è¡Œã‚’ãƒ•ã‚¡ã‚¤ãƒ«ã‹ã‚‰èªã¿è¾¼ã‚€å‡¦ç†ã§ã‚ã‚‹ã¨ã„ã†ã“ã¨ã«ãªã‚Šã¾ã™ï¼ˆãŸã ã—ã€æ¤œç´¢ãŒå®Œäº†ã—ãŸã‚‰lastã—ã¦ã„ã‚‹ã®ã§ã€å®Ÿéš›ã«ã¯ã‚‚ã£ã¨å°‘ãªã„è¡Œæ•°ã§æ¸ˆã¿ã¾ã™ãŒï¼‰ã€‚

ã€€ã“ã‚“ãªå›žæ•°ã‚’ãƒ«ãƒ¼ãƒ—å‡¦ç†ã—ã¦ã„ã‚Œã°ã€å‡¦ç†ãŒçµ‚ã‚ã‚‰ãªã„ã®ã¯å½“ãŸã‚Šå‰ã§ã™ã€‚ç†è€…ã®ç’°å¢ƒã§ã¯1æ™‚é–“å¾…ã£ã¦ã‚‚å‡¦ç†ãŒçµ‚ã‚ã‚‰ãªã‹ã£ãŸã®ã§ã€ã¨ã†ã¨ã†ï¼»Ctrlï¼½ï¼‹ï¼»Cï¼½ã§å¼·åˆ¶çµ‚äº†ã—ã¦ã—ã¾ã„ã¾ã—ãŸã€‚

ãƒãƒƒã‚·ãƒ¥ã‚’æœ‰åŠ¹ã«ä½¿ã†

ã€€ã§ã¯ã€ã“ã®å‡¦ç†ã‚’ç¾å®Ÿçš„ãªæ™‚é–“ã§çµ‚ãˆã‚‹ãŸã‚ã«ã¯ã©ã†ã™ã‚Œã°ã„ã„ã®ã§ã—ã‚‡ã†ã‹ï¼Ÿ ãã®ãŸã‚ã«ã¯ã€ã€Œaddress.csvã€ã‹ã‚‰å¯¾è±¡è¡Œã‚’å‘¼ã³å‡ºã™å‡¦ç†ã‚’é«˜é€ŸåŒ–ã™ã‚‹å¿…è¦ãŒã‚ã‚Šã¾ã™ã€‚

ã€€å‰å›žã®è¨˜äº‹ã§ã‚‚è¿°ã¹ãŸå†…å®¹ã§ã™ãŒã€ã“ã“ã§ã€å–ã‚Šæ‰±ã†ãƒ•ã‚¡ã‚¤ãƒ«ã®å¤§ãã•ãŒå•é¡Œã¨ãªã£ã¦ãã¾ã™ã€‚ä»Šå›žæ‰±ã£ã¦ã„ã‚‹ã€Œaddress.csvã€ã¯5MBç¨‹åº¦ã®å¤§ãã•ã§ã™ã®ã§ã€å…¨ã¦ãƒ¡ãƒ¢ãƒªã«å–ã‚Šè¾¼ã‚“ã§ã‚‚å¤§ããªå•é¡Œã«ãªã‚‹ã“ã¨ã¯ãªã•ãã†ã§ã™ã€‚ãã“ã§ã€3ä¸‡å›žç¹°ã‚Šè¿”ã—ã¦ã„ãŸã€Œaddress.csvã€ã®èªã¿è¾¼ã¿å‡¦ç†ã‚’æœ€åˆã«æŒã£ã¦ãã¦ã€å…¨ã¦ãƒ¡ãƒ¢ãƒªã«æŒã¤ã‚ˆã†ã«å¤‰æ›´ã—ã¦ã¿ã¾ã™ã€‚ã“ã‚Œã§ãƒ•ã‚¡ã‚¤ãƒ«ã®èªã¿è¾¼ã¿è¡Œæ•°ã¯30å„„è¡Œã‹ã‚‰10ä¸‡è¡Œã«æ¸›ã‚‹ã¯ãšã§ã™ã€‚

ã€€æ¤œç´¢ã®é«˜é€ŸåŒ–ã«ã¯ã‚‚ã†ä¸€ã¤é‡è¦ãªã“ã¨ãŒã‚ã‚Šã¾ã™ã€‚ãã‚Œã¯ã€ãƒ¡ãƒ¢ãƒªä¸Šã®ãƒ‡ãƒ¼ã‚¿ã‚’é«˜é€Ÿã«æ¤œç´¢ã™ã‚‹ãŸã‚ã®ç´¢å¼•ã€ã¤ã¾ã‚Šã€ã‚¤ãƒ³ãƒ‡ãƒƒã‚¯ã‚¹ã‚’å¼µã‚‹ã“ã¨ã§ã™ã€‚ã‚¤ãƒ³ãƒ‡ãƒƒã‚¯ã‚¹ãŒç”¨æ„ã•ã‚Œã¦ã„ãªã‘ã‚Œã°ã€å¯¾è±¡ã¨ãªã‚‹é¡§å®¢IDã«å¯¾å¿œã™ã‚‹è¡Œã‚’æŽ¢ã™ã®ã«ã€æ¯Žå›žå…¨ãƒ‡ãƒ¼ã‚¿ã‚’èµ°æŸ»ã—ãªã‘ã‚Œã°ãªã‚‰ãªããªã‚Šã¾ã™ãŒã€ãã‚Œã¯ã‚ã¾ã‚Šã«éžåŠ¹çŽ‡çš„éŽãŽã¾ã™ã€‚

ã€€Perlã«ãŠã„ã¦ã€ã“ã®ã‚¤ãƒ³ãƒ‡ãƒƒã‚¯ã‚¹ã¨ã—ã¦é©ä»»ãªã®ã¯ãƒãƒƒã‚·ãƒ¥ã§ã™ã€‚ã‚ãƒ¼ã«å¯¾ã™ã‚‹å€¤ã‚’ã€é«˜é€Ÿã«æŽ¢ã—å‡ºã™ã“ã¨ãŒã§ãã‚‹ã‹ã‚‰ã§ã™ã€‚ä»Šå›žã®ä¾‹ã§ã¯ã€é¡§å®¢IDã‹ã‚‰å¯¾è±¡ã¨ãªã‚‹è¡ŒãŒãƒ¦ãƒ‹ãƒ¼ã‚¯ã«å®šã¾ã‚Šã¾ã™ã®ã§ã€é¡§å®¢IDã‚’ã‚ãƒ¼ã¨ã—ãŸãƒãƒƒã‚·ãƒ¥ã«ã€Œaddress.csvã€ã®ãƒ‡ãƒ¼ã‚¿ã‚’ä¿å˜ã—ã¾ã™ã€‚

ã€€ã‚³ãƒ¼ãƒ‰ã¯ä»¥ä¸‹ã®ã‚ˆã†ã«ãªã‚Šã¾ã—ãŸã€‚

marge_csv.plï¼ˆé©åˆ‡ã«ã‚³ãƒ¼ãƒ‡ã‚£ãƒ³ã‚°ã—ãªãŠã—ãŸç‰©ï¼‰

# æœ€åˆã«ã€é¡§å®¢ã®ä½æ‰€ã‚’å…¨ã¦ãƒãƒƒã‚·ãƒ¥(ãƒ¡ãƒ¢ãƒªä¸Š)ã«å–ã‚Šè¾¼ã‚€
my %address_datas = ();
open(IN, 'address.csv');
while(<IN>){
    chomp;
    my ($id, $name, $address) = split(/,/, $_, 3);

    # (â€»1)é¡§å®¢IDã‚’ã‚ãƒ¼ã¨ã—ã€å¯¾å¿œã™ã‚‹åå‰ã¨ä½æ‰€ã®é…åˆ—ã‚’ä¿å˜ã™ã‚‹
    $address_datas{$id} = [$name, $address];
}
close(IN);

# ã‚¢ãƒ³ã‚±ãƒ¼ãƒˆãƒ‡ãƒ¼ã‚¿ã«æ°åã¨ä½æ‰€ã‚’ãƒžãƒ¼ã‚¸ã™ã‚‹
open(OUT, '>result.csv');
open(IN, 'enquate.csv');

while(my $line = <IN>){
    chomp($line);
    my ($id, $ans1, $ans2, $ans3) = split(/,/, $line, 4);

    # ã“ã®è¡Œã«ãƒžãƒƒãƒã™ã‚‹é¡§å®¢ãƒ‡ãƒ¼ã‚¿ã‚’æ¤œç´¢ã™ã‚‹
    my $ref_data = $address_datas{$id};

    # é…åˆ—ã®0ç•ªç›®ã«åå‰ã€1ç•ªç›®ã«ä½æ‰€ãŒå…¥ã£ã¦ã„ã‚‹ (â€»1ã‚’å‚ç…§)
    my $name    = $ref_data->[0];
    my $address = $ref_data->[1];

    # å‡ºåŠ›ã™ã‚‹
    print OUT join(',', $id, $ans1, $ans2, $ans3, $name, $address), "\n";
}

close(OUT);
close(IN);

ã€€ã“ã®ã‚³ãƒ¼ãƒ‰ã‚’ç†è€…ã®ç’°å¢ƒã§å®Ÿè¡Œã™ã‚‹ã¨ã€5ç§’ã‚‚ç«‹ãŸãªã„ã†ã¡ã«çµ‚äº†ã—ã¾ã—ãŸã€‚ã“ã‚Œãªã‚‰å®Ÿç”¨ä¸Šã¾ã£ãŸãå•é¡ŒãŒãªã•ãã†ã§ã™ã€‚

ã€€ã“ã®ä¾‹ã®ã‚ˆã†ã«ã€ç‰¹å®šã®IDé …ç›®ã‚’å«ã‚€è¤‡æ•°ã®ãƒ•ã‚¡ã‚¤ãƒ«ã‚’ãã®IDé …ç›®ã§JOINã™ã‚‹å ´åˆã«ã¯ã€IDé …ç›®ã‚’ã‚ãƒ¼ã¨ã—ãŸãƒãƒƒã‚·ãƒ¥ã¸JOINã—ãŸã„ãƒ•ã‚¡ã‚¤ãƒ«ã®ãƒ‡ãƒ¼ã‚¿ã‚’èªã¿è¾¼ã‚“ã§ãŠãã¨ã€åŠ¹çŽ‡ã‚ˆãå‡¦ç†ã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚é–“é•ãˆã¦ã‚‚ã€æœ€åˆã®ã‚³ãƒ¼ãƒ‰ã®ã‚ˆã†ã«2é‡ãƒ«ãƒ¼ãƒ—ã‚’ä½œã£ã¦æ¤œç´¢ã™ã‚‹ã“ã¨ã®ãªã„ã‚ˆã†ã«æ°—ã‚’ã¤ã‘ã¾ã—ã‚‡ã†ã€‚

ã€€(è¿½è¨˜ï¼šã“ã®ã‚³ãƒ¼ãƒ‰ã«é–¢ã—ã¾ã—ã¦ã€å¼¾ã•ã‚“ã‹ã‚‰ãƒˆãƒ©ãƒƒã‚¯ãƒãƒƒã‚¯ã‚’é ‚ã„ã¦ãŠã‚Šã¾ã™ã€‚ã‚ã‚ã›ã¦ã”å‚ç…§ãã ã•ã„ã€‚)

2ã¤ã®CSVã«å…±é€šã™ã‚‹IDã€ç‰‡å´ã«ã—ã‹ãªã„ID

ã€€æ¬¡ã¯ã€2ã¤ã®CSVã®åŒ…å«é–¢ä¿‚ã‚’èª¿ã¹ã‚‹å‡¦ç†ã§ã™ã€‚ã€Œenquate.csvã€ã¨åŒã˜ãƒ•ã‚©ãƒ¼ãƒžãƒƒãƒˆã®ã€Œenquate2.csvã€ã¨ã„ã†ãƒ•ã‚¡ã‚¤ãƒ«ãŒã‚ã‚Šã¾ã™ã€‚ã“ã®ãƒ•ã‚¡ã‚¤ãƒ«ã¯2å›žç›®ã«ã¨ã£ãŸã‚¢ãƒ³ã‚±ãƒ¼ãƒˆã§ã™ãŒã€1å›žç›®ã¨ã¯é•ã†ãƒ¦ãƒ¼ã‚¶ã‚‚åŒã˜ãƒ¦ãƒ¼ã‚¶ã‚‚æ··ã˜ã£ã¦ã„ã¾ã™ã€‚ã“ã®2ã¤ã®ãƒ•ã‚¡ã‚¤ãƒ«ã‚’èªã¿è¾¼ã‚“ã§ã€ã€Œ1å›žç›®ã ã‘å¿œå‹Ÿã—ãŸé¡§å®¢ã€ã€Œ2å›žç›®ã ã‘å¿œå‹Ÿã—ãŸé¡§å®¢ã€ã€Œã©ã¡ã‚‰ã‚‚å¿œå‹Ÿã—ãŸé¡§å®¢ã€ã‚’èª¿ã¹ã¦ã¿ã¾ã—ã‚‡ã†ã€‚å‡ºåŠ›ã¯2ã‚«ãƒ©ãƒ ã§ã€

é¡§å®¢ID,1 or 2 or 3
ï¼ˆ1: 1å›žç›®ã ã‘å¿œå‹Ÿã€2: 2å›žç›®ã ã‘å¿œå‹Ÿã€3: ã©ã¡ã‚‰ã‚‚å¿œå‹Ÿï¼‰

ã€€ã¨ã—ã¾ã™ã€‚ã€Œenquate2.csvã€ã®è¡Œæ•°ã¯ã€ã€Œenquate.csvã€ã¨åŒã˜30,000è¡Œã§ã™ã€‚

ã€€ã“ã®å‡¦ç†ã‚’å®Ÿç¾ã™ã‚‹ãŸã‚ã«ã€ä»Šå›žã¯ä»¥ä¸‹ã®æ‰‹é †ã‚’ã¨ã‚Šã¾ã™ã€‚

ã€Œenquate2.csvã€ã‚’ãƒãƒƒã‚·ãƒ¥ã«å–ã‚Šè¾¼ã‚€
ã€Œenquate.csvã€ã‚’1è¡Œãšã¤èªã¿è¾¼ã‚€
ãƒãƒƒã‚·ãƒ¥ã«ãƒ‡ãƒ¼ã‚¿ãŒãªã‘ã‚Œã°ã€ã€Œ1å›žç›®ã ã‘å¿œå‹Ÿã—ãŸé¡§å®¢ã€
ãƒãƒƒã‚·ãƒ¥ã«ãƒ‡ãƒ¼ã‚¿ãŒã‚ã‚Œã°ã€ã€Œã©ã¡ã‚‰ã‚‚å¿œå‹Ÿã—ãŸé¡§å®¢ã€
ãƒãƒƒã‚·ãƒ¥ã‹ã‚‰ã€è©²å½“ãƒ‡ãƒ¼ã‚¿ï¼ˆ1å›žç›®ã«å¿œå‹Ÿã—ãŸé¡§å®¢ã®ãƒ‡ãƒ¼ã‚¿ï¼‰ã‚’æ¶ˆã™
æœ€å¾Œã«ã€æ¶ˆã•ã‚Œãšã«æ®‹ã£ãŸãƒ‡ãƒ¼ã‚¿ãŒã€Œ2å›žç›®ã ã‘å¿œå‹Ÿã—ãŸé¡§å®¢ã€

ã€€å¯¾ç§°æ€§ãŒãªãã¦å¤šå°‘ã‚ã‹ã‚Šã«ãã„å‡¦ç†ã§ã¯ã‚ã‚Šã¾ã™ãŒã€ã“ã®æ–¹æ³•ã ã¨ãƒ¡ãƒ¢ãƒªã«èªã¿è¾¼ã‚€ã®ã¯ç‰‡æ–¹ã®ãƒ•ã‚¡ã‚¤ãƒ«ã ã‘ã§æ¸ˆã¿ã¾ã™ã®ã§ã€å¤§ãã‚ã®ãƒ•ã‚¡ã‚¤ãƒ«ã§ã‚‚ãªã‚“ã¨ã‹ãªã‚‹ã®ãŒåˆ©ç‚¹ã§ã™ã€‚ã‚³ãƒ¼ãƒ‰ã¯ã€ä»¥ä¸‹ã®ã‚ˆã†ã«ãªã‚Šã¾ã™ã€‚

diff.pl (1)

# 2å›žç›®ã®ã‚¢ãƒ³ã‚±ãƒ¼ãƒˆå¿œå‹Ÿè€…ã‚’ãƒãƒƒã‚·ãƒ¥ã«å–ã‚Šè¾¼ã‚€
my %enq2_data = ();
open(IN, 'enquate2.csv');
while(<IN>){
    chomp;

    # IDã ã‘å¿…è¦ãªã®ã§ã€IDã ã‘å–ã‚Šå‡ºã™
    my ($id) = split(/,/, $_, 2);
    # ã‚ãƒ¼ã‚’é¡§å®¢IDã¨ã—ã€ç›®å°(ãƒ•ãƒ©ã‚°)ã¨ã—ã¦1ã‚’å…¥ã‚Œã‚‹
    $enq2_data{$id} = 1;
}
close(IN);

ã€€ã¾ãšæœ€åˆã«ã€2å›žç›®ã®ã‚¢ãƒ³ã‚±ãƒ¼ãƒˆçµæžœã‚’ãƒãƒƒã‚·ãƒ¥ã«å–ã‚Šè¾¼ã¿ã¾ã™ã€‚ä»Šå›žå¿…è¦ãªãƒ‡ãƒ¼ã‚¿ã¯IDã ã‘ã§è¨å•ã®å›žç”éƒ¨åˆ†ã¯å¿…è¦ã‚ã‚Šã¾ã›ã‚“ã®ã§ã€splitã®å¼•ãæ•°ã®æœ€å¾Œã«2ã‚’æŒ‡å®šã—ã€å·¦è¾ºã§ã¯$idã ã‘ã‚’æŒ‡å®šã™ã‚‹ã“ã¨ã§æœ€åˆã®ã‚«ãƒ©ãƒ ã€ã¤ã¾ã‚Šé¡§å®¢IDã ã‘ã‚’å–ã‚Šå‡ºã—ã¦ã„ã¾ã™ã€‚

ã€€ã¾ãŸã€ãƒãƒƒã‚·ãƒ¥ã®ã‚ãƒ¼ã¯é¡§å®¢IDã¨ã—ã¦ã¾ã™ãŒã€ãƒãƒƒã‚·ãƒ¥ã®å€¤ã¯ç‰¹ã«åˆ©ç”¨ã—ãªã„ã®ã§ã€ãƒ€ãƒŸãƒ¼ã®å€¤ã¨ã—ã¦1ã‚’ä»£å…¥ã™ã‚‹ã“ã¨ã«ã—ã¾ã—ãŸã€‚

ã€€ãƒãƒƒã‚·ãƒ¥ã«ãƒ‡ãƒ¼ã‚¿ãŒæ•´ãˆã°ã€æ¬¡ã¯1å›žç›®ã®ã‚¢ãƒ³ã‚±ãƒ¼ãƒˆçµæžœã‚’èªã¿è¾¼ã‚“ã§æ¯”è¼ƒã™ã‚‹éƒ¨åˆ†ã¨ãªã‚Šã¾ã™ã€‚æœ€åˆã®éƒ¨åˆ†ã¨åŒã˜ã‚ˆã†ã«ã€è¡Œã‚’splitã™ã‚‹éƒ¨åˆ†ã§ã¯é¡§å®¢IDã ã‘ã‚’å–ã‚Šå‡ºã—ã¾ã™ã€‚ãã®å¾Œã€ãƒãƒƒã‚·ãƒ¥ã«å«ã¾ã‚Œã‚‹2å›žç›®å¿œå‹Ÿè€…ã®é¡§å®¢IDã‚’æ¤œç´¢ã—ã€ã‚ãƒ¼ãŒå˜åœ¨ã™ã‚‹ã‚ˆã†ã§ã‚ã‚Œã°ã©ã¡ã‚‰ã«ã‚‚å¿œå‹Ÿã—ãŸé¡§å®¢ã¨ã—ã¦ã€Œ3ã€ã‚’å‡ºåŠ›ã—ã¾ã™ã€‚ã¾ãŸã€deleteé–¢æ•°ã«ã‚ˆã£ã¦ãƒãƒƒã‚·ãƒ¥ã‹ã‚‰ã“ã®é¡§å®¢IDã‚’å‰Šé™¤ã—ã¾ã™ã€‚ã“ã‚Œã«ã‚ˆã‚Šã€2å›žç›®ã®ã‚¢ãƒ³ã‚±ãƒ¼ãƒˆå¿œå‹Ÿè€…ã‹ã‚‰1å›žç›®ã‚‚å¿œå‹Ÿã—ãŸé¡§å®¢IDãŒå‰Šé™¤ã•ã‚Œã€æœ€çµ‚çš„ã«ã¯2å›žç›®ã®ã¿å¿œå‹Ÿã—ãŸå¿œå‹Ÿè€…ãŒæ®‹ã‚‹ã¨ã„ã†ã“ã¨ã«ãªã‚Šã¾ã™ã€‚

ã€€2å›žç›®å¿œå‹Ÿè€…ã®ãƒãƒƒã‚·ãƒ¥å†…ã«ã‚ãƒ¼ãŒå˜åœ¨ã—ãªã‘ã‚Œã°ã€1å›žç›®ã®ã‚¢ãƒ³ã‚±ãƒ¼ãƒˆçµæžœã«ã—ã‹å«ã¾ã‚Œãªã‹ã£ãŸé¡§å®¢IDã¨ã„ã†ã“ã¨ã«ãªã‚Šã¾ã™ã®ã§ã€ã€Œ1ã€ã‚’å‡ºåŠ›ã—ã¾ã™ã€‚

diff.pl (2)

# 1å›žç›®ã®ã‚¢ãƒ³ã‚±ãƒ¼ãƒˆå¿œå‹Ÿè€…ã¨2å›žç›®ã®å¿œå‹Ÿè€…ã‚’æ¯”è¼ƒã™ã‚‹
open(OUT, '>result.csv');
open(IN,  'enquate.csv');
while(<IN>){
    chomp;

    # IDã ã‘å¿…è¦ãªã®ã§ã€IDã ã‘å–ã‚Šå‡ºã™
    my ($id) = split(/,/, $_, 2);
    
    if($enq2_data{$id}){
        # ã©ã¡ã‚‰ã«ã‚‚å¿œå‹Ÿã—ãŸé¡§å®¢
        print OUT "$id,3\n";
        # ãƒãƒƒã‚·ãƒ¥ã‹ã‚‰ã€Œ1å›žç›®å¿œå‹Ÿã—ãŸé¡§å®¢ã€ã‚’å‰Šé™¤
        delete $enq2_data{$id};
    }else{
        # 1å›žç›®ã ã‘å¿œå‹Ÿã—ãŸé¡§å®¢
        print OUT "$id,1\n";
    }
}
close(IN);

ã€€ã“ã“ã¾ã§ã§ã€ã€Œ1å›žç›®ã®ã¿å¿œå‹Ÿã—ãŸé¡§å®¢ã€ã¨ã€Œã©ã¡ã‚‰ã«ã‚‚å¿œå‹Ÿã—ãŸé¡§å®¢ã€ã®å‡ºåŠ›ãŒçµ‚ã‚ã‚Šã¾ã—ãŸã€‚å¾Œã¯ã€ãƒãƒƒã‚·ãƒ¥ã«æ®‹ã£ã¦ã„ã‚‹ã€Œ2å›žç›®ã®ã¿å¿œå‹Ÿã—ãŸé¡§å®¢ã€ã‚’å‡ºåŠ›ã•ã›ã‚Œã°ã€å‡¦ç†ã¯å®Œäº†ã¨ãªã‚Šã¾ã™ã€‚

diff.pl (3)

# æœ€å¾Œã«ã€ãƒãƒƒã‚·ãƒ¥ã«æ®‹ã£ãŸã®ãŒ2å›žç›®ã®ã¿å¿œå‹Ÿã—ãŸé¡§å®¢
foreach(keys %enq2_data){
    print OUT "$_,2\n";
}

close(OUT);

ã€€ä»Šå›žã®ä¾‹ã§ã¯ã€1ã¤ã®ãƒ•ã‚¡ã‚¤ãƒ«ã«å…¨ã¦ã®çµæžœã‚’åãã¾ã—ãŸãŒã€ã‚°ãƒ«ãƒ¼ãƒ—ã”ã¨ã«3ã¤ã®ãƒ•ã‚¡ã‚¤ãƒ«ã«åˆ†ã‘ã‚‹ã¨ã„ã†å‡ºåŠ›æ–¹æ³•ã‚‚è€ƒãˆã‚‰ã‚Œã¾ã™ã€‚ãã®å ´åˆã¯ã€OUT1ã€OUT2ã€OUT3ã®ç”¨ã«ãƒ•ã‚¡ã‚¤ãƒ«ãƒãƒ³ãƒ‰ãƒ«ã‚’è¤‡æ•°ç”¨æ„ã—ã¦openã—ã€é©åˆ‡ãªãƒãƒ³ãƒ‰ãƒ«ã«å‘ã‘ã¦çµæžœã‚’å‡ºåŠ›ã•ã›ã‚‹ã‚ˆã†ã«ã™ã‚‹ã¨ã‚ˆã„ã§ã—ã‚‡ã†ã€‚

ä¼šå“¡ç™»éŒ²ç„¡æ–™ã™ã‚‹ã¨ã€ç¶šãã‚’ãŠèªã¿ã„ãŸã ã‘ã¾ã™

æ–°è¦ä¼šå“¡ç™»éŒ²ç„¡æ–™ã®ã”æ¡ˆå†…

ãƒ»å…¨ã¦ã®éŽåŽ»è¨˜äº‹ãŒé–²è¦§ã§ãã¾ã™
ãƒ»ä¼šå“¡é™å®šãƒ¡ãƒ«ãƒžã‚¬ã‚’å—ä¿¡ã§ãã¾ã™

ãƒ¡ãƒ¼ãƒ«ãƒãƒƒã‚¯ãƒŠãƒ³ãƒãƒ¼

æ–°è¦ä¼šå“¡ç™»éŒ²ç„¡æ–™

æ¬¡ã®ãƒšãƒ¼ã‚¸
ã•ã¾ã–ã¾ãªCSVãƒ•ã‚¡ã‚¤ãƒ«ã«å¯¾å¿œã™ã‚‹

ä¿®æ£å±¥æ´: 2007/03/07 21:25 å¼¾ã•ã‚“ã«é ‚ã„ãŸãƒˆãƒ©ãƒƒã‚¯ãƒãƒƒã‚¯ã¸ã®ãƒªãƒ³ã‚¯ã‚’è¿½è¨˜(ãŸã³ãŸã³ã‚ã‚ŠãŒã¨ã†ã”ã–ã„ã¾ã™)

ã“ã®è¨˜äº‹ã¯å‚è€ƒã«ãªã‚Šã¾ã—ãŸã‹ï¼Ÿ

å°åˆ·ç”¨ã‚’è¡¨ç¤º

ãƒã‚¹ãƒˆ

Perlã«ã‚ˆã‚‹CSVãƒ•ã‚¡ã‚¤ãƒ«ã®é«˜é€Ÿé›†è¨ˆé€£è¼‰è¨˜äº‹ä¸€è¦§: Perlã«ã‚ˆã‚‹CSVãƒ•ã‚¡ã‚¤ãƒ«ã®é«˜é€Ÿé›†è¨ˆ 2

Perlã«ã‚ˆã‚‹CSVãƒ•ã‚¡ã‚¤ãƒ«ã®é«˜é€Ÿé›†è¨ˆ

ã“ã®è¨˜äº‹ã®è‘—è€…: hirataraï¼ˆãƒ’ãƒ©ã‚¿ãƒ©ï¼‰

1977å¹´ã«è‹«å°ç‰§å¸‚ã§ç”Ÿã¾ã‚Œã‚‹ã€‚åŒ—æµ·é“å¤§å¦ç†å¦éƒ¨æ•°å¦ç§‘å’ã€‚å°å¦ç”Ÿã®é ƒã€ä¸¡è¦ªã«è²·ã„ä¸Žãˆã‚‰ã‚ŒãŸMZ-2500ã§ãƒ—ãƒã‚°ãƒ©ãƒŸãƒ³ã‚°ã‚’å§‹ã‚ãŸã€‚å¦ç”Ÿæ™‚ä»£ã€CGIã®è‡ªä½œã«æ²¡é ã—ã€ãã‚Œä»¥é™WEBé–‹ç™ºã®é…åŠ›ã«æ†‘ã‹ã‚Œã‚‹ã€‚ç¤¾ä¼šäººã«ãªã£ã¦ã‚‚æ•°å¦å¥½ãã¯å¤‰ã‚ã‚‰ãšã€å°‚é–€æ›¸ã‚’è²·ã„é›†ã‚ã‚‹ã®ãŒæœ€è¿‘ã®è¶£å‘³ã€‚id:hirataraã«ã¦blogã‚’åŸ·ç†...

â€»ãƒ—ãƒãƒ•ã‚£ãƒ¼ãƒ«ã¯ã€åŸ·ç†æ™‚ç‚¹ã€ã¾ãŸã¯ç›´è¿‘ã®è¨˜äº‹ã®å¯„ç¨¿æ™‚ç‚¹ã§ã®å†…å®¹ã§ã™

ã“ã®è‘—è€…ã®æœ€è¿‘ã®åŸ·ç†è¨˜äº‹