talkbank/callhomeã®æ—¥æœ¬èªžéŸ³å£°ã‚’wavå½¢å¼ã§ä¿å˜ã™ã‚‹

AI

é–‹ç™ºç’°å¢ƒ ã‚»ãƒƒãƒˆã‚¢ãƒƒãƒ— å®Ÿè¡Œ é–‹ç™ºç’°å¢ƒ python 3.9 uv ã‚»ãƒƒãƒˆã‚¢ãƒƒãƒ— ãƒ©ã‚¤ãƒ–ãƒ©ãƒªã‚’ã‚¤ãƒ³ã‚¹ãƒˆãƒ¼ãƒ«ã—ã¾ã™ uv pip install datasets[audio] soundfile pydub å®Ÿè¡Œ ä»¥ä¸‹ã§ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã‚’ãƒ€ã‚¦ãƒ³ãƒãƒ¼ãƒ‰ã—ã¦ã€wavå½¢å¼ã§ä¿å˜ã—ã¾ã™ from datasets import load_dataset iâ€¦

2024-12-16

pyannote + whisperã§è©±è€…ãƒ€ã‚¤ã‚¢ãƒ©ã‚¤ã‚¼ãƒ¼ã‚·ãƒ§ãƒ³ã‚’è¡Œã†

AI

åˆã‚ã« é–‹ç™ºç’°å¢ƒ ã‚»ãƒƒãƒˆã‚¢ãƒƒãƒ— å®Ÿè¡Œ åˆã‚ã« ä»Šå›žã¯å®šç•ªã®pyanonoteã¨whisperã§è©±è€…ãƒ€ã‚¤ã‚¢ãƒ©ã‚¤ã‚¼ãƒ¼ã‚·ãƒ§ãƒ³ã‚’è¡Œã£ã¦ã¿ã¾ã™ ä»¥ä¸‹ã§è¨˜äº‹ã®ã‚µãƒ³ãƒ—ãƒ«ãƒªãƒã‚¸ãƒˆãƒªã‚’å…¬é–‹ã—ã¦ã„ã¾ã™ github.com éŽåŽ»ã«ã¯ã»ã‹ã®ãƒ©ã‚¤ãƒ–ãƒ©ãƒªã§ã‚‚è©¦ã—ã¦ã„ã‚‹ã®ã§ã€ã»ã‹ã«ã©ã®ã‚ˆã†ãªãƒ©ã‚¤ãƒ–ãƒ©â€¦

2024-12-15

Wespeaker/wespeaker-voxceleb-resnet34-LMã§è©±è€…ãƒ€ã‚¤ã‚¢ãƒ©ã‚¤ã‚¼ãƒ¼ã‚·ãƒ§ãƒ³ã‚’è¡Œã†

AI

åˆã‚ã« é–‹ç™ºç’°å¢ƒ ã‚»ãƒƒãƒˆã‚¢ãƒƒãƒ— CLIã‹ã‚‰å®Ÿè¡Œ Pythonã®ã‚³ãƒ¼ãƒ‰ã§å®Ÿè¡Œ å‚™è€ƒ åˆã‚ã« wespeakerã§è©±è€…ãƒ€ã‚¤ã‚¢ãƒ©ã‚¤ã‚¼ãƒ¼ã‚·ãƒ§ãƒ³ã‚’è¡Œã£ã¦ã¿ã¾ã™ã€‚ ãƒ¢ãƒ‡ãƒ«ã¯ä»¥ä¸‹ã§ã™ huggingface.co ä»¥ä¸‹ã«è¨˜äº‹ã®å†…å®¹ã®Repositoryã‚’å…¬é–‹ã—ã¦ã„ã¾ã™ github.com é–‹ç™ºç’°å¢ƒ windows11 pythonâ€¦

2024-12-15

powerset_calibrationã‚’ä½¿ã£ã¦è©±è€…ãƒ€ã‚¤ã‚¢ãƒ©ã‚¤ã‚¼ãƒ¼ã‚·ãƒ§ãƒ³ã‚’è¡Œã†

AI

åˆã‚ã« é–‹ç™ºç’°å¢ƒ ã‚»ãƒƒãƒˆã‚¢ãƒƒãƒ— è©±è€…ãƒ€ã‚¤ã‚¢ãƒ©ã‚¤ã‚¼ãƒ¼ã‚·ãƒ§ãƒ³ã‚’å®Ÿè¡Œ åˆã‚ã« powerset_calibrationã‚’ä½¿ã£ã¦éŸ³å£°å†…ã®è©±è€…ãƒ€ã‚¤ã‚¢ãƒ©ã‚¤ã‚¼ãƒ¼ã‚·ãƒ§ãƒ³ã‚’è¡Œã£ã¦ã¿ã¾ã™ã€‚è«–æ–‡ã«ã‚ˆã‚Šãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã«ã¯æ—¥æœ¬èªžãŒå«ã¾ã‚Œã¦ã„ãªã„ãŸã‚ã€æ—¥æœ¬èªžã®éŸ³å£°ã«ä½¿ã†å ´åˆã¯è‡ªåˆ†ã§å¦ç¿’ã‚’è¡Œã†å¿…â€¦

2024-12-15

nvidia/parakeet-tdt_ctc-0.6b-jaã‚’Windowsã§å‹•ã‹ã™éš›ã®AttributeError: module 'signal' has no attribute 'SIGKILL'. Did you mean: 'SIGILL'?ã®å¯¾å¿œ

AI

åˆã‚ã« é–‹ç™ºç’°å¢ƒ åŽŸå› å¯¾å¿œæ–¹æ³• å‚™è€ƒ åˆã‚ã« NVIDIAãŒå…¬é–‹ã—ã¦ã„ã‚‹æ—¥æœ¬èªžéŸ³å£°å‘ã‘ã®éŸ³å£°èªè˜ãƒ¢ãƒ‡ãƒ« nvidia/parakeet-tdt_ctc-0.6b-jaã‚’ Windowsã§å‹•ã‹ã™éš›ã«ä»¥ä¸‹ã®ã‚¨ãƒ©ãƒ¼ãŒå‡ºãŸå¤šãŸã‚ã€å¯¾å¿œæ–¹æ³•ã‚’è¨˜è¼‰ã—ã¾ã™ packages\nemo\collections\asr\models\configs\aâ€¦

2024-12-15

reazonspeech-k2-v2ã‚’å‹•ã‹ã™

AI

åˆã‚ã« é–‹ç™ºç’°å¢ƒ ã‚»ãƒƒãƒˆã‚¢ãƒƒãƒ— æ–‡å—ãŠè¶Šã—ã®å®Ÿè¡Œ åˆã‚ã« reazon-researchãŒæ–°ã—ã„éŸ³å£°èªè˜ãƒ¢ãƒ‡ãƒ«ã‚’å…¬é–‹ã•ã‚Œã¦ã„ãŸã®ã§è§¦ã£ã¦ã¿ã¾ã™ ReazonSpeech v2.1ã‚’ãƒªãƒªãƒ¼ã‚¹ã—ã¾ã—ãŸï¼v2.1ã§è¿½åŠ ã—ãŸæ–°ã—ã„æ—¥æœ¬èªžASRãƒ¢ãƒ‡ãƒ«ã€ReazonSpeech-k2-v2ã¯ONNXãƒ•ã‚©ãƒ¼ãƒžãƒƒãƒˆã§æä¾›â€¦

2024-12-13

S3Tokenizerã‚’å‹•ã‹ã™

AI

åˆã‚ã« é–‹ç™ºç’°å¢ƒ ã‚»ãƒƒãƒˆã‚¢ãƒƒãƒ— å®Ÿè¡Œ åˆã‚ã« CosyVoiceã®æ•™å¸«ã‚ã‚ŠéŸ³å£°ãƒˆãƒ¼ã‚¯ãƒŠã‚¤ã‚¶ãƒ¼ã«é–¢ã™ã‚‹ã‚³ãƒ¼ãƒ‰ãŒå‡ºã¦ã„ãªã‹ã£ãŸãŸã‚ issueã€ä»¥ä¸‹ã®Repositoryã«ã¦å†ç¾å®Ÿè£…ãŒè¡Œã‚ã‚Œã¾ã—ãŸã€‚ã“ã¡ã‚‰ã‚’å‹•ã‹ã—ã¦ã„ãã¾ã™ github.com ä»¥ä¸‹ã§ãƒ©ã‚¤ãƒ–ãƒ©ãƒªã®verã‚’å›ºå®šã—ãŸRepositoâ€¦

2024-12-12

DNSMOSã§éŸ³å£°è©•ä¾¡ã‚’è¡Œã†

AI

åˆã‚ã« é–‹ç™ºç’°å¢ƒ DNSMOSã«ã¤ã„ã¦ ç’°å¢ƒæ§‹ç¯‰ éŸ³å£°ãƒ•ã‚¡ã‚¤ãƒ«ã®è©•ä¾¡ åˆã‚ã« AIå£°ã¥ãã‚ŠæŠ€è¡“ç ”ç©¶ä¼š ã‚¢ãƒ‰ã‚«ãƒ¬ 12æ—¥ç›®ã§ã™ã€‚ ä»Šå›žã¯ éŸ³å£°åˆæˆã«ãŠã‘ã‚‹ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆä½œæˆã®ä¸€ã¤ã®é‡è¦ãªè¦ç´ ã§ã‚ã‚‹ ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã®éŸ³å£°è©•ä¾¡ã«ã¤ã„ã¦ æ¯”è¼ƒçš„æ–°ã—ã‚ã®è©•ä¾¡æ‰‹æ³•ãŠã‚ˆã³ãƒ©ã‚¤ãƒ–â€¦

2024-12-12

Windowsã§Freeze-Omniã‚’å‹•ã‹ã™

AI

åˆã‚ã« é–‹ç™ºç’°å¢ƒ ã‚»ãƒƒãƒˆã‚¢ãƒƒãƒ— éŸ³å£°ãƒ•ã‚¡ã‚¤ãƒ«ã‹ã‚‰æŽ¨è«– ãƒªã‚¢ãƒ«ã‚¿ã‚¤ãƒ ã®ã‚¤ãƒ³ã‚¿ãƒ©ã‚¯ãƒ†ã‚£ãƒ–Demoã‚’å‹•ã‹ã™ åˆã‚ã« speech to speechã®ãƒ©ã‚¤ãƒ–ãƒ©ãƒªã® Freeze-Omniã‚’å‹•ã‹ã—ã¦ã„ãã¾ã™ã€‚ã“ã‚Œã¯å¾“æ¥ã®ã‚ˆã†ãª speech to text(STT) â†’ text to text(LLM) â†’ text to speech(Sâ€¦

2024-12-10

sudachipyã‚’ä½¿ã£ã¦æ–‡ç« ã‚’ã²ã‚‰ãŒãªã«å¤‰æ›ã™ã‚‹

AI

åˆã‚ã« é–‹ç™ºç’°å¢ƒ ã‚»ãƒƒãƒˆã‚¢ãƒƒãƒ— ã²ã‚‰ãªãŒã«å¤‰æ› è¾žæ›¸ã®å¤‰æ›´ åˆã‚ã« TTSã®å¦ç¿’ã®ã²ã¨ã¤ã§ã€æ–‡å—åˆ—ã‚’ã™ã¹ã¦ã²ã‚‰ãŒãªã«ã—ãŸã„å ´åˆãŒã‚ã‚Šã¾ã™ã€‚ãã®éš›ã«ç°¡å˜ã«ä½¿ãˆã‚‹ sudachiã‚’ä½¿ã£ã¦å‡¦ç†ã‚’ã—ã¦ã¿ã¾ã™ ä»¥ä¸‹ã«ã‚µãƒ³ãƒ—ãƒ«ãƒªãƒã‚¸ãƒˆãƒªã‚’å…¬é–‹ã—ã¦ã„ã¾ã™ github.com é–‹ç™ºâ€¦

2024-12-10

WeSpeakerã§éŸ³å£°ãƒ‡ãƒ¼ã‚¿å†…ã®è©±è€…åˆ†é›¢ãŠã‚ˆã³è©±è€…æ•°ã®ç‰¹å®šã‚’è¡Œã†

AI

åˆã‚ã« é–‹ç™ºç’°å¢ƒ ã‚»ãƒƒãƒˆã‚¢ãƒƒãƒ— è©±è€…åˆ†é›¢ã®å®Ÿè¡Œ åˆã‚ã« æœ€è¿‘å…¬é–‹ã•ã‚ŒãŸ WeSpeakerã‚’ä½¿ã£ã¦ éŸ³å£°ãƒ‡ãƒ¼ã‚¿ã§ã„ã‚ã„ã‚è¡Œã£ã¦ã„ãã¾ã™ã€‚ä»Šå›žã¯ã€éŸ³å£°ãƒ‡ãƒ¼ã‚¿å†…ã®è©±è€…åˆ†é›¢ãŠã‚ˆã³è©±è€…æ•°ã®ç‰¹å®šã‚’è¡Œã„ã¾ã™ github.com ä»¥ä¸‹ã«ã¦ã‚µãƒ³ãƒ—ãƒ«ãƒªãƒã‚¸ãƒˆãƒªã‚’å…¬é–‹ã—ã¦ã„ã¾ã™ https:â€¦

2024-12-08

Unityã§DrawLineã‚’ä½¿ã£ã¦æ“¬ä¼¼çš„ã«ã‚¹ãƒ•ã‚£ã‚¢ã‚’æç”»ã™ã‚‹

Unity

åˆã‚ã« Demo é–‹ç™ºç’°å¢ƒ å®Ÿè£… åˆã‚ã« Unityã§rayã®å½“ãŸã‚Šåˆ¤å®šã§ãƒ‡ãƒãƒƒã‚°ã‚’ã™ã‚‹éš›ã« Gizmoã‚„ Drawlineã‚’ä½¿ã£ã¦è¡Œã†ã“ã¨ãŒå¤šã€…ã‚ã‚Šã¾ã™ã€‚ä»Šå›žã¯ GizmoãŒä½¿ãˆãªã„(MonoBehaviourã‚’ç¶™æ‰¿ã—ã¦ã„ãªã„ or æ›´æ–°é–¢æ•°ã‚’ OnDrawGizmosã¾ã§ä¼æ’ã§ããªã„)å ´åˆã®æ–¹æ³•ã¨ã—ã¦ Drâ€¦

2024-11-27

ãƒãƒ¼ã‚«ãƒ«ã§smollmã§å‹•ç”»ã®å†…å®¹ã«é–¢ã™ã‚‹æŽ¨è«–ã‚’è¡Œã†

AI

åˆã‚ã« é–‹ç™ºç’°å¢ƒ ã‚»ãƒƒãƒˆã‚¢ãƒƒãƒ— å‹•ç”»æŽ¨è«– åˆã‚ã« æ˜¨æ—¥ä»¥ä¸‹ã®LLMã‚’å‹•ã‹ã—ã¾ã—ãŸã€‚ ayousanz.hatenadiary.jp æ˜¨æ—¥ã®PRã§å‹•ç”»ã®æŽ¨è«–ã‚³ãƒ¼ãƒ‰ãŒãƒžãƒ¼ã‚¸ã•ã‚ŒãŸã®ã§ã€è§¦ã£ã¦ã¿ã¾ã™ github.com é–‹ç™ºç’°å¢ƒ Windows uv python 3.11 smollm[85a4eb2dd5dd0eb4e116264f1853ae2â€¦

2024-11-26

ãƒãƒ¼ã‚«ãƒ«ã§smollmã‚’å‹•ã‹ã™

AI

åˆã‚ã« é–‹ç™ºç’°å¢ƒ ã‚»ãƒƒãƒˆã‚¢ãƒƒãƒ— ãƒ‡ãƒ•ã‚©ãƒ«ãƒˆã®è³ªå• åˆã‚ã« å°ã•ãã¦ç²¾åº¦ãŒé«˜ã„ãƒ¢ãƒ‡ãƒ«ãŒå‡ºãŸã®ã§ã€è§¦ã£ã¦ã„ãã¾ã™ã€‚TRL CLIã‚’ä½¿ã£ã¦ãƒãƒ£ãƒƒãƒˆã‚‚ã§ãã‚‹ã¿ãŸã„ãªã®ã§ã“ã¡ã‚‰ã‚‚è§¦ã£ã¦ã¿ã¾ã™ github.com é–‹ç™ºç’°å¢ƒ smollm[1e43f0dcd76261d4317cc2ee7258fe67d151d082] Wâ€¦

2024-11-24

Windowsã§samuraiã§Zero-Shot Visual Trackingã‚’Custom Videoã§è¡Œã†

AI

åˆã‚ã« é–‹ç™ºç’°å¢ƒ ã‚»ãƒƒãƒˆã‚¢ãƒƒãƒ— ãƒ‡ãƒ¼ã‚¿ã®æº–å‚™ Custom Videoã§ã®æŽ¨è«– åˆã‚ã« ãƒ¢ãƒ¼ã‚·ãƒ§ãƒ³èªè˜ãƒ¡ãƒ¢ãƒªã‚’ä½¿ç”¨ã—ãŸã‚¼ãƒã‚·ãƒ§ãƒƒãƒˆè¦–è¦šè¿½è·¡ã‚’ãƒãƒ¼ã‚«ãƒ«ã§è§¦ã£ã¦ã„ãã¾ã™ github.com é–‹ç™ºç’°å¢ƒ Windows11 uv pyhton 3.10 ã‚»ãƒƒãƒˆã‚¢ãƒƒãƒ— ã¾ãšã¯ç’°å¢ƒã‚’ä½œã£ã¦ã„ãã¾ã™ uv venvâ€¦

2024-11-24

FFmpegã§é€£ç•ªã®ç”»åƒã‹ã‚‰å‹•ç”»ã‚’ä½œæˆã™ã‚‹

é–‹ç™ºç’°å¢ƒ é€£ç•ªç”»åƒã‹ã‚‰å‹•ç”»ä½œæˆ é–‹ç™ºç’°å¢ƒ Windows11 FFmpeg N-113785-gfe340c3244-20240223 é€£ç•ªç”»åƒã‹ã‚‰å‹•ç”»ä½œæˆ é€£ç•ªã®ç”»åƒãŒã‚ã‚‹ãƒ•ã‚©ãƒ«ãƒ€ã§ä»¥ä¸‹ã‚’å®Ÿè¡Œ ffmpeg -framerate 30 -i %08d.jpg -c:v libx264 -r 30 -pix_fmt yuv420p output.mp4 ã‚ªãƒ—ã‚·ãƒ§ãƒ³ã«ã¤â€¦

2024-11-24

WSL2 + dockerã®å®¹é‡å‰Šæ¸›æ–¹æ³•

åˆã‚ã« é–‹ç™ºç’°å¢ƒ æ–¹æ³• åˆã‚ã« Windowsã§dockerã‚’ä½¿ã£ãŸé–‹ç™ºã‚’è¡Œã£ã¦ã„ã‚‹ã¨å®¹é‡ãŒã©ã‚“ã©ã‚“å¢—ãˆã¦ã„ãã¾ã™ã€‚å®šæœŸçš„ã«æŽƒé™¤ã‚’ã™ã‚‹å¿…è¦ãŒã‚ã‚‹ã®ã§ã€ã‚„ã‚Šæ–¹ã®ãƒ¡ãƒ¢ã§ã™ é–‹ç™ºç’°å¢ƒ Windows11 wsl æ–¹æ³• ä»¥ä¸‹ã®è¨˜äº‹ã‚’å‚è€ƒã«ã—ã¦ã€æ—¢å˜ã®docker imageã‚’å‰Šé™¤ docker systeâ€¦

2024-11-23

Windowsã§AudioLDM-training-finetuningã§AudioLDMã®finetuningã‚’è¡Œã†

AI

åˆã‚ã« é–‹ç™ºç’°å¢ƒ ã‚»ãƒƒãƒˆã‚¢ãƒƒãƒ— ãƒ¢ãƒ‡ãƒ«ãƒ»ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã®é…ç½® è¿½åŠ å¦ç¿’ã®å®Ÿè¡Œ åˆã‚ã« ä»¥å‰ã«text to audioã‚’ AudioLDMã‚’ä½¿ã£ã¦è¡Œã„ã¾ã—ãŸã€‚ ayousanz.hatenadiary.jp ä»Šå›žã¯ã“ã® AudioLDMã‚’äº‹å‰å¦ç¿’ãƒ¢ãƒ‡ãƒ« + ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã‚’ä½¿ã£ã¦è¿½åŠ å¦ç¿’ã‚’ã—ã¦ã„ãã¾ã™ã€‚ ä»¥â€¦

2024-11-23

AudioLDMã§text to audioã‚’è¡Œã†

AI

åˆã‚ã« é–‹ç™ºç’°å¢ƒ ã‚»ãƒƒãƒˆã‚¢ãƒƒãƒ— æŽ¨è«– requirements.txt åˆã‚ã« text to audioãŒã„ã‚ã„ã‚ã‚ã‚‹ä¸ã§å‡ºã¦ããŸ AudioLDMã¨ã„ã†CLAPã‚’ä½¿ã£ã¦éŸ³å£°ã‚’ç”Ÿæˆã™ã‚‹ãƒ¢ãƒ‡ãƒ«ã‚’è§¦ã£ã¦ã¿ã¾ã™ github.com é–‹ç™ºç’°å¢ƒ uv python 3.8 windows 11(powershell) ã‚»ãƒƒãƒˆã‚¢ãƒƒãƒ— ã¾ãšã¯å…¬å¼â€¦

2024-11-21

OmniParserã‚’Dockerã§å‹•ã‹ã™

AI

åˆã‚ã« é–‹ç™ºç’°å¢ƒ è©³ç´° åˆã‚ã« microsoftã‹ã‚‰ã‚¹ã‚¯ãƒªãƒ¼ãƒ³ã‚·ãƒ§ãƒƒãƒˆã®å†…å®¹ã‚’ç†è§£ã™ã‚‹ãƒ¢ãƒ‡ãƒ«ãŠã‚ˆã³ãƒ©ã‚¤ãƒ–ãƒ©ãƒªãŒå‡ºã¦ã„ã‚‹ã®ã§ã€ã“ã‚Œã‚’è§¦ã£ã¦ã„ãã¾ã™ã€‚ ç’°å¢ƒæ§‹ç¯‰ã®ãŸã‚ã«ã€dockerç’°å¢ƒã‚’ä½œã£ã¦ã„ãã¾ã™ github.com ä»¥ä¸‹ã§dockerç’°å¢ƒã‚’ã¾ã¨ã‚ãŸãƒªãƒã‚¸ãƒˆãƒªã‚’ã‚ã’ã¦ã„â€¦

2024-11-21

GeminiAPIã‚’ä½¿ã£ã¦éŸ³å£°ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã®ãƒ©ãƒ™ãƒ«ä»˜ã‘ã‚’è¡Œã†

AI

åˆã‚ã« é–‹ç™ºç’°å¢ƒ æº–å‚™ GeminiAPIã‚’ä½¿ã£ã¦ãƒ©ãƒ™ãƒ«ä»˜ã‘ã¤ã‘ åˆã‚ã« éŸ³å£°ã®ãƒ©ãƒ™ãƒ«ä»˜ã‘ã‚’ã™ã‚‹å ´åˆã€LLMã‚’ä½¿ã£ã¦æ–‡å—ãŠè¶Šã—ãƒ‡ãƒ¼ã‚¿ã‹ã‚‰è¡Œã† or ãƒžãƒ«ãƒãƒ¢ãƒ¼ãƒ€ãƒ«ã‚’ä½¿ã£ã¦éŸ³å£°ãŠã‚ˆã³ãƒ†ã‚ã‚¹ãƒˆã‹ã‚‰ãƒ©ãƒ™ãƒ«ä»˜ã‘ã‚’ã™ã‚‹æ–¹æ³•ã«ãªã‚Šã¾ã™ã€‚ ä»Šå›žã¯ã€Geminaiã®APIã‚’ä½¿ã£ã¦éŸ³å£°ãŠâ€¦

2024-11-19

manga-ocrã‚’å‹•ã‹ã™

AI

åˆã‚ã« é–‹ç™ºç’°å¢ƒ ç’°å¢ƒã‚»ãƒƒãƒˆã‚¢ãƒƒãƒ— æŽ¨è«– åˆã‚ã« æ—¥æœ¬ã®æ¼«ç”»ãƒ•ã‚©ãƒ¼ãƒžãƒƒãƒˆã«ç‰¹åŒ–ã—ãŸOCRã®ãƒ©ã‚¤ãƒ–ãƒ©ãƒªãŒã‚ã‚‹ã®ã§å‹•ã‹ã—ã¦ã¿ã¾ã™ github.com é–‹ç™ºç’°å¢ƒ uv python 3.10 mange-ocr ç’°å¢ƒã‚»ãƒƒãƒˆã‚¢ãƒƒãƒ— å…¬å¼ã®ã¾ã¾ã ã¨ã‚¨ãƒ©ãƒ¼ã«ãªã‚‹ã®ã§ã€pyproject.toml ã‚’å¤‰æ›´ã—ã¾ã™ â€¦

2024-11-19

Kotoba-Speech v0.1ã‚’Dockerã‚’ä½¿ã£ã¦ãƒãƒ¼ã‚«ãƒ«ç’°å¢ƒã§æŽ¨è«–ã‚’è¡Œã†

AI

åˆã‚ã« é–‹ç™ºç’°å¢ƒ æ§‹ç¯‰æ™‚ã®è©³ç´° FlashAttentionã®ã‚¤ãƒ³ã‚¹ãƒˆãƒ¼ãƒ«ã«ã¤ã„ã¦ audiocraftã®ã‚¤ãƒ³ã‚¹ãƒˆãƒ¼ãƒ« pytorchã®å¤ã„å•é¡Œ ãƒœãƒªãƒ¥ãƒ¼ãƒ ãƒžã‚¦ãƒ³ãƒˆã‚’ä½¿ã£ãŸãƒ•ã‚©ãƒ«ãƒ€å…±æœ‰ æŽ¨è«– åˆã‚ã« ã“ã¡ã‚‰å‹•ã‹ã—ã¦ã„ãã¾ã™ã€‚ github.com æ˜”ã«ãƒ©ã‚¤ãƒ–ãƒ©ãƒªã®verãŒåˆã‚ãšã«è«¦ã‚ã¦ã„ãŸã®ã§â€¦

2024-11-19

boltz(Boltz-1)ã‚’ä½¿ã£ã¦ç”Ÿä½“åˆ†åç›¸äº’ä½œç”¨ãƒ¢ãƒ‡ãƒªãƒ³ã‚°ã‚’è¡Œã†

AI

åˆã‚ã« é–‹ç™ºç’°å¢ƒ ã‚»ãƒƒãƒˆã‚¢ãƒƒãƒ— ã‚¿ãƒ³ãƒ‘ã‚¯è³ªã¨ãƒªã‚¬ãƒ³ãƒ‰ï¼ˆåˆ†åï¼‰ã®æƒ…å ±ã‹ã‚‰æŽ¨è«– çµæžœ å‚™è€ƒ clangä¸è¶³ã‚¨ãƒ©ãƒ¼ åˆã‚ã« Boltz-1ã¯ã€ã‚¿ãƒ³ãƒ‘ã‚¯è³ªã€RNAã€DNAã€å°åˆ†åãªã©ã®ç”Ÿä½“åˆ†åã®3Dæ§‹é€ ã‚’äºˆæ¸¬ã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚é¢ç™½ãã†ãªã®ã§å®Ÿéš›ã«å®Ÿè¡Œã—ã¦ã¿ã¾ã™ github.com â€¦

2024-11-17

Style-Bert-VITS2(SBV2)ã§AssertionError: choose a window size 400 that is [2, 251]ã®å¯¾å¿œæ–¹æ³•

AI

åˆã‚ã« é–‹ç™ºç’°å¢ƒ ãƒ©ã‚¤ãƒ–ãƒ©ãƒª ver åˆã‚ã« ä»¥ä¸‹ã®å¦ç¿’ã«ã¦ä»¥ä¸‹ã®ã‚¨ãƒ©ãƒ¼ã«ã¦å‰å‡¦ç†ãŒæ¢ã¾ã‚‹ã“ã¨ãŒã‚ã‚Šã¾ã™ã€‚ã“ã¡ã‚‰ã®å¯¾å¿œã‚’ã—ã¦ã„ãã¾ã™ packages/torchaudio/compliance/kaldi.py", line 142, in _get_waveform_and_window_properties assert 2 <= window_size â€¦

2024-11-12

linuxã®screenç’°å¢ƒã§ã‚¹ã‚¯ãƒãƒ¼ãƒ«ãŒã§ããªã„æ™‚ã«ã™ã‚‹å¯¾å¿œ

é–‹ç™ºç’°å¢ƒ ç¾è±¡ å¯¾å¿œæ–¹æ³• é–‹ç™ºç’°å¢ƒ Ubuntu 22.04 ç¾è±¡ linuxã«ä»®æƒ³ã‚¿ãƒ¼ãƒŸãƒŠãƒ«åŒ–ã™ã‚‹ãƒ©ã‚¤ãƒ–ãƒ©ãƒªãŒã‚ã‚Šã¾ã™ãŒã€ã“ã¡ã‚‰ã‚’ä½¿ç”¨æ™‚ã«ã‚¹ã‚¯ãƒãƒ¼ãƒ«ã—ã¦ã‚‚ä¸Šéƒ¨ã«ã‚ã‚‹ã‚‚ã®ãŒã‚¹ã‚¯ãƒãƒ¼ãƒ«ã•ã‚Œãªã„ã“ã¨ãŒã‚ã‚Šã¾ã™ã€‚ å¯¾å¿œæ–¹æ³• ãƒ›ãƒ¼ãƒ ãƒ‡ã‚£ãƒ¬ã‚¯ãƒˆãƒªã«ã‚ã‚‹.screenrcãƒ•ã‚¡ã‚¤ãƒ«ã‚’ç·¨â€¦

2024-11-12

XREALã§æŽ´ã‚ã‚‹ã‚ªãƒ–ã‚¸ã‚§ã‚¯ãƒˆã®è¨å®šã‚’è¡Œã†

xR Unity

åˆã‚ã« é–‹ç™ºç’°å¢ƒ è©³ç´° ã‚ªãƒ–ã‚¸ã‚§ã‚¯ãƒˆå´ã®è¨å®š 1. Collider 2. RIgidbody 3. NRGrabbale Object ã‚ªãƒ–ã‚¸ã‚§ã‚¯ãƒˆã®ç™»éŒ² åˆã‚ã« ä»¥ä¸‹ã®ç”»åƒã®ã‚ˆã†ã«å·¦å´ã«è‡ªåˆ†ã§è¿½åŠ ã—ãŸã‚ªãƒ–ã‚¸ã‚§ã‚¯ãƒˆã‚’XREAL SDKã‚’é€šã—ã¦æŽ´ã‚ã‚‹ã‚ˆã†ã«ã—ã¦ã„ãã¾ã™ é–‹ç™ºç’°å¢ƒ Unity 2022.3.42f1 XREAâ€¦

2024-11-11

Unityã§URPã®Lit shaderã®ãƒ¢ãƒ‡ãƒ«ã®materialã®Offsetã‚’ã‚¹ã‚¯ãƒªãƒ—ãƒˆã‹ã‚‰å¤‰æ›´ã™ã‚‹

Unity

åˆã‚ã« é–‹ç™ºç’°å¢ƒ å®Ÿè£… ã‚¹ã‚¯ãƒªãƒ—ãƒˆã‹ã‚‰shaderã®ãƒ†ã‚¯ã‚¹ãƒãƒ£ãƒ¼ã®ãƒ—ãƒãƒ‘ãƒ†ã‚£ã«ã¤ã„ã¦ MaterialPropertyBlockã‚’ä½¿ã£ã¦ãƒžãƒ†ãƒªã‚¢ãƒ«ã®ãƒ—ãƒãƒ‘ãƒ†ã‚£ã®å–å¾—ãƒ»æ›´æ–° å‚™è€ƒ åˆã‚ã« ãƒ†ã‚¯ã‚¹ãƒãƒ£ã®ä½ç½®ã‚’å¤‰æ›´ã—ãŸå®Ÿè£…ã‚’è¡Œã†éš›ã« ã‚¹ã‚¯ãƒªãƒ—ãƒˆã‹ã‚‰ä»»æ„ã®ã‚¿ã‚¤ãƒŸãƒ³ã‚°ã§ materialã®offâ€¦

2024-11-10

sbintuitions/sarashina2-70bã‚’å‹•ã‹ã™

AI

åˆã‚ã« é–‹ç™ºç’°å¢ƒ æº–å‚™ å®Ÿè¡Œ åˆã‚ã« ayousanz.hatenadiary.jp é–‹ç™ºç’°å¢ƒ Linux H100(80GB) æº–å‚™ ä»¥ä¸‹ã®ãƒ©ã‚¤ãƒ–ãƒ©ãƒªã‚’ã‚¤ãƒ³ã‚¹ãƒˆãƒ¼ãƒ«ã—ã¾ã™ pip install torch --index-url https://download.pytorch.org/whl/nightly/cu121 pip install transformers==4.46.2 bitsâ€¦

2024-11-10

Unityã§OpenAIã®realtime apiã§å…¥åŠ›ã—ãŸéŸ³å£°ã®æ–‡å—èµ·ã“ã—ã‚’å–å¾—ã™ã‚‹æ–¹æ³•

Unity AI

åˆã‚ã« é–‹ç™ºç’°å¢ƒ å®Ÿè£… åˆã‚ã« ä»¥ä¸‹ã®è¨˜äº‹ã§Unityã§OpenAIã®realtime apiã‚’ä½¿ã£ã¦éŸ³å£°ã®ã‚„ã‚Šå–ã‚Šã‚’è¡Œã„ã¾ã—ãŸã€‚ä»Šå›žã¯ä»¥ä¸‹ã®ã‚„ã‚Šå–ã‚Šã‚’ã™ã‚‹éš›ã« ãƒ¦ãƒ¼ã‚¶ãƒ¼ãŒå…¥åŠ›ã‚’ã—ãŸéŸ³å£°ã®æ–‡å—èµ·ã“ã—ã‚’å–å¾—ã—ãŸã„å ´åˆã®è¨å®šã«ã¤ã„ã¦ã§ã™ã€‚ ayousanz.hatenadiary.jp é–‹ç™ºç’°å¢ƒâ€¦

#Unity #C# #OpenAI #realtimeapi

yousanã®ãƒ¡ãƒ¢

2024-01-01ã‹ã‚‰1å¹´é–“ã®è¨˜äº‹ä¸€è¦§

talkbank/callhomeã®æ—¥æœ¬èªžéŸ³å£°ã‚’wavå½¢å¼ã§ä¿å˜ã™ã‚‹

pyannote + whisperã§è©±è€…ãƒ€ã‚¤ã‚¢ãƒ©ã‚¤ã‚¼ãƒ¼ã‚·ãƒ§ãƒ³ã‚’è¡Œã†

Wespeaker/wespeaker-voxceleb-resnet34-LMã§è©±è€…ãƒ€ã‚¤ã‚¢ãƒ©ã‚¤ã‚¼ãƒ¼ã‚·ãƒ§ãƒ³ã‚’è¡Œã†

powerset_calibrationã‚’ä½¿ã£ã¦è©±è€…ãƒ€ã‚¤ã‚¢ãƒ©ã‚¤ã‚¼ãƒ¼ã‚·ãƒ§ãƒ³ã‚’è¡Œã†

nvidia/parakeet-tdt_ctc-0.6b-jaã‚’Windowsã§å‹•ã‹ã™éš›ã®AttributeError: module 'signal' has no attribute 'SIGKILL'. Did you mean: 'SIGILL'?ã®å¯¾å¿œ

reazonspeech-k2-v2ã‚’å‹•ã‹ã™

S3Tokenizerã‚’å‹•ã‹ã™

DNSMOSã§éŸ³å£°è©•ä¾¡ã‚’è¡Œã†

Windowsã§Freeze-Omniã‚’å‹•ã‹ã™

sudachipyã‚’ä½¿ã£ã¦æ–‡ç« ã‚’ã²ã‚‰ãŒãªã«å¤‰æ›ã™ã‚‹

WeSpeakerã§éŸ³å£°ãƒ‡ãƒ¼ã‚¿å†…ã®è©±è€…åˆ†é›¢ãŠã‚ˆã³è©±è€…æ•°ã®ç‰¹å®šã‚’è¡Œã†

Unityã§DrawLineã‚’ä½¿ã£ã¦æ“¬ä¼¼çš„ã«ã‚¹ãƒ•ã‚£ã‚¢ã‚’æç”»ã™ã‚‹

ãƒãƒ¼ã‚«ãƒ«ã§smollmã§å‹•ç”»ã®å†…å®¹ã«é–¢ã™ã‚‹æŽ¨è«–ã‚’è¡Œã†

ãƒãƒ¼ã‚«ãƒ«ã§smollmã‚’å‹•ã‹ã™

Windowsã§samuraiã§Zero-Shot Visual Trackingã‚’Custom Videoã§è¡Œã†

FFmpegã§é€£ç•ªã®ç”»åƒã‹ã‚‰å‹•ç”»ã‚’ä½œæˆã™ã‚‹

WSL2 + dockerã®å®¹é‡å‰Šæ¸›æ–¹æ³•

Windowsã§AudioLDM-training-finetuningã§AudioLDMã®finetuningã‚’è¡Œã†

AudioLDMã§text to audioã‚’è¡Œã†

OmniParserã‚’Dockerã§å‹•ã‹ã™

GeminiAPIã‚’ä½¿ã£ã¦éŸ³å£°ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã®ãƒ©ãƒ™ãƒ«ä»˜ã‘ã‚’è¡Œã†

manga-ocrã‚’å‹•ã‹ã™

Kotoba-Speech v0.1ã‚’Dockerã‚’ä½¿ã£ã¦ãƒãƒ¼ã‚«ãƒ«ç’°å¢ƒã§æŽ¨è«–ã‚’è¡Œã†

boltz(Boltz-1)ã‚’ä½¿ã£ã¦ç”Ÿä½“åˆ†åç›¸äº’ä½œç”¨ãƒ¢ãƒ‡ãƒªãƒ³ã‚°ã‚’è¡Œã†

Style-Bert-VITS2(SBV2)ã§AssertionError: choose a window size 400 that is [2, 251]ã®å¯¾å¿œæ–¹æ³•

linuxã®screenç’°å¢ƒã§ã‚¹ã‚¯ãƒãƒ¼ãƒ«ãŒã§ããªã„æ™‚ã«ã™ã‚‹å¯¾å¿œ

XREALã§æŽ´ã‚ã‚‹ã‚ªãƒ–ã‚¸ã‚§ã‚¯ãƒˆã®è¨å®šã‚’è¡Œã†

Unityã§URPã®Lit shaderã®ãƒ¢ãƒ‡ãƒ«ã®materialã®Offsetã‚’ã‚¹ã‚¯ãƒªãƒ—ãƒˆã‹ã‚‰å¤‰æ›´ã™ã‚‹

sbintuitions/sarashina2-70bã‚’å‹•ã‹ã™

Unityã§OpenAIã®realtime apiã§å…¥åŠ›ã—ãŸéŸ³å£°ã®æ–‡å—èµ·ã“ã—ã‚’å–å¾—ã™ã‚‹æ–¹æ³•

2024-01-01ã‹ã‚‰1å¹´é–“ã®è¨˜äº‹ä¸€è¦§

2024-01-01ã‹ã‚‰1å¹´é–“ã®è¨˜äº‹ä¸€è¦§