Stars
Official repo for CoVoMix: Advancing Zero-Shot Speech Generation for Human-like Multi-talker Conversations
State-of-the-art audio codec with 90x compression factor. Supports 44.1kHz, 24kHz, and 16kHz mono/stereo audio.
Instant voice cloning by MIT and MyShell.
Tacotron 2 - PyTorch implementation with faster-than-realtime inference
A Python library that can apply: darth vader, echo, radio, robotic, and ghost effects to audio samples.
FFmpeg实现视频裁剪、水印、转码、编解码、转Gif动图;FFmpeg本地推流、H264与RTMP实时推流直播;OpenGL滤镜特效,视频拍摄。音视频学习路线,音视频知识总结、流媒体协议
A fully working pytorch implementation of NaturalSpeech (Tan et al., 2022)
A pytorch implementation of MBNET: MOS PREDICTION FOR SYNTHESIZED SPEECH WITH MEAN-BIAS NETWORK
Singing Voice Synthesis based on VITS, different from VISinger
A book about Text-to-Speech (TTS) in Chinese.
🔊 A comprehensive list of open-source datasets for voice and sound computing (95+ datasets).
视频硬字幕提取,生成srt文件。无需申请第三方API,本地实现文本识别。基于深度学习的视频字幕提取框架,包含字幕区域检测、字幕内容提取。A GUI tool for extracting hard-coded subtitle (hardsub) from videos and generating srt files.
搜集、整理、发布 中文 自然语言处理 语料/数据集,与 有志之士 共同 促进 中文 自然语言处理 的 发展。
中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌词库、汽车零件词库、连续英文切割、各种中文词向量、公司名字大全、古诗词库、IT词库、财经词库、成语词库、地名词库、…
pkuseg多领域中文分词工具; The pkuseg toolkit for multi-domain Chinese word segmentation
此项目是机器学习(Machine Learning)、深度学习(Deep Learning)、NLP面试中常考到的知识点和代码实现,也是作为一个算法工程师必会的理论基础知识。
CNN-RNN中文文本分类,基于TensorFlow
从新浪财经、每经网、金融界、中国证券网、证券时报网上,爬取上市公司(个股)的历史新闻文本数据进行文本分析、提取特征集,然后利用SVM、随机森林等分类器进行训练,最后对实施抓取的新闻数据进行分类预测
transformer xl在中文文本生成上的尝试(可写小说、古诗)(transformer xl for text generation of chinese)
pycorrector is a toolkit for text error correction. 文本纠错,实现了Kenlm,T5,MacBERT,ChatGLM3,Qwen2.5等模型应用在纠错场景,开箱即用。
Tensorflow2.0 🍎🍊 is delicious, just eat it! 😋😋
Future versions with model training module will be maintained through a forked version here: https://github.com/seasalt-ai/snowboy
kaldi-asr/kaldi is the official location of the Kaldi project.
目标检测yolo算法,采用tensorflow框架编写,中文注释完全,含测试和训练,支持摄像头
使用SpringBoot+MyBatis进行前后端开发的个人博客网站(不再维护)