Advertisement

Spleeter是 Deezer 音频源分离库,它包含预训练模型,并且是开源的。

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
Spleeter是一个基于Deezer源代码构建的分离库,其核心在于包含一个以Python编写并利用Tensorflow进行预训练的强大模型。 该库极大地简化了训练音乐源分离模型的过程,尤其适用于拥有独立源数据集中的情况,并且提供了经过精心训练的最先进模型,以支持多种分离风格。 针对musdb数据集,2个茎和4个茎的模型均展现出卓越的性能,处于领先水平。 此外,Spleeter的运行速度非常快,能够在GPU上以惊人的效率将音频文件分解为四个独立的声道,其分离速度比实时处理快出100倍。 为了方便用户的使用,我们设计了Spleeter,使其能够直接在命令行界面进行操作,也可以无缝集成到您自己的开发流程中作为Python库。 此外,Spleeter可以通过Conda以及pip进行便捷安装,同时还支持与Docker容器一起使用,提供了灵活的部署选择。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • Deezer-Python
    优质
    本项目为Python开发的Deezer源分离库,内嵌多种预训练模型,支持音乐信号处理与研究,旨在促进音频内容的创新应用。 Spleeter是由Deezer开发的源代码分离库,包含使用Python编写的预训练模型,并基于Tensorflow框架。它使得在拥有隔离音源数据集的情况下进行源分离模型的训练变得简单,并提供了经过训练的各种先进模型来执行不同风格的声音分离:包括人声(演唱声音)/伴奏分离(2个词干)、人声/鼓/贝斯/其他分离(4个词干),以及人声/鼓/贝斯/钢琴/其他分离(5个词干)。
  • Spleeter:Deezer-版本
    优质
    Spleeter是由Deezer开发的一款先进的音乐源分离工具,提供了预训练模型以帮助用户轻松地将音频文件分解为其基本元素。该软件是开源的,可供所有人免费使用和改进。 Spleeter是Deezer开发的一款源代码分离库,它包含用Python编写并使用TensorFlow进行预训练的模型。该工具使得利用隔离音源的数据集来训练音乐源分离模型变得简单,并提供了经过优化的各种风格的音频分割模型。在musdb数据集中,2个茎和4个茎模型展现出了最先进的性能水平。 Spleeter运行速度非常快,在GPU上可以将音频文件分解为四个独立的部分,其处理效率比实时高出100倍。设计者们为了让用户能够更加方便地使用它,不仅提供了命令行接口支持直接操作,还允许开发者将其作为Python库集成到自己的开发流程中。安装方式多样,既可以通过Conda和pip进行部署,也可以选择Docker容器化环境来运行Spleeter。
  • Spleeter人声_2stems.tar.gz
    优质
    Spleeter人声分离模型_2stems.tar.gz是一款先进的音乐处理工具包,它利用深度学习技术从音频文件中精确分离出人声和伴奏两部分,方便用户进行个性化编辑与创作。 GitHub下载较慢的话,可以尝试其他途径下载。详细使用方法请参考我写的另一篇文章《spleeter音乐人声分离环境搭建和运行windows+ubuntu18.04》。
  • CIFAR10 - PyTorch - 文件、和测试代码以及Kaggle上
    优质
    本项目提供了一个基于PyTorch框架的CIFAR-10数据集图像分类解决方案,包含详细的模型源码、训练与测试脚本,并附有在Kaggle平台上的预训练模型以供参考和使用。 cifar10文件夹:包括了cifar10原数据库 kaggle文件夹:包括了在kaggle上训练好的模型及日志文件 model文件夹:包括了本地cpu训练好的模型 src文件夹: - kaggle_tensorboard.py: 用于使用tensorboard展示kaggle上训练的日志 - model.py: 神经网络模型 - res_model:残差网络模型 有问题就发邮件。GuanlinLi_BIT@163.com
  • RTKSharp:这基于C#LibRTK端口,一个小c/c++ -
    优质
    RTKSharp是一款开源软件,它是对LibRTK的C#版本实现,旨在提供高精度GNSS定位解决方案。该项目包含了必要的C/C++组件以确保功能完整性和性能优化。 RTKLIB是一个用于GNSS(全球导航卫星系统)的标准和精确定位的开源程序包。它包含一个可移植程序库以及几个使用该库的应用程序。此端口仅提供适用于C/C++语言的动态链接库(.so或.dll)及适用于.NET Framework环境的.dll文件。RTKSharp支持Windows和Linux操作系统,并且可以与.NET/Mono Assembly兼容,无需重新编译/交叉构建。
  • 人声与背景
    优质
    本文提出了一种先进的深度学习模型,专门用于音频处理中的人声和背景音乐分离。该模型通过创新的架构设计和大量的数据训练,显著提升了分离精度和自然度,在多种评估指标上超越现有技术,为音乐制作、语音识别等领域提供了强有力的支持。 将模型文件导入到music_source_separation_master工程目录下的bytesep_data文件夹中。用户也可以修改代码以自定义路径,最后运行工程代码,输出人声和背景音分离的效果。
  • Spleeter
    优质
    Spleeter模型分析介绍了一种先进的音频分离技术,通过深度学习方法将音乐文件精确分割成其基本成分如人声、乐器等。 Spleeter项目用于人声分离的深度学习模型有三个版本:分别包含2、4和5个分离轨道的模型。这些模型可以直接导入并放置在对应的文件夹中使用,无需额外配置。下载时可能会遇到速度较慢的问题,并且找到现成可用的模型也较为困难。每个模型文件包括checkpoint、model.data、mode.index和model.meta等组成部分。
  • yolov8s.pt 一个文件,归属于YOLOv8系列
    优质
    简介:Yolov8s.pt是YOLOv8系列中的小型预训练模型文件,适用于资源受限环境下的目标检测任务。 yolov8s.pt 是 YOLOv8 模型系列中的一个预训练模型文件,它是该系列的小型(small)版本。YOLO是一种流行的实时对象检测系统。 **特点:** - **小型化**: yolov8s.pt 强调的是“small”版本,这意味着它在模型大小和计算复杂度上进行了优化,以便在资源受限的设备(如边缘设备或移动设备)上运行。尽管体积较小,但它仍然保持了相当不错的检测性能。 - **高性能**: 尽管是小型版本,但 YOLOv8s 仍能在保证实时检测速度的同时提供准确的结果。这得益于其先进的模型架构和训练策略。 - **易于使用**: YOLOv8 设计为便于用户部署的解决方案。yolov8s.pt 文件可以直接加载到 PyTorch 环境中,进行进一步推理或微调。 - **多尺度检测**: YOLOv8 继承了其系列中的多尺度检测能力,能够识别不同大小的对象,在复杂场景下非常有用。 - **广泛适应性**: 由于 YOLOv8 的高效性和准确性,它被广泛应用在各种领域中,例如视频监控、自动驾驶和机器人视觉等。
  • YOLOv8
    优质
    简介:YOLOv8分类预训练模型是一款高性能的目标检测与分类工具,采用先进的神经网络架构,在大规模数据集上进行预训练,实现快速、精准的图像识别功能。 YOLOV8分类预训练模型提供了一种高效的方法来进行图像分类任务。此模型基于之前版本的YOLO系列,在速度与精度上都有所提升,并且可以快速应用于各种不同的场景中。使用者可以根据具体需求对模型进行微调,以达到最佳效果。
  • 腾讯已图像超辨率算法RealSR,码及和测试图片
    优质
    腾讯已经开放了其先进的图像超分辨率技术RealSR的源代码、预训练模型以及测试图片,为开发者提供了强大的工具来提升图像清晰度。 由于RealSR源码及预训练模型在国内下载速度较慢,这里已将其打包好,并附带测试图片。使用方法请参考我的博客文章。