当前位置：首页 > 软件库 > 应用工具 > 多媒体工具 >

Basic Pitch

Spotify 开源的轻量级音频转换器

授权协议 Apache-2.0

开发语言 Python

所属分类应用工具、多媒体工具

软件类型开源软件

地区不详

投递者皮骏

操作系统跨平台

开源组织无

适用人群未知

软件概览

Basic Pitch 是一个用于自动音乐转录（AMT，Automatic Music Transcription）的 Python 库，使用由 Spotify 开发的轻量级神经网络。它很小，容易使用，而且可以用 pip install安装。

Basic Pitch 高效且易于使用，支持多音阶、对不同乐器的概括能力以及它的音符准确性都能与更大、更耗资源的 AMT 系统竞争。

安装

basic-pitch可通过 PyPI 获得，可使用以下命令安装当前版本：

pip install basic-pitch

要将 Basic Pitch 更新到最新版本，请添加 --upgrade到上面的命令。

兼容环境

macOS、Windows 和 Ubuntu 操作系统
Python 版本 3.7、3.8、3.9

支持的音频编解码器

basic-pitch接受与librosa版本兼容的所有声音文件，其中包含：

.mp3
.ogg
.wav
.flac
.m4a

演示

官方演示网站：https://basicpitch.spotify.com/

使用案例

基音检测算法的性能：Performance Evaluation of Pitch Detection Algorithms

http://access.feld.cvut.cz/view.php?cisloclanku=2009060001 Vydáno dne 02. 06. 2009 (15123 přečtení) This paper presents the comparative study of performance of four pitch detection algorithms. The a
利用vb测声卡_visualbasic教程

在一个多媒体应用程序中，如果涉及对声音的播放与操作，那么我们就有必要先对用户系统中的声卡及真功能进行一下测试。幸好有VB，所以我们要实现这些功能并不用费多大力气(也就是吃顿饭的力气)，在下面的程序中我们将利用VB调用两个windowsApi函数–Waveoutgetnumdevs()和Waveoutgetdev-capS()来访问设备驱动程序，获取有关信息，实现上述目的。OK，LetsGo!一、我
QT学习OpenGL序列：Hello Basic Lighting

我们将学习OpenGL中的几种不同环境光照 (1) 头文件 #ifndef COPENGLWIDGETAMBIENT_H #define COPENGLWIDGETAMBIENT_H /* * 控件名称：Hello Basic Lighting * 环境光照(Ambient) * * 注意：STD C++ Version >= C++11 * * Author: hsw * */

相关资料

音频格式转换

问题内容：我在转换WAV文件的音频格式时遇到麻烦。我正在从麦克风录制声音，并且声音以以下格式录制：PCM_SIGNED 44100.0 Hz，16位，单声道，2字节/帧我想将上述格式转换为ULAW 8000.0 Hz，8位，单声道，1字节/帧我正在使用以下代码，我收到以下错误， java.lang.IllegalArgumentException：不支持的转换：ULAW 8000.0 H
用于在音频文件中转录语音的开源软件

问题内容：谁能推荐可靠的开源软件来在wav文件中记录英语语音？我研究过的两个主要程序是Sphinx和Julius，但是我从来都无法使用它们，并且每个转录文件的文档充其量都是粗略的。我正在开发64位Ubuntu 10.04，其存储库包括sphinx2和julius，以及voxforge的英语julius声学模态。我专注于转录文件，而不是直接处理麦克风的声音，因为我已经放弃了期望像这样的项目可以与
使用ffmpeg进行视频转换，降低音频质量

当我使用ffmpeg从wmv转换到mp4时，我的音频质量很差。我的ffmpeg命令如下：有人能建议我如何在不降低任何质量的情况下转换视频吗？
将音频转换为文本

问题内容：我只想知道在Java或C＃中是否有任何库或外部库中的构建允许我获取音频文件并对其进行解析并从中提取文本。我需要创建一个应用程序，但是我不知道从哪里开始。问题答案：以下是您的一些选择：微软演讲光明龙自然讲狮身人面像4
35 音频源

35 音频源下面介绍当前可用的音频源 abuffer 缓冲音频帧，作为滤镜链图中有效的组成（起点）它主要编程使用，特别是通过libavfilter/asrc_abuffer.h中的接口进行调用。接受如下参数： time_base 用于提交帧的时间戳时基。是浮点数或者分数形式。 sample_rate 进入音频缓冲的采样率。 sample_fmt 进入音频缓冲的采样格式。libavutil/s
Android webRTC音频音量

我在android上使用APPRTCdemo应用程序。我试着让它播放来自另一个同龄人的声音，音量与Android设置中设置的音量一样大。因此，如果用户将设备静音，则不会听到音频。我几乎尝试了每一个Android API调用，但似乎对音量没有任何影响。以下是我尝试过的东西：AudioManager AudioManager=（AudioManager）_context.getSystemServic
asp.net音频转换之.amr转.mp3(利用ffmpeg转换法)

本文向大家介绍asp.net音频转换之.amr转.mp3(利用ffmpeg转换法)，包括了asp.net音频转换之.amr转.mp3(利用ffmpeg转换法)的使用技巧和注意事项，需要的朋友参考一下前言上篇文章已经跟大家分享了asp.net利用七牛转换法将.amr转.mp3的方法，当时也说了还有另外一种方法是利用ffmpeg转换法，下面这篇文章就给大家详细介绍这种方法。这种方法相对第一种来说，
Audio Source 音频源

The Audio Source plays back an Audio Clip in the scene. If the Audio Clip is a 3D clip, the source is played back at a given position and will attenuate over distance. The audio can be spread out betw

Basic Pitch

安装

兼容环境

支持的音频编解码器

演示

同类工具

相关阅读

相关文章

相关问答

相关文档